1403/09/14
شاهو زارعی

شاهو زارعی

مرتبه علمی: استادیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 6325
دانشکده: دانشکده علوم پایه
نشانی: دانشکده علوم پایه- اتاق 321
تلفن: 2492: داخلی

مشخصات پژوهش

عنوان
خوشه‌بندی‌ استوار مبتنی بر مدل با آمیخته خبرگان و توزیع α-پایدار
نوع پژوهش
پایان نامه
کلیدواژه‌ها
خوشه‌بندی مبتنی بر مدل، مدل آمیخته خبرگان، خوشه‌بندی بر مبنای متغیر کمکی، خطای اندازه‌گیری، توزیع ‎$ \alpha $-‎پایدار.
سال 1403
پژوهشگران مژگان مرادی(دانشجو)، شاهو زارعی(استاد راهنما)

چکیده

خوشه‌بندی یک روش تحلیل داده و از نوع یادگیری بدون نظارت می‌باشد که در آن مجموعه‌ای از داده‌های ناهمگن به گروه‌ها یا اصطلاحا خوشه‌هایی تقسیم می‌شوند. به طوری‌که بیشترین تفاوت در بین خوشه‌ها و بیشترین تشابه درون خوشه‌ها وجود داشته باشد. در روش‌های معمولی خوشه‌بندی مبتنی بر مدل از متغیرهای کمکی استفاده نمی‌شود. یک راه برای استفاده از متغیرهای کمکی استفاده از مدل‌های آمیخته رگرسیونی است. در این مدل‌ها فقط در توزیع در نظر گرفته شده برای خوشه‌ها از متغیرهای کمکی استفاده می‌شود. یک روش جدید برای استفاده از متغیرهای کمکی هم درتوزیع خوشه‌ها و هم در وزن‌های آمیخته، مدل آمیخته خبرگان است. معمولا در این مدل توزیع مولفه‌های آمیخته یا شبکه‌های خبره، نرمال در نظر گرفته می‌شود. اما وجود داده‌های دورافتاده می‌تواند بر کیفیت خوشه‌بندی تاثیرگذار باشد. مشخص است که توزیع نرمال در مدل کردن داده‌های دورافتاده ضعیف عمل می‌کند. برای رفع این مشکل در این پایان‌نامه به جای توزیع نرمال برای خبرگان، از توزیع ‎$ t $‎ استفاده می‌شود که نسبت به داده‌های دورافتاده استوارتر است. یکی دیگر از مشکلات مربوط به مدل‌های آمیخته معمولی وجود خطای اندازه‌گیری در مشاهدات است. اگر داده‌های در اختیار همراه با خطای اندازه‌گیری باشند، این امر می‌تواند باعث کاهش کیفیت خوشه‌بندی و تولید خوشه‌های جعلی و بیش برازشی شود. معمولا برای بررسی و مدل کردن خطای اندازه‌گیری فرض می‌شود که این نوع خطا دارای توزیع نرمال است. اما در عمل موقعیت‌هایی وجود دارد که خطاها بسیار بزرگ یا بسیار کوچک یا به اصطلاح دورافتاده هستند. در این حالت فرض نرمال بودن غیر واقعی و موجب کاهش دقت استنباط می‌شود. به همین خاطر ما در حالت یک متغیره توزیع ‎$ \alpha $-‎پایدار متقارن را برای مدل کردن خطاهای اندازه‌گیری مورد استفاده قرار می‌دهیم، که می‌تواند بستگی به مقدار ‎$ \alpha $‎ خطای اندازه‌گیری نرمال، خفیف و شدید را مدل کند. در فصل اول پایان‌نامه مقدمات خوشه‌بندی مانند معرفی دقیق، مفهوم فاصله و تشابه، معیارهای ارزیابی و انواع روش خوشه‌بندی را توضیح می‌دهیم. فصل دوم خوشه‌بندی مبتنی بر مدل از نظر تئوری و نحوه اجرا، مدل آمیخته خبرگان، خوشه‌بندی مبتنی بر مدل همراه با متغیرهای کمکی، مدل آمیخته نرمال خبرگان و مدل آمیخته ‎$ t $‎ خبرگان مورد بررسی قرار می‌گیرند. در فصل سوم خوشه‌بندی استوار مبتنی بر مدل، خطای اندازه‌گیری، روش ‎$MCLUST$‎ ، ‎$MCLUST-ME$‎ و توزیع ‎$ \alpha $‎ -پایدار به طور دقیق بیان می‌شود. سرانجام در فصل چهارم روش‌های ذکر شده در فصل سوم با شبیه‌سازی و تحلیل داده‌های واقعی، مورد ارزیابی و مقایسه قرار می‌گیرند.