خوشهبندی یک روش تحلیل داده و از نوع یادگیری بدون نظارت میباشد که در آن مجموعهای از دادههای ناهمگن به گروهها یا اصطلاحا خوشههایی تقسیم میشوند. به طوریکه بیشترین تفاوت در بین خوشهها و بیشترین تشابه درون خوشهها وجود داشته باشد. در روشهای معمولی خوشهبندی مبتنی بر مدل از متغیرهای کمکی استفاده نمیشود. یک راه برای استفاده از متغیرهای کمکی استفاده از مدلهای آمیخته رگرسیونی است. در این مدلها فقط در توزیع در نظر گرفته شده برای خوشهها از متغیرهای کمکی استفاده میشود. یک روش جدید برای استفاده از متغیرهای کمکی هم درتوزیع خوشهها و هم در وزنهای آمیخته، مدل آمیخته خبرگان است. معمولا در این مدل توزیع مولفههای آمیخته یا شبکههای خبره، نرمال در نظر گرفته میشود. اما وجود دادههای دورافتاده میتواند بر کیفیت خوشهبندی تاثیرگذار باشد. مشخص است که توزیع نرمال در مدل کردن دادههای دورافتاده ضعیف عمل میکند. برای رفع این مشکل در این پایاننامه به جای توزیع نرمال برای خبرگان، از توزیع $ t $ استفاده میشود که نسبت به دادههای دورافتاده استوارتر است. یکی دیگر از مشکلات مربوط به مدلهای آمیخته معمولی وجود خطای اندازهگیری در مشاهدات است. اگر دادههای در اختیار همراه با خطای اندازهگیری باشند، این امر میتواند باعث کاهش کیفیت خوشهبندی و تولید خوشههای جعلی و بیش برازشی شود. معمولا برای بررسی و مدل کردن خطای اندازهگیری فرض میشود که این نوع خطا دارای توزیع نرمال است. اما در عمل موقعیتهایی وجود دارد که خطاها بسیار بزرگ یا بسیار کوچک یا به اصطلاح دورافتاده هستند. در این حالت فرض نرمال بودن غیر واقعی و موجب کاهش دقت استنباط میشود. به همین خاطر ما در حالت یک متغیره توزیع $ \alpha $-پایدار متقارن را برای مدل کردن خطاهای اندازهگیری مورد استفاده قرار میدهیم، که میتواند بستگی به مقدار $ \alpha $ خطای اندازهگیری نرمال، خفیف و شدید را مدل کند. در فصل اول پایاننامه مقدمات خوشهبندی مانند معرفی دقیق، مفهوم فاصله و تشابه، معیارهای ارزیابی و انواع روش خوشهبندی را توضیح میدهیم. فصل دوم خوشهبندی مبتنی بر مدل از نظر تئوری و نحوه اجرا، مدل آمیخته خبرگان، خوشهبندی مبتنی بر مدل همراه با متغیرهای کمکی، مدل آمیخته نرمال خبرگان و مدل آمیخته $ t $ خبرگان مورد بررسی قرار میگیرند. در فصل سوم خوشهبندی استوار مبتنی بر مدل، خطای اندازهگیری، روش $MCLUST$ ، $MCLUST-ME$ و توزیع $ \alpha $ -پایدار به طور دقیق بیان میشود. سرانجام در فصل چهارم روشهای ذکر شده در فصل سوم با شبیهسازی و تحلیل دادههای واقعی، مورد ارزیابی و مقایسه قرار میگیرند.