1405/02/27
شاهو زارعی

شاهو زارعی

مرتبه علمی: استادیار
ارکید:
تحصیلات: دکترای تخصصی
ریسرچ گیت:
دانشکده: دانشکده علوم پایه
اسکولار:
پست الکترونیکی: sh.zarei [at] uok.ac.ir
اسکاپوس: پیوند
تلفن: 2492
HIndex:

مشخصات پژوهش

عنوان
خوشه‌بندی براساس مدل‌های آمیخته چوله و انتخاب متغیر
نوع پژوهش
پایان نامه
کلیدواژه‌ها
خوشه‌بندی مبتنی بر مدل، مدل‌های آمیخته چوله، کاهش بعد، تبدیل منلی، انتخاب متغیر.
سال 1404
پژوهشگران میترا درخشی(دانشجو)، شاهو زارعی(استاد راهنما)

چکیده

خوشه‌بندی به‌عنوان یکی از مهم‌ترین رویکردهای یادگیری بدون نظارت، با هدف کشف ساختارهای نهفته و گروه‌بندی مشاهدات همگن در مجموعه‌داده‌های ناهمگن، نقشی اساسی در حوزه‌های گوناگون علمی ایفا می‌کند. در این میان، خوشه‌بندی مبتنی بر مدل با بهره‌گیری از مدل‌های آمیخته متناهی، چارچوبی انعطاف‌پذیر و قدرتمند برای استنتاج آماری فراهم می‌آورد. با این حال، فرض متداول نرمال بودن مؤلفه‌های آمیخته، در مواجهه با داده‌های دنیای واقعی که اغلب دارای چولگی، کشیدگی و دم‌های سنگین هستند، با چالش‌های جدی مواجه شده و می‌تواند به برآوردهای اریب و شناسایی نادرست خوشه‌ها منجر شود. افزون بر این، تعداد زیاد متغیرها، "مشقت چند بعدی" را تشدید کرده، ساختار اصلی خوشه‌ها را مخفی ساخته و کارایی و دقت مدل‌ها را کاهش می‌دهد. پژوهش حاضر با هدف ارائه و ارزیابی چارچوبی یکپارچه برای خوشه‌بندی مبتنی بر مدل‌های آمیخته چوله و کاهش بعد بر اساس انتخاب متغیر انجام شده است. بدین منظور، ابتدا به معرفی و تحلیل مبانی نظری خوشه‌بندی مدل‌محور و مدل‌های آمیخته متناهی پرداخته شده و محدودیت‌های مدل‌های آمیخته نرمال در مواجهه با داده‌های نامتقارن مورد بررسی قرار گرفته است. در ادامه، تبدیل منلی به‌عنوان رویکردی انعطاف‌پذیر برای کنترل چولگی معرفی شده که با اعمال یک تبدیل نمایی پارامتری، امکان مدل‌سازی چولگی را بر روی اعداد حقیقی فراهم می‌کند. سپس به مسئله انتخاب متغیر می‌پردازد و ضمن مرور دسته‌بندی روش‌های انتخاب متغیر، بر الگوریتم کارای$VCSS$ و نسخه توسعه‌یافته آن تمرکز می‌کند. این الگوریتم با بهره‌گیری از معیار کمینه‌سازی واریانس درون‌خوشه‌ای و کنترل همبستگی بین متغیرها، به شناسایی زیرمجموعه‌ای بهینه از متغیرهای متمایزکننده می‌پردازد. به‌طور کلی، این پژوهش نشان می‌دهد که تلفیق مدل‌سازی چولگی از طریق تبدیل منلی با الگوریتم‌های کارآمد انتخاب متغیر، چارچوبی قدرتمند، انعطاف‌پذیر و تفسیرپذیر برای خوشه‌بندی دقیق داده‌های بعدبالا و پیچیده دنیای واقعی فراهم می‌آورد.