عنوان
|
ارائه راهکارهای مبتنی بر خوشه بندی گراف برای انتخاب ویژگی
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
انتخاب ویژگی، راهکار پوششی، راهکار فیلتر، الگوریتم ژنتیک، الگوریتم بهینه سازی کلونی مورچه ها، شبکه های اجتماعی، خوشه بندی گراف، تشخیص جوامع، مرکزیت گره.
|
چکیده
|
با پیشرفت های به وجود آمده در جمع آوری داده و قابلیت های ذخیره سازی در طی دهه های اخیر مجموعه های داده ای با ابعاد بالا در علوم مختلف به سرعت در حال افزایش هستند. بسیاری از این مجموعه های داده ای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگی ها اغلب نامرتبط و دارای افزونگی هستند که منجر به کاهش عملکرد الگوریتم های طبقه بندی می شوند. ازاین رو انتخاب ویژگی، برای کاهش ابعاد مسئله و افزایش کارای الگوریتم های طبقه بندی پیشنهادشده است. انتخاب ویژگی از دو جهت سبب بهبود الگوریتم طبقه بندی می شوند. ازیک طرف با کاهش ابعاد مسئله پیچیدگی محاسباتی کاهش پیدا می کند و از طرف دیگر، قابلیت تعمیم الگوریتم یادگیری افزایش پیدا می کند و احتمال بیش برازش کاهش می یابد. در این پایان نامه سه روش انتخاب ویژگی با استفاده از خوشه بندی گراف ارائه می شود. درروش پیشنهادی اول، در ابتدا با استفاده از یک الگوریتم تشخیص جوامع ویژگی های اولیه به تعدادی خوشه، دسته بندی می شوند. سپس، با به کارگیری الگوریتم ژنتیک و با استفاده از الگوریتم طبقه بندی KNN یک روش انتخاب ویژگی مبتنی بر راهکار پوششی ارائه می شود. در این روش، ویژگی های نامرتبط و دارای افزونگی به طور مؤثر حذف می شوند اما به دلیل استفاده از الگوریتم طبقه بندی در طی فرآیند انتخاب ویژگی این روش دارای پیچیدگی محاسباتی بالایی برای مجموعه های داده ای با ابعاد بالا است. با در نظر گرفتن این ضعف، درروش پیشنهادی دوم با استفاده از الگوریتم بهینه سازی کلونی مورچه ها یک روش مبتنی بر راهکار فیلتر راهکار فیلتر ارائه شده است که باوجود کاهش پیچیدگی محاسباتی، کیفیت ویژگی های انتخاب شده همچنان حفظ شده است. درنهایت درروش پیشنهادی سوم با ترکیب دو تکنیک خوشه بندی گراف و مرکزیت گره یک روش انتخاب ویژگی مبتنی بر راهکار فیلتر ارائه شده است که می تواند در هر دو حالت بدون ناظر و با ناظر ویژگی های نهایی را انتخاب کند. عملکرد روش های پیشنهادی با شناخته شده ترین و جدیدترین روش های انتخاب ویژگی، بر روی طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایش ها نشان داد که روش های پیشنهادی هم از نظر زمان اجرا و هم از نظر دقت طبقه بندی دارای عملکرد مناسب هستند.
|
پژوهشگران
|
پرهام مرادی دولت آبادی (استاد راهنما)، مهرداد رستمی (دانشجو)
|