مشخصات پژوهش

صفحه نخست /ارائه یک الگوریتم بهینه سازی ...
عنوان ارائه یک الگوریتم بهینه سازی ترکیبی کارآمد مبتنی بر جستجوی نیمه محلی برای مسأله انتخاب ویژگی
نوع پژوهش پایان نامه
کلیدواژه‌ها انتخاب ویژگی، طبقه بندی، جستجوی زیرفضا، ژنتیک بهبود یافته، بهینهسازی گروه ذرات، شبیه سازی تبرید
چکیده گسترش مجموعه داده ها با ابعاد بسیار بالا، روش های کاهش بعد را به یک امر حیاتی برای پردازش و تحلیل داده ها در داده کاوی و شناسایی آماری الگو تبدیل کرده است. از روش های رایج کاهش بعد انتخاب ویژگی می باشد. انتخاب ویژگی بدلیل قابلیت تشخیص ویژگی های متمایز کننده و ویژگی های حاوی اطلاعات تکراری درمجموعه داده ها مورد توجه قرار گرفته است. تکنیک های انتخاب ویژگی با کاهش زمان محاسباتی، افزایش دقت پیش بینی و ایجاد درک بهتری از داده ها عامل اصلی بهبود در کاربردهای یادگیری ماشین می شوند. در میان روش های متنوع ارائه شده برای حل مسأله انتخاب ویژگی، جستجوهای بهینه سازی مانند الگوریتم های تکاملی و فرا اکتشافی برای بدست آوردن زیرمجوعه بهینه یا نزدیک به بهینه از ویژگی ها نسبتا موفق بوده و مورد استفاده گرفته اند. در این پایان نامه یک روش انتخاب ویژگی جدید مبتنی بر ترکیب الگوریتم ژنتیک بهبود یافته و یک الگوریتم جستجوی محلی ارائه می شود. در این روش، فضای جستجو توسط الگوریتم ژنتیک به زیرفضاهای ناپیوسته تقسیم می شود. جستجو در این زیرفضاها توسط یک الگوریتم جستجوی دیگر صورت می پذیرد. در الگوریتم پیشنهادی اول از شبیه سازی تبرید برای جستجوی محلی اعمال شده است. در مجموعه داده ها با ابعاد بالا تعداد نقاط مورد جستجو افزایش می یابد. بنابراین، در الگوریتم پیشنهادی دوم از الگوریتم بهینه سازی گروه ذرات به منظور جستجوی نیمه محلی استفاده می شود. این الگوریتم بدلیل قابل تنظیم بودن تعداد ذرات برای جستجو متناسب با ابعاد زیرفضاها باعث افزایش دقت پیش بینی می شود. پس از جستجو و مشخص کردن مقدار برازندگی زیرفضاها، عملگر های تطبیق یافته الگوریتم ژنتیک برای تکامل زیر فضاها بکار گرفته می شوند. به عبارت دیگر، جستجوی نقطه به نقطه به جستجوی زیرمجموعه ای از نقاط و حرکت به زیرمجموعه بهتری از نقاط تبدیل شده است. مزیت قابل توجه این روش قابلیت انعطاف پذیری و ایجاد تعادل میان جستجوی سراسری و جستجوی محلی می-باشد. لذا، الگوریتم پیشنهادی علاوه بر افزایش سرعت همگرایی در دام بهینه محلی نیز گیر نمی کند. برای ارزیابی، روش پیشنهادی با روش های شناخته شده و جدید بر روی 16 مجموعه داده با ابعاد متفاوت و طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایشات تجربی برتری این روش نسبت به سایر روش ها از نظر دقت عملکرد و تعداد ویژگی های انتخاب شده را نشان می دهد. روش پیشنهادی از نظر پایداری نیز در دسته روش های برتر قرار می گیرد.
پژوهشگران فردین اخلاقیان طاب (استاد راهنما)، مهسا محمدی (دانشجو)