عنوان
|
یک راهکار ترکیبی بدون ناظر برای انتخاب ویژگی در متن با استفاده از الگوریتم های بهینه سازی مبتنی بر جمعیت
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
انتخاب ویژگی، کاهش ابعاد، طبقه بندی متن، راهکار چند متغیره، الگوریتم بهینه سازی چند هدفه.
|
چکیده
|
با پیشرفت روزافزون فناوری اینترنت، تعداد اسناد الکترونیکی به طور چشم گیری افزایش یافته است. دسته بندی متن، نقش مهمی برای مقابله با این حجم عظیم از داده ها را دارد. یکی از مشکلات دسته بندی متن، ابعاد بالای فضای ویژگی است. در مجموعه های داده ای با ابعاد بالا، بسیاری از ویژگی ها، نامناسب و دارای افزونگی می باشند و می توانند تاثیر منفی بر روی عملکرد سیستم طبقه بندی داشته باشند. انتخاب ویژگی یک راهکارمهم برای غلبه بر این مشکل است که هدف آن، انتخاب زیرمجموعه ای از ویژگی های مناسب از بین مجموعه ویژگی های اولیه است. از این رو، راهکار انتخاب ویژگی با کاهش ابعاد مسئله، سبب کاهش پیچیدگی محاسباتی و افزایش قابلیت تعمیم الگوریتم طبقه بندی می شود. در این پایان نامه، سه روش انتخاب ویژگی جدید ارائه می شود. در روش پیشنهادی اول، بر انتخاب ویژگی با استفاده از مفهوم کمترین افزونگی بین ویژگی ها و بیشترین ارتباط با کلاس هدف در دسته بندی متن تمرکز دارد. در این روش، ویژگی های نامناسب و دارای افزونگی به طور موثر حذف می شوند، اما به دلیل انتخاب حریصانه ویژگی ها در فرآیند انتخاب ویژگی راه حل های محلی تولید می کند. با در نظر گرفتن این ضعف، در راهکار پیشنهادی دوم، یک الگوریتم چند هدفه مبتنی بر اطلاعات متقابل با هدف کاهش افزونگی بین ویژگی ها و افزایش ارتباط با کلاس ارائه شده است. روش پیشنهادی سوم براساس روش پیشنهادی اول ارائه شده است. در روش پیشنهادی سوم، با به کار بردن معیار های ارتباط و افزونگی روش اول در یک الگوریتم تکاملی چندهدفه، سعی در انتخاب بهترین ویژگی ها دارد. مزیت عمده روش های پیشنهادی دوم و سوم، استفاده از الگوریتم های تکاملی چند هدفه در فرآیند انتخاب ویژگی می باشد. عملکرد روش های پیشنهادی با چندین روش انتخاب ویژگی، بر روی طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایشات کارایی روش های پیشنهادی و بهبود روش های انتخاب ویژگی قبلی را نشان می دهد.
|
پژوهشگران
|
فردین احمدی زر (استاد مشاور)، پرهام مرادی دولت آبادی (استاد راهنما)، مهدیه لبنی (دانشجو)
|