عنوان
|
انتخاب ویژگی در متن با استفاده از یک روش بهینه سازی ترکیبی
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
دسته بندی متن، انتخاب ویژگی، الگوریتم بهینه سازی کلونی مورچه ها، الگوریتم ژنتیک، اندازه گیری فازی، بهره اطلاعات
|
چکیده
|
دسته بندی متن نقش مهمی را در مدیریت اطلاعات ایفا می کند. به دلیل افزایش حجم اطلاعات موجود در اینترنت، دسته بندی خودکار متن ها بسیار مورد توجه قرار گرفته شده است. یکی از مشکلات دسته بندی متن، ابعاد بالای فضای ویژگی است. اغلب ویژگی ها نامربوط و زائد هستند و بر کارایی دسته بندی کننده تاثیر منفی می گذارند. ازاینرو، انتخاب ویژگی برای کاهش فضای ویژگی و افزایش کارایی دسته بندی متن به کار می رود. در این پژوهش یک روش سه مرحله ای برای انتخاب ویژگی در دسته بندی متن ارائه شده است. در ابتدا یک روش فیلترینگ با استفاده از معیار آنتروپی فازی یا بهره اطلاعات اعمال می شود و ویژگی ها بر مبنای مقداری که دارند، رتبه بندی می شوند. اگر در گام اول روش آنتروپی فازی استفاده شود، ویژگی هایی که بیشترین مقدار و هرگاه روش بهره اطلاعات بکار رود، ویژگی هایی که کمترین مقدار را دارند از مجموعه ویژگی ها حذف می شوند. سپس در گام دوم، الگوریتم بهینه سازی کلونی مورچه ها برای انتخاب ویژگی هایی که در گام اول حذف نشده اند، اعمال می شود. در گام آخر الگوریتم ژنتیک برای کاهش ابعاد ویژگی هایی که توسط الگوریتم بهینه سازی کلونی مورچه ها بدست آمده است، مورد استفاده قرار می گیرد. در این پژوهش از یک دسته بندی کننده نزدیکترین همسایگی برای دسته بندی 10 کلاس برتر رویترز 21578 استفاده شده است و نتایج بدست آمده نشان دهنده کارایی روش ارائه شده می باشد.
|
پژوهشگران
|
فردین احمدی زر (استاد راهنما)، مجید همتی (دانشجو)، پرهام مرادی دولت آبادی (استاد مشاور)
|