عنوان
|
ارائه یک روش دو مرحله ای برای انتخاب ویژگی در متن مبتنی بر الگوریتم جفت گیری زنبور عسل
|
نوع پژوهش
|
مقاله ارائه شده کنفرانسی
|
کلیدواژهها
|
جفت گیری زنبور عسل - طبقه بندی متن - انتخاب ویژگی
|
چکیده
|
یکی از مشکلات طبقه بندی کننده های اسناد، کار کردن در فضای ویژگی با ابعاد بالا می باشد . انتخاب ویژگی؛ یکی از راه های کاهش تعداد ویژگی های موجود است؛ بدین دلیل که کار کردن با این حجم از فضای ویژگی، هزینه محاسباتی - که تابعی از طول بردار ویژگی ها می باشد- را بالا برده و نیز حذف ویژگی های بی ربط بهره وری را افزایش می دهد. در این مقاله انتخاب و استخراج ویژگی در دو مرحله انجام می شود. در مرحله ی اول به ویژگی ها با استفاده از روش "اطلاعات متقابل" و روش IDF-TF وزن می دهیم و در مرحله ی دوم با استفاده از " الگوریتم جفت گیری زنبورعسل " به انتخاب بردار ویژگی از بین ویژگی های موجود می پردازیم و با دسته بندی کننده ی KNNو همچنین با استفاده از مراکز بدست آمده از خوشه بندی داده های آموزشی با الگوریتم کلونی زنبورعسل به دسته بندی مستندات می پردازیم. نتایج آزمایشات برروی مجموعه داده ای رویترز21578 در متن مقاله آمده است.
|
پژوهشگران
|
مصطفی اعظمی (نفر دوم)، پرهام مرادی دولت آبادی (نفر اول)
|