عنوان
|
یک الگوریتم انتخاب ویژگی برخط در جریان داده ها با استفاده از اطلاعات متقابل چندمتغیره
|
نوع پژوهش
|
مقاله چاپشده در مجلات علمی
|
کلیدواژهها
|
انتخاب ویژگی ، داده های آموزشی برخط ، اطلاعات متقابل ، متغیر تصادفی مشترک
|
چکیده
|
امروزه در بسیاری از مسایل دنیای واقعی همچون شبکه های اجتماعی، با جریان داده مواجه هستیم که در هر لحظه داده جدیدی به مجموعه داده های موجود اضافه می شود. از آنجا که کارایی بیشتر الگوریتم های داده کاوی با افزایش ابعاد داده ها کاهش می یابد، تحلیل این جریان داده ها در سال های اخیر به یکی از مسایل مهم در داده کاوی تبدیل شده است. روش های انتخاب ویژگی در جریان داده های برخط، روش های کارآمدی هستند که با حذف ویژگی های افزونه و نامربوط باعث کاهش ابعاد کلان داده ها و در نتیجه بهبود کارایی الگوریتم ها می شوند. از چالش های اساسی در رابطه با الگوریتم های انتخاب ویژگی برخط، در دسترس نبودن همه داده ها قبل از شروع الگوریتم، مقیاس پذیری، دقت ویژگی های انتخاب شده و اندازه زیرمجموعه انتخابی را می توان نام برد. تا کنون الگوریتم های انتخاب ویژگی موجود تنها توانسته اند بخش محدودی از این چالش ها را به صورت هم زمان مرتفع کنند. به همین منظور در این مقاله یک راهکار انتخاب ویژگی برخط به نام MMIOSFS با استفاده از اطلاعات متقابل ارائه داده ایم که حد واسط بهتری را میان چالش های ذکرشده به دست می آورد. در روش پیشنهادی در ابتدا مجموعه ویژگی ها با استفاده از تکنیک متغیرهای تصادفی توأم به یک ویژگی نگاشت و سپس اطلاعات متقابل ویژگی جدید با برچسب به عنوان میزان ارتباط مجموعه ویژگی های اولیه در نظر گرفته می شود. کارایی روش پیشنهادی با چند الگوریتم انتخاب ویژگی برخط با استفاده از دسته بندهای مختلف مورد ارزیابی قرار گرفته و نتایج به دست آمده نشان می دهد الگوریتم پیشنهادی معمولاً حد واسط بهتری میان چالش ها به دست می آورد.
|
پژوهشگران
|
پرهام مرادی دولت آبادی (نفر دوم)، مریم رحمانی نیا (نفر اول)
|