عنوان
|
طبقه بندی ترافیک شبکه با استفاده از الگوریتم های یادگیری ماشین
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
ترافیک شبکه، طبقه بندی ترافیک شبکه، الگوریتم جنگل تصادفی بهبودیافته، یادگیری ماشین.
|
چکیده
|
در سال های اخیر با رشد سریع تعدادکاربران اینترنت و ظهور برنامه های جدید، ترافیک اینترنت به شدت در حال رشد است. در نتیجه، مسئله شناسایی برنامه های روی شبکه به یک کار پیچیده تبدیل شده است. تشخیص و طبقه بندی جریان ها و برنامه ها روی ترافیک شبکه اینترنت نقش مهمی در امنیت و مدیریت شبکه دارد. به طور سنتی، تکنیک های طبقه بندی ترافیک به بازرسی مستقیم بسته های جریان وابسته هستند؛ مانند روش های مبتنی بر شماره های پورت شناخته شده و روش های بازرسی Payload. این روش ها محدودیت های بزرگی مانند استفاده از شماره پورت پویا به جای شماره پورت شناخته شده در روش مبتنی بر شماره پورت و Payload رمزگذاری شده در روش مبتنی بر بازرسی Payload دارند. تکنیک بعدی برای طبقه بندی جریان های ترافیک اینترنت، روش مبتنی بر رفتار میزبان های شبکه است. این روش به دلیل اینکه فرض می کند در هر لحظه تنها یک برنامه روی هر میزبان شبکه در حال اجرا است، ضعف بزرگی در طبقه بندی برنامه ها دارد. اخیرا، با توجه به محدودیت های روش های قبلی، از الگوریتم های یادگیری ماشین به منظور بهبود دقت طبقه بندی جریان های ترافیک اینترنت، استفاده شده است. الگوریتم های یادگیری ماشین با استفاده از اطلاعات آماری جریان ها روی بسته ها، توانایی بالایی در دسته بندی جریان های ترافیک اینترنت دارند. در اینجا، ما الگوریتم یادگیری ماشین جنگل تصادفی بهبودیافته که جزء الگوریتم های یادگیری تحت نظارت است را برای طبقه بندی برنامه های ترافیک اینترنت پیشنهاد کرده ایم. الگوریتم جنگل تصادفی بهبودیافته، یک طبقه بند گروهی است با مجموعه ای از درختان تصمیم که توسط مجموعه داده های تصادفی انتخاب شده، رشد می کنند. برای ارزیابی روش پیشنهادی از شش طبقه بند دیگر یادگیری ماشین شامل: الگوریتم شبکه عصبی چندلایه، ماشین بردار پشتیبان، درخت تصمیمC4.5، الگوریتم نزدیکترین همسایه، بیز ساده و جنگل تصادفی ساده برای مقایسه استفاده کرده ایم. عملکرد روش پیشنهادی را از نظر معیارهای ارزیابی مختلف مورد بررسی قرار دادیم. نتایج آزمایشات بر روی مجموعه داده جریان های ترافیک واقعی UNIBS نشان می دهد که روش پیشنهادی عملکرد بهتری نسبت به سایر الگوریتم ها ارائه می دهد و دقت طبقه بندی آن روی هرکدام از برنامه های مجموعه داده نسبت به سایر الگوریتم ها بالاتر است و میانگین دقت طبقه بندی روی همه ی
|
پژوهشگران
|
علیرضا عبداله پوری (استاد راهنما)، زهره امینی (دانشجو)
|