|
عنوان
|
مدل نویز شده دو جمله ای برای تعیین اعتبار خوشه ها
|
|
نوع پژوهش
|
پایان نامه
|
|
کلیدواژهها
|
اعتبار خوشه بندی ، خوشه بندی ، نزدیکترین همسایگی ، آزمون دو نمونه ، ثبات خوشه
|
|
چکیده
|
امروزه شاهد تولید حجم عظیمی از دادهها در دنیای مدرن هستیم و یکی از علوم بسیار استراتژیک حائز اهمیت در دنیای دادهها علم داده کاوی است. از تکنیک های پر کاربرد داده کاوی میتوان به خوشه بندی اشاره کرد. خوشه بندی یک تابع کاوشی نظارت نشده ی داده کاوی به منظور کشف گروه بندی طبیعی درون دادههاست معمولا الگوریتمهای مختلف خوشه بندی نیازمند پارامتری به نام تعداد خوشهها هستند و تعیین تعداد بهینه آنها برای ارزیابی الگوریتمها به کار میرود . برای تعیین تعداد خوشهها سه روش شامل آزمون فرض، معیارهای داخلی و معیارهای خارجی وجود دارد که هر کدام دارای شاخصهای متعددی است و بدین منظور در کار پژوهشی حاضر، از مدل نویز شده دو جمله ای استفاده شده است . این پایان نامه در چهار فصل جداگانه جمع آوری شده است که در فصل اول مفاهیم وتعاریف اولیه، در فصل دوم خوشه بندی و انواع الگوریتمهای آن در نرم افزار R و در فصل سوم به تحلیل مدل نویز شده دو جمله ای و یک مثال عددی با استفاده از این مدل میپردازیم.
|
|
پژوهشگران
|
حسین بیورانی (Hossein Bevrani) (استاد راهنما)، سمیه صمدی (دانشجو)، جعفر احمدی شالی (استاد مشاور)
|