مشخصات پژوهش

صفحه نخست /مدل نویز شده دو جمله ای برای ...
عنوان مدل نویز شده دو جمله ای برای تعیین اعتبار خوشه ها
نوع پژوهش پایان نامه
کلیدواژه‌ها اعتبار خوشه بندی ، خوشه بندی ، نزدیکترین همسایگی ، آزمون دو نمونه ، ثبات خوشه
چکیده امروزه شاهد تولید حجم عظیمی از داده‌ها در دنیای مدرن هستیم و یکی از علوم بسیار استراتژیک حائز اهمیت در دنیای داده‌ها علم داده کاوی است. از تکنیک های پر کاربرد داده کاوی می‌توان به خوشه بندی اشاره کرد. خوشه بندی یک تابع کاوشی نظارت نشده ی داده کاوی به منظور کشف گروه بندی طبیعی درون داده‌هاست معمولا الگوریتم‌های مختلف خوشه بندی نیازمند پارامتری به نام تعداد خوشه‌ها هستند و تعیین تعداد بهینه آن‌ها برای ارزیابی الگوریتم‌ها به کار می‌رود . برای تعیین تعداد خوشه‌ها سه روش شامل آزمون فرض، معیار‌های داخلی و معیار‌های خارجی وجود دارد که هر کدام دارای شاخص‌های متعددی است و بدین منظور در کار پژوهشی حاضر، از مدل نویز شده دو جمله ای استفاده شده است . این پایان نامه در چهار فصل جداگانه جمع آوری شده است که در فصل اول مفاهیم وتعاریف اولیه، در فصل دوم خوشه بندی و انواع الگوریتم‌های آن در نرم افزار R و در فصل سوم به تحلیل مدل نویز شده دو جمله ای و یک مثال عددی با استفاده از این مدل می‌پردازیم.
پژوهشگران حسین بیورانی (Hossein Bevrani) (استاد راهنما)، سمیه صمدی (دانشجو)، جعفر احمدی شالی (استاد مشاور)