امروزه شاهد تولید حجم عظیمی از دادهها در دنیای مدرن هستیم و یکی از علوم بسیار استراتژیک حائز اهمیت در دنیای دادهها علم داده کاوی است. از تکنیک های پر کاربرد داده کاوی میتوان به خوشه بندی اشاره کرد. خوشه بندی یک تابع کاوشی نظارت نشده ی داده کاوی به منظور کشف گروه بندی طبیعی درون دادههاست معمولا الگوریتمهای مختلف خوشه بندی نیازمند پارامتری به نام تعداد خوشهها هستند و تعیین تعداد بهینه آنها برای ارزیابی الگوریتمها به کار میرود . برای تعیین تعداد خوشهها سه روش شامل آزمون فرض، معیارهای داخلی و معیارهای خارجی وجود دارد که هر کدام دارای شاخصهای متعددی است و بدین منظور در کار پژوهشی حاضر، از مدل نویز شده دو جمله ای استفاده شده است . این پایان نامه در چهار فصل جداگانه جمع آوری شده است که در فصل اول مفاهیم وتعاریف اولیه، در فصل دوم خوشه بندی و انواع الگوریتمهای آن در نرم افزار R و در فصل سوم به تحلیل مدل نویز شده دو جمله ای و یک مثال عددی با استفاده از این مدل میپردازیم.