در سال های اخیر، نرخ تولید داده افزایش چشم گیری داشته است. از دلایل این امر می توان به توسعه ابزارهای دیجیتال و دستگاه های ذخیره سازی، استفاده روز افزون از ابزار های دیجیتال همچون تلفن های همراه و رایانه های شخصی، ظهور و پیدایش سیستم ها و نرم افزار های ارتباطی جدید نظیر شبکه های اجتماعی، علاقمندی سازمان ها و شرکت ها به ذخیره سازی و استخراج اطلاعات مفید از میان حجم عظیمی از داده ها و از این قبیل، اشاره نمود. این حجم از داده تولید شده به حدی زیاد است که چالش های جدیدی را برای محققان علوم داده بوجود آورده است و باعث شکل گیری مفهوم جدیدی به نام داده های کلان گردیده است. تجزیه و تحلیل و استخراج دانش مفید از این حجم عظیم داده، با تکنولوژی ها و روش های موجود کنونی بسیار مشکل و در برخی موارد غیرممکن است. در این تحقیق سعی شده است که با اولویت بندی سریع داده ها به لحاظ اهمیت و خلاصه سازی و حذف داده های زائد و کم اهمیت و تاکید بر داده های ارزشمند، باغلبه بر چالش های موجود سر راه پردازش داده های کلان، روشی جدید و سریع برای طبقه بندی این قبیل از داده ها ارائه گردد.