پیشرفتهای بوجود آمده در جمعآوری دادهها و قابلیتهای ذخیرهسازی در طی دهههای اخیر باعث شده در بسیاری از علوم با حجم بزرگی از اطلاعات روبرو شویم. محققان در زمینههای مختلف مانند مهندسی، اقتصاد، ستارهشناسی و زیست شناسی هر روز با مشاهدات بیشتر و بیشتری روبرو میشوند. در مقایسه با بسترهای دادهای قدیمی و کوچکتر، بسترهای دادهای امروزی چالشهای جدیدی در تحلیل دادهها بوجود آوردهاند. روشهای آماری سنتی به دو دلیل امروزه کارائی خود را از دست دادهاند. علت اول افزایش تعداد مشاهدات است، و علت دوم که از اهمیت بالاتری برخوردار است، افزایش تعداد متغیرهای مربوط به یک مشاهده میباشد. مراکز و دانشکدههای دانشگاه فنی و حرفهای سالانه حجم زیادی از دادهها را تولید میکنند که بایستی روی این دادهها تحلیل لازم انجام شود. در این مقاله با استفاده از تکنیکهای مختلف دادهکاوی، مراکز فنی و حرفهای را طبقهبندی و بهترین روش انتخاب و انجام میشود.