انقلاب آموزشی در فضای دیجیتال با ظهور دورههای آنلاین باز گسترده (MOOCs) به مرحله جدیدی وارد شده است. این پدیده، که در سالهای اخیر رشد چشمگیری داشته، با چالشهایی مانند نرخ بالای افت تحصیلی و درصد پایین تکمیل دورهها مواجه است. پژوهش حاضر به بررسی روشهای نوین تحلیل و طبقهبندی دادههای آموزشی برای پیشبینی انصراف از تحصیل دانشجویان میپردازد. دادههای مرتبط با آموزش آنلاین شامل اطلاعات تعاملی، پیشرفت تحصیلی و محتوای دیجیتال هستند که به تحلیل کیفیت و اثربخشی مواد آموزشی کمک میکنند. مجموعه دادههای مورد استفاده از سیستم مدیریت یادگیری دانشگاه به دست آمده و شامل اطلاعات تحصیلی و رفتاری دانشجویان است. این پژوهش دقت پیشبینی را در میان دانشجویان در معرض خطر انصراف و دانشجویانی که به تحصیل ادامه میدهند، بررسی میکند. استفاده از روشهای نوین تحلیل دادهها میتواند دقت پیشبینی را بهبود بخشد. در این پژوهش، ابتدا سامانه و دادههای آموزشی آنلاین معرفی میشوند و سپس به دادهکاوی آموزشی و مسئله انصراف از تحصیل دانشجویان پرداخته میشود. اهمیت تشخیص زودهنگام دانشجویان در معرض انصراف مورد بحث قرار گرفته و دادهها به گراف تبدیل میشوند تا روابط و الگوهای پیچیده تحلیل شوند. ویژگیهای گرافی مؤثر برای ارائه اطلاعات درباره الگوهای رفتاری و تحصیلی دانشجویان استخراج میشوند. برای پیشبینی انصراف از تحصیل، سه روش بررسی شده است. در روش اول، از دادههای Harvard and MIT با ۲۲ ویژگی، ۶ ویژگی جدید استخراج شده است. در روش دوم، دادههای KDDCup با ۱۵ ویژگی و ۵ ویژگی محلی جدید بررسی شدهاند. در روش سوم، با تبدیل دادهها به دو مجموعه مجزا، ۵ ویژگی محلی و ۵ ویژگی سراسری جدید استخراج گردیده است. در نهایت، با معیارهای مختلف طبقهبندی، دانشجویان در معرض انصراف شناسایی میشوند و این رویکرد میتواند به شناسایی دقیقتر دانشجویان در خطر و مداخلات بهموقع کمک کند. نتایج این پژوهش نشاندهنده تأثیر مثبت رویکرد مبتنی بر گراف در تحلیل دادههای آموزشی و بهبود دقت پیشبینی انصراف از تحصیل دانشجویان است. این روش کارآمدتر از روشهای سنتی بوده و به مؤسسات آموزشی در شناسایی سریعتر دانشجویان در معرض خطر و اتخاذ اقدامات پیشگیرانه کمک میکند. ساختار گراف امکان بررسی روابط پیچیده بین ویژگیهای آموزشی را فراهم کرده و ویژگیهای مؤثرتر را استخراج میکند. در روش پیشنهادی اول، معیار InfoMap بهترین عملکرد را داشت. روش دوم دقت پیشبینی را 5.33 درصد و روش سوم دقت را 6.04 درصد بهبود بخشید و به دقت 100 درصد رسید. این یافتهها نشان میدهد که استخراج و ترکیب ویژگیهای مناسب میتواند دقت پیشبینی انصراف از تحصیل در MOOCs را به طور قابل توجهی افزایش دهد. این پژوهش با وجود نتایج مثبت، دارای محدودیتهایی نیز میباشد. یکی از چالشهای اصلی، دشواری در مدیریت و پردازش مجموعه دادههای بزرگ است که میتواند فرآیند تحلیل را زمانبر کند. برای غلبه بر این محدودیت، میتوان از روشهای گرافهای عمیق استفاده کرد که امکان تحلیل سریعتر و کارآمدتر دادهها را فراهم میکنند. در کارهای آینده، میتوان از روشهای پیشرفته تشخیص اجتماع برای استخراج ویژگیهای متعدد بهره برد و یا از کدگذاریهای مختلف برای استخراج ویژگیها استفاده کرد. این رویکردها نه تنها میتوانند به افزایش کارایی در پردازش دادههای حجیم کمک کنند، بلکه امکان کشف الگوهای پنهان و پیچیدهتر در دادههای آموزشی را نیز فراهم میآورند، که میتواند منجر به پیشبینیهای دقیقتر و جامعتر در زمینه انصراف از تحصیل دانشجویان شود.