دیابت بهعنوان یک اختلال مزمن متابولیک، بارهای قابلتوجهی بر سلامت و اقتصاد جهانی تحمیل میکند. تشخیص زودهنگام و دقیق برای مدیریت مؤثر و پیشگیری از عوارض ناشی از این بیماری ضروری است. روشهای سنتی تشخیص که بر پارامترهای بالینی متکی هستند، اغلب با محدودیتهایی همچون طولانی بودن فرآیند و احتمال خطا مواجهاند. پیشرفتهای اخیر در حوزه یادگیری ماشین گزینههای امیدبخشی برای تحلیل دادههای پزشکی و بهبود دقت تشخیص فراهم کرده است. با این حال، مدلهای یادگیری ماشین با چالشهایی در مدلسازی روابط پیچیدهتر بین عوامل مرتبط با دیابت روبرو هستند. این پایاننامه به بررسی پتانسیل روشهای مبتنی بر گراف در کنار یادگیری ماشین برای بهبود تشخیص دیابت میپردازد. روشهای مبتنی بر گراف چارچوبی قدرتمند برای نمایش و تحلیل روابط پیچیده بین نمونهها فراهم میکنند و امکان شناسایی الگوهای پنهان را مهیا میسازند. در این پژوهش، دادههای مربوط به مجموعه دادهای شامل 768 نمونه و 9 ویژگی، مورد استفاده قرار گرفته است. به منظور ساخت گراف، ابتدا میزان شباهت بین هر جفت نمونه مجموعه داده با استفاده از معیار شباهت فاصله اقلیدسی محاسبه شد و سپس گرافهای وزندار و بدون جهت در دو سطح آستانه 0.01 و 0.004 ایجاد گردیدند. گراف حاصل در آستانه 0.01 شامل 26,130 یال و در آستانه 0.004 شامل 87,250 یال بود که روابط معنادار بین نمونهها را نشان میدهد. پس از ساخت گراف، مجموعهای از ویژگیهای مبتنی بر گراف ازجمله مرکزیت درجه، مرکزیت نزدیکی، و چندین معیار دیگر، استخراج شدند که در کنار ویژگیهای اصلی و اولیه دادهها، برای آموزش مدلهای یادگیری ماشین استفاده شد. در این پژوهش از چندین مدل یادگیری ماشین، شامل طبقهبندهای سنتی و مبتنی بر گروهبندی، استفاده شده است. همچنین، آزمایشها با استفاده از معیارهایی نظیر دقت، بازیابی، صحت و امتیاز F1 و AUC ارزیابی شدند. نتایج نشان داد که ترکیب ویژگیهای گرافی با الگوریتمهای یادگیری ماشین بهطور قابلتوجهی دقت تشخیص را بهبود میبخشد. مدل پیشنهادی توانست در هر دو آستانه بررسی شده، با الگوریتمهای تقویت گرادیان و پرسپترون چندلایه به ترتیب به دقتهای %98.51 و %99.07 درصد دست یابد که برتری قابلتوجهی را نسبت به رویکردهای مبتنی بر ویژگیهای اصلی داده نشان میدهد. این یافتهها نشان میدهند که روشهای مبتنی بر گراف در به همراه الگوریتمهای یادگیری ماشین، با شناسایی روابط پنهان و افزایش دقت تشخیص، میتوانند در تحلیل دادههای مورد استفاده مؤثر واقع شوند.