مشخصات پژوهش

صفحه نخست /تشخیص جوامع با خوشه‌بندی طیفی ...
عنوان تشخیص جوامع با خوشه‌بندی طیفی تقریبی مبتنی بر چگالی در شبکه‌های دارای مشخصه
نوع پژوهش پایان نامه
کلیدواژه‌ها تشخیص‌جامعه، خوشه‌بندی طیفی، ماتریس شباهت، فاصله حساس به چگالی، کاهش نقاط داده، خوشه‌بندی طیفی تقریبی، شبکه‌های دارای مشخصه، ساختار توپولوژیکی.
چکیده مسئله تشخیص جوامع در شبکه‌ها یکی از مسائل مهم علم شبکه بوده و مطالعات گسترده‌ای در این خصوص صورت گرفته است. مفهوم جامعه را می‌توان در شبکه‌های بسیاری از جمله شبکه‌های بیولوژیکی، علوم کامپیوتر،مهندسی، اقتصاد ،سیاست و .... مشاهده کرد. خوشه‌بندی، اشیاء را با توجه به شباهت بین اشیاء به چندین گروه تقسیم می‌کند. با توجه به استراتژی‌های مختلف، روش‌های مختلفی پیشنهاد شده‌است.در میان همه الگوریتم‌های تشخیص جامعه ، خوشه‌بندی طیفی به عنوان یک رقیب قدرتمند به نسبت سایر روش‌های خوشه-بندی به دلیل اجرای آسان و دقت بالا برای اکثر شبکه‌های پیچیده محسوب می‌شود. این روش براساس ویژگی-های طیفی گراف است و بر روی بردارهای ویژه ماتریس لاپلاسین تمرکز دارد. مزیت خوشه‌بندی طیفی این است که محدودیت خاصی در مورد شکل خوشه‌ها ندارد و به دلیل عملکرد خوبی که به نسبت الگوریتم‌های خوشه‌بندی پایه مانندk-means درکشف خوشه‌های غیر محدب و با ویژگی‌های مختلف دارد، به طور گسترده‌ای در حوزه‌های مختلف استفاده می‌شود. با این حال از معایب این روش می‌توان به هزینه‌های محاسباتی بالا، نتایج خوشه‌بندی ناپایدار وعدم مقاومت در مقابل نویز اشاره کرد. در این پژوهش جهت استفاده از مزایای خوشه‌بندی طیفی در مجموعه داده‌های بزرگ از روش‌ خوشه‌بندی طیفی تقریبی، که در آن خوشه‌بندی طیفی را بر روی مجموعه کاهش‌یافته از نقاط ( نمایندگان داده‌ها) انتخاب‌شده با نمونه‌برداری یا کمی سازی اعمال می‌کنیم و در نهایت نتایج به کل داده ها تعمیم داده می شود. مراحل اصلی خوشه‌بندی طیفی شامل محاسبه ماتریس شباهت، به دست آوردن نمایش‌های جدید از مجموعه داده‌ها با روش تجزیه ویژه وتقسیم پارامترهای جدید با الگوریتم خوشه‌بندی k-means برای به دست آوردن برچسب‌های خوشه می‌باشد. الگوریتم‌های خوشه‌بندی طیفی بر تحلیل ماتریس شباهت تکیه دارند، از این رو، تعریف یک ماتریس مناسب تاثیر زیادی بر بهبود عملکرد این نوع از خوشه‌بندی دارد، زیرا رابطه بین اجسام را حفظ می‌کند. ماتریس شباهت روش پایه‌ای خوشه بندی طیفی مبتنی بر فاصله اقلیدسی می‌باشد و این نوع شباهت نمی‌تواند توزیع داده‌ها را به خوبی نشان دهد و در نتیجه منجر به عملکرد ضعیف خوشه‌بندی طیفی می‌شود. همچنین این ماتریس تنها برا ساس خصیصه‌های توپولوژیکی ساخته شده است حال آنکه در شبکه‌های دارای ویژگی هر دو ساختار توپولوژیکی و ویژگی گره، ویژگیهایی مهم در تشخیص جامعه هستند و عملکرد خوشه‌بندی طیفی تا حد زیادی به خوبی ماتریس شباهت بستگی دارد. از این رو در این مطالعه نسخه جدیدی به نام خوشه‌بندی طیفی درشبکه های دارای ویژگی به کار می‌رود که جوامع شناسایی‌شده دارای پیوستگی ساختاری و همگنی ویژگی بوده و همچنین بر اساس یک نوع فاصله حساس به چگالی به جای فاصله اقلیدسی می‌باشد. در فاصله جدید حساس به چگالی می‌توانیم فاصله را در مناطق با چگالی متفاوت تنظیم کنیم و سپس با اندازه‌گیری فاصله حساس به چگالی می‌توانیم شباهت جدیدی را تعریف کنیم. برای اجتناب از مقداردهی تصادفی مراکز، از گراف تصمیم استفاده می‌شود تا به مراکز و تعداد خوشه ها دست پیدا کنیم. برای افزایش کارایی تعداد خوشه‌ها از طریق گراف تصمیم تعیین شده است. واژه‌های کلیدی: تشخیص‌جامعه، خوشه‌بندی طیفی، ماتریس شباهت، فاصله حساس به چگالی، کاهش نقاط داده، خوشه‌بندی طیفی تقریبی، شبکه‌های دارای مشخصه، ساختار توپولوژیکی
پژوهشگران روجیار پیرمحمدیانی (استاد راهنما)، گلاله مظفری (دانشجو)