مشخصات پژوهش

صفحه نخست /تشخیص و آنالیز داده‌های موثر ...
عنوان تشخیص و آنالیز داده‌های موثر برای رگرسیون ابعاد بالا
نوع پژوهش پایان نامه
کلیدواژه‌ها داده‌های ابعاد بالا، انتخاب مدل، معیارهای تشخیصی تاثیر، درستنمایی تاوانیده
چکیده در دسترس بودن داده‌های با ابعاد بالا که در آن تعداد متغیرها به‌طور قابل ‌ملاحظه‌ای بیشتر از تعداد مشاهدات است، اکنون در بسیاری از زمینه‌های علمی به ویژه ژنومیکس و زیست‌شناسی مولکولی رایج است. اغلب در آنالیز داده‌های ابعاد بالا فرض می‌شود تعداد متغیرهایی که در اصل با پاسخ مورد نظر مرتبط هستند، کم است. بررسی در مورد این تعداد کم از متغیرهای مهم به اهمیت روش‌های انتخاب مدل در محیط‌‌های ابعاد بالا تأکید کرده است. استفاده از روش‌های درستنمایی تاوانیده با تکثیر مجموعه داده‌های ابعاد بالا گسترش یافته است. با این وجود، هنگامی که تعداد مشاهدات در مقایسه با تعداد متغیرهای کمکی نسبتاً کم است، هر مشاهده‌ای به‌طور بالقوه می‌تواند تأثیر بسزایی روی انتخاب مدل و استنباط داشته باشد. از این رو، تشخیص مشاهدات موثر در روش‌های تاوانیده مهم است. در این پایان‌نامه، معیارهای تأثیر رگرسیون لاسو برای اندازه‌گیری تأثیر یک مشاهده روی مولفه انتخاب مدل رگرسیون برازش شده معرفی می‌شوند. همچنین، این معیارها تحت روش الاستیک‌نت برای شناسایی مشاهدات موثر در داده‌های ابعاد بالا مورد مطالعه قرار می‌گیرند. روش الاستیک‌نت برای بهبود پیش‌بینی‌های مدل، ویژگی حذف از لاسو و کاهش ضرایب از مدل ریج را ترکیب می‌کند. از طریق شبیه‌سازی و مجموعه داده‌های واقعی نشان می‌دهیم که معیارهای تأثیر معرفی شده به‌طور کارآمد مشاهدات موثر را شناسایی می‌کنند و می‌توانند به آشکارسازی روابط پنهان در داده‌ها کمک کنند.
پژوهشگران حسین بیورانی (Hossein Bevrani) (استاد راهنما)، نسرین نوری (دانشجو)، رضا عربی بلاغی (استاد مشاور)