عنوان
|
اکتساب افزایشی مهارت در یادگیری تقویتی با استفاده از معیارهای مرکزیت گراف
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
یادگیری تقویتی ، یادگیری تقویتی سلسله مراتبی ، اهداف میانی ، مهارت ، چارچوب
|
چکیده
|
یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که به بررسی رفتار عامل هوشمند در محیط های تصادفی و ناشناخته می پردازد. در یادگیری تقویتی عامل هوشمند بایستی از طریق سعی و خطا با محیط ارتباط برقرار کرده و با گذشت زمان و با دریافت سیگنال های تقویتی از محیط رفتار خود را بهبود دهد. اغلب روش های یادگیری تقویتی در برخورد با مسائل پیچیده و بزرگ دچار مشکل می شوند. به منظور کاهش پیچیدگی، اغلب مسائل بزرگ به زیر مسائل کوچکتر شکسته می شوند و با حل این زیرمسائل ساده تر، راه حلی برای مسئله پیچیده اصلی ارائه می گردد. بدین ترتیب یک ساختار سلسله مراتبی از مسئله ارائه می گردد. در یادگیری تقویتی سلسله مراتبی، یکی از روش های تجزیه مسائل بزرگ به زیرمسائل کوچکتر، شناسایی اهداف میانی مسئله است. اهداف میانی که زیرهدف نیز نامیده می شوند، حالت هایی هستند که برای رسیدن به هدف سودمند می باشند و سرعت یادگیری عامل را افزایش می دهد. با شناسایی اهداف میانی، سپس مهارت رسیدن به حالت های میانی شناسایی شده برای عامل ایجاد می-گردد. مهارت یا عمل مجرد، دنباله ای از اعمال پایه یا اعمال مجرد دیگر است که به صورت یک عمل واحد در نظر گرفته می شود. عامل هوشمند با یک بار فراگیری مهارت، قادر خواهد بود در آینده مجدداً از آن استفاده کرده و بدین ترتیب سرعت یادگیری خود را افزایش دهد. در این پایان نامه یک روش مبتنی بر نظریه گراف برای شناسایی اهداف میانی ارائه شده است. روش رائه شده از طریق معیارهای مرکزیت گراف، اهداف میانی را شناسایی می کنند. روش های پیشنهادی پایدار بوده و وابسته به تابع پاداش و تعداد ملاقات حالات نیست، بنابراین می توان از آن ها برای شناسایی اهداف میانی در محیط های گوناگون استفاده کرد. در این پایان نامه از چارچوب سلسله مراتبی گزینه برای نمایش مهارت ها استفاده شده است.
|
پژوهشگران
|
مجتبی مظفری (استاد راهنما)، پرهام مرادی دولت آبادی (استاد مشاور)، محمد ابراهیم شیری (استاد راهنما)، محبوبه احمدعلی نژاد (دانشجو)
|