در این مقاله، یک روش کنترل ناحیه گسترده ی هوشمند بر پایه ی داده های اندازه گیری شده از سیستم قدرت، مبتنی بر الگوریتم یادگیری تقویتی، به منظور بهبود عملکرد میرایی، ارائه شده است. اما با توجه به پیچیدگی مسئله ی کنترل دینامیک سیستم قدرت، کنترل کننده RL به زمان زیادی برای رسیدن به هدف مطلوب از طریق کسب تجربه با محیط نیازمند است، در نتیجه زمان محاسباتی لازم برای پیدا کردن سیاست بهینه بالا می رود. بنابراین در این مقاله، با استفاده از الگوریتم تجمع ذرات، الگوریتم RL بهبنه شده است. مساله ی انتخاب .....