فتوولتائیک ( PV) به عنوان یکی از مهمترین منابع انرژی پایدار در جهان شناخته میشود. با این حال، چگونگی به دست آوردن حداکثر انرژی خورشیدی موجود تحت شرایط آب و هوایی مختلف هنوز هم یک مشکل چالش برانگیز است. روش ردیابی نقطه حداکثر توان ( MPPT) برای استخراج حداکثر توان از سیستم PV استفاده میشود روشهای مرسوم MPPT به دلیل پیادهسازی ساده خود، به طور گستردهای در عمل پذیرفته شدهاند، این روش ها به دلیل استفاده از اندازه گام ثابت، دقت ردیابی و سرعت ردیابی به عنوان دو چالش اصلی برای این تکنیکهای MPPT سنتی در نظر گرفته میشوند. این پژوهش یک روش جدید برای ردیابی نقطه حداکثر توان با استفاده ترکیب الگوریتم ازدحام ذرات و یادگیری تقویتی ارائه میکند که قابلیت خودآموزی و همگرایی به نقطه بهینه را دارد. به منظور برآورد کارایی و تایید اثربخشی، روش QPSO در شرایط عملیاتی مختلف اجرا و شبیهسازی شدهاست. روش QPSO با روش P&O و PSO تحت سناریو های مختلف مقایسه شدند با توجه به نتایج بدست الگوریتم QPSO می تواند در تابش های مختلف به MPP همگرا شود. علاوه بر این، با تغییرات تابش خورشیدی، کنترلر QPSO نیاز به کشف وضعیت جدید و یادگیری نحوه دستیابی به عملکرد بهینه در حضور اختلالات پیوسته دارد و پس از همگرایی و یافتن نقطه بهینه، هیچ نوسانی در حول نقطه MPP ندارد. از نظر سرعت ردیابی و کارایی، مقایسه دو روش P&O و روش QPSO نشان میدهد که وقتی شرایط محیطی جدید رخ میدهد، روش QPSO کندتر از روش P&O است زیرا این روش از فرآیند اکتشاف یاد میگیرد. گرچه، سرعت ردیابی روش P&O سریعتر از روش QPSO است اما نوسانات زیادی ایجاد میکند که منجر به تلفات توان قابل توجهی میشود.