پیش بینی حساسیت سیلاب شهری با استفاده از الگوریتم های هوش مصنوعی با داده های متوازن و نامتوازن (مطالعه موردی: شهر سنندج)

مشخصات پژوهش

عنوان	پیش‌بینی حساسیت سیلاب شهری با استفاده از الگوریتم‌های هوش مصنوعی با داده‌های متوازن و نامتوازن (مطالعه موردی: شهر سنندج)
نوع پژوهش	طرح پژوهشی خاتمه یافته
کلیدواژه‌ها	مدل‌سازی سیلاب شهری، داده‌های نامتوازن، الگوریتم‌های یادگیری ماشین، سیستم اطلاعات جغرافیایی.
سال	1404
پژوهشگران	عطااله شیرزادی ، هیمن شهابی ، محسن رمضانی ، احسان جعفری ندوشن ، مرضیه حاجیزاده تهان ، آرین صلواتی

چکیده

به‌دلیل محدودیت‌های ذاتی مدل‌سازی که ناشی از نیاز به آزمون و خطا یا اجرای مکرر با ترکیب‌های گوناگون بوده و همچنین به‌سبب استفاده از مجموعه‌داده‌ آموزشی کوچک و متوازن، بهره‌گیری از مجموعه‌داده‌های نامتوازن برای مقابله با این چالش ضروری است. در این پژوهش، رویکردی ترکیبی (RFADT) از یادگیری ماشین مبتنی بر درخت تصمیم متناوب (ADT) و جنگل چرخشی (Rotation forest) همراه با مدل‌های یادگیری عمیق شبکه عصبی کانولوشنی (CNN)، روی داده‌های متوازن (n1) و نامتوازن (n2 تا n10) آموزش داده شد تا نقشه حساسیت‌پذیری سیلاب شهری در شهر سنندج (استان کردستان) تولید شود. مدل‌ها با استفاده از 174 نقطه سیلاب و 19 عامل مؤثر اعتبارسنجی شده و عملکرد آن‌ها با شاخص‌های آماری گوناگون از جمله Sensitivity، Specificity، Accuracy، F1-Measure، Precision-Recall curve، MAE، RMSE و AUC ارزیابی شدند. نتایج نشان داد که RF و CNN در همه موارد، به‌جز در مجموعه‌ داده n9، عملکرد بهتری نسبت به ADT داشتند. مهم‌تر آن‌که، مدل‌های ADT، RFADT و CNN افزایش قابل‌توجه و یکنواختی در مقدار AUC نشان‌دهنده (پیش‌بینی بهتر) از n1 تا n2 در مجموعه ‌داده‌های نامتوازن نشان دادند. همچنین، نتایج مربوط به مجموعه اعتبارسنجی در طی فرآیند مدل‌سازی بیانگر آن بود که: مدل ADT با مجموعه‌ داده نامتوازن n10 بهترین عملکرد را داشت (215/0MAE=؛ 282/0RMSE=؛ 850/0AUC=)؛ مدل RFADT با مجموعه ‌داده‌های نامتوازن n8 (216/0MAE=؛ 282/0RMSE=؛ 912/0AUC=) و n6 (261/0MAE=؛ 317/0 RMSE=؛ 884/0AUC=) بهترین عملکرد را نشان داد؛ و مدل CNN نیز با مجموعه‌داده‌های نامتوازن n8 (102/0MAE=؛ 319/0RMSE=؛ 925/0AUC=) و n10 (0٫086 MAE=؛ 0٫293 RMSE=؛ 0٫898 AUC=) بهترین عملکرد را ارائه داد. بهترین نتایج برای مدل ADT در مجموعه‌داده n10، برای RFADT در n8 و n6، و برای CNN در n8 و n10 به‌دست آمد. این یافته‌ها نشان دادند که مجموعه‌داده‌های نامتوازن به‌ویژه در اندازه‌های n6، n8 و n10، نسبت به مجموعه‌داده‌های متوازن (AUC=0.774) عملکردی قابل‌اعتمادتر در تهیه نقشه‌های حساسیت سیلاب شهری دارند و می‌توانند جایگزینی مؤثر در شرایط داده‌های متوازن با تعداد کم‌تر باشند.

عطااله شیرزادی

مشخصات پژوهش

چکیده