پیش‌بینی مناطق مستعد سیلاب با رویکرد هوش مصنوعی و تلفیق داده‌های سنجش از دور در بستر Google Earth Engine و Google Colab

نوع مقاله : علمی - پژوهشی

نویسندگان

1 1- کارشناس ارشد مهندسی منابع آب، شرکت آب منطقه ای خراسان جنوبی، شرکت مدیریت منابع آب، بیرجند، ایران

2 2- دانشجو دکتری منابع آب، گروه علوم و مهندسی آب، پردیس کشاورزی، دانشگاه بیرجند، بیرجند، ایران و کارشناس بخش تحقیقات خاک و آب، مرکز

چکیده

چکیده مبسوط

سابقه و هدف

سیلاب به‌عنوان یکی از مخرب‌ترین مخاطرات طبیعی، به‌ویژه در مناطق خشک و نیمه‌خشک، خسارات گسترده‌ای به مناطق شهری، زیرساخت‌ها، اراضی کشاورزی و منابع آب وارد می‌کند. تشدید تغییرات اقلیمی، افزایش بارش‌های حدی، توسعه نامتوازن شهری و تغییر کاربری اراضی، فراوانی و شدت رخدادهای سیلابی را در دهه‌های اخیر افزایش داده است. در چنین شرایطی، شناسایی دقیق مناطق مستعد سیلاب و تهیه نقشه‌های ان، نقش کلیدی در مدیریت ریسک، برنامه‌ریزی کاربری زمین و کاهش خسارات ایفا می‌کند. با این حال، کمبود داده‌های هیدرولوژیکی و زمینی در بسیاری از مناطق کشور، از جمله دشت بیرجند، کارایی روش‌های هیدرولوژیکی را با محدودیت مواجه ساخته است. ازاین‌رو، بهره‌گیری از داده‌های سنجش از دور، شاخص‌های طیفی و الگوریتم‌های یادگیری ماشین به‌عنوان رویکردی نوین، سریع و مقرون‌به‌صرفه مطرح شده است. هدف اصلی این پژوهش، پیش بینی مناطق مستعد سیلاب در دشت بیرجند با استفاده از شاخص نرمال تفاضلی سیلاب (NDFI)، سامانه Google Earth Engine و الگوریتم‌های یادگیری ماشین و ارزیابی و مقایسه عملکرد آن‌ها است.

مواد و روش‌ها

در این پژوهش، ابتدا با استفاده از تصاویر ماهواره‌ای در محیط Google Earth Engine و پس از اعمال پیش‌پردازش‌ها و حذف اثر ابر، شاخص NDFI محاسبه و با کمک بازدید میدانی و بررسی عکسهای هوایی دهه 40، نقشه دودویی مناطق سیلابی و غیرسیلابی تولید گردید. بر اساس این نقشه، مناطق وقوع سیل استخراج و برای آموزش و اعتبارسنجی مدل‌ها مورد استفاده قرار گرفتند. سپس پانزده عامل ژئومحیطی مؤثر بر وقوع سیلاب شامل پارامترهای توپوگرافی، هیدرولوژیکی، اقلیمی و پوشش سطح زمین استخراج و به‌صورت لایه‌های رستری با تفکیک مکانی ۳۰×۳۰ متر آماده‌سازی شدند. به‌منظور جلوگیری از هم‌خطی چندگانه، روابط همبستگی بین عوامل بررسی شد. در ادامه، چهار الگوریتم یادگیری ماشین شامل جنگل تصادفی(RF)، آدابوست (AdaBoost)، گرادیان بوستینگ (GB) و مدل ترکیبی جنگل تصادفی–گرادیان بوستینگ (RF–GB) برای مدل‌سازی حساسیت به سیلاب به‌کار گرفته شدند. ارزیابی عملکرد مدل‌ها با استفاده از شاخص‌های Accuracy ، Sensitivity ، Specificity ، F1-Score، ضریب کاپا، RMSE و مساحت زیر منحنی ROC انجام شد.

نتایج و بحث

نتایج نشان داد که تمامی مدل‌های یادگیری ماشین توانایی قابل قبولی در پیش‌بینی مناطق مستعد سیلاب دارند، اما از نظر دقت و پایداری عملکرد، تفاوت‌هایی میان آن‌ها مشاهده می‌شود. مدل جنگل تصادفی بهترین عملکرد کلی را با بیشترین توانایی تفکیک(AUC=0.9) ، بالاترین دقت کلی(Accuracy=0.83) و حساسیت کامل در شناسایی مناطق سیلابی (Sensitivity=1, Specificity=0.6, F1=0.87, Kappa=0.64) و کمترین مقدار خطا (RMSE=0.39) به خود اختصاص داد. مدل‌های گرادیان بوستینگ با مقادیر (AUC=0.78, RMSE=0.49, Accuracy=0.75, Sensitivity=1, Specificity=0.4, F1=0.82, Kappa=0.49) و آدابوست با مقادیر (AUC=0.82, RMSE=0.43, Accuracy=0.66, Sensitivity=0.71,Specificity=0.6, F1=0.71, Kappa=0.31) نیز توانایی مناسبی در شناسایی مناطق سیلابی دارند، اما از نظر توازن بین حساسیت و ویژگی، در رتبه‌های بعدی قرار گرفتند. مدل ترکیبی RF–GB علی‌رغم بهبود نسبی در توان تفکیک،(AUC=0.88, RMSE=0.41, Accuracy=0.75, Sensitivity=1, Specificity=0.4, F1=0.82, Kappa=0.43) برتری معناداری نسبت به مدل جنگل تصادفی نشان نداد. نقشه‌های مناطق مستعد سیلاب به پنج کلاس بسیار کم، کم، متوسط، زیاد و بسیار زیاد تقسیم شدند. تحلیل الگوی مکانی نشان داد که مناطق با حساسیت زیاد و بسیار زیاد عمدتاً در نواحی کم‌ارتفاع، دارای شیب ملایم، نزدیک به رودخانه‌ها و با پوشش گیاهی ضعیف متمرکز هستند که بیانگر نقش غالب عوامل توپوگرافی و هیدرولوژیکی در فرآیند سیلاب‌زایی منطقه است.

نتیجه‌گیری

یافته‌های این پژوهش نشان می‌دهد که ادغام شاخص NDFI، داده‌های سنجش از دور و الگوریتم‌های یادگیری ماشین در بستر Google Earth Engine، رویکردی کارآمد، سریع و مقرون‌به‌صرفه برای پیش بینی مناطق مستعد سیلاب در مناطق خشک و کم‌داده فراهم می‌کند. در میان مدل‌های مورد بررسی، جنگل تصادفی به‌عنوان پایدارترین و دقیق‌ترین الگوریتم، توان بالایی در شناسایی مناطق پرخطر از خود نشان داد و می‌تواند به‌عنوان ابزار پشتیبان تصمیم‌گیری در مدیریت ریسک سیلاب، برنامه‌ریزی کاربری اراضی و کاهش خسارات مورد استفاده قرار گیرد. چارچوب پیشنهادی این مطالعه قابلیت تعمیم به سایر مناطق مشابه را داشته و می‌تواند در ارتقای تاب‌آوری سرزمینی در برابر مخاطرات سیلابی نقش مؤثری ایفا کند.

کلیدواژه‌ها


عنوان مقاله [English]

Flood Susceptibility Prediction Using an Artificial Intelligence Approach and Integration of Remote Sensing Data in Google Earth Engine

نویسندگان [English]

  • Omid Khorashadizadeh 1
  • Elham Ghouchanian Haghverdi 2
1 1- M.Sc. in Water Resources Engineering, South Khorasan Regional Water Company, Iran Water Resources Management Company, Birjand, Iran
2 2- Ph.D. Student in Water Resources, Department of Water Science and Engineering, College of Agriculture, University of Birjand, Birjand, Iran, Soil and Water Research Expert, South Khorasan Agricultural and Natural Resources Research and Education C
چکیده [English]

Extended Abstract

Background and Objectives

Floods are among the most destructive natural hazards, particularly in arid and semi-arid regions, causing extensive damage to urban areas, infrastructure, agricultural lands, and water resources. Climate change, increased extreme rainfall events, unplanned urban development, and land-use changes have intensified the frequency and severity of floods in recent decades. In this context, accurately identifying flood-prone areas and producing susceptibility maps play a crucial role in risk management, land-use planning, and damage mitigation. However, the lack of hydrological and ground-based data in many regions, including the Birjand Plain, limits the effectiveness of conventional hydrological methods. Consequently, leveraging remote sensing data, spectral indices, and machine learning algorithms has emerged as a novel, rapid, and cost-effective approach. The main objective of this study is to develop an integrated framework for flood susceptibility mapping in the Birjand Plain using the Normalized Difference Flood Index (NDFI), Google Earth Engine (GEE), and machine learning algorithms, and to evaluate and compare their performance.

Materials and Methods

In this study, satellite imagery was first processed in the Google Earth Engine environment. After applying preprocessing steps and cloud removal, the NDFI was computed. Using field surveys and historical aerial photographs from the 1960s, a binary map of flood and non-flood areas was produced. Based on this map, flood occurrence locations were extracted and used for model training and validation. Fifteen geo-environmental factors influencing flood occurrence, including topographic, hydrological, climatic, and land-cover parameters, were extracted and prepared as raster layers with a spatial resolution of 30 × 30 m. To prevent multicollinearity, correlations among factors were examined. Subsequently, four machine learning algorithms—Random Forest (RF), AdaBoost, Gradient Boosting (GB), and a hybrid RF–GB model—were applied to model flood susceptibility. Model performance was evaluated using Accuracy, Sensitivity, Specificity, F1-Score, Kappa coefficient, RMSE, and the Area Under the ROC Curve (AUC).

Results and Discussion

The results indicated that all machine learning models demonstrated acceptable capability in predicting flood-prone areas; however, differences in accuracy and stability were observed among them. The Random Forest model exhibited the best overall performance, with the highest discriminative ability (AUC = 0.9), overall accuracy (Accuracy = 0.83), and complete sensitivity in identifying flood-prone areas (Sensitivity = 1, Specificity = 0.6, F1 = 0.87, Kappa = 0.64), along with the lowest error (RMSE = 0.39). Gradient Boosting (AUC = 0.78, RMSE = 0.49, Accuracy = 0.75, Sensitivity = 1, Specificity = 0.4, F1 = 0.82, Kappa = 0.49) and AdaBoost (AUC = 0.82, RMSE = 0.43, Accuracy = 0.66, Sensitivity = 0.71, Specificity = 0.6, F1 = 0.71, Kappa = 0.31) also showed reasonable ability to identify flood-prone areas, but ranked lower in terms of balance between sensitivity and specificity. The hybrid RF–GB model, despite a relative improvement in discriminative ability (AUC = 0.88, RMSE = 0.41, Accuracy = 0.75, Sensitivity = 1, Specificity = 0.4, F1 = 0.82, Kappa = 0.43), did not demonstrate a significant advantage over the Random Forest model.Flood-prone maps were classified into five categories: very low, low, moderate, high, and very high. Spatial pattern analysis revealed that areas with high and very high susceptibility were predominantly located in low-elevation zones with gentle slopes, close to rivers, and with sparse vegetation cover, highlighting the dominant role of topographic and hydrological factors in the region’s flood generation processes.

Conclusion

The findings of this study indicate that integrating the NDFI index, remote sensing data, and machine learning algorithms within the Google Earth Engine framework provides an efficient, rapid, and cost-effective approach for predicting flood-prone areas in arid and data-scarce regions. Among the evaluated models, Random Forest demonstrated the most stable and accurate performance, showing a strong capability in identifying high-risk areas. Therefore, it can serve as a valuable decision-support tool for flood risk management, land-use planning, and mitigation of flood-related damages. The proposed framework is transferable to other regions with similar environmental conditions and can contribute to enhancing regional resilience to flood hazards.

کلیدواژه‌ها [English]

  • Flooding
  • Flood Susceptibility
  • Machine Learning
  • Normalized Difference Flood Index (NDFI)
  • Google Earth Engine