مدلسازی حساسیت مکانی وقوع زمین‌لغزش با استفاده از الگوریتم یادگیری ماشین جنگل تصادفی در امتداد جاده هراز

نوع مقاله : علمی - پژوهشی

نویسنده

استادیار جغرافیا-سنجش از دور و سامانه اطلاعات جغرافیایی گروه جغرافیا، دانشکده علوم انسانی و اجتماعی دانشگاه مازندران

چکیده

چکیده

سابقه و هدف:

وقوع زمین‌لغزش به‌عنوان یکی از مهمترین انواع مخاطرات ژئومورفولوژیک به‌دلیل ابعاد گسترده خسارات و آسیبهای جانی، اقتصادی و زیست‌محیطی در جاده‌های کوهستانی، ایمنی شبکه‌های حمل و نقل را تحت تاثیر قرار می‌دهد. در این زمینه، مدلسازی حساسیت مکانی وقوع زمین‌لغزش - مهمترین مرحله ارزیابی خطر و ریسک وقوع زمین‌لغزش – می‌تواند نقش قابل-ملاحظه‌ای در کاهش آسیب‌های احتمالی ایفا نماید. در سالهای اخیر توسعه الگوریتمهای یادگیری ماشین، قابلیت مدلسازی مکانی حساسیت وقوع زمین‌لغزش را به شکل قابل‌ملاحظه‌ای بهبود بخشیده است. هدف این پژوهش، استفاده از الگوریتم یادگیری ماشین جنگل تصادفی به منظور مدلسازی حساسیت مکانی وقوع زمین‌لغزش در امتداد جاده کوهستانی هراز می‌باشد. این جاده، بدلیل وجود ساختارهای زمین‌شناسی متنوع و مستعد وقوع زمین لغزش، شرایط آب و هوایی و دخالتهای انسانی همواره در معرض وقوع انواع زمین‌لغزش بوده و به عنوان خطرناک‌ترین جاده کوهستانی در کشور به شمار می‌رود.

مواد و روشها:

جهت مدلسازی حساسیت مکانی وقوع زمین‌لغزش در جاده هراز، در ابتدا توزیع مکانی زمین‌لغزشهای بوقوع پیوسته با مطالعه میدانی و استفاده از نقشه‌های زمین‌شناسی و تصاویر ماهواره‌ای به صورت نقشه فهرست زمین‌لغزش تهیه شد. سپس عوامل موثر مستقل تاثیرگذار بر وقوع زمین‌لغزش نظیر عوامل زمین‌شناسی، توپوگرافیکی، هیدرولوژیکی، پوشش‌گیاهی، کاربری ‌اراضی و عوامل انسانی در حریم یک کیلومتری جاده هراز تهیه شد. بدلیل عدم توازن در تعداد پیکسلهای دارای زمین‌لغزش و پیکسلهای فاقد زمین‌لغزش در منطقه مورد مطالعه، یک مجموعه داده متعادل و برابر از پیکسلهای دارای رخداد زمین‌لغزش و پیسکلهای بدون رخداد زمین‌لغزش تهیه شد که در آن 70% پیکسلها جهت آموزش و 30% برای آزمایش و اعتبار‌سنجی مدل مورد استفاده قرار گرفت. جهت بررسی اثر انتخاب تصادفی داده های آموزشی و آزمایشی، با استفاده از روش اعتبارسنجی متقابل 10‌گانه در الگوریتم جنگل تصادفی، این تقسیم‌بندی 10 بار تکرار شده‌است. علاوه‌براین، به منظور افزایش دقت پیش‌بینی الگوریتم جنگل تصادفی، از قابلیت بهینه‌سازی ابرپارامترها در الگوریتم استفاده شده و پارمترهای اصلی الگوریتم نظیر تعداد درخت‌های تصمیم‌گیری و تعداد متغیرهایی انتخابی در هر تقسیم‌بندی، تعدیل و تنظیم شده‌اند. دقت و عملکرد مدلهای 10‌گانه آموزشی و 10‌گانه اعتبارسنجی با‌استفاده از شاخص‌های ماتریس درهم‌ریختگی، کاپا و شاخص سطح زیر منحنی مورد بررسی قرارگرفته و بهترین مدل از نظر عملکرد شاخص سطح زیرمنحنی در قسمت اعتبار‌سنجی مدل، جهت تهیه نقشه حساسیت مکانی وقوع زمین‌لغزش مورد استفاده قرار گرفته است.

نتایج و بحث:

نتایج بدست‌آمده در ارتباط با اهمیت متغیرهای مستقل تاثیرگذار در وقوع زمین‌لغزش در الگوریتم جنگل تصادفی نشان می‌دهد که متغیر زمین‌شناسی با درصد اهمیت 47.8% ، مهمترین عامل وقوع زمین‌لغزش در امتداد جاده هراز به شمار می‌رود. در این رابطه، ساختارهای زمین‌شناسی متشکل از واریزه‌ها و سازند زمین‌شناسی شمشک بیشترین نقش را در ارتباط با وقوع زمین‌لغزش در جاده هراز بر عهده دارند. در ارتباط با مدلسازی حساسیت مکانی وقوع زمین‌لغزش با استفاده از الگوریتم یادگیری ماشین جنگل تصادفی و رویکرد اعتبارسنجی متقابل 10‌گانه، نتایج نشان می‌دهد که با میانگین مقادیر شاخص سطح زیر منحنی (AUC) 0.93 و 0.85 به ترتیب در 10 بار تکرار آموزش مدل و 10 بار تکرار اعتبارسنجی مدل، دقت و عمکرد قابل‌ملاحظه‌ای در شناسایی منطق مستعد وقوع ‌زمین‌لغزش در این روش وجود دارد.

نتیجه‌گیری:

نتایج این پروژه پژوهشی نشان می‌دهد که حساسیت مکانی وقوع زمین‌لغزش در امتداد طول جاده هراز متغیر و ناهمگن می‌باشد. در این زمینه و در پهنه یک کیلومتری حریم جاده هراز، 130 کیلومتر مربع از وسعت منطقه در مناطق با خطر خیلی زیاد و زیاد وقوع زمین‌لغزش واقع شده‌اند که درحدود 36 کیلومتر از طول جاده هراز در منطقه مورد مطالعه را شامل می‌شود. نتایج بدست-آمده می‌تواند در مدیریت بحران وقوع مخاطرات ژئومورفولوژیک در امتداد جاده کوهستانی هراز، جهت اولویت‌بندی انجام اقدامات فنی، عمرانی و به منظور بررسی وضعیت دامنه‌های ناپایدار و انجام عملیات تثبیت دامنه‌ای در مناطق با خطر زیاد و خیلی زیاد و همچنین برنامه‌ریزی جهت افزایش ایمنی جاده مورد استفاده قرار گیرد.

کلیدواژه‌ها


عنوان مقاله [English]

Landslide susceptibility modelling using random forest machine learning algorithm along Haraz road

چکیده [English]

Background and aim:

Landslides, as a major geomorphological hazard, threaten transportation safety along mountainous roads due to their severe human, economic, and environmental impacts. In this context, spatial landslide susceptibility modeling—considered a key step in landslide hazard and risk assessment—plays a crucial role in mitigating potential damages. In recent years, the rapid development of machine learning algorithms has significantly enhanced the capability of spatial modeling for landslide susceptibility. The main objective of this study is to apply the random forest machine learning algorithm to model the spatial susceptibility of landslide occurrence along the Haraz mountainous road. Haraz road is continuously exposed to various types of landslides due to its complex and diverse geological structures, landslide-prone lithological conditions, climatic factors, and intensive human activities, and is regarded as one of the most hazardous mountainous roads in Iran.

Materials and methods:

To model landslide susceptibility, the spatial distribution of landslides was first identified and compiled as a landslide inventory map. This inventory was prepared based on detailed field surveys, geological maps, and satellite images. Subsequently, a set of independent conditioning factors including geological, topographic, hydrological, vegetation, land-use and land-cover, and human-related factors, were generated within a one-kilometer buffer zone along the Haraz road. Due to the imbalance between landslide and non-landslide pixels in the study area, a balanced dataset with an equal number of landslide and non-landslide pixels was constructed. From this dataset, 70% of the pixels were randomly selected for model training, while the remaining 30% were used for validation. To evaluate the effect of random data partitioning on model performance, a 10-fold cross-validation approach was implemented within the random forest algorithm, and the training–testing process was repeated ten times. In addition, to improve the predictive performance of the random forest model, hyperparameter tuning was applied. Key algorithm parameters, including the number of decision trees and the number of variables selected at each node of split, were systematically tuned. The accuracy and performance of the ten training models and ten validation models were evaluated using confusion matrix, Kappa coefficient, and the Area Under Curve (AUC). Finally, the model with the highest AUC value in the validation stage was selected as the optimal model and used to generate spatial landslide susceptibility map.

Resulst and discussion:

The results related to the importance of conditioning factors affecting landslides in random forest algorithm, indicate that the geology is the most influential variable controlling landslide occurrence along the Haraz road, with a relative importance of 47.8%. In this regard, geological units consisting of scree deposits and the Shemshak formation play a dominant role in triggering landslides in the study area. Regarding the spatial modeling of landslide susceptibility using the random forest machine learning algorithm combined with a 10-fold cross-validation approach, the results demonstrate a high predictive accuracy and robust performance in identifying landslide-prone areas. The mean Area Under the Curve (AUC) values obtained from the ten training iterations and ten validation iterations were 0.93 and 0.85, respectively, indicating the strong capability of the proposed approach for reliable landslide susceptibility assessment along mountainous road corridors.

Conclusion:

The results indicate that landslide spatial susceptibility along the Haraz road is variable and heterogeneous. Within the one-kilometer buffer zone along the road corridor, approximately 130 km² of the study area is classified as high and very high prone landslide areas, encompassing nearly 36 km of the Haraz road length. The findings of this study provide valuable insights for geomorphological hazard management along this road and can be effectively used for prioritizing technical and engineering interventions. In particular, the generated landslide susceptibility map can support the assessment of unstable slopes, the implementation of slope stabilization measures in high- and very high-risk zones, and strategic planning aimed at enhancing road safety and reducing landslide-related risks.

کلیدواژه‌ها [English]

  • Landslide
  • Haraz road
  • Random forest
  • Shemshak formation
  • GIS