ارزیابی روش‌های آمار کلاسیک در تخمین و بازسازی دمای روزانۀ کشور ایران

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه علوم و مهندسی آب، دانشگاه تبریز، تبریز، ایران

2 مؤسسة تحقیقات فنی و مهندسی کشاورزی، سازمان تحقیقات، آموزش و ترویج کشاورزی، کرج، ایران

چکیده

سابقه و هدف: تصمیم‌گیری و مدیریت مؤثر درزَمینۀ توسعة پایدار منابع طبیعی نیازمند دسترسی به اطلاعات دقیق و به‌روز اقلیمی است. این اطلاعات امکان بررسی نقش تغییرات اقلیمی را در موضوعات گوناگون مهیا می‌کنند و براساس آن، می‌توان راهکار‌های مدیریتی مؤثری را تدوین کرد. در این‌ راستا، پارامتر دما یکی از مهم‌ترین شاخص‌های اقلیمی است که نقش محوری را در تحلیل‌ها و پژوهش‌های محیطی ایفا می‌کند. با توجه به نقش اساسی دما در موضوعات گوناگون، دسترسی به داده‌های دمایی دقیق و جامع اهمیت بسیاری دارد. این داده‌ها باید به‌گونه‌ای باشند که بتوانند تصویری واضح و کامل از الگوهای دمایی، در طول زمان، ارائه دهند. اما متأسفانه، داده‌های اقلیمی اغلب با مشکلاتی مانند انقطاع آماری و خطاهای اندازه‌گیری مواجه‌اند. این مشکلات ممکن است به تصمیم‌گیری‌های نادرست و برنامه‌ریزی‌های ناکارآمد منجر شوند. در این پژوهش، با استفاده از روش‌های آماری، سعی شده است داده‌های دمایی موجود و انقطاع‌های آماری آنها با استفاده از روش‌هایی ازجمله مختصات جغرافیایی (گرافیکی)، نسبت نرمال، ضریب همبستگی وزنی و میانگین حسابی که در تکمیل داده‌های اقلیمی شناخته‌شده و پرکاربردند، تحلیل و ارزیابی شود. انتخاب روش مناسب از میان این روش‌ها می‌تواند دقت تخمین داده‌های دمایی را افزایش دهد و در تصمیم‌گیری‌های مبتنی‌بر داده‌های جامع‌تر و معتبرتر، نقش اساسی داشته باشد. درنَهایت، هدف از این پژوهش معرفی بهترین روش برای تخمین اطلاعات و رفع انقطاع آماری است که پژوهشگران، مدیران و سیاست‌گذاران را درزَمینة توسعة پایدار و درک بهتر شرایط اقلیمی و اتخاذ تصمیماتی هوشمندانه‌تر و مؤثرتر، یاری خواهد کرد.
مواد و روش‌ها: در این پژوهش، به‌منظور رفع خلأ آماری، روش‌های شناخته‌شده و محبوب آمار کلاسیک شامل روش مختصات جغرافیایی، نسبت نرمال، ضریب همبستگی وزنی و میانگین حسابی، در تخمین داده‌های دمایی کشور ارزیابی شد. به‌منظور بررسی بهترین روش برای تکمیل اطلاعات مفقودی، از اطلاعات 125 ایستگاه استفاده شد. این ایستگاه‌ها دارای اطلاعات کامل (بدون هیچ‌گونه مفقودی)، درطول 21 سال (2020-2000 م.) بودند. ازآنجاکه محاسبات گسترده و زمان‌بر بودند، با انتخاب 10٪ این ایستگاه‌ها به‌صورت تصادفی با پراکندگی مکانی مناسب، عملیات پرکردن اطلاعات روی ایستگاه‌های منتخب انجام شد. اطلاعات ایستگاه‌های منتخب، در هر مرحله و به‌صورت جداگانه، حذف و براساس پنج ایستگاه مجاور خود، بازسازی شدند و به‌منظور ارزیابی روش‌های مذکور، از معیار‌های ارزیابی آماری ضریب تبیین (R2)، جذر میانگین مربعات خطا (RMSE) و میانگین انحراف مطلق (MAD) استفاده شد.
نتایج و بحث: با ارزیابی نتایج حاصل از بررسی مقادیر محاسباتی ازطریق روش نسبت نرمال درمقابل مقادیر مشاهداتی، مشخص شد تمامی ایستگاه‌های مورد بررسی همبستگی بالایی دارند؛ این نکته بیانگر مقبولیت روش نسبت نرمال برای تخمین داده‌هاست. با توجه به مقادیر متوسط حاصل از ارزیابی نتایج، روش نسبت نرمال، ضریب همبستگی وزنی، مختصات جغرافیایی و میانگین حسابی به‌ترتیب، با مقدار RMSE معادل 05/3، 28/3، 30/3 و 51/3 درجة سلسیوس، اولویت‌بندی می‌شوند. بنابراین روش نسبت نرمال در میان سایر روش‌های مورد مطالعه از مقبولیت بیشتری برخوردار است و ازاین‌رو، در رفع مشکلاتی اعم‌از فقدان اطلاعات، خطای موجود در داده‌ها و همچنین گسترش دورة زمانی مطالعاتی، می‌توان از آن بهره برد.
نتیجه‌گیری: در میان روش‌های مورد بررسی، روش نسبت نرمال به‌صورت کلی مقبولیت و کیفیتی بیشتر از دیگر روش‌ها دارد که توصیه می‌شود در پژوهش‌های آتی، در محدودة مطالعاتی مشابه، از این روش استفاده شود. در مراتب بعدی، به‌ترتیب روش مختصات جغرافیایی، همبستگی وزنی و میانگین حسابی قرار دارند. شایان توجه است، با اینکه سایر روش‌ها در مراتب اهمیت بعدی واقع شده‌اند، همچنان در برخی ایستگاه‌ها کارآیی مناسبی نشان می‌دهند؛ بنابراین در شرایط متفاوت، روش‌های متنوعی می‌تواند نیاز به ترمیم داده‌ها را رفع کند و با توجه به محدودة مورد مطالعه، باید بهترین روش انتخاب شود و به‌کار رود.

کلیدواژه‌ها


عنوان مقاله [English]

Evaluation of Classical Statistical Methods for Estimating and Reconstructing the Daily Temperature in Iran

نویسندگان [English]

  • Mohammad Khaledi 1
  • Ghasem Zarei 2
1 Dep. of Water Engineering,University of Tabriz,Tabriz, Iran
2 Dep. of Greenhouse Engineering, Agricultural Engineering Research Institute, Karaj , Iran
چکیده [English]

Introduction: Effective decision-making and management in the field of sustainable development of natural resources require access to accurate and up-to-date climatic information. This information enables the examination of the role of climate change in various issues and the formulation of effective management strategies accordingly. In this context, temperature as one of the most important climatic indicators plays a key role in environmental analyses and research. Given the fundamental role of temperature in various situations, access to precise and comprehensive temperature data is of high importance. Such data should be sufficiently detailed to provide a clear and complete picture of temperature patterns over time. Unfortunately, climatic data often faces problems such as statistical discontinuities and measurement errors, which can lead to incorrect decisions and inefficient planning. In this research, statistical methods have been employed to analyze existing temperature data and their statistical discontinuities. These methods include geographical coordinates (graphical), normal ratio, weighted correlation coefficient, and arithmetic mean, which are well-established and widely used in completing climatic data. Selecting the most appropriate method from among these can enhance the accuracy of temperature data estimation and play a pivotal role in decisions based on more comprehensive and reliable data. The objective of this research is to identify the optimal methodology for estimating data and addressing statistical discontinuities. This will assist researchers, managers, and policymakers in the field of sustainable development and in better understanding climatic conditions, enabling them to make more informed and effective decisions.
Material and Methods: In order to address the statistical gap, a number of well-known and popular classical statistical methods were evaluated for estimating Iran temperature data. These included geographical coordinates, normal ratio, weighted correlation coefficient, and arithmetic mean. In order to determine the best method for completing missing information, data from 125 stations with complete information (without any missing data) over 21 years (2000 to 2020) were used. Given the extensive and time-consuming nature of the calculations, a random selection of 10% of the stations with an appropriate spatial distribution was employed to carry out the data filling operations. The information of the selected stations was removed at each stage separately and reconstructed based on their five nearest stations. To evaluate the aforementioned methods, statistical evaluation criteria such as R-squared (R2), root mean square error (RMSE), and mean absolute deviation (MAD) were used.
Results and discussion: The results of the analysis of computational values through the normal ratio method were evaluated against observational values. It was found that all the stations under study exhibited a high correlation, indicating the acceptability of the normal ratio method to data estimation. The average values obtained from the evaluation of results indicate that the methods of normal ratio, weighted correlation coefficient, geographical coordinates, and arithmetic mean are prioritized in order, with RMSE values of 3.05, 3.28, 3.30, and 3.51 degrees Celsius, respectively. Consequently, the normal ratio method is the most suitable among the other studied methods and can be employed to address issues such as a lack of information, existing data errors, and also the expansion of the study period.
Conclusion: Among the methods reviewed, the normal ratio method is generally more acceptable and of higher quality than the other methods and is recommended for use in future research within similar study ranges. In subsequent ranks, the methods of geographical coordinates, weighted correlation, and arithmetic mean are placed, respectively. It is notable that, although the other methods are considered of secondary importance, they nevertheless demonstrate satisfactory efficacy in certain locations. Consequently, under varying circumstances, a range of methods may be employed to address data deficiencies, and the optimal approach should be selected and utilized in accordance with the specific study area.

کلیدواژه‌ها [English]

  • Daily temperature
  • geographic coordinates
  • normal ratio
  • statistical discontinuity
Alfaro, R. & Pacheco, R., 2000, Aplicación de algunos métodos de relleno a series anuales de lluvia de diferentes regiones de Costa Rica, Tópicos Meteorológicos y Oceanográficos, 7(1), PP. 1-20.
Armanuos, A.M., Al-Ansari, N. & Yaseen, Z.M., 2020, Cross Assessment of Twenty-One Different Methods for Missing Precipitation Data Estimation, Atmosphere, 11(4), PP. 1-34.
Asseng, S., Foster, I. & Turner, N.C., 2011, The Impact of Temperature Variability on Wheat Yields, Global Change Biology, 17, PP., 997-1012.
Bannayan, M., Crout, N. & Hoogenboom, G., 2003, Application of the CERES‐Wheat Model for within‐Season Prediction of Winter Wheat Yield in the United Kingdom, Agronomy Journal, 95, PP. 114-125.
Barrios, A., Trincado, G. & Garreaud, R., 2018, Alternative Approaches for Estimating Missing Climate Data: Application to Monthly Precipitation Records in South-Central Chile, Forest Ecosystems, 5(1), PP. 1-10.
Campozano, L., Sánchez, E., Avilés, Á. & Samaniego, E., 2014, Evaluation of Infilling Methods for Time Series of Daily Precipitation and Temperature: The Case of the Ecuadorian Andes, Maskana, 5(1), PP. 99-115.
De Martonne, E., 1926, Aerisme, et índices d’aridite, Comptesrendus de L’Academie des Sciences, 182, PP. 1395-1398.
Hasanpour Kashani, M. & Dinpashoh, Y., 2012, Evaluation of Efficiency of Different Estimation Methods for Missing Climatological Data, Stochastic Environmental Research and Risk Assessment, 26(1), PP. 59-71.
Houari, R., Bounceur, A., Kechadi, M.T., Tari, A.K. & Euler, R., 2016, Dimensionality Reduction in Data Mining: A Copula Approach, Expert Systems with Applications, 64, PP. 247-260.
Mouneskhah, V., Khaledi, M., Hadi, M. & Samadianfard, S., 2023, Comparison of the Efficiency of Intelligent and Statistical Methods in the Reconstruction of Sunshine Hours Data (Case Study: East of Urmia Lake Basin), Journal of Agricultural Meteorology, 10(2), PP. 28-36.
Palosuo, T., Kersebaum, K.C., Angulo, C., Hlavinka, P., Moriondo, M., Olesen, J.E., Patil, R.H., Ruget, F., Rumbaur, C. & Takáč, J., 2011, Simulation of Winter Wheat Yield and Its Variability in Different Climates of Europe: A Comparison of Eight Crop Growth Models, European Journal of Agronomy, 35, PP. 103-114.
Paulhus, J.L. & Kohler, M.A., 1952, Interpolation of Missing Precipitation Records, Monthly Weather Review, 80(8), PP. 129-133.
Rafii, F. & Kechadi, T., 2019, Collection of Historical Weather Data: Issues with Missing Values, Proceedings of the 4th International Conference on Smart City Application.
Romman, Z.A., Al-Bakri, J.T. & Al Kuisi, M.M., 2019, Estimation of Rainfall Missing Data in an Arid Area Using Spatial and EM Methods, Journal of Software Engineering & Applications, 9, PP. 76-80.
Shabalala, Z.P., Moeletsi, M.E., Tongwane, M.I. & Mazibuko, S.M., 2019, Evaluation of Infilling Methods for Time Series of Daily Temperature Data: Case Study of Limpopo Province, South Africa, Climate, 7(7), P. 86.
Simolo, C., Brunetti, M., Maugeri, M. & Nanni, T., 2010, Improving Estimation of Missing Values in Daily Precipitation Series Bya Probability Density Function-Preserving Approach, International Journal of Climatology, 30, PP. 1564-1576.
Teegavarapu, R.S. & Chandramouli, V., 2005, Improved Weighting Methods, Deterministic and Stochastic Data-Driven Models for Estimation of Missing Precipitation Records, Journal of Hydrology, 312(1-4), PP. 191-206.
Wilhite, D.A., 2000, Drought as a Natural Hazard: Concepts and Definitions, Drought: A Global Assessment, Springer, London, Routledge.1(1), PP. 3-18.
Willmott, C.J., Robeson, S.M. & Feddema, J.J., 1994, Estimating Continental and Terrestrial Precipitation Averages from Rain‐Gauge Networks, International Journal of Climatology, 14(4), PP. 403-414.
Young, K.C., 1992, A Three-Way Model for Interpolating for Monthly Precipitation Values, Monthly Weather Review, 120(11), PP. 2561-2569.
Zare khormizie, H. & Ghafarian Malamiri, H.R., 2020, Effect of Height and Temperature on Plant Phenological Processes Using Harmonic Analysis of MODIS NDVI Time Series (Case Study: Shirkouh, Yazd Province), Iranian Journal of Remote Sensing & GIS, 12(3), PP. 1-22.