palette
ارزیابی قابلیت‌های ترکیب الگوریتم‌های مجموعه‌های راف و ژنتیک برای داده‌کاوی و استخراج قوانین مرتبط با آب مصرفی در شهر تهران
وحید احمدی, عباس علیمحمدی, جلال کرمی

چکیده
مدیریت و برنامه‌ریزی آب شهری، به‌ویژه در کلان‌شهر‌ها، اهمیت بسیار زیادی دارد. توسعة مناطق شهری، تبدیل شهرها به کلان‌شهر و افزایش پیچیدگی عوامل تأثیرگذار در مصرف آب در شهر‌ها سبب دشواری مدیریت مصرف، تأمین و توزیع آب شده است. بنابراین، استخراج قوانین نقش مهمی در کشف الگو‌های حاکم بر مجموعة داده و کاهش پیچیدگی‌ها دارد. اصل نظریة مجموعه‌های راف، که پائولاک در دهة 80 مطرح کرد، روشی توانمند و انعطاف‌پذیر در پردازش داده‌های دارای عدم قطعیت شمرده می‌شود و در این تحقیق، به‌منظور استخراج قوانین حاکم بر مصرف آب، به‌کار رفته است. در این تحقیق، از روش ترکیب الگوریتم‌های مجموعه‌های راف و ژنتیک از روش‌های داده‌کاوی، برای بهبود استخراج قوانین و طبقه‌بندی داده‌های آب مصرفی، با کاربری مسکونی در شهر تهران به‌منزلة منطقة مورد مطالعه استفاده شده است. داده‌های مورد استفاده در این تحقیق شامل داده‌های اجتماعی‌ـ اقتصادی، محیطی، اقلیمی و فنی‌ـ مدیریتی می‌شوند. این داده‌ها به دو زیرمجموعه، شامل 60% با هدف آموزش و 40% به‌قصد ارزیابی نتایج، تقسیم شدند. نتایج نشان می‌دهند که تلفیق الگوریتم‌های ژنتیک و مجموعه‌های راف کارآیی بالاتری برای استخراج مؤثر قوانین از داده‌های مصرف آب شهر تهران را دارند. دقت طبقه‌بندی مجموعه دادة آزمون، ازطریق قوانین استخراج‌شده از مجموعه‌های راف، 77% بود. پس از بهینه‌سازی قوانین با استفاده از الگوریتم ژنتیک در مجموعه‌های راف، دقت طبقه‌بندی در نسل ششم، با سرعت همگرایی متوسط، به 88% و در نسل دهم، به 92% افزایش یافت. براساس قوانین استخراج‌شده، عوامل مؤثر در مصرف سالیانة آب به‌ترتیب میزان تأثیرگذاری، جمعیت ساکن، آب‌بها، تراکم جمعیت در واحد سطح، بعد خانوار، موقعیت مکانی (عرض جغرافیایی)، تحصیلات ساکنان و سرانة فضای سبز به‌شمار می‌روند.
واژگان کلیدی
استخراج قوانین، مجموعة راف، الگوریتم ژنتیک، داده‌کاوی مکانی

منابع و مآخذ مقاله

ببران، ص.، 1387، بحران وضعیت آب در جهان و ایران، راهبرد، دورة 16، ش 48، صص. 212- 193.

حسین‌زاده، ل.، 1386، دسته‌بندی مشتریان هدف در صنعت بیمه با استفاده از داده‌کاوی، پایان‌نامة کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه تربیت مدرس.

صالحی، م.، باوی، ا.، 1389، الگوریتم‌های ژنتیک و بهینه‌سازی سازه‌های مرکب، تهران، انتشارات عابد.

طالقانی، م.، 1385، اطلس کامل تهران 85، مؤسسة جغرافیایی و کارتوگرافی گیتاشناسی.

Cabena, P., Hadjinian, P., Stadler, R., Verhees, J & Zanasi, A., 1998, Discovering Data Mining: From Concept to Implementation, Prentice Hall, Upper Saddle River, NJ.

Dempster, A.P., 1967, Upper and Lower Probabilities Induced by a Multivalued Mapping, Annals of Mathematical Statistics, 38, PP. 325-339.

Dubois, D. & Prade, H., 1990, Rough Fuzzy Sets and Fuzzy Rough Sets, International Journal of General Systems, 17, PP. 191-209.

Dubois, D. & Prade, H., 1992, Putting Rough Sets and Fuzzy Sets Together, in R. Slowinski, ed. Intelligent Decision Support - Handbook of Applications and Advances of the Rough Sets Theory, Dordrecht: Kluwer Academic Publishers.

Gorsevski, P.V., Jankowski, P., 2008, Discerning Landslide Susceptibility Using Rough Sets, Computers, Environment and Urban Systems, 32, PP. 53-65.

Hsue Cheng, C., 2010, A Hybrid Model Based on Rough Sets Theory and Genetic Algorithms for Stock Price Forecasting, Elsevier Information Sciences, 180, P. 20.

Larose, D., 2005, Discovering Knowledge (In Data An Introduction to Data Mining), Ebook.

McKee, T. & Lensberg, T., 2002, Genetic Programming and Rough Sets: A Hybrid Approach to Bankruptcy Classification, Elsevier/Information Technology, 138, P. 16.

Mortazavi, M., 2009, Comparison of Multi-Objective Genetic Algorithm with Ant Colony Optimization: A Case Study for Canberra Water Supply System, 33rd IAHR Congress: Water Engineering for a Sustainable Environment.

Pawlak, Z., 1982, Rough Sets, International Journal of Computer and information Science, 11(5), PP. 341-356.

Pheng Khoo, L., 2002, Feature Extraction Using Rough Set Theory and Genetic Algorithms an Application for the Simplification of Product Quality Evaluation, Elsevier/Computers & Industrial Engineering, 43, P. 16.

Pheng Khoo, L. & Yin Zhai, L., 2001, A Prototype Genetic Algorithm Enhanced Rough Set Based Rule Induction System, Elsevier/Computers & Industrial Engineering, 46, P. 12.

Santana, L., 2010, DEMORS: A Hybrid Multi-Objective Optimization Algorithm Using Differential Evolution and Rough Set Theory for Constrained Problems, Elsevier/ Computers & Operations Research, 37, P. 11.

Sheng, 2008, Modular Feature Selection Using Relative Importance Factors, Department of Electrical and Computer Engineering National University of Singapore, 13.

Slowinski, R. & Stefanowski, J., 1989, Rough Classification in Incomplete Information Systems, Mathematical & Computer Modeling, 12.

Thangavel, 2009, Dimensionality Reduction Based on Rough Set Theory: A Review, Elsevier/Applied Soft Computing, 9, P. 12.

Triantaphyllou, E. & Felici, G., 2006, Data Mining & Knowledge Discovery Approaches Based on Rule Induction Techniques, Springer.

Yau Liang, W. & Che Huang, C., 2009, The Generic Genetic Algorithm Incorporates with Rough Set Theory – An Application of the Web Services Composition, Elsevier/Expert Systems with Application, 36, P. 8.

Wygralak, W., 1989, Rough Sets and Fuzzy Sets - Some Remarks on Interrelations, Fuzzy Sets and Systems, 29, PP. 241-243.

Yin Zhai, L., Pheng Khoo, L., Cheong Fok, S., 2006, Knowledge Acquisition and Uncertainty in Fault Diagnosis: A Rough Sets Perspective, Data Mining and Knowledge Discovery Approaches Based on Rule Induction Techniques, Springer, Heidelberg, PP. 359-394


ارجاعات
  • در حال حاضر ارجاعی نیست.