حمید عزتآبادیپور؛ سعید همایونی
دوره 7، شماره 3 ، بهمن 1394، ، صفحه 97-114
چکیده
مدلهای خوشهبندی c-means یکی از پرکاربردترین شیوههای طبقهبندی نظارتنشده در آنالیز دادهها بهشمار میرود. مدل فازی این روش، یعنی Fuzzy c-means، یکی از مشهورترین مدلهایی است که در آن هر داده با یک مقدار درجۀ عضویت بین 0 و 1، به هر یک از خوشهها اختصاص داده میشود. این مدل خوشهبندی جهت طبقهبندی دادههای سنجش از دوری بسیار استفاده ...
بیشتر
مدلهای خوشهبندی c-means یکی از پرکاربردترین شیوههای طبقهبندی نظارتنشده در آنالیز دادهها بهشمار میرود. مدل فازی این روش، یعنی Fuzzy c-means، یکی از مشهورترین مدلهایی است که در آن هر داده با یک مقدار درجۀ عضویت بین 0 و 1، به هر یک از خوشهها اختصاص داده میشود. این مدل خوشهبندی جهت طبقهبندی دادههای سنجش از دوری بسیار استفاده شده است. مدل Fuzzy c-means از فاصلۀ اقلیدسی جهت خوشهبندی استفاده کرده و برای همۀ خوشهها شکل یکسانی فرض میکند. با وجود این، این مدل برای دادههایی که در آنها کلاسها دارای شکل و حجم متفاوتاند، مناسب به نظر نمیرسد. برای رفع این مشکل، مدل Gustafson-Kessel جهت خوشهبندی دادههای پیچیده ارائه شده است. این مدل برمبنای بهکارگیری یک ماتریس کوواریانس فازی برای هر خوشه عمل میکند و شکل هندسی، حجم و جهتگیری یکسانی برای همۀ خوشهها در نظر نمیگیرد. در این تحقیق، از هر دو مدل خوشهبندی مذکور جهت دادههای سنجش از دوری فراطیفی واقعی حاصل از سنجندههای Hyperion، ROSIS و CASI استفاده شده است. نتایج حاصل از مدلهای خوشهبندی Fuzzy c-means و Gustafson-Kessel به پارامتری به نام فازیکننده وابسته است که در این تحقیق، مقدار بهینۀ آن با محاسبه و بررسی دقت طبقهبندی هر یک از این مدلها، در ازای فازیکنندههای مختلف بهدست آمده است. نتایج بهدستآمده در ازای مقدار بهینه فازیکننده، نشان میدهد که مدل Gustafson-Kessel دقت و صحت طبقهبندی را حدود 5/12% برای دادههای Hyperion و حدود 45/8% برای دادههای ROSIS افزایش میدهد. همچنین، ارزیابی دیداری نتایج دو مدل خوشهبندی روی دادههای CASI نشان میدهد که مدل Gustafson-Kessel عملکرد بهتری دارد. البته در مقابل، باید گفت مدل Gustafson-Kessel هزینۀ زمانی بیشتری را صرف میکند و همچنین، جهت تعیین پارامتر مربوط به حجم خوشهها، به دانش قبلی نیاز دارد.