یک الگوریتم ترکیبی خوشه بندی جدید در رویکرد داده های دسته ای

نویسندگان

Shahid Rajaee Teacher Training University

چکیده

خوشه­ بندی داده­ ها یک ابزار پایه موجود برای درک ساختار مجموعه داده­ ها است. فرایندی که داده­ ها را در گروه­ های از اشیاء شبیه به هم قرار می­دهد خوشه­ بندی نام دارد. خوشه­ بندی یکی از مهم‌ترین مسائل بدون ناظر برای یافتن ساختار در یک مجموعه داده­ های برچسب نخورده است. الگوریتم­ های خوشه­ بندی با توجه به نوع داده­ ها به دو دسته تقسیم می­ شوند: الگوریتم­ های خوشه­ بندی داده­ های عددی و الگوریتم­ های خوشه­ بندی داده­ های دسته­ ای. الگوریتم­ های خوشه­ بندی داده­ های دسته­ ای به دلیل  ماهیت و کاربرد این داده­ ها نسبت به الگوریتم­ های خوشه­ بندی داده­ های عددی از اهمیت بالایی برخوداراند. در این مقاله ابتدا به بررسی ماهیت این نوع داده­ ها پرداخته و سپس معیارهای شباهت و الگوریتم­ های خوشه­ بندی مطرح‌شده در این حوزه را بررسی می­ کنیم و در انتها، روشی ترکیبی، برپایه ترکیب دو الگوریتم خوشه­ بندی سلسله‌مراتبی و خوشه­ بندی تفکیکی برای خوشه­ بندی بهتر این نوع داده­ ها ارائه می­ دهیم. آزمایشات نشان می­ دهد که روش ارائه شده در این مقاله نتایج حاصل از خوشه بندی را بهبود می­ بخشد.