در این پست از وبسایت پرووید با دومین قسمت از سری آموزشی “پیاده سازی الگوریتم خوشه بندی کا-میانگین در سی شارپ” در خدمت شما هستیم. به ادامه ی مطلب بروید.

الگوریتم خوشه بندی کا-میانگین

قبل از اینکه بریم سراغ برنامه میخوام یه کوچولو در مورد الگوریتم کا-میانگین صحبت کنم. اولین سوالی که شاید به ذهن برسه اینه که کار این الگوریتم چیه؟ همونطور که از اسمش معلومه، این الگوریتم قراره خوشه بندی برای ما انجام بده. یعنی اینکه یه سری داده رو توی خوشه های مختلف برای ما دسته بندی کنه. خوشه رو همون دسته یا گروه در نظر بگیرید.

به عنوان یه مثال از خوشه بندی، فرض کنید ما اطلاعات صد تا دانش آموز رو داریم و میخوایم اونا رو توی n دسته، گروه بندی کنیم. اما اساس گروه بندی چیه؟ خب اساس کار اینه که طوری خوشه بندی رو انجام بدیم تا اعضای یک خوشه ی یکسان حداقل اختلاف رو با هم داشته باشن و اعضای خوشه های مختلف بیشترین اختلاف رو. مثلاً، همون دانش آموزها رو در نظر بگیرید. دانش آموزهایی که معدلشون بالای 16 است، انضباطشون بالای 17 است و حداکثر دو درس رو تا حالا افتادن بذاریم توی یه خوشه، دانش آموزهایی که معدلشون بالای 18 هست، انضباطشون بالای 19 هست و تا حالا هیچ درسی رو نیفتادن بذاریم توی گروه دیگه و همینطور الی آخر.

در واقع نتیجه ی آخر الگوریتم کا-میانگین یه سری خوشه است که هر کدوم حاوی یه سری داده هستند به طوری که داده های درون یه خوشه خیلی به هم شباهت دارند و داده های دو تا خوشه ی متفاوت با هم اختلاف زیادی دارند.

خب تا همین جا بحث رو نگه داریم و ادامه رو بذاریم برای پست بعدی.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *