برای کسب اطلاعات بیشتر، به این لینک مراجعه نمایید:
خوشه بندی یا گروه بندی داده ها یکی از روش های پایه ای در داده کاوی است. برای خوشه بندی (Clustering) روش ها و الگوریتم های مختلفی وجود دارد ولی یکی از اصلی و پرکاربردترین خوشه بندی ها، خوشه بندی سلسله مراتبی (Hierarchical) است. خوشه بندی سلسله مراتبی برای داده های چند بعدی و حجیم احتیاج به انجام محاسبات سنگین و زیادی خواهد داشت که این محاسبات در اکثر نرم افزارهای آماری یا داده کاوی امکان پذیر است. در این آموزش به کمک برنامه نویسی در محیط R انجام چنین محاسباتی را ساده می کنیم.
سرفصل های مورد بحث در این فیلم آموزشی عبارتند از:
درس یکم: مبانی خوشه بندی
انواع داده ها و شیوه اندازه گیری فاصله برای داده های کمی و کیفی
ماتریس فاصله و نحوه محاسبه آن
آشنایی با مفهوم خوشه بندی و معرفی روش های آن
خوشه بندی سلسله مراتبی و خصوصیات آن
خوشه بندی سلسله مراتبی تجمیعی – تقسیمی
آشنایی با نمودار درختی – Dendrogram
برش نمودار درختی و تفسیر آن
آشنایی با مفهوم پیوند و انواع آن
درس دوم: انجام خوشه بندی سلسله مراتبی در R
آشنایی با محیط R و RStudio
استفاده از بسته های Stat ,Cluster و همچنین Factoextra برای خوشه بندی و نمایش خوشه ها
محاسبه ماتریس فاصله برای داده های کمی – کیفی و دودویی
خوشه بندی به روش تجمیعی
نمایش خروجی و نمودار درختی و برش آن
خوشه بندی به روش تقسیمی
ارزیابی خوشه بندی سلسله مراتبی به کمک مقایسه نمودار درختی
مدرس: آرمان ری بد