2.5.1
k-means
Ringkasan
- k-means mengelompokkan titik yang saling berdekatan dengan memperbarui centroid (titik wakil) dan penugasan sampel secara bergantian hingga stabil.
- Fungsi objektifnya adalah jumlah kuadrat dalam klaster (WCSS), yaitu jarak kuadrat antara setiap sampel dan centroid klasternya.
KMeansdariscikit-learnmemudahkan kita memvisualisasikan konvergensi, mencoba berbagai inisialisasi, dan melihat perubahan penugasan.- Pemilihan \(k\) lazimnya memadukan diagnosis seperti metode siku atau skor siluet dengan pertimbangan kebutuhan bisnis.
Intuisi #
Metode ini dipahami lewat asumsi dasarnya, karakteristik data, dan dampak pengaturan parameter terhadap generalisasi.