k-means

2.5.1

k-means

Diperbarui 2020-01-29 Baca 1 menit
Ringkasan
  • k-means mengelompokkan titik yang saling berdekatan dengan memperbarui centroid (titik wakil) dan penugasan sampel secara bergantian hingga stabil.
  • Fungsi objektifnya adalah jumlah kuadrat dalam klaster (WCSS), yaitu jarak kuadrat antara setiap sampel dan centroid klasternya.
  • KMeans dari scikit-learn memudahkan kita memvisualisasikan konvergensi, mencoba berbagai inisialisasi, dan melihat perubahan penugasan.
  • Pemilihan \(k\) lazimnya memadukan diagnosis seperti metode siku atau skor siluet dengan pertimbangan kebutuhan bisnis.

Intuisi #

Metode ini dipahami lewat asumsi dasarnya, karakteristik data, dan dampak pengaturan parameter terhadap generalisasi.

Penjelasan Rinci #