k-means

2.5.1

k-means

Ενημέρωση 2020-01-29 Ανάγνωση 1 λεπτά
Σύνοψη
  • Ο k-means ακολουθεί έναν διαισθητικό κανόνα — ομαδοποίηση κοντινών σημείων μαζί — ενημερώνοντας επαναληπτικά τους αντιπροσώπους συστάδων (κεντροειδή) μέχρι οι αναθέσεις να σταθεροποιηθούν.
  • Η αντικειμενική συνάρτηση είναι το ενδο-συσταδικό άθροισμα τετραγώνων (WCSS), δηλαδή η τετραγωνική απόσταση μεταξύ κάθε δείγματος και του ανατεθέντος κεντροειδούς του.
  • Με τον KMeans του scikit-learn μπορείτε να οπτικοποιήσετε τη σύγκλιση, να πειραματιστείτε με σχήματα αρχικοποίησης και να ελέγξετε πώς αλλάζουν οι αναθέσεις.
  • Η επιλογή \(k\) τυπικά περιλαμβάνει διαγνωστικά όπως η μέθοδος αγκώνα ή τα σκορ σιλουέτας, σε ισορροπία με τη γνώση του πεδίου.

Εισαγωγή #

Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.

Αναλυτική Επεξήγηση #