2.5.1
k-means
Σύνοψη
- Ο k-means ακολουθεί έναν διαισθητικό κανόνα — ομαδοποίηση κοντινών σημείων μαζί — ενημερώνοντας επαναληπτικά τους αντιπροσώπους συστάδων (κεντροειδή) μέχρι οι αναθέσεις να σταθεροποιηθούν.
- Η αντικειμενική συνάρτηση είναι το ενδο-συσταδικό άθροισμα τετραγώνων (WCSS), δηλαδή η τετραγωνική απόσταση μεταξύ κάθε δείγματος και του ανατεθέντος κεντροειδούς του.
- Με τον
KMeansτουscikit-learnμπορείτε να οπτικοποιήσετε τη σύγκλιση, να πειραματιστείτε με σχήματα αρχικοποίησης και να ελέγξετε πώς αλλάζουν οι αναθέσεις. - Η επιλογή \(k\) τυπικά περιλαμβάνει διαγνωστικά όπως η μέθοδος αγκώνα ή τα σκορ σιλουέτας, σε ισορροπία με τη γνώση του πεδίου.
Εισαγωγή #
Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.