2.5.2
k-means++
Σύνοψη
- Ο k-means++ απλώνει τα αρχικά κεντροειδή μακριά μεταξύ τους, μειώνοντας την πιθανότητα ο απλός k-means να συγκλίνει σε φτωχό τοπικό βέλτιστο.
- Τα πρόσθετα κεντροειδή δειγματοληπτούνται με πιθανότητα ανάλογη του τετραγώνου της απόστασης από τα υπάρχοντα κεντροειδή, αποθαρρύνοντας στενές ομάδες σπόρων.
- Στο
scikit-learn, οKMeans(init="k-means++")ενεργοποιεί τη μέθοδο, διευκολύνοντας τη σύγκριση με καθαρά τυχαία αρχικοποίηση. - Παραλλαγές μεγάλης κλίμακας όπως ο mini-batch k-means βασίζονται στον k-means++ και είναι κοινές σε ρυθμίσεις ροής ή μεγάλων δεδομένων.
Εισαγωγή #
Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.