k-means++

2.5.2

k-means++

Ενημέρωση 2020-02-12 Ανάγνωση 1 λεπτά
Σύνοψη
  • Ο k-means++ απλώνει τα αρχικά κεντροειδή μακριά μεταξύ τους, μειώνοντας την πιθανότητα ο απλός k-means να συγκλίνει σε φτωχό τοπικό βέλτιστο.
  • Τα πρόσθετα κεντροειδή δειγματοληπτούνται με πιθανότητα ανάλογη του τετραγώνου της απόστασης από τα υπάρχοντα κεντροειδή, αποθαρρύνοντας στενές ομάδες σπόρων.
  • Στο scikit-learn, ο KMeans(init="k-means++") ενεργοποιεί τη μέθοδο, διευκολύνοντας τη σύγκριση με καθαρά τυχαία αρχικοποίηση.
  • Παραλλαγές μεγάλης κλίμακας όπως ο mini-batch k-means βασίζονται στον k-means++ και είναι κοινές σε ρυθμίσεις ροής ή μεγάλων δεδομένων.

Εισαγωγή #

Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.

Αναλυτική Επεξήγηση #