k-means++

Name: k-means++ | Εξυπνότερες Στρατηγικές Αρχικοποίησης για Ομαδοποίηση k-means
Uploaded: 2020-02-12
Description: Ο k-means++ απλώνει τα αρχικά κεντροειδή μακριά μεταξύ τους, μειώνοντας την πιθανότητα ο απλός k-means να συγκλίνει σε φτωχό τοπικό βέλτιστο.

Ενημέρωση 2020-02-12 Ανάγνωση 1 λεπτά

Σύνοψη

Ο k-means++ απλώνει τα αρχικά κεντροειδή μακριά μεταξύ τους, μειώνοντας την πιθανότητα ο απλός k-means να συγκλίνει σε φτωχό τοπικό βέλτιστο.
Τα πρόσθετα κεντροειδή δειγματοληπτούνται με πιθανότητα ανάλογη του τετραγώνου της απόστασης από τα υπάρχοντα κεντροειδή, αποθαρρύνοντας στενές ομάδες σπόρων.
Στο scikit-learn, ο KMeans(init="k-means++") ενεργοποιεί τη μέθοδο, διευκολύνοντας τη σύγκριση με καθαρά τυχαία αρχικοποίηση.
Παραλλαγές μεγάλης κλίμακας όπως ο mini-batch k-means βασίζονται στον k-means++ και είναι κοινές σε ρυθμίσεις ροής ή μεγάλων δεδομένων.

Εισαγωγή #

Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.

Εισαγωγή #

Αναλυτική Επεξήγηση #