2.2.6
Naive Bayes
Σύνοψη
- Ο Naive Bayes υποθέτει υπό συνθήκη ανεξαρτησία μεταξύ χαρακτηριστικών και συνδυάζει εκ των προτέρων πιθανότητες με πιθανοφάνειες μέσω του κανόνα Bayes.
- Η εκπαίδευση και η εξαγωγή συμπερασμάτων είναι εξαιρετικά γρήγορες, καθιστώντας τον ισχυρή βάση αναφοράς για αραιά δεδομένα υψηλών διαστάσεων, όπως κείμενο ή φιλτράρισμα ανεπιθύμητης αλληλογραφίας.
- Η εξομάλυνση Laplace και τα χαρακτηριστικά TF-IDF μετριάζουν προβλήματα με άγνωστες λέξεις και ανισορροπία συχνοτήτων.
- Όταν η υπόθεση ανεξαρτησίας είναι πολύ ισχυρή, εξετάστε την επιλογή χαρακτηριστικών ή τον συνδυασμό του Naive Bayes με άλλα μοντέλα.
Εισαγωγή #
Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.
Αναλυτική Επεξήγηση #
Μαθηματική Διατύπωση #
Για την κλάση \(y\) και τα χαρακτηριστικά \(\mathbf{x} = (x_1, \ldots, x_d)\),
$$ P(y \mid \mathbf{x}) \propto P(y) \prod_{j=1}^{d} P(x_j \mid y). $$Διαφορετικά μοντέλα πιθανοφάνειας ταιριάζουν σε διαφορετικούς τύπους δεδομένων: το πολυωνυμικό μοντέλο για μετρήσεις λέξεων, το μοντέλο Bernoulli για δυαδική παρουσία/απουσία και ο Gaussian Naive Bayes για συνεχείς τιμές.
Πειράματα σε Python #
Το παρακάτω απόσπασμα κώδικα εκπαιδεύει έναν ταξινομητή Gaussian Naive Bayes σε συνθετικά δεδομένα και οπτικοποιεί τις περιοχές απόφασης. Ακόμα και με χιλιάδες χαρακτηριστικά, το μοντέλο εκπαιδεύεται γρήγορα.
| |
Αναφορές #
- Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to Information Retrieval. Cambridge University Press.
- Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspective. MIT Press.