2.2.1
Λογιστική Παλινδρόμηση
- Η λογιστική παλινδρόμηση περνάει έναν γραμμικό συνδυασμό των εισόδων μέσα από τη σιγμοειδή συνάρτηση για να προβλέψει την πιθανότητα ότι η ετικέτα είναι 1.
- Η έξοδος βρίσκεται στο \([0, 1]\), επιτρέποντας ευέλικτο ορισμό κατωφλίων απόφασης και ερμηνεία των συντελεστών ως συνεισφορές στα λογ-πηλίκα.
- Η εκπαίδευση ελαχιστοποιεί την απώλεια διασταυρούμενης εντροπίας (ισοδύναμα μεγιστοποιεί τη λογαριθμική πιθανοφάνεια)· η κανονικοποίηση L1/L2 αποτρέπει την υπερπροσαρμογή.
- Η
LogisticRegressionτου scikit-learn χειρίζεται προεπεξεργασία, εκπαίδευση και οπτικοποίηση ορίων απόφασης με λίγες γραμμές κώδικα.
Εισαγωγή #
Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.
Αναλυτική Επεξήγηση #
Μαθηματική Διατύπωση #
Η πιθανότητα της κλάσης 1 δεδομένου \(\mathbf{x}\) είναι
$$ P(y=1 \mid \mathbf{x}) = \sigma(\mathbf{w}^\top \mathbf{x} + b) = \frac{1}{1 + \exp\left(-(\mathbf{w}^\top \mathbf{x} + b)\right)}. $$Η μάθηση μεγιστοποιεί τη λογαριθμική πιθανοφάνεια
$$ \ell(\mathbf{w}, b) = \sum_{i=1}^{n} \Bigl[ y_i \log p_i + (1 - y_i) \log (1 - p_i) \Bigr], \quad p_i = \sigma(\mathbf{w}^\top \mathbf{x}_i + b), $$ή ισοδύναμα ελαχιστοποιεί την αρνητική απώλεια διασταυρούμενης εντροπίας. Η προσθήκη κανονικοποίησης L2 αποτρέπει τους συντελεστές από το να εκρήγνυνται, ενώ η κανονικοποίηση L1 μπορεί να οδηγήσει τα μη σχετικά βάρη στο μηδέν.
Πειράματα σε Python #
Το παρακάτω απόσπασμα κώδικα προσαρμόζει τη λογιστική παλινδρόμηση σε ένα συνθετικό δισδιάστατο σύνολο δεδομένων και οπτικοποιεί το προκύπτον όριο απόφασης. Τα πάντα — από την εκπαίδευση μέχρι τη σχεδίαση — χωρούν σε λίγες γραμμές χάρη στο scikit-learn.
| |

Αναφορές #
- Agresti, A. (2015). Foundations of Linear and Generalized Linear Models. Wiley.
- Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer.