2.1.5
Παλινδρόμηση Elastic Net
Σύνοψη
- Το Elastic Net συνδυάζει τις ποινές L1 (Lasso) και L2 (Ridge) για να ισορροπήσει αραιότητα και σταθερότητα.
- Μπορεί να διατηρήσει ομάδες ισχυρά συσχετισμένων χαρακτηριστικών ενώ ρυθμίζει τη σημασία τους συλλογικά.
- Η ρύθμιση τόσο της \(\alpha\) όσο και του
l1_ratioμε διασταυρωμένη επικύρωση διευκολύνει την εύρεση της ισορροπίας πόλωσης-διακύμανσης. - Η τυποποίηση των χαρακτηριστικών και η παροχή αρκετών επαναλήψεων βελτιώνουν την αριθμητική σταθερότητα του βελτιστοποιητή.
Εισαγωγή #
Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσα από τις υποθέσεις της, τις συνθήκες των δεδομένων και τον τρόπο με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.
Αναλυτική Επεξήγηση #
Μαθηματική Διατύπωση #
Το Elastic Net ελαχιστοποιεί
$$ \min_{\boldsymbol\beta, b} \sum_{i=1}^{n} \left( y_i - (\boldsymbol\beta^\top \mathbf{x}_i + b) \right)^2 + \alpha \left( \rho \lVert \boldsymbol\beta \rVert_1 + (1 - \rho) \lVert \boldsymbol\beta \rVert_2^2 \right), $$όπου \(\alpha > 0\) είναι η ισχύς κανονικοποίησης και \(\rho \in [0,1]\) (l1_ratio) ελέγχει τον συμβιβασμό L1/L2. Μετακινώντας τη \(\rho\) μεταξύ 0 και 1 μπορείτε να εξερευνήσετε το φάσμα μεταξύ Ridge και Lasso.
Πειράματα σε Python #
Παρακάτω χρησιμοποιούμε το ElasticNetCV για να επιλέξουμε ταυτόχρονα \(\alpha\) και l1_ratio, και στη συνέχεια εξετάζουμε τους συντελεστές και την απόδοση.
| |
Ανάγνωση των αποτελεσμάτων #
- Το
ElasticNetCVαξιολογεί αυτόματα πολλαπλούς συνδυασμούς L1/L2 και επιλέγει μια καλή ισορροπία. - Όταν τα συσχετισμένα χαρακτηριστικά επιβιώνουν μαζί, οι συντελεστές τους τείνουν να ευθυγραμμίζονται σε μέγεθος, γεγονός που απλοποιεί την ερμηνεία.
- Αν η σύγκλιση είναι αργή, τυποποιήστε τις εισόδους ή αυξήστε το
max_iter.
Αναφορές #
- Zou, H., & Hastie, T. (2005). Regularization and Variable Selection via the Elastic Net. Journal of the Royal Statistical Society: Series B, 67(2), 301–320.
- Friedman, J., Hastie, T., & Tibshirani, R. (2010). Regularization Paths for Generalized Linear Models via Coordinate Descent. Journal of Statistical Software, 33(1), 1–22.