2.1.5
Regresi Elastic Net
Ringkasan
- Elastic Net menggabungkan penalti L1 (lasso) dan L2 (ridge) untuk menyeimbangkan sparsitas dan stabilitas.
- Kelompok fitur yang sangat berkorelasi dapat dipertahankan sekaligus menyesuaikan pentingnya secara kolektif.
- Menyetel \(\alpha\) dan
l1_ratiodengan cross-validation memudahkan pencarian keseimbangan bias–varian. - Menstandarkan fitur dan memberi iterasi yang cukup meningkatkan stabilitas numerik optimisasi.
Intuisi #
Metode ini dipahami lewat asumsi dasarnya, karakteristik data, dan dampak pengaturan parameter terhadap generalisasi.
Penjelasan Rinci #
Formulasi matematis #
Elastic Net meminimalkan
$$ \min_{\boldsymbol\beta, b} \sum_{i=1}^{n} \left( y_i - (\boldsymbol\beta^\top \mathbf{x}_i + b) \right)^2 + \alpha \left( \rho \lVert \boldsymbol\beta \rVert_1 + (1 - \rho) \lVert \boldsymbol\beta \rVert_2^2 \right), $$dengan \(\alpha > 0\) sebagai kekuatan regularisasi dan \(\rho \in [0,1]\) (l1_ratio) mengontrol perbandingan L1/L2. Mengubah \(\rho\) dari 0 ke 1 memungkinkan kita menelusuri spektrum antara ridge dan lasso.
Eksperimen dengan Python #
Berikut penggunaan ElasticNetCV untuk memilih \(\alpha\) dan l1_ratio secara bersamaan, kemudian meninjau koefisien serta kinerjanya.
| |
Cara membaca hasil #
ElasticNetCVmengevaluasi berbagai kombinasi L1/L2 secara otomatis dan memilih keseimbangan yang baik.- Ketika fitur yang berkorelasi bertahan bersama, koefisiennya cenderung memiliki besar yang serupa sehingga lebih mudah ditafsirkan.
- Jika konvergensi lambat, standarkan input atau tingkatkan
max_iter.
Referensi #
- Zou, H., & Hastie, T. (2005). Regularization and Variable Selection via the Elastic Net. Journal of the Royal Statistical Society: Series B, 67(2), 301–320.
- Friedman, J., Hastie, T., & Tibshirani, R. (2010). Regularization Paths for Generalized Linear Models via Coordinate Descent. Journal of Statistical Software, 33(1), 1–22.