2.1.10
Παλινδρόμηση Διανυσμάτων Υποστήριξης (SVR)
Σύνοψη
- Η Παλινδρόμηση Διανυσμάτων Υποστήριξης επεκτείνει τα SVM στην παλινδρόμηση, αντιμετωπίζοντας σφάλματα εντός ενός ε-ασυμπτωτικού σωλήνα ως μηδενικά για τη μείωση της επίδρασης ακραίων τιμών.
- Οι μέθοδοι πυρήνα επιτρέπουν ευέλικτες μη γραμμικές σχέσεις, ενώ διατηρούν το μοντέλο συμπαγές μέσω των διανυσμάτων υποστήριξης.
- Οι υπερπαράμετροι
C,epsilonκαιgammaρυθμίζουν την ισορροπία μεταξύ γενίκευσης και ομαλότητας. - Η κλιμάκωση χαρακτηριστικών είναι απαραίτητη· η ενσωμάτωση προεπεξεργασίας και μάθησης σε ένα pipeline διασφαλίζει συνεπείς μετασχηματισμούς.
Εισαγωγή #
Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσω των υποθέσεών της, των συνθηκών δεδομένων και του τρόπου με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.
Αναλυτική Επεξήγηση #
Μαθηματική Διατύπωση #
Το πρόβλημα βελτιστοποίησης είναι
$$ \min_{\mathbf{w}, b, \boldsymbol{\xi}, \boldsymbol{\xi}^*} \frac{1}{2} \|\mathbf{w}\|^2 + C \sum_{i=1}^{n} (\xi_i + \xi_i^*) $$υπό τους περιορισμούς
$$ \begin{aligned} y_i - (\mathbf{w}^\top \phi(\mathbf{x}_i) + b) &\le \epsilon + \xi_i, \\ (\mathbf{w}^\top \phi(\mathbf{x}_i) + b) - y_i &\le \epsilon + \xi_i^*, \\ \xi_i, \xi_i^* &\ge 0, \end{aligned} $$όπου \(\phi\) απεικονίζει τις εισόδους σε έναν χώρο χαρακτηριστικών μέσω του επιλεγμένου πυρήνα. Η επίλυση του δυϊκού δίνει τα διανύσματα υποστήριξης και τους συντελεστές.
Πειράματα σε Python #
Αυτό το παράδειγμα επιδεικνύει τη SVR σε συνδυασμό με StandardScaler σε ένα pipeline.
| |
Ερμηνεία αποτελεσμάτων #
- Το pipeline κλιμακώνει τα δεδομένα εκπαίδευσης χρησιμοποιώντας τον μέσο και τη διακύμανσή τους, και στη συνέχεια εφαρμόζει τον ίδιο μετασχηματισμό στο σύνολο ελέγχου.
- Η
predπεριέχει προβλέψεις για τα χαρακτηριστικά ελέγχου· η ρύθμιση τωνepsilonκαιCπροσαρμόζει τη σχέση μεταξύ υπερπροσαρμογής και υποπροσαρμογής. - Η αύξηση του
gammaτου πυρήνα RBF εστιάζει σε τοπικά μοτίβα, ενώ μικρότερες τιμές παράγουν πιο ομαλές συναρτήσεις.
Αναφορές #
- Smola, A. J., & Schölkopf, B. (2004). A Tutorial on Support Vector Regression. Statistics and Computing, 14(3), 199–222.
- Vapnik, V. (1995). The Nature of Statistical Learning Theory. Springer.