2.1.11
Σταθμισμένα Ελάχιστα Τετράγωνα (WLS)
Σύνοψη
- Τα Σταθμισμένα Ελάχιστα Τετράγωνα εκχωρούν βάρη ανά παρατήρηση ώστε οι αξιόπιστες μετρήσεις να επηρεάζουν ισχυρότερα την προσαρμοσμένη γραμμή.
- Ο πολλαπλασιασμός των τετραγωνικών σφαλμάτων με βάρη υποβαθμίζει τις παρατηρήσεις υψηλής διακύμανσης και διατηρεί την εκτίμηση κοντά στα αξιόπιστα δεδομένα.
- Μπορείτε να εκτελέσετε WLS με τη
LinearRegressionτου scikit-learn παρέχονταςsample_weight. - Τα βάρη μπορούν να προέρχονται από γνωστές διακυμάνσεις, διαγνωστικά υπολοίπων ή γνώση πεδίου· ο προσεκτικός σχεδιασμός είναι κρίσιμος.
Εισαγωγή #
Αυτή η μέθοδος πρέπει να ερμηνεύεται μέσω των υποθέσεών της, των συνθηκών δεδομένων και του τρόπου με τον οποίο οι επιλογές παραμέτρων επηρεάζουν τη γενίκευση.
Αναλυτική Επεξήγηση #
Μαθηματική Διατύπωση #
Με θετικά βάρη \(w_i\), ελαχιστοποιήστε
$$ L(\boldsymbol\beta, b) = \sum_{i=1}^{n} w_i \left(y_i - (\boldsymbol\beta^\top \mathbf{x}_i + b)\right)^2. $$Η βέλτιστη επιλογή \(w_i \propto 1/\sigma_i^2\) (αντίστροφη διακύμανση) δίνει μεγαλύτερη επιρροή στις ακριβείς παρατηρήσεις.
Πειράματα σε Python #
Συγκρίνουμε OLS και WLS σε δεδομένα των οποίων το επίπεδο θορύβου διαφέρει σε διαφορετικές περιοχές.
| |

Ερμηνεία αποτελεσμάτων #
- Η στάθμιση προσελκύει την προσαρμογή προς την περιοχή χαμηλού θορύβου, παράγοντας εκτιμήσεις κοντά στην πραγματική γραμμή.
- Η OLS παρεκκλίνει λόγω της θορυβώδους περιοχής και υποεκτιμά την κλίση.
- Η απόδοση εξαρτάται από την επιλογή κατάλληλων βαρών· τα διαγνωστικά και η διαίσθηση πεδίου έχουν σημασία.
Αναφορές #
- Carroll, R. J., & Ruppert, D. (1988). Transformation and Weighting in Regression. Chapman & Hall.
- Seber, G. A. F., & Lee, A. J. (2012). Linear Regression Analysis (2nd ed.). Wiley.