Τι θα μάθετε σε αυτό το κεφάλαιο #
- Συνολική εικόνα των δεικτών
Θα οργανώσουμε τις βασικές έννοιες για παλινδρόμηση, ταξινόμηση, κατάταξη και ανίχνευση ανωμαλιών. - Παραδείγματα Python 3.13
Με scikit-learn / matplotlib, θα δείξουμε πώς υπολογίζουμε και οπτικοποιούμε δείκτες με λίγο κώδικα. - Επιλογή δεικτών ανά χρήση
Θα συνδέσουμε επιχειρησιακές απαιτήσεις (π.χ. έμφαση στο recall ή στο κέρδος) με το κατάλληλο σύνολο δεικτών.
まとめ
- Πίνακες δεικτών ανά στόχο και μοτίβα οπτικοποίησης με βάση τον πίνακα σύγχυσης
- Συνταγές υπολογισμού για MAE/MSE/RMSE, Accuracy/F1/AUC, MAP@K κ.ά.
- Συνδυασμοί διαδικασίας αξιολόγησης (holdout / CV) και δεικτών
Δομή ενότητας #
| Σελίδα | Σκοπός | Κύρια θέματα |
|---|---|---|
| Δείκτες παλινδρόμησης | Αξιολόγηση σφάλματος αριθμητικής πρόβλεψης | MAE, MSE, RMSE, MAPE, R², residual plots |
| Δείκτες δυαδικής ταξινόμησης | Ετικέτες 0/1 | Precision, Recall, F1, AUC, PR curve |
| Πολυκλασική / πολυετικετική | Πολλαπλές ετικέτες | Macro/Micro averaging, confusion matrix heatmap |
| Δείκτες κατάταξης | Σύσταση/αναζήτηση | MAP@K, NDCG, Hit@K |
| Ανίχνευση ανωμαλιών | Λίγες ή χωρίς ετικέτες | ROC/PR, κατανομή score, ψευδο-ετικέτες |
Σε κάθε σελίδα ακολουθούμε τη ροή «έννοια δείκτη → παράδειγμα υπολογισμού → οπτικοποίηση → πότε τον χρησιμοποιούμε».
Συνολική διαδικασία αξιολόγησης #
- Διαχωρισμός δεδομένων
- Holdout: Train / Validation / Test
- Cross-validation: KFold, StratifiedKFold, TimeSeriesSplit
- Υπολογισμός δεικτών
- Χρήση συναρτήσεων του
sklearn.metrics - Με
make_scorerενσωμάτωση σεGridSearchCV
- Χρήση συναρτήσεων του
- Σύνοψη και οπτικοποίηση
- Συγκέντρωση σε
pandas.DataFrame, boxplot / ROC / PR - Συνδυασμός με feature importance και residual analysis
- Συγκέντρωση σε
Οδηγός επιλογής δεικτών #
| Οπτική | Ερώτηση | Προτεινόμενοι δείκτες |
|---|---|---|
| Μονάδα σφάλματος | Θέλεις απόλυτο μέγεθος ή ποσοστό; | MAE / RMSE / MAPE |
| Δομή κόστους | Ποιο είναι ακριβότερο: false positive ή false negative; | Precision/Recall, Fβ, cost-sensitive loss |
| Αναλογία ετικετών | Υπάρχει ανισορροπία κλάσεων; | PR-AUC, Balanced Accuracy, ROC-AUC |
| Στόχος κατάταξης | Σε ενδιαφέρουν οι Top-K προτάσεις; | MAP@K, NDCG, Hit@K |
| Monitoring/alerting | Θες έγκαιρο εντοπισμό υποβάθμισης; | Χρονική παρακολούθηση δεικτών και drift metrics |
Μετά την ολοκλήρωση του κεφαλαίου #
- Μπορείς να εξηγείς «γιατί F1 σε αυτό το πρόβλημα» σε αναφορές.
- Θα επιλέγεις δείκτες χωρίς αμφιβολία σε competitions ή A/B tests.
- Θα στήνεις alerts βάσει μεταβολών των δεικτών.
Από την επόμενη σελίδα, εμβαθύνουμε στους δείκτες ανά task.