4.3.2
Precision-Recall
สรุป
- Precision-Recall curve แสดง trade-off ระหว่างการเตือนผิดและการพลาดเหตุการณ์
- F1 สรุป Precision และ Recall เมื่ออยากให้สมดุลกัน
- การปรับ threshold ช่วยปรับพฤติกรรมโมเดลให้ตรงกับต้นทุนจริง
1. นิยาม #
ให้ (TP, FP, FN):
$$ \text{Precision} = \frac{TP}{TP + FP}, \qquad \text{Recall} = \frac{TP}{TP + FN} $$F1 คือค่าเฉลี่ยเชิงฮาร์มอนิก:
$$ F_1 = 2 \cdot \frac{\text{Precision}\cdot\text{Recall}}{\text{Precision}+\text{Recall}} $$2. เหตุผลที่ threshold สำคัญ #
- ลด threshold → Recall สูงขึ้น แต่ Precision ลดลง
- เพิ่ม threshold → ลด false positive แต่เพิ่ม false negative
- ใช้ PR curve เพื่อเลือกจุดสมดุลตามต้นทุนงานจริง
3. เคล็ดลับใช้งาน #
- เมื่อคลาสบวกหายาก PR-AUC มักสะท้อนผลได้ดีกว่า ROC-AUC
- ถ้าจำนวน alert จำกัด ให้เน้น Precision มากขึ้น
- ใช้ confusion matrix เพื่อดูรูปแบบความผิดพลาด