Precision-Recall

4.3.2

Precision-Recall

อัปเดต 2020-02-12 อ่าน 1 นาที
สรุป
  • Precision-Recall curve แสดง trade-off ระหว่างการเตือนผิดและการพลาดเหตุการณ์
  • F1 สรุป Precision และ Recall เมื่ออยากให้สมดุลกัน
  • การปรับ threshold ช่วยปรับพฤติกรรมโมเดลให้ตรงกับต้นทุนจริง

1. นิยาม #

ให้ (TP, FP, FN):

$$ \text{Precision} = \frac{TP}{TP + FP}, \qquad \text{Recall} = \frac{TP}{TP + FN} $$

F1 คือค่าเฉลี่ยเชิงฮาร์มอนิก:

$$ F_1 = 2 \cdot \frac{\text{Precision}\cdot\text{Recall}}{\text{Precision}+\text{Recall}} $$

2. เหตุผลที่ threshold สำคัญ #

  • ลด threshold → Recall สูงขึ้น แต่ Precision ลดลง
  • เพิ่ม threshold → ลด false positive แต่เพิ่ม false negative
  • ใช้ PR curve เพื่อเลือกจุดสมดุลตามต้นทุนงานจริง

3. เคล็ดลับใช้งาน #

  • เมื่อคลาสบวกหายาก PR-AUC มักสะท้อนผลได้ดีกว่า ROC-AUC
  • ถ้าจำนวน alert จำกัด ให้เน้น Precision มากขึ้น
  • ใช้ confusion matrix เพื่อดูรูปแบบความผิดพลาด