4.6.1
BLEU
สรุป
- BLEU วัดการทับซ้อนของ n-grams ระหว่างผลทำนายกับคำตอบอ้างอิง
- นิยมใช้ในงานแปลภาษาอัตโนมัติ
หมายเหตุ #
- ใช้ความแม่นของ n-grams และมีบทลงโทษเมื่อประโยคสั้นเกินไป
- เหมาะสำหรับเปรียบเทียบโมเดล มากกว่าประเมินความลื่นไหล