まとめ
- BLEU และ ROUGE เป็นตัวชี้วัดพื้นฐานสำหรับงานแปลและสรุป
- วัดการทับซ้อนของ n-grams ระหว่างผลทำนายกับคำตอบอ้างอิง
- ควรตีความอย่างระมัดระวังในงานภาษาธรรมชาติ
เนื้อหา #
- BLEU
- ROUGE
ควรเสริมด้วยการประเมินจากมนุษย์เมื่อเป็นไปได้