การประเมินโมเดลภาษา

Eval

การประเมินโมเดลภาษา

まとめ
  • BLEU และ ROUGE เป็นตัวชี้วัดพื้นฐานสำหรับงานแปลและสรุป
  • วัดการทับซ้อนของ n-grams ระหว่างผลทำนายกับคำตอบอ้างอิง
  • ควรตีความอย่างระมัดระวังในงานภาษาธรรมชาติ

เนื้อหา #

  • BLEU
  • ROUGE

ควรเสริมด้วยการประเมินจากมนุษย์เมื่อเป็นไปได้