Avaliacao de modelos de linguagem

Eval

Avaliacao de modelos de linguagem

まとめ
  • BLEU e ROUGE sao metricas classicas para traducao e resumo.
  • Medem a sobreposicao de n-grams entre previsao e referencia.
  • A interpretacao deve ser cuidadosa em linguagem natural.

Conteudo #

  • BLEU
  • ROUGE

Sempre que possivel, complemente com avaliacao humana.