ランキング評価

ランキング評価 #

ランキング指標は、モデルがスコア付けしたアイテムの並び順の良さを評価します。推薦システムや検索、広告配信など、上位に提示した候補の質が重要なタスクで不可欠です。


よく使われる指標 #

  • NDCG / DCG:上位に正解を置いた程度を対数重み付きで評価。
  • MAP / 平均適合率:複数正解があるランキングでリコールを考慮。
  • Recall@k / Hit Rate:上位 k 件に正解が含まれているか。

レポートに記載したいポイント #

  • 複数指標を併記する(例:NDCG@10 と Recall@10)。
  • 推薦候補数や露出機会に合わせて k を設定。
  • Comparator(旧モデルやベースライン)との相対改善率も示すと理解されやすい。