ランキング評価 #
ランキング指標は、モデルがスコア付けしたアイテムの並び順の良さを評価します。推薦システムや検索、広告配信など、上位に提示した候補の質が重要なタスクで不可欠です。
よく使われる指標 #
- NDCG / DCG:上位に正解を置いた程度を対数重み付きで評価。
- MAP / 平均適合率:複数正解があるランキングでリコールを考慮。
- Recall@k / Hit Rate:上位 k 件に正解が含まれているか。
レポートに記載したいポイント #
- 複数指標を併記する(例:NDCG@10 と Recall@10)。
- 推薦候補数や露出機会に合わせて k を設定。
- Comparator(旧モデルやベースライン)との相対改善率も示すと理解されやすい。