Average Precision

最終更新 2020-05-20 読了時間 1 分

まとめ

Average Precision はスコア順に並べた Precision-Recall を平均したランキング指標です。
PR 曲線と AP を算出してしきい値に依存しない評価方法を確認します。
少数クラス重視のタスクで活用するときの注意点を整理します。

適合率・再現率の概念を先に学ぶと理解がスムーズです

1. 定義 #

PR 曲線上の各点を $(R_n, P_n)$ とすると、Average Precision は次のように表されます。

$$ \mathrm{AP} = \sum_{n}(R_n - R_{n-1}) P_n $$

再現率（Recall）の増加分を重みとして適合率（Precision）を積み上げるため、閾値を下げていくときの平均的な精度を表現できます。

2. Python 3.13 での計算 #

1
2
python --version        # 例: Python 3.13.0
pip install scikit-learn matplotlib

Precision-Recall の記事で生成した確率出力 proba を再利用し、precision_recall_curve と verage_precision_score で AP を計算します。

1
2
3
4
from sklearn.metrics import precision_recall_curve, average_precision_score
precision, recall, thresholds = precision_recall_curve(y_test, proba)
ap = average_precision_score(y_test, proba)
print(f"Average Precision: {ap:.3f}")

PR 曲線の描画は先ほどのスクリプトで保存した pr_curve.png を参照できます。

Precision-Recall 曲線 — AP は PR 曲線の下側面積を再現率の増分で重み付けした指標。

3. AP と PR-AUC の違い #

scikit-learn では verage_precision_score が AP、sklearn.metrics.auc(recall, precision) が単純な台形公式による PR-AUC を返します。AP はステップ状の曲線を想定して再現率の変化量を重視するため、クラス不均衡なデータでより安定した評価が得られることが多いです。

4. 実務での活用ポイント #

閾値選択の指針 … AP が高いモデルほど、広い閾値範囲で高い Precision を維持しやすい。
ランキング課題の評価 … レコメンドや情報検索では、MAP（平均 AP）として各クエリの AP を平均するのが一般的。
F1 との比較 … F1 は特定の閾値に依存する一方、AP は閾値全体を通した性能を可視化できる。

まとめ #

Average Precision は Precision–Recall 曲線全体の品質を数値化した指標。少数クラスの挙動も反映される。
Python 3.13 + scikit-learn では verage_precision_score を使えば数行で算出できる。
F1、ROC-AUC、精度曲線と合わせて利用し、モデル選定や閾値調整の議論をスムーズに進めよう。

閾値と適合率・再現率曲線 #

閾値の変化に応じた適合率と再現率の推移を確認できます。

適合率・再現率 — AP の構成要素
ROC-AUC — ROC ベースの代替指標
NDCG — ランキング品質の評価