2.2.8
順序回帰
まとめ
- 順序回帰(Ordinal Regression)は「悪い < 普通 < 良い」のような順序関係を持つカテゴリを予測する。
- 通常の多クラス分類(ソフトマックス)はカテゴリ間の順序を無視するが、順序回帰はこの情報を活用する。
mordライブラリの OrdinalRidge や、Frank-Hall 法(二値分類器の連鎖)で実装できる。
直感 #
映画のレビュー(1〜5つ星)を予測するタスクで、3つ星を5つ星と誤分類するのと、4つ星と誤分類するのでは深刻さが違う。通常のソフトマックスはすべての誤分類を等しく扱うが、順序回帰は「2つ離れた誤分類より1つ離れた誤分類の方がまし」という構造を組み込む。
詳細な解説 #
累積確率モデル #
順序回帰の代表的な定式化は、累積確率モデル(比例オッズモデル):
$$ P(Y \le k | X) = \sigma(\theta_k - X\beta) $$- $\theta_k$: クラス $k$ の閾値($\theta_1 < \theta_2 < \cdots$)
- $\beta$: 共通の回帰係数
- $\sigma$: シグモイド関数
Python 実装 — mord #
| |
順序回帰 vs ソフトマックス #
| |
応用場面 #
| タスク | 順序カテゴリ | 例 |
|---|---|---|
| 商品レビュー | 1〜5つ星 | ECサイトの評価予測 |
| 患者の重症度 | 軽症 < 中等 < 重症 | 医療トリアージ |
| 信用スコア | A > B > C > D | 与信審査 |
| 満足度調査 | 非常に不満〜非常に満足 | アンケート分析 |
- ロジスティック回帰 — 二値分類の基本手法
- ソフトマックス回帰 — 順序を無視した多クラス分類
- Cohen’s Kappa — 順序を考慮した一致度指標