2.2.9
最尤推定
まとめ
- 最尤推定(MLE: Maximum Likelihood Estimation)は「観測データが最も高い確率で生じるパラメータ」を求める推定手法。
- ロジスティック回帰・ナイーブベイズ・ガウス混合モデルなど、多くの機械学習手法が内部で MLE を使っている。
- 対数尤度を最大化する形で定式化し、勾配法やニュートン法で数値的に解く。
直感 #
コインを10回投げて7回表が出た。「このコインの表の確率は?」という問いに対して、「7回表が出る確率が最も高くなる値」を探すのが最尤推定。答えは直感通り 0.7。MLE は「データを最もよく説明するパラメータ」を選ぶという単純で強力な原理。
詳細な解説 #
数式 #
観測データ $x_1, \ldots, x_n$ に対する尤度関数:
$$ L(\theta) = \prod_{i=1}^{n} f(x_i | \theta) $$対数尤度:
$$ \ell(\theta) = \sum_{i=1}^{n} \log f(x_i | \theta) $$MLE:$\hat{\theta} = \arg\max_\theta \ell(\theta)$
例 1: コイン投げ(ベルヌーイ分布) #
| |
例 2: 正規分布の MLE #
| |
MLE が使われている手法 #
| 手法 | MLE の役割 |
|---|---|
| ロジスティック回帰 | クロスエントロピー最小化 = 対数尤度最大化 |
| ナイーブベイズ | クラス条件付き確率のパラメータ推定 |
| ガウス混合モデル | EM アルゴリズムの M ステップ |
| ARIMA | モデルパラメータの推定 |
MLE vs MAP vs ベイズ推定 #
| 推定手法 | 事前分布 | 出力 | 対応する手法 |
|---|---|---|---|
| MLE | なし | 点推定 | ロジスティック回帰 |
| MAP | あり | 点推定 | Ridge 回帰(ガウス事前分布) |
| ベイズ | あり | 事後分布 | ベイズ線形回帰 |