2.1
回帰
まとめ
- このチャプターでは、回帰モデルの基本概念・代表手法・適用条件を体系的に学ぶ。
- 手法ごとの前提、ハイパーパラメータ、評価指標の違いを比較しながら理解する。
- 実装例を通じて、理論を実務データに適用する際の注意点を押さえる。
直感 #
回帰モデルは、アルゴリズム名を覚えるだけでなく『どんなデータにどの手法が効くか』を判断するための土台です。前提条件と評価の読み方を先に理解しておくと、モデル選択と改善の精度が大きく上がります。
詳細な解説 #
このチャプターで学べること #
- 代表的な手法の目的・前提・出力の違い
- 精度指標と誤差分析の見方
- 実装時に性能を左右する主要パラメータ
これが分かるとできること #
- 課題とデータ特性に応じて適切な手法を選択できる
- 結果を評価し、改善の優先順位を説明できる
- 再現可能な手順で実装・検証を進められる
手法クイックリファレンス #
| 手法 | 特徴 | 計算量 | 推奨場面 |
|---|---|---|---|
| 線形回帰 | 解析解あり・解釈性高 | 低 | ベースライン・線形関係 |
| Ridge / Lasso | 正則化で過学習抑制 | 低 | 特徴量が多いとき |
| ElasticNet | L1+L2の両方 | 低 | 相関特徴量が多いとき |
| 多項式回帰 | 非線形をキャプチャ | 中 | 曲線的な関係 |
| ベイズ線形回帰 | 不確実性を定量化 | 中 | 信頼区間が必要なとき |
| ロバスト回帰 | 外れ値に頑健 | 中 | 外れ値が多いデータ |
| SVR | カーネルで非線形 | 高 | 小〜中規模の非線形 |
| 分位点回帰 | 条件付き分位を推定 | 中 | 区間予測・リスク評価 |
学習の進め方 #
- まず概念と前提を確認する
- 次に数式と実装例で挙動を理解する
- 最後に評価指標で改善サイクルを回す
まとめ #
このチャプターでは、線形回帰をベースラインとし、正則化(Ridge/Lasso/ElasticNet)・非線形拡張(多項式回帰・SVR)・頑健性(ロバスト回帰)・不確実性定量化(ベイズ線形回帰・分位点回帰)まで、回帰モデルの代表手法を体系的に学びました。 データの特性(多重共線性・外れ値・非線形性)に応じて適切な手法を選択し、評価指標と組み合わせてモデルを改善するサイクルを回せるようになることがゴールです。