線形分類 #
線形分類とは、データをクラスに分ける際に「直線(または超平面)」を境界として使う方法の総称です。
線形回帰が数値を予測する手法だったのに対し、線形分類は「ラベル(カテゴリ)」を予測するために用いられます。
なぜ線形分類を学ぶのか? #
- 最も基本的な分類手法であり、多くの応用の基礎になる
- 学習結果を 確率として解釈できる(例:クラスに属する確率)
- 決定境界が「直線」で表されるため わかりやすく可視化できる
- 実務でも「シンプルかつ解釈性の高いモデル」として利用される
線形分類でできること #
- スパムメール判定:メール文をベクトル化して「スパム or 非スパム」に分類
- 医療データの診断:患者の検査結果から「疾患あり or なし」を判別
- マーケティング:顧客データから「購入するかしないか」を予測
この章で学ぶ内容 #
- ロジスティック回帰
2クラス分類を確率的に扱える基本モデル - ソフトマックス回帰(多クラス分類)
ロジスティック回帰を拡張して複数クラスを扱えるモデル - 判別分析(LDA)
クラスを分けるだけでなく、次元削減の効果も持つ伝統的な手法
まとめ #
- 線形分類は「直線を使ってクラスを分ける」シンプルな考え方
- 出力を「確率」として扱えるため、実務での説明性が高い
- ここで学ぶ内容は、より高度な分類器(SVM, ニューラルネットワーク)へ進む前の大切な基盤になります