線形分類

線形分類 #

線形分類とは、データをクラスに分ける際に「直線(または超平面)」を境界として使う方法の総称です。

線形回帰が数値を予測する手法だったのに対し、線形分類は「ラベル(カテゴリ)」を予測するために用いられます。


なぜ線形分類を学ぶのか? #

  • 最も基本的な分類手法であり、多くの応用の基礎になる
  • 学習結果を 確率として解釈できる(例:クラスに属する確率)
  • 決定境界が「直線」で表されるため わかりやすく可視化できる
  • 実務でも「シンプルかつ解釈性の高いモデル」として利用される

線形分類でできること #

  • スパムメール判定:メール文をベクトル化して「スパム or 非スパム」に分類
  • 医療データの診断:患者の検査結果から「疾患あり or なし」を判別
  • マーケティング:顧客データから「購入するかしないか」を予測

この章で学ぶ内容 #

  1. ロジスティック回帰
    2クラス分類を確率的に扱える基本モデル
  2. ソフトマックス回帰(多クラス分類)
    ロジスティック回帰を拡張して複数クラスを扱えるモデル
  3. 判別分析(LDA)
    クラスを分けるだけでなく、次元削減の効果も持つ伝統的な手法

まとめ #

  • 線形分類は「直線を使ってクラスを分ける」シンプルな考え方
  • 出力を「確率」として扱えるため、実務での説明性が高い
  • ここで学ぶ内容は、より高度な分類器(SVM, ニューラルネットワーク)へ進む前の大切な基盤になります