次元削減

Basic

次元削減 | 機械学習の基礎解説

次元削減 #

次元削減とは、情報をなるべく失わずに多数の特徴量を少数へ圧縮する手法です。高次元データの可視化、ノイズ除去、計算高速化に大きく貢献します。

代表的な手法 #

PCA / SVD / LDA / Kernel PCA: 線形代数に基づく基礎的アプローチ
t-SNE: 近傍確率を保ったまま 2D/3D に可視化する探索ツール
Isomap: グラフ上の測地距離を用いて多様体を展開

使う理由 #

可視化: クラスタ構造や異常点を発見
ノイズ除去: 情報量の高い成分だけを残して過学習を抑制
計算効率: 次元を減らすことで学習が高速化

まとめ #

線形・非線形の両面から多様体を理解し、データ探索や前処理に活用する
パラメータ感度や距離の意味を理解し、必要に応じて複数手法を比較しましょう