次元削減 #
次元削減とは、情報をなるべく失わずに多数の特徴量を少数へ圧縮する手法です。高次元データの可視化、ノイズ除去、計算高速化に大きく貢献します。
代表的な手法 #
- PCA / SVD / LDA / Kernel PCA: 線形代数に基づく基礎的アプローチ
- t-SNE: 近傍確率を保ったまま 2D/3D に可視化する探索ツール
- Isomap: グラフ上の測地距離を用いて多様体を展開
使う理由 #
- 可視化: クラスタ構造や異常点を発見
- ノイズ除去: 情報量の高い成分だけを残して過学習を抑制
- 計算効率: 次元を減らすことで学習が高速化
まとめ #
- 線形・非線形の両面から多様体を理解し、データ探索や前処理に活用する
- パラメータ感度や距離の意味を理解し、必要に応じて複数手法を比較しましょう