2.9
異常検知
まとめ
- この章では、時系列・表形式データの異常検知で使う代表手法を学ぶ。
rn- ルールベース検知(ADTK)と木ベース検知(Isolation Forest)の使い分けを理解する。rn- 検知精度だけでなく、誤検知率や運用時の監視設計まで含めて判断できるようになる。
直感 #
異常検知の実務では、アルゴリズム選択と同じくらい「何を異常と定義するか」が重要です。この章では、データ特性に応じた検出器の設計と評価の進め方を学びます。
詳細な解説 #
Chapter 9 #
異常検知 #
なぜ異常検知を学ぶのか? #
安全性の確保
工場設備の故障や異常動作を早期に発見。不正検知
金融取引やログイン履歴の中から不正利用を特定。品質管理
製造ラインやセンサーの出力から不良品を検出。需要・売上の変動把握
ビジネスデータの急激な変化をキャッチ。
異常検知の種類 #
1. 統計的手法 #
- 平均や分散、四分位範囲などの統計量から外れ値を検知。
- 例:IQR法
$$ x < Q1 - 1.5 \cdot IQR \quad \text{または} \quad x > Q3 + 1.5 \cdot IQR $$
2. 機械学習ベース #
- 教師なし学習(例:PCA、クラスタリング、LOF)
- 教師あり学習(ラベル付き異常データがある場合に分類モデルを学習)
3. 時系列異常検知 #
- 過去データから未来を予測し、誤差が大きい点を異常と判定。
- 例:自己回帰モデル (AR)、Prophet、ADTK の SeasonalAD など。
この章で扱う内容 #
- 異常検知①:1次元の時系列データに対する異常検知
- 異常検知②:多次元データに対する異常検知
- (発展)実運用に向けた工夫(閾値調整・アラート設計・評価指標など)