2.9
異常検知
まとめ
- この章では、時系列・表形式データの異常検知で使う代表手法を学ぶ。
- ルールベース検知(ADTK)と木ベース検知(Isolation Forest)の使い分けを理解する。
- 検知精度だけでなく、誤検知率や運用時の監視設計まで含めて判断できるようになる。
直感 #
異常検知の実務では、アルゴリズム選択と同じくらい「何を異常と定義するか」が重要です。この章では、データ特性に応じた検出器の設計と評価の進め方を学びます。
詳細な解説 #
このチャプターで学べること #
- 統計的手法(IQR法など)による外れ値検知の考え方
- 機械学習ベースの検知(PCA、LOF、Isolation Forest)の特性と使い分け
- 時系列データに対する異常検知(自己回帰モデル、ADTK)の適用方法
これがわかるとできること #
- データの種類(1次元時系列・多次元表形式)に応じて適切な検知手法を選べる
- 閾値調整やアラート設計を含めた実運用の監視フローを組み立てられる
- 検知精度と誤検知率のバランスを評価指標で判断できる
学習の進め方 #
- まず統計的手法で外れ値検知の基本概念を押さえる
- 次にIsolation ForestやADTKで実装ベースの検知手法を理解する
- 最後に実運用を想定した閾値調整・評価指標の読み方を身に付ける