異常検知

2.9

異常検知

まとめ
  • この章では、時系列・表形式データの異常検知で使う代表手法を学ぶ。
  • ルールベース検知(ADTK)と木ベース検知(Isolation Forest)の使い分けを理解する。
  • 検知精度だけでなく、誤検知率や運用時の監視設計まで含めて判断できるようになる。

直感 #

異常検知の実務では、アルゴリズム選択と同じくらい「何を異常と定義するか」が重要です。この章では、データ特性に応じた検出器の設計と評価の進め方を学びます。

詳細な解説 #

このチャプターで学べること #

  • 統計的手法(IQR法など)による外れ値検知の考え方
  • 機械学習ベースの検知(PCA、LOF、Isolation Forest)の特性と使い分け
  • 時系列データに対する異常検知(自己回帰モデル、ADTK)の適用方法

これがわかるとできること #

  • データの種類(1次元時系列・多次元表形式)に応じて適切な検知手法を選べる
  • 閾値調整やアラート設計を含めた実運用の監視フローを組み立てられる
  • 検知精度と誤検知率のバランスを評価指標で判断できる

学習の進め方 #

  1. まず統計的手法で外れ値検知の基本概念を押さえる
  2. 次にIsolation ForestやADTKで実装ベースの検知手法を理解する
  3. 最後に実運用を想定した閾値調整・評価指標の読み方を身に付ける