異常検知

2.9

異常検知

まとめ

この章では、時系列・表形式データの異常検知で使う代表手法を学ぶ。
ルールベース検知（ADTK）と木ベース検知（Isolation Forest）の使い分けを理解する。
検知精度だけでなく、誤検知率や運用時の監視設計まで含めて判断できるようになる。

直感 #

異常検知の実務では、アルゴリズム選択と同じくらい「何を異常と定義するか」が重要です。この章では、データ特性に応じた検出器の設計と評価の進め方を学びます。

詳細な解説 #

このチャプターで学べること #

統計的手法（IQR法など）による外れ値検知の考え方
機械学習ベースの検知（PCA、LOF、Isolation Forest）の特性と使い分け
時系列データに対する異常検知（自己回帰モデル、ADTK）の適用方法

これがわかるとできること #

データの種類（1次元時系列・多次元表形式）に応じて適切な検知手法を選べる
閾値調整やアラート設計を含めた実運用の監視フローを組み立てられる
検知精度と誤検知率のバランスを評価指標で判断できる

学習の進め方 #

まず統計的手法で外れ値検知の基本概念を押さえる
次にIsolation ForestやADTKで実装ベースの検知手法を理解する
最後に実運用を想定した閾値調整・評価指標の読み方を身に付ける