異常検知

2.9

異常検知

まとめ
  • この章では、時系列・表形式データの異常検知で使う代表手法を学ぶ。rn- ルールベース検知(ADTK)と木ベース検知(Isolation Forest)の使い分けを理解する。rn- 検知精度だけでなく、誤検知率や運用時の監視設計まで含めて判断できるようになる。

直感 #

異常検知の実務では、アルゴリズム選択と同じくらい「何を異常と定義するか」が重要です。この章では、データ特性に応じた検出器の設計と評価の進め方を学びます。

詳細な解説 #

Chapter 9 #

異常検知 #


なぜ異常検知を学ぶのか? #

  • 安全性の確保
    工場設備の故障や異常動作を早期に発見。

  • 不正検知
    金融取引やログイン履歴の中から不正利用を特定。

  • 品質管理
    製造ラインやセンサーの出力から不良品を検出。

  • 需要・売上の変動把握
    ビジネスデータの急激な変化をキャッチ。


異常検知の種類 #

1. 統計的手法 #

  • 平均や分散、四分位範囲などの統計量から外れ値を検知。
  • 例:IQR法
    $$ x < Q1 - 1.5 \cdot IQR \quad \text{または} \quad x > Q3 + 1.5 \cdot IQR $$

2. 機械学習ベース #

  • 教師なし学習(例:PCA、クラスタリング、LOF)
  • 教師あり学習(ラベル付き異常データがある場合に分類モデルを学習)

3. 時系列異常検知 #

  • 過去データから未来を予測し、誤差が大きい点を異常と判定。
  • 例:自己回帰モデル (AR)、Prophet、ADTK の SeasonalAD など。

この章で扱う内容 #

  • 異常検知①:1次元の時系列データに対する異常検知
  • 異常検知②:多次元データに対する異常検知
  • (発展)実運用に向けた工夫(閾値調整・アラート設計・評価指標など)