การตรวจจับความผิดปกติ

Basic

การตรวจจับความผิดปกติ | พื้นฐานแมชชีนเลิร์นนิง

Chapter 9 #

การตรวจจับความผิดปกติ #

การตรวจจับความผิดปกติ (Anomaly Detection) คือเทคนิคสำหรับค้นหาข้อมูลที่เบี่ยงเบนจากรูปแบบปกติ เช่น การคาดการณ์ความขัดข้องของเครื่องจักร การพบการใช้งานที่ผิดปกติ หรือการตรวจจับยอดขายที่เปลี่ยนฉับพลัน ซึ่งล้วนเป็นงานสำคัญในโลกจริง


ทำไมต้องเรียนเรื่องการตรวจจับความผิดปกติ #

  • ความปลอดภัย
    พบความผิดปกติของอุปกรณ์ในโรงงานได้เร็วขึ้น

  • การตรวจจับการทุจริต
    คัดกรองธุรกรรมหรือประวัติการล็อกอินที่ผิดปกติ

  • การควบคุมคุณภาพ
    ตรวจหาชิ้นงานเสียจากสายการผลิตและสัญญาณเซนเซอร์

  • การมองเห็นความผันผวนของยอดขาย/อุปสงค์
    จับสัญญาณการเปลี่ยนแปลงของข้อมูลธุรกิจได้ทัน


ประเภทของการตรวจจับความผิดปกติ #

1. วิธีเชิงสถิติ #

  • ตรวจหา outlier จากค่าเฉลี่ย ความแปรปรวน หรือ IQR
  • ตัวอย่าง: วิธี IQR
    $$ x < Q1 - 1.5 \cdot IQR \quad \text{หรือ} \quad x > Q3 + 1.5 \cdot IQR $$

2. วิธีบนแมชชีนเลิร์นนิง #

  • แบบไม่มีผู้สอน (เช่น PCA, คลัสเตอร์, LOF)
  • แบบมีผู้สอน (เมื่อมีป้ายกำกับของความผิดปกติ)

3. ความผิดปกติของอนุกรมเวลา #

  • พยากรณ์ค่าถัดไป แล้วใช้ค่าคลาดเคลื่อนเพื่อตัดสินว่าเป็นความผิดปกติหรือไม่
  • ตัวอย่าง: AR, Prophet, SeasonalAD ใน ADTK

สิ่งที่ครอบคลุมในบทนี้ #

  • การตรวจจับความผิดปกติ ①: ข้อมูลอนุกรมเวลาแบบมิติเดียว
  • การตรวจจับความผิดปกติ ②: ข้อมูลหลายมิติ
  • (ขั้นสูง) การนำไปใช้จริง เช่น การตั้งค่า threshold, การออกแบบ alert, ตัวชี้วัดประเมินผล

สรุป #

  • การตรวจจับความผิดปกติคือการแยกข้อมูล “ปกติ” ออกจาก “ผิดปกติ”
  • ใช้ได้กว้างทั้งภาคอุตสาหกรรม การเงิน และบริการเว็บ
  • บทนี้ครอบคลุมตั้งแต่วิธีเชิงสถิติไปจนถึงวิธีเชิงแมชชีนเลิร์นนิงเพื่อใช้งานจริง