การตรวจจับความผิดปกติ

2.9

การตรวจจับความผิดปกติ

สรุป
  • สรุปเป้าหมาย สมมติฐาน และเงื่อนไขที่เหมาะสมของวิธีนี้.
  • ตรวจสอบว่ากฎการอัปเดตหรือเกณฑ์การแบ่งส่งผลต่อพฤติกรรมโมเดลอย่างไร.
  • ใช้ตัวอย่างโค้ดเพื่อกำหนดแนวทางปรับพารามิเตอร์อย่างเป็นรูปธรรม.

สัญชาตญาณ #

การตรวจจับความผิดปกติ ควรเข้าใจผ่านสมมติฐาน กลไกการปรับปรุงโมเดล และรูปแบบความผิดพลาดบนข้อมูลจริง เพื่อให้เลือกโมเดลและปรับพารามิเตอร์ได้อย่างเหมาะสม.

คำอธิบายโดยละเอียด #

ทำไมต้องเรียนเรื่องการตรวจจับความผิดปกติ #

  • ความปลอดภัย
    พบความผิดปกติของอุปกรณ์ในโรงงานได้เร็วขึ้น

  • การตรวจจับการทุจริต
    คัดกรองธุรกรรมหรือประวัติการล็อกอินที่ผิดปกติ

  • การควบคุมคุณภาพ
    ตรวจหาชิ้นงานเสียจากสายการผลิตและสัญญาณเซนเซอร์

  • การมองเห็นความผันผวนของยอดขาย/อุปสงค์
    จับสัญญาณการเปลี่ยนแปลงของข้อมูลธุรกิจได้ทัน


ประเภทของการตรวจจับความผิดปกติ #

1. วิธีเชิงสถิติ #

  • ตรวจหา outlier จากค่าเฉลี่ย ความแปรปรวน หรือ IQR
  • ตัวอย่าง: วิธี IQR
    $$ x < Q1 - 1.5 \cdot IQR \quad \text{หรือ} \quad x > Q3 + 1.5 \cdot IQR $$

2. วิธีบนแมชชีนเลิร์นนิง #

  • แบบไม่มีผู้สอน (เช่น PCA, คลัสเตอร์, LOF)
  • แบบมีผู้สอน (เมื่อมีป้ายกำกับของความผิดปกติ)

3. ความผิดปกติของอนุกรมเวลา #

  • พยากรณ์ค่าถัดไป แล้วใช้ค่าคลาดเคลื่อนเพื่อตัดสินว่าเป็นความผิดปกติหรือไม่
  • ตัวอย่าง: AR, Prophet, SeasonalAD ใน ADTK

สิ่งที่ครอบคลุมในบทนี้ #

  • การตรวจจับความผิดปกติ ①: ข้อมูลอนุกรมเวลาแบบมิติเดียว
  • การตรวจจับความผิดปกติ ②: ข้อมูลหลายมิติ
  • (ขั้นสูง) การนำไปใช้จริง เช่น การตั้งค่า threshold, การออกแบบ alert, ตัวชี้วัดประเมินผล