Chapter 9 #
การตรวจจับความผิดปกติ #
การตรวจจับความผิดปกติ (Anomaly Detection) คือเทคนิคสำหรับค้นหาข้อมูลที่เบี่ยงเบนจากรูปแบบปกติ เช่น การคาดการณ์ความขัดข้องของเครื่องจักร การพบการใช้งานที่ผิดปกติ หรือการตรวจจับยอดขายที่เปลี่ยนฉับพลัน ซึ่งล้วนเป็นงานสำคัญในโลกจริง
ทำไมต้องเรียนเรื่องการตรวจจับความผิดปกติ #
ความปลอดภัย
พบความผิดปกติของอุปกรณ์ในโรงงานได้เร็วขึ้นการตรวจจับการทุจริต
คัดกรองธุรกรรมหรือประวัติการล็อกอินที่ผิดปกติการควบคุมคุณภาพ
ตรวจหาชิ้นงานเสียจากสายการผลิตและสัญญาณเซนเซอร์การมองเห็นความผันผวนของยอดขาย/อุปสงค์
จับสัญญาณการเปลี่ยนแปลงของข้อมูลธุรกิจได้ทัน
ประเภทของการตรวจจับความผิดปกติ #
1. วิธีเชิงสถิติ #
- ตรวจหา outlier จากค่าเฉลี่ย ความแปรปรวน หรือ IQR
- ตัวอย่าง: วิธี IQR
$$ x < Q1 - 1.5 \cdot IQR \quad \text{หรือ} \quad x > Q3 + 1.5 \cdot IQR $$
2. วิธีบนแมชชีนเลิร์นนิง #
- แบบไม่มีผู้สอน (เช่น PCA, คลัสเตอร์, LOF)
- แบบมีผู้สอน (เมื่อมีป้ายกำกับของความผิดปกติ)
3. ความผิดปกติของอนุกรมเวลา #
- พยากรณ์ค่าถัดไป แล้วใช้ค่าคลาดเคลื่อนเพื่อตัดสินว่าเป็นความผิดปกติหรือไม่
- ตัวอย่าง: AR, Prophet, SeasonalAD ใน ADTK
สิ่งที่ครอบคลุมในบทนี้ #
- การตรวจจับความผิดปกติ ①: ข้อมูลอนุกรมเวลาแบบมิติเดียว
- การตรวจจับความผิดปกติ ②: ข้อมูลหลายมิติ
- (ขั้นสูง) การนำไปใช้จริง เช่น การตั้งค่า threshold, การออกแบบ alert, ตัวชี้วัดประเมินผล
สรุป #
- การตรวจจับความผิดปกติคือการแยกข้อมูล “ปกติ” ออกจาก “ผิดปกติ”
- ใช้ได้กว้างทั้งภาคอุตสาหกรรม การเงิน และบริการเว็บ
- บทนี้ครอบคลุมตั้งแต่วิธีเชิงสถิติไปจนถึงวิธีเชิงแมชชีนเลิร์นนิงเพื่อใช้งานจริง