2.9
การตรวจจับความผิดปกติ
สรุป
- สรุปเป้าหมาย สมมติฐาน และเงื่อนไขที่เหมาะสมของวิธีนี้.
- ตรวจสอบว่ากฎการอัปเดตหรือเกณฑ์การแบ่งส่งผลต่อพฤติกรรมโมเดลอย่างไร.
- ใช้ตัวอย่างโค้ดเพื่อกำหนดแนวทางปรับพารามิเตอร์อย่างเป็นรูปธรรม.
สัญชาตญาณ #
การตรวจจับความผิดปกติ ควรเข้าใจผ่านสมมติฐาน กลไกการปรับปรุงโมเดล และรูปแบบความผิดพลาดบนข้อมูลจริง เพื่อให้เลือกโมเดลและปรับพารามิเตอร์ได้อย่างเหมาะสม.
คำอธิบายโดยละเอียด #
ทำไมต้องเรียนเรื่องการตรวจจับความผิดปกติ #
ความปลอดภัย
พบความผิดปกติของอุปกรณ์ในโรงงานได้เร็วขึ้นการตรวจจับการทุจริต
คัดกรองธุรกรรมหรือประวัติการล็อกอินที่ผิดปกติการควบคุมคุณภาพ
ตรวจหาชิ้นงานเสียจากสายการผลิตและสัญญาณเซนเซอร์การมองเห็นความผันผวนของยอดขาย/อุปสงค์
จับสัญญาณการเปลี่ยนแปลงของข้อมูลธุรกิจได้ทัน
ประเภทของการตรวจจับความผิดปกติ #
1. วิธีเชิงสถิติ #
- ตรวจหา outlier จากค่าเฉลี่ย ความแปรปรวน หรือ IQR
- ตัวอย่าง: วิธี IQR
$$ x < Q1 - 1.5 \cdot IQR \quad \text{หรือ} \quad x > Q3 + 1.5 \cdot IQR $$
2. วิธีบนแมชชีนเลิร์นนิง #
- แบบไม่มีผู้สอน (เช่น PCA, คลัสเตอร์, LOF)
- แบบมีผู้สอน (เมื่อมีป้ายกำกับของความผิดปกติ)
3. ความผิดปกติของอนุกรมเวลา #
- พยากรณ์ค่าถัดไป แล้วใช้ค่าคลาดเคลื่อนเพื่อตัดสินว่าเป็นความผิดปกติหรือไม่
- ตัวอย่าง: AR, Prophet, SeasonalAD ใน ADTK
สิ่งที่ครอบคลุมในบทนี้ #
- การตรวจจับความผิดปกติ ①: ข้อมูลอนุกรมเวลาแบบมิติเดียว
- การตรวจจับความผิดปกติ ②: ข้อมูลหลายมิติ
- (ขั้นสูง) การนำไปใช้จริง เช่น การตั้งค่า threshold, การออกแบบ alert, ตัวชี้วัดประเมินผล