2.6
การลดมิติ
สรุป
- สรุปเป้าหมาย สมมติฐาน และเงื่อนไขที่เหมาะสมของวิธีนี้.
- ตรวจสอบว่ากฎการอัปเดตหรือเกณฑ์การแบ่งส่งผลต่อพฤติกรรมโมเดลอย่างไร.
- ใช้ตัวอย่างโค้ดเพื่อกำหนดแนวทางปรับพารามิเตอร์อย่างเป็นรูปธรรม.
สัญชาตญาณ #
การลดมิติ ควรเข้าใจผ่านสมมติฐาน กลไกการปรับปรุงโมเดล และรูปแบบความผิดพลาดบนข้อมูลจริง เพื่อให้เลือกโมเดลและปรับพารามิเตอร์ได้อย่างเหมาะสม.
คำอธิบายโดยละเอียด #
วิธีที่พบบ่อย #
- PCA / SVD / LDA / Kernel PCA: เทคนิคเชิงเส้นที่ตั้งอยู่บนพื้นฐานพีชคณิตเชิงเส้น
- t-SNE: เครื่องมือสำรวจข้อมูลที่คงความคล้ายของเพื่อนบ้านเมื่อฉายลง 2D/3D
- Isomap: ใช้ระยะทางตามกราฟ (geodesic) เพื่อคลี่ manifold ที่โค้ง
ทำไมถึงต้องลดมิติ #
- การมองภาพ: ทำให้เห็นโครงสร้างคลัสเตอร์หรือจุดผิดปกติ |- การตัด Noise: เก็บเฉพาะองค์ประกอบที่ให้ข้อมูลมากที่สุดเพื่อลดการเรียนรู้เกิน
- ประสิทธิภาพ: ลด feature dimension แล้วอัลกอริทึม downstream จะทำงานเร็วขึ้น
สาระสำคัญ #
- ใช้ทั้งวิธีเชิงเส้นและไม่เชิงเส้นเพื่อทำความเข้าใจ manifold ของข้อมูล
- เข้าใจว่าพารามิเตอร์และนิยามระยะมีผลอย่างไร เลือกวิธีให้เหมาะกับโจทย์แต่ละแบบ