การลดมิติ

2.6

การลดมิติ

สรุป

สรุปเป้าหมาย สมมติฐาน และเงื่อนไขที่เหมาะสมของวิธีนี้.
ตรวจสอบว่ากฎการอัปเดตหรือเกณฑ์การแบ่งส่งผลต่อพฤติกรรมโมเดลอย่างไร.
ใช้ตัวอย่างโค้ดเพื่อกำหนดแนวทางปรับพารามิเตอร์อย่างเป็นรูปธรรม.

สัญชาตญาณ #

การลดมิติ ควรเข้าใจผ่านสมมติฐาน กลไกการปรับปรุงโมเดล และรูปแบบความผิดพลาดบนข้อมูลจริง เพื่อให้เลือกโมเดลและปรับพารามิเตอร์ได้อย่างเหมาะสม.

คำอธิบายโดยละเอียด #

วิธีที่พบบ่อย #

PCA / SVD / LDA / Kernel PCA: เทคนิคเชิงเส้นที่ตั้งอยู่บนพื้นฐานพีชคณิตเชิงเส้น
t-SNE: เครื่องมือสำรวจข้อมูลที่คงความคล้ายของเพื่อนบ้านเมื่อฉายลง 2D/3D
Isomap: ใช้ระยะทางตามกราฟ (geodesic) เพื่อคลี่ manifold ที่โค้ง

ทำไมถึงต้องลดมิติ #

การมองภาพ: ทำให้เห็นโครงสร้างคลัสเตอร์หรือจุดผิดปกติ |- การตัด Noise: เก็บเฉพาะองค์ประกอบที่ให้ข้อมูลมากที่สุดเพื่อลดการเรียนรู้เกิน
ประสิทธิภาพ: ลด feature dimension แล้วอัลกอริทึม downstream จะทำงานเร็วขึ้น

สาระสำคัญ #

ใช้ทั้งวิธีเชิงเส้นและไม่เชิงเส้นเพื่อทำความเข้าใจ manifold ของข้อมูล
เข้าใจว่าพารามิเตอร์และนิยามระยะมีผลอย่างไร เลือกวิธีให้เหมาะกับโจทย์แต่ละแบบ