การลดมิติ

2.6

การลดมิติ

สรุป
  • สรุปเป้าหมาย สมมติฐาน และเงื่อนไขที่เหมาะสมของวิธีนี้.
  • ตรวจสอบว่ากฎการอัปเดตหรือเกณฑ์การแบ่งส่งผลต่อพฤติกรรมโมเดลอย่างไร.
  • ใช้ตัวอย่างโค้ดเพื่อกำหนดแนวทางปรับพารามิเตอร์อย่างเป็นรูปธรรม.

สัญชาตญาณ #

การลดมิติ ควรเข้าใจผ่านสมมติฐาน กลไกการปรับปรุงโมเดล และรูปแบบความผิดพลาดบนข้อมูลจริง เพื่อให้เลือกโมเดลและปรับพารามิเตอร์ได้อย่างเหมาะสม.

คำอธิบายโดยละเอียด #

วิธีที่พบบ่อย #

  • PCA / SVD / LDA / Kernel PCA: เทคนิคเชิงเส้นที่ตั้งอยู่บนพื้นฐานพีชคณิตเชิงเส้น
  • t-SNE: เครื่องมือสำรวจข้อมูลที่คงความคล้ายของเพื่อนบ้านเมื่อฉายลง 2D/3D
  • Isomap: ใช้ระยะทางตามกราฟ (geodesic) เพื่อคลี่ manifold ที่โค้ง

ทำไมถึงต้องลดมิติ #

  • การมองภาพ: ทำให้เห็นโครงสร้างคลัสเตอร์หรือจุดผิดปกติ |- การตัด Noise: เก็บเฉพาะองค์ประกอบที่ให้ข้อมูลมากที่สุดเพื่อลดการเรียนรู้เกิน
  • ประสิทธิภาพ: ลด feature dimension แล้วอัลกอริทึม downstream จะทำงานเร็วขึ้น

สาระสำคัญ #

  • ใช้ทั้งวิธีเชิงเส้นและไม่เชิงเส้นเพื่อทำความเข้าใจ manifold ของข้อมูล
  • เข้าใจว่าพารามิเตอร์และนิยามระยะมีผลอย่างไร เลือกวิธีให้เหมาะกับโจทย์แต่ละแบบ