2.4.6
Isomap
สรุป
- สรุปเป้าหมาย สมมติฐาน และเงื่อนไขที่เหมาะสมของวิธีนี้.
- ตรวจสอบว่ากฎการอัปเดตหรือเกณฑ์การแบ่งส่งผลต่อพฤติกรรมโมเดลอย่างไร.
- ใช้ตัวอย่างโค้ดเพื่อกำหนดแนวทางปรับพารามิเตอร์อย่างเป็นรูปธรรม.
สัญชาตญาณ #
Isomap ควรเข้าใจผ่านสมมติฐาน กลไกการปรับปรุงโมเดล และรูปแบบความผิดพลาดบนข้อมูลจริง เพื่อให้เลือกโมเดลและปรับพารามิเตอร์ได้อย่างเหมาะสม.
คำอธิบายโดยละเอียด #
ขั้นตอน #
- สร้างกราฟ k-nearest neighbors หรือ \(\varepsilon\)-neighbors
- คำนวณเส้นทางที่สั้นที่สุดบนกราฟ (ประมาณระยะทางตามพื้นผิว)
- ส่งเมทริกซ์ระยะให้กับ Multidimensional Scaling (MDS) เพื่อได้พิกัดใหม่
ตัวอย่างด้วย Python #
| |
วิธีเลือกพารามิเตอร์ #
n_neighbors: เล็กไปกราฟขาดการเชื่อมต่อ ใหญ่ไประยะ geodesic จะคล้าย Euclideann_components: หากเน้น visualization ใช้ 2 หรือ 3 ถ้าต้องการลดมิติเพื่อโมเดลให้ใช้ค่าที่เหมาะกับงาน- ข้อมูลที่มี noise มากควรทำความสะอาดก่อน เพราะกราฟพึ่งพาระยะใกล้มาก
ข้อดี / ข้อจำกัด #
| ข้อดี | ข้อจำกัด |
|---|---|
| จัดการโครงสร้างไม่เชิงเส้นได้ดี | ต้องคำนวณ shortest path บนกราฟ ขนาดใหญ่จะช้า |
| พิกัดใหม่ตีความได้ตรงไปตรงมา | ไวต่อการเลือกพารามิเตอร์ k และ noise |
| เหมาะกับการมองภาพ manifold | ขยายไปยังข้อมูลมิติสูงจำนวนมากได้ยาก |