การวัดระยะทางด้วยภาพ

ในด้านหุ่นยนต์และคอมพิวเตอร์วิชั่น การวัดระยะทางด้วยภาพ ( Visual Odometry)คือกระบวนการกำหนดตำแหน่งและทิศทางของหุ่นยนต์หรือระบบคอมพิวเตอร์อื่นๆ โดยการวิเคราะห์ชุดภาพจากกล้องที่ระบบถ่ายจากสภาพแวดล้อม มีการนำไปใช้งานในแอปพลิเคชันหุ่นยนต์ที่หลากหลาย เช่น ในยานสำรวจดาวอังคาร^{[ 1 ]}

การใช้งานการวัดระยะทางด้วยภาพ ได้แก่ความเป็นจริงเสริมและหุ่นยนต์^{[ 2 ]}

หากใช้หน่วยวัดความเฉื่อย จะเรียกว่า ระบบวัดระยะทางด้วยภาพและความเฉื่อย (Visual-Inertial OdometryหรือVIO )

ภาพรวม

ในด้านการนำทาง การวัดระยะทาง (odometry)คือการใช้ข้อมูลจากการเคลื่อนที่ของตัวขับเคลื่อนเพื่อประมาณการการเปลี่ยนแปลงตำแหน่งเมื่อเวลาผ่านไป โดยใช้อุปกรณ์ต่างๆ เช่นตัวเข้ารหัสแบบหมุน (rotary encoder)เพื่อวัดการหมุนของล้อ แม้ว่าเทคนิคการวัดระยะทางแบบดั้งเดิมจะมีประโยชน์สำหรับยานพาหนะแบบมีล้อหรือแบบมีตีนตะขาบ แต่ก็ไม่สามารถนำไปใช้กับหุ่นยนต์เคลื่อนที่ที่มีวิธีการเคลื่อนที่แบบไม่มาตรฐาน เช่นหุ่นยนต์ขาเดินได้นอกจากนี้ การวัดระยะทางยังประสบปัญหาเรื่องความแม่นยำอยู่เสมอ เนื่องจากล้อมีแนวโน้มที่จะลื่นไถลบนพื้น ทำให้ระยะทางที่เดินทางไม่สม่ำเสมอเมื่อเทียบกับการหมุนของล้อ ข้อผิดพลาดนี้จะยิ่งมากขึ้นเมื่อยานพาหนะทำงานบนพื้นผิวที่ไม่เรียบ ค่าที่ได้จากการวัดระยะทางจะเชื่อถือไม่ได้มากขึ้นเรื่อยๆ เมื่อข้อผิดพลาดเหล่านี้สะสมและทวีความรุนแรงขึ้นตามเวลา

การวัดระยะทางด้วยภาพ (Visual odometry) คือกระบวนการกำหนดข้อมูลการวัดระยะทางที่เทียบเท่าโดยใช้ภาพจากกล้องหลายตัวเรียงต่อกันเพื่อประมาณระยะทางที่เดินทางไป การวัดระยะทางด้วยภาพช่วยเพิ่มความแม่นยำในการนำทางของหุ่นยนต์หรือยานพาหนะที่ใช้การเคลื่อนที่ทุกประเภทบนพื้นผิวใดๆ ก็ตาม

ประเภท

VO มีหลายประเภท

กล้องตาเดียวและกล้องสเตอริโอ

ขึ้นอยู่กับการตั้งค่ากล้อง เสียงพากย์สามารถแบ่งออกเป็น เสียงพากย์แบบกล้องเดี่ยว (Monocular VO) และเสียงพากย์แบบสเตอริโอ (Stereo VO) (กล้องสองตัวในระบบสเตอริโอ)

วิธีการแบบอิงคุณลักษณะและแบบตรง

ข้อมูลภาพของระบบจดจำใบหน้าแบบดั้งเดิมได้มาจากการใช้วิธีการอิงคุณลักษณะ ซึ่งจะสกัดจุดเด่นของภาพและติดตามจุดเหล่านั้นในลำดับภาพ การพัฒนาล่าสุดในการวิจัยระบบจดจำใบหน้าได้นำเสนอทางเลือกใหม่ที่เรียกว่าวิธีการโดยตรง ซึ่งใช้ความเข้มของพิกเซลในลำดับภาพโดยตรงเป็นข้อมูลป้อนเข้าทางภาพ นอกจากนี้ยังมีวิธีการแบบผสมผสานอีกด้วย

การวัดระยะทางด้วยระบบเฉื่อยทางสายตา

หาก มีการใช้ หน่วยวัดความเฉื่อย (IMU) ภายในระบบ VO โดยทั่วไปจะเรียกว่า Visual Inertial Odometry (VIO)

อัลกอริทึม

วิธีการวัดระยะทางด้วยภาพที่มีอยู่ส่วนใหญ่มีพื้นฐานมาจากขั้นตอนต่อไปนี้

รับภาพอินพุต: โดยใช้^{กล้อง}เดี่ยว [ ³^]^[^{4 ]}^{กล้อง}สเตอริโอ [ ⁴^]^[^{5 ]}หรือกล้องรอบ^{ทิศทาง} [ ^{6 ]}^[⁷^]
การแก้ไขภาพ: ใช้ เทคนิค การประมวลผลภาพเพื่อลบความบิดเบี้ยวของเลนส์ เป็นต้น
การตรวจจับคุณลักษณะ : กำหนดตัวดำเนินการความสนใจ จับคู่คุณลักษณะระหว่างเฟรม และสร้างฟิลด์ การไหลของแสง
1. การสกัดคุณลักษณะและการหาความสัมพันธ์
  - ใช้การหาความสัมพันธ์เชิงสถิติ ไม่ใช่การติดตามคุณลักษณะ ในระยะยาว เพื่อสร้างความสัมพันธ์ระหว่างภาพสองภาพ
2. สร้างสนามการไหลของแสง ( วิธี Lucas–Kanade )
ตรวจสอบเวกเตอร์สนามการไหลเพื่อหาข้อผิดพลาดในการติดตามที่อาจเกิดขึ้นและกำจัดค่าผิดปกติ^{[ 8 ]}
การประมาณการเคลื่อนที่ของกล้องจากการไหลของแสง^{[ 9 ]}^{[ 10 ]}^{[ 11 ]}^{[ 12 ]}
1. ตัวเลือกที่ 1: ตัวกรอง Kalmanสำหรับการบำรุงรักษาการกระจายค่าประมาณสถานะ
2. ตัวเลือกที่ 2: ค้นหาคุณสมบัติทางเรขาคณิตและสามมิติของคุณลักษณะที่ทำให้ฟังก์ชันต้นทุน มีค่าน้อยที่สุด โดยพิจารณาจากข้อผิดพลาดในการฉายภาพซ้ำระหว่างภาพสองภาพที่อยู่ติดกัน วิธีนี้สามารถทำได้โดยการลดค่าทางคณิตศาสตร์หรือการสุ่มตัวอย่าง
เติมจุดติดตามเป็นระยะเพื่อรักษาความครอบคลุมทั่วทั้งภาพ

ทางเลือกอื่นนอกเหนือจากวิธีการตามคุณลักษณะคือเทคนิคการวัดระยะทางด้วยภาพแบบ "โดยตรง" หรือตามลักษณะที่ปรากฏ ซึ่งลดข้อผิดพลาดโดยตรงในพื้นที่เซ็นเซอร์และหลีกเลี่ยงการจับคู่และการสกัดคุณลักษณะในภายหลัง^{[ 5 ]}^{[ 13 ]}^{[ 14 ]}

อีกวิธีหนึ่งที่เรียกว่า 'visiodometry' ประมาณการการเลื่อนแบบระนาบระหว่างภาพโดยใช้ความสัมพันธ์ของเฟสแทนการสกัดคุณลักษณะ^{[ 15 ]}^{[ 16 ]}

การเคลื่อนไหวของตนเอง

การประมาณการเคลื่อนที่ของตนเองโดยใช้การตรวจจับมุม

การเคลื่อนที่ของกล้อง (Egomotion)ถูกกำหนดให้เป็นการเคลื่อนที่แบบสามมิติของกล้องภายในสภาพแวดล้อม^{[ 17 ]}ในสาขาคอมพิวเตอร์วิชั่นการเคลื่อนที่ของกล้องหมายถึงการประมาณการเคลื่อนที่ของกล้องเทียบกับฉากคงที่^{[ 18 ]}ตัวอย่างของการประมาณการเคลื่อนที่ของกล้องคือการประมาณตำแหน่งการเคลื่อนที่ของรถเทียบกับเส้นบนถนนหรือป้ายจราจรที่สังเกตได้จากตัวรถเอง การประมาณการเคลื่อนที่ของกล้องมีความสำคัญในแอปพลิ เคชัน การนำทางหุ่นยนต์อัตโนมัติ^{[ 19 ]}

ภาพรวม

เป้าหมายของการประมาณการเคลื่อนที่ของกล้องคือการกำหนดการเคลื่อนที่ 3 มิติของกล้องนั้นภายในสภาพแวดล้อมโดยใช้ลำดับภาพที่ถ่ายโดยกล้อง^{[ 20 ]}กระบวนการประมาณการเคลื่อนที่ของกล้องภายในสภาพแวดล้อมเกี่ยวข้องกับการใช้เทคนิคการวัดระยะทางด้วยภาพบนลำดับภาพที่ถ่ายโดยกล้องที่กำลังเคลื่อนที่^{[ 21 ]}โดยทั่วไปจะทำโดยใช้การตรวจจับคุณลักษณะเพื่อสร้างการไหลของแสงจากเฟรมภาพสองเฟรมในลำดับ^{[ 17 ]}ที่สร้างจากกล้องเดี่ยวหรือกล้องสเตอริโอ^{[ 21 ]}การใช้ภาพคู่สเตอริโอสำหรับแต่ละเฟรมช่วยลดข้อผิดพลาดและให้ข้อมูลเชิงลึกและขนาดเพิ่มเติม^{[ 22 ]}^{[ 23 ]}

คุณลักษณะต่างๆ จะถูกตรวจจับในเฟรมแรก จากนั้นจึงนำมาจับคู่ในเฟรมที่สอง ข้อมูลนี้จะถูกนำมาใช้สร้างสนามการไหลของแสง (optical flow field) สำหรับคุณลักษณะที่ตรวจพบในภาพทั้งสอง สนามการไหลของแสงแสดงให้เห็นว่าคุณลักษณะต่างๆ แยกออกจากจุดเดียวอย่างไร ซึ่งก็คือจุดโฟกัสของการขยายตัวจุดโฟกัสของการขยายตัวสามารถตรวจจับได้จากสนามการไหลของแสง ซึ่งบ่งชี้ทิศทางการเคลื่อนที่ของกล้อง และทำให้สามารถประมาณการการเคลื่อนที่ของกล้องได้

นอกจากนี้ยังมีวิธีการอื่นในการสกัดข้อมูลการเคลื่อนไหวของร่างกายจากภาพ รวมถึงวิธีการที่หลีกเลี่ยงการตรวจจับคุณลักษณะและฟิลด์การไหลของแสง และใช้ความเข้มของภาพโดยตรง^{[ 17 ]}

ดูเพิ่มเติม

[ 1 ]

[ 2 ]

3

กล้อง

5 ]

6 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

การวัดระยะทางด้วยภาพ

ภาพรวม

ประเภท

กล้องตาเดียวและกล้องสเตอริโอ

วิธีการแบบอิงคุณลักษณะและแบบตรง

การวัดระยะทางด้วยระบบเฉื่อยทางสายตา

อัลกอริทึม

การเคลื่อนไหวของตนเอง

ภาพรวม

ดูเพิ่มเติม

ข้อมูลสำคัญจากบทความ