กลับไปหน้าบทความ

อ่าน 5 นาที

การวัดระยะทางด้วยภาพ

ในด้าน หุ่นยนต์ และ คอมพิวเตอร์วิชั่น การวัดระยะทางด้วยภาพ ( Visual Odometry) คือกระบวนการกำหนดตำแหน่งและทิศทางของหุ่นยนต์หรือระบบคอมพิวเตอร์อื่นๆ...

การวัดระยะทางด้วยภาพ

เวก เตอร์ การไหลของแสง (optical flow vector) ของวัตถุที่เคลื่อนที่ในลำดับวิดีโอ

ในด้านหุ่นยนต์และคอมพิวเตอร์วิชั่น การวัดระยะทางด้วยภาพ ( Visual Odometry)คือกระบวนการกำหนดตำแหน่งและทิศทางของหุ่นยนต์หรือระบบคอมพิวเตอร์อื่นๆ โดยการวิเคราะห์ชุดภาพจากกล้องที่ระบบถ่ายจากสภาพแวดล้อม มีการนำไปใช้งานในแอปพลิเคชันหุ่นยนต์ที่หลากหลาย เช่น ในยานสำรวจดาวอังคาร[ 1 ]

การใช้งานการวัดระยะทางด้วยภาพ ได้แก่ความเป็นจริงเสริมและหุ่นยนต์[ 2 ]

หากใช้หน่วยวัดความเฉื่อย จะเรียกว่า ระบบวัดระยะทางด้วยภาพและความเฉื่อย (Visual-Inertial OdometryหรือVIO )

ภาพรวม

ในด้านการนำทาง การวัดระยะทาง (odometry)คือการใช้ข้อมูลจากการเคลื่อนที่ของตัวขับเคลื่อนเพื่อประมาณการการเปลี่ยนแปลงตำแหน่งเมื่อเวลาผ่านไป โดยใช้อุปกรณ์ต่างๆ เช่นตัวเข้ารหัสแบบหมุน (rotary encoder)เพื่อวัดการหมุนของล้อ แม้ว่าเทคนิคการวัดระยะทางแบบดั้งเดิมจะมีประโยชน์สำหรับยานพาหนะแบบมีล้อหรือแบบมีตีนตะขาบ แต่ก็ไม่สามารถนำไปใช้กับหุ่นยนต์เคลื่อนที่ที่มีวิธีการเคลื่อนที่แบบไม่มาตรฐาน เช่นหุ่นยนต์ขาเดินได้นอกจากนี้ การวัดระยะทางยังประสบปัญหาเรื่องความแม่นยำอยู่เสมอ เนื่องจากล้อมีแนวโน้มที่จะลื่นไถลบนพื้น ทำให้ระยะทางที่เดินทางไม่สม่ำเสมอเมื่อเทียบกับการหมุนของล้อ ข้อผิดพลาดนี้จะยิ่งมากขึ้นเมื่อยานพาหนะทำงานบนพื้นผิวที่ไม่เรียบ ค่าที่ได้จากการวัดระยะทางจะเชื่อถือไม่ได้มากขึ้นเรื่อยๆ เมื่อข้อผิดพลาดเหล่านี้สะสมและทวีความรุนแรงขึ้นตามเวลา

การวัดระยะทางด้วยภาพ (Visual odometry) คือกระบวนการกำหนดข้อมูลการวัดระยะทางที่เทียบเท่าโดยใช้ภาพจากกล้องหลายตัวเรียงต่อกันเพื่อประมาณระยะทางที่เดินทางไป การวัดระยะทางด้วยภาพช่วยเพิ่มความแม่นยำในการนำทางของหุ่นยนต์หรือยานพาหนะที่ใช้การเคลื่อนที่ทุกประเภทบนพื้นผิวใดๆ ก็ตาม

ประเภท

VO มีหลายประเภท

กล้องตาเดียวและกล้องสเตอริโอ

ขึ้นอยู่กับการตั้งค่ากล้อง เสียงพากย์สามารถแบ่งออกเป็น เสียงพากย์แบบกล้องเดี่ยว (Monocular VO) และเสียงพากย์แบบสเตอริโอ (Stereo VO) (กล้องสองตัวในระบบสเตอริโอ)

VIO ถูกนำไปใช้อย่างแพร่หลายในโดรนสี่ใบพัดเชิงพาณิชย์ ซึ่งช่วยในการระบุตำแหน่งในพื้นที่ที่ไม่มีสัญญาณ GPS

วิธีการแบบอิงคุณลักษณะและแบบตรง

ข้อมูลภาพของระบบจดจำใบหน้าแบบดั้งเดิมได้มาจากการใช้วิธีการอิงคุณลักษณะ ซึ่งจะสกัดจุดเด่นของภาพและติดตามจุดเหล่านั้นในลำดับภาพ การพัฒนาล่าสุดในการวิจัยระบบจดจำใบหน้าได้นำเสนอทางเลือกใหม่ที่เรียกว่าวิธีการโดยตรง ซึ่งใช้ความเข้มของพิกเซลในลำดับภาพโดยตรงเป็นข้อมูลป้อนเข้าทางภาพ นอกจากนี้ยังมีวิธีการแบบผสมผสานอีกด้วย

การวัดระยะทางด้วยระบบเฉื่อยทางสายตา

หาก มีการใช้ หน่วยวัดความเฉื่อย (IMU) ภายในระบบ VO โดยทั่วไปจะเรียกว่า Visual Inertial Odometry (VIO)

อัลกอริทึม

วิธีการวัดระยะทางด้วยภาพที่มีอยู่ส่วนใหญ่มีพื้นฐานมาจากขั้นตอนต่อไปนี้

  1. รับภาพอินพุต: โดยใช้กล้องเดี่ยว [ 3 ] [ 4 ] กล้องสเตอริโอ [ 4 ] [ 5 ]หรือกล้องรอบทิศทาง [ 6 ] [ 7 ]
  2. การแก้ไขภาพ: ใช้ เทคนิค การประมวลผลภาพเพื่อลบความบิดเบี้ยวของเลนส์ เป็นต้น
  3. การตรวจจับคุณลักษณะ : กำหนดตัวดำเนินการความสนใจ จับคู่คุณลักษณะระหว่างเฟรม และสร้างฟิลด์ การไหลของแสง
    1. การสกัดคุณลักษณะและการหาความสัมพันธ์
    2. สร้างสนามการไหลของแสง ( วิธี Lucas–Kanade )
  4. ตรวจสอบเวกเตอร์สนามการไหลเพื่อหาข้อผิดพลาดในการติดตามที่อาจเกิดขึ้นและกำจัดค่าผิดปกติ[ 8 ]
  5. การประมาณการเคลื่อนที่ของกล้องจากการไหลของแสง[ 9 ] [ 10 ] [ 11 ] [ 12 ]
    1. ตัวเลือกที่ 1: ตัวกรอง Kalmanสำหรับการบำรุงรักษาการกระจายค่าประมาณสถานะ
    2. ตัวเลือกที่ 2: ค้นหาคุณสมบัติทางเรขาคณิตและสามมิติของคุณลักษณะที่ทำให้ฟังก์ชันต้นทุน มีค่าน้อยที่สุด โดยพิจารณาจากข้อผิดพลาดในการฉายภาพซ้ำระหว่างภาพสองภาพที่อยู่ติดกัน วิธีนี้สามารถทำได้โดยการลดค่าทางคณิตศาสตร์หรือการสุ่มตัวอย่าง
  6. เติมจุดติดตามเป็นระยะเพื่อรักษาความครอบคลุมทั่วทั้งภาพ

ทางเลือกอื่นนอกเหนือจากวิธีการตามคุณลักษณะคือเทคนิคการวัดระยะทางด้วยภาพแบบ "โดยตรง" หรือตามลักษณะที่ปรากฏ ซึ่งลดข้อผิดพลาดโดยตรงในพื้นที่เซ็นเซอร์และหลีกเลี่ยงการจับคู่และการสกัดคุณลักษณะในภายหลัง[ 5 ] [ 13 ] [ 14 ]

อีกวิธีหนึ่งที่เรียกว่า 'visiodometry' ประมาณการการเลื่อนแบบระนาบระหว่างภาพโดยใช้ความสัมพันธ์ของเฟสแทนการสกัดคุณลักษณะ[ 15 ] [ 16 ]

การเคลื่อนไหวของตนเอง

การประมาณการเคลื่อนที่ของตนเองโดยใช้การตรวจจับมุม

การเคลื่อนที่ของกล้อง (Egomotion)ถูกกำหนดให้เป็นการเคลื่อนที่แบบสามมิติของกล้องภายในสภาพแวดล้อม[ 17 ]ในสาขาคอมพิวเตอร์วิชั่นการเคลื่อนที่ของกล้องหมายถึงการประมาณการเคลื่อนที่ของกล้องเทียบกับฉากคงที่[ 18 ]ตัวอย่างของการประมาณการเคลื่อนที่ของกล้องคือการประมาณตำแหน่งการเคลื่อนที่ของรถเทียบกับเส้นบนถนนหรือป้ายจราจรที่สังเกตได้จากตัวรถเอง การประมาณการเคลื่อนที่ของกล้องมีความสำคัญในแอปพลิ เคชัน การนำทางหุ่นยนต์อัตโนมัติ[ 19 ]

ภาพรวม

เป้าหมายของการประมาณการเคลื่อนที่ของกล้องคือการกำหนดการเคลื่อนที่ 3 มิติของกล้องนั้นภายในสภาพแวดล้อมโดยใช้ลำดับภาพที่ถ่ายโดยกล้อง[ 20 ]กระบวนการประมาณการเคลื่อนที่ของกล้องภายในสภาพแวดล้อมเกี่ยวข้องกับการใช้เทคนิคการวัดระยะทางด้วยภาพบนลำดับภาพที่ถ่ายโดยกล้องที่กำลังเคลื่อนที่[ 21 ]โดยทั่วไปจะทำโดยใช้การตรวจจับคุณลักษณะเพื่อสร้างการไหลของแสงจากเฟรมภาพสองเฟรมในลำดับ[ 17 ]ที่สร้างจากกล้องเดี่ยวหรือกล้องสเตอริโอ[ 21 ]การใช้ภาพคู่สเตอริโอสำหรับแต่ละเฟรมช่วยลดข้อผิดพลาดและให้ข้อมูลเชิงลึกและขนาดเพิ่มเติม[ 22 ] [ 23 ]

คุณลักษณะต่างๆ จะถูกตรวจจับในเฟรมแรก จากนั้นจึงนำมาจับคู่ในเฟรมที่สอง ข้อมูลนี้จะถูกนำมาใช้สร้างสนามการไหลของแสง (optical flow field) สำหรับคุณลักษณะที่ตรวจพบในภาพทั้งสอง สนามการไหลของแสงแสดงให้เห็นว่าคุณลักษณะต่างๆ แยกออกจากจุดเดียวอย่างไร ซึ่งก็คือจุดโฟกัสของการขยายตัวจุดโฟกัสของการขยายตัวสามารถตรวจจับได้จากสนามการไหลของแสง ซึ่งบ่งชี้ทิศทางการเคลื่อนที่ของกล้อง และทำให้สามารถประมาณการการเคลื่อนที่ของกล้องได้

นอกจากนี้ยังมีวิธีการอื่นในการสกัดข้อมูลการเคลื่อนไหวของร่างกายจากภาพ รวมถึงวิธีการที่หลีกเลี่ยงการตรวจจับคุณลักษณะและฟิลด์การไหลของแสง และใช้ความเข้มของภาพโดยตรง[ 17 ]

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Visual_odometry&oldid=1359595178#Egomotion "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การวัดระยะทางด้วยภาพ

ในด้าน หุ่นยนต์ และ คอมพิวเตอร์วิชั่น การวัดระยะทางด้วยภาพ ( Visual Odometry) คือกระบวนการกำหนดตำแหน่งและทิศทางของหุ่นยนต์หรือระบบคอมพิวเตอร์อื่นๆ...

ภาพรวม

ในด้าน การนำทาง การวัด ระยะ ทาง (odometry) คือการใช้ข้อมูลจากการเคลื่อนที่ของตัวขับเคลื่อนเพื่อประมาณการการเปลี่ยนแปลงตำแหน่งเมื่อเวลาผ่านไป โดยใช้อุปกรณ์ต่างๆ เช่น ตัวเข้ารหัสแบบหมุน (rotary encoder) เพื่อวัดการหมุนของล้อ...

กล้องตาเดียวและกล้องสเตอริโอ

ขึ้นอยู่กับการตั้งค่ากล้อง เสียงพากย์สามารถแบ่งออกเป็น เสียงพากย์แบบกล้องเดี่ยว (Monocular VO) และเสียงพากย์แบบสเตอริโอ (Stereo VO) (กล้องสองตัวในระบบสเตอริโอ)

วิธีการแบบอิงคุณลักษณะและแบบตรง

ข้อมูลภาพของระบบจดจำใบหน้าแบบดั้งเดิมได้มาจากการใช้วิธีการอิงคุณลักษณะ ซึ่งจะสกัดจุดเด่นของภาพและติดตามจุดเหล่านั้นในลำดับภาพ การพัฒนาล่าสุดในการวิจัยระบบจดจำใบหน้าได้นำเสนอทางเลือกใหม่ที่เรียกว่าวิธีการโดยตรง...