กลับไปหน้าบทความ

อ่าน 15 นาที

การจดจำวัตถุสามมิติ

ในวิชั่นคอมพิวเตอร์การรู้จำวัตถุ 3 มิติเกี่ยวข้องกับการรู้จำและระบุข้อมูล 3 มิติ เช่นท่าทางปริมาตร หรือรูปร่างของวัตถุ 3 มิติ ที่ผู้ใช้เลือก ในภาพถ่ายหรือภาพสแกนโดยทั่วไป...

การจดจำวัตถุสามมิติ | วิกิภาษาไทย

บทความความรู้ภาษาไทย

การจดจำวัตถุสามมิติ

คำถามที่พบบ่อยเกี่ยวกับ การจดจำวัตถุสามมิติ

การจดจำวัตถุสามมิติ คืออะไร?

ในวิชั่นคอมพิวเตอร์การรู้จำวัตถุ 3 มิติเกี่ยวข้องกับการรู้จำและระบุข้อมูล 3 มิติ เช่นท่าทางปริมาตร หรือรูปร่างของวัตถุ 3 มิติ ที่ผู้ใช้เลือก ในภาพถ่ายหรือภาพสแกนโดยทั่วไป ตัวอย่างของวัตถุที่…

บทความอธิบายเรื่อง “การจดจำวัตถุเดี่ยวแบบสามมิติในภาพถ่าย” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

วิธีการจดจำวัตถุสามมิติขึ้นอยู่กับคุณสมบัติของวัตถุ เพื่อความเรียบง่าย อัลกอริทึมที่มีอยู่มากมายจึงมุ่งเน้นไปที่การจดจำวัตถุแข็งที่ประกอบด้วยชิ้นส่วนเดียว นั่นคือวัตถุที่มีการแปลงเชิงพื้นที่…

บทความอธิบายเรื่อง “แนวทางการจดจำรูปแบบ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

วิธีการเหล่านี้ใช้ข้อมูลลักษณะที่ปรากฏที่รวบรวมจากการฉายภาพวัตถุที่บันทึกไว้ล่วงหน้าหรือคำนวณไว้ล่วงหน้า เพื่อจับคู่วัตถุในฉากที่อาจดูรก อย่างไรก็ตาม วิธีการเหล่านี้ไม่ได้คำนึงถึงข้อจำกัดทาง…

บทความอธิบายเรื่อง “แนวทางทางเรขาคณิตตามคุณลักษณะ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

วิธีการแบบอิงคุณลักษณะ (Feature-based) ใช้งานได้ดีกับวัตถุที่มี คุณลักษณะเฉพาะตัวจนถึงปัจจุบัน วัตถุที่มีคุณลักษณะขอบ (edge ​​features) หรือ คุณลักษณะ แบบหยด (blob features) ที่ดี ก็ได้รับกา…

บทความอธิบายเรื่อง “แนวทางทางเรขาคณิตตามคุณลักษณะ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

โดยทั่วไปแล้ว ตัวจดจำวัตถุตามคุณลักษณะจะทำงานโดยการจับภาพมุมมองคงที่จำนวนหนึ่งของวัตถุที่ต้องการจดจำไว้ล่วงหน้า จากนั้นจึงดึงคุณลักษณะจากมุมมองเหล่านี้ จากนั้นจึงจับคู่คุณลักษณะเหล่านี้กับฉา…

บทความอธิบายเรื่อง “แนวทางทางเรขาคณิตตามคุณลักษณะ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

ตัวอย่างของระบบต้นแบบที่ใช้วิธีการนี้ เราจะนำเสนอโครงร่างของวิธีการที่ [Rothganger et al.

บทความอธิบายเรื่อง “แนวทางทางเรขาคณิตตามคุณลักษณะ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

2004] ใช้ โดยตัดรายละเอียดบางส่วนออกไป วิธีการนี้เริ่มต้นด้วยการสมมติว่าวัตถุผ่านการแปลงแบบแข็งทั่วโลก เนื่องจากพื้นผิวเรียบเป็นระนาบเฉพาะที่ คุณสมบัติคงที่แบบแอฟฟีนจึงเหมาะสมสำหรับการจับคู่…

บทความอธิบายเรื่อง “แนวทางทางเรขาคณิตตามคุณลักษณะ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

ขั้นต่อไป เมื่อพิจารณาจากจำนวนมุมมองของกล้องของวัตถุ (24 ในเอกสาร) วิธีการนี้จะสร้างแบบจำลอง 3 มิติสำหรับวัตถุ ซึ่งประกอบด้วยตำแหน่งเชิงพื้นที่ 3 มิติและทิศทางของแต่ละลักษณะเด่น เนื่องจากจำน…

บทความอธิบายเรื่อง “แนวทางทางเรขาคณิตตามคุณลักษณะ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

เพื่อสร้างแบบจำลองรวม บทความนี้ใช้แบบจำลองย่อยที่ใหญ่ที่สุด แล้วค่อยๆ จัดแนวแบบจำลองย่อยที่เล็กกว่าทั้งหมดให้สอดคล้องกับแบบจำลองนั้น มีการใช้การย่อขนาดแบบทั่วไปเพื่อลดความคลาดเคลื่อน จากนั้น…

บทความอธิบายเรื่อง “แนวทางทางเรขาคณิตตามคุณลักษณะ” ที่เกี่ยวกับ การจดจำวัตถุสามมิติ อย่างไร?

ในการจดจำวัตถุในภาพอินพุตใดๆ งานวิจัยนี้จะตรวจจับลักษณะเฉพาะ แล้วใช้RANSACเพื่อค้นหาเมทริกซ์การฉายภาพแบบแอฟฟีนที่เหมาะสมที่สุดกับแบบจำลองวัตถุแบบรวมในฉาก 2 มิติ หากวิธีการของ RANSAC นี้มีข้อ…

เปิดฉบับอ่านง่าย จัดเนื้อหาให้อ่านภาพรวมได้เร็วขึ้น

ภาพรวม

  • ในวิชั่นคอมพิวเตอร์การรู้จำวัตถุ 3 มิติเกี่ยวข้องกับการรู้จำและระบุข้อมูล 3 มิติ เช่นท่าทางปริมาตร หรือรูปร่างของวัตถุ 3 มิติ ที่ผู้ใช้เลือก ในภาพถ่ายหรือภาพสแกนโดยทั่วไป ตัวอย่างของวัตถุที่…

การจดจำวัตถุเดี่ยวแบบสามมิติในภาพถ่าย

  • วิธีการจดจำวัตถุสามมิติขึ้นอยู่กับคุณสมบัติของวัตถุ เพื่อความเรียบง่าย อัลกอริทึมที่มีอยู่มากมายจึงมุ่งเน้นไปที่การจดจำวัตถุแข็งที่ประกอบด้วยชิ้นส่วนเดียว นั่นคือวัตถุที่มีการแปลงเชิงพื้นที่…

แนวทางการจดจำรูปแบบ

  • วิธีการเหล่านี้ใช้ข้อมูลลักษณะที่ปรากฏที่รวบรวมจากการฉายภาพวัตถุที่บันทึกไว้ล่วงหน้าหรือคำนวณไว้ล่วงหน้า เพื่อจับคู่วัตถุในฉากที่อาจดูรก อย่างไรก็ตาม วิธีการเหล่านี้ไม่ได้คำนึงถึงข้อจำกัดทาง…

แนวทางทางเรขาคณิตตามคุณลักษณะ

  • วิธีการแบบอิงคุณลักษณะ (Feature-based) ใช้งานได้ดีกับวัตถุที่มี คุณลักษณะเฉพาะตัวจนถึงปัจจุบัน วัตถุที่มีคุณลักษณะขอบ (edge ​​features) หรือ คุณลักษณะ แบบหยด (blob features) ที่ดี ก็ได้รับกา…
  • โดยทั่วไปแล้ว ตัวจดจำวัตถุตามคุณลักษณะจะทำงานโดยการจับภาพมุมมองคงที่จำนวนหนึ่งของวัตถุที่ต้องการจดจำไว้ล่วงหน้า จากนั้นจึงดึงคุณลักษณะจากมุมมองเหล่านี้ จากนั้นจึงจับคู่คุณลักษณะเหล่านี้กับฉา…
  • ตัวอย่างของระบบต้นแบบที่ใช้วิธีการนี้ เราจะนำเสนอโครงร่างของวิธีการที่ [Rothganger et al.
บทความต้นฉบับฉบับเต็ม

ในวิชั่นคอมพิวเตอร์การรู้จำวัตถุ 3 มิติเกี่ยวข้องกับการรู้จำและระบุข้อมูล 3 มิติ เช่นท่าทางปริมาตร หรือรูปร่างของวัตถุ 3 มิติ ที่ผู้ใช้เลือก ในภาพถ่ายหรือภาพสแกนโดยทั่วไป ตัวอย่างของวัตถุที่ต้องการรู้จำจะถูกนำเสนอต่อระบบวิชั่นในสภาพแวดล้อมที่มีการควบคุม จากนั้นระบบจะระบุตำแหน่งวัตถุที่นำเสนอก่อนหน้านี้สำหรับอินพุตที่กำหนดเอง เช่นสตรีมวิดีโอซึ่งสามารถทำได้ทั้งแบบออฟไลน์และแบบเรียล ไทม์ อัลกอริทึมสำหรับการแก้ปัญหานี้มีความเชี่ยวชาญเฉพาะด้านสำหรับการระบุตำแหน่งวัตถุที่ระบุล่วงหน้าเพียงชิ้นเดียว และสามารถเปรียบเทียบกับอัลกอริทึมที่ทำงานกับวัตถุประเภททั่วไป เช่นระบบรู้จำใบหน้าหรือการรู้จำวัตถุ 3 มิติทั่วไป เนื่องจากต้นทุนต่ำและความสะดวกในการรับภาพถ่าย จึงมีการวิจัยจำนวนมากเกี่ยวกับการรู้จำวัตถุ 3 มิติในภาพถ่าย

การจดจำวัตถุเดี่ยวแบบสามมิติในภาพถ่าย

วิธีการจดจำวัตถุสามมิติขึ้นอยู่กับคุณสมบัติของวัตถุ เพื่อความเรียบง่าย อัลกอริทึมที่มีอยู่มากมายจึงมุ่งเน้นไปที่การจดจำวัตถุแข็งที่ประกอบด้วยชิ้นส่วนเดียว นั่นคือวัตถุที่มีการแปลงเชิงพื้นที่เป็นการเคลื่อนที่แบบยุคลิดปัญหานี้มีสองวิธีหลักที่ใช้แก้ปัญหานี้ ได้แก่ วิธี การจดจำรูปแบบที่ใช้ข้อมูลลักษณะที่ปรากฏของภาพระดับต่ำเพื่อระบุตำแหน่งของวัตถุ ในขณะที่วิธีการทางเรขาคณิตที่อิงตามคุณลักษณะจะสร้างแบบจำลองสำหรับวัตถุที่จะจดจำ และจับคู่แบบจำลองกับภาพถ่าย

แนวทางการจดจำรูปแบบ

วิธีการเหล่านี้ใช้ข้อมูลลักษณะที่ปรากฏที่รวบรวมจากการฉายภาพวัตถุที่บันทึกไว้ล่วงหน้าหรือคำนวณไว้ล่วงหน้า เพื่อจับคู่วัตถุในฉากที่อาจดูรก อย่างไรก็ตาม วิธีการเหล่านี้ไม่ได้คำนึงถึงข้อจำกัดทางเรขาคณิตสามมิติของวัตถุในระหว่างการจับคู่ และโดยทั่วไปแล้วจะไม่จัดการกับการบดบัง (occlusion) ได้ดีเท่ากับวิธีการแบบอิงคุณลักษณะ (feature-based approach) ดู [Murase and Nayar 1995] และ [Selinger and Nelson 1999]

แนวทางทางเรขาคณิตตามคุณลักษณะ

ตัวอย่างลักษณะที่ตรวจพบในภาพ สีน้ำเงินแสดงจุดศูนย์กลางของลักษณะ วงรีสีแดงแสดงมาตราส่วนลักษณะเฉพาะที่ระบุโดยตัวตรวจจับลักษณะ และรูปสี่เหลี่ยมด้านขนานสีเขียวสร้างขึ้นจากพิกัดของวงรีตาม [Lowe 2004]

วิธีการแบบอิงคุณลักษณะ (Feature-based) ใช้งานได้ดีกับวัตถุที่มี คุณลักษณะเฉพาะตัวจนถึงปัจจุบัน วัตถุที่มีคุณลักษณะขอบ (edge ​​features) หรือ คุณลักษณะ แบบหยด (blob features) ที่ดี ก็ได้รับการยอมรับแล้ว ตัวอย่างเช่น อัลกอริทึมการตรวจจับ (ดูHarris affine region detector)และSIFTตามลำดับ เนื่องจากขาดตัวตรวจจับคุณลักษณะที่เหมาะสม วัตถุที่ไม่มีพื้นผิวเรียบและมีพื้นผิวเรียบจึงไม่สามารถจัดการด้วยวิธีการนี้ได้ในปัจจุบัน

โดยทั่วไปแล้ว ตัวจดจำวัตถุตามคุณลักษณะจะทำงานโดยการจับภาพมุมมองคงที่จำนวนหนึ่งของวัตถุที่ต้องการจดจำไว้ล่วงหน้า จากนั้นจึงดึงคุณลักษณะจากมุมมองเหล่านี้ จากนั้นจึงจับคู่คุณลักษณะเหล่านี้กับฉากและบังคับใช้ข้อจำกัดทางเรขาคณิตในกระบวนการจดจำ

ตัวอย่างของระบบต้นแบบที่ใช้วิธีการนี้ เราจะนำเสนอโครงร่างของวิธีการที่ [Rothganger et al. 2004] ใช้ โดยตัดรายละเอียดบางส่วนออกไป วิธีการนี้เริ่มต้นด้วยการสมมติว่าวัตถุผ่านการแปลงแบบแข็งทั่วโลก เนื่องจากพื้นผิวเรียบเป็นระนาบเฉพาะที่ คุณสมบัติคงที่แบบแอฟฟีนจึงเหมาะสมสำหรับการจับคู่: บทความนี้จะตรวจจับบริเวณที่มีรูปร่างคล้ายวงรีที่สนใจโดยใช้ทั้งลักษณะคล้ายขอบและคล้ายหยด และตาม [Lowe 2004] จะค้นหาทิศทางการไล่ระดับที่โดดเด่นของวงรี แปลงวงรีเป็นรูปสี่เหลี่ยมด้านขนาน และนำ ตัวระบุ SIFT มาใช้ กับรูปสี่เหลี่ยมด้านขนานที่ได้ ข้อมูลสียังถูกนำมาใช้เพื่อปรับปรุงการแยกแยะคุณลักษณะของ SIFT เพียงอย่างเดียวอีกด้วย

แบบจำลองบางส่วนของลักษณะที่ฉายเป็นสามมิติ สร้างขึ้นจากมุมมองใกล้ ๆ ของตุ๊กตาหมี นำมาจาก [Rothganger et al. 2004]

ขั้นต่อไป เมื่อพิจารณาจากจำนวนมุมมองของกล้องของวัตถุ (24 ในเอกสาร) วิธีการนี้จะสร้างแบบจำลอง 3 มิติสำหรับวัตถุ ซึ่งประกอบด้วยตำแหน่งเชิงพื้นที่ 3 มิติและทิศทางของแต่ละลักษณะเด่น เนื่องจากจำนวนมุมมองของวัตถุมีมาก โดยทั่วไปลักษณะเด่นแต่ละอย่างจะปรากฏอยู่ในหลายมุมมองที่อยู่ติดกัน จุดศูนย์กลางของลักษณะเด่นที่ตรงกันเหล่านี้จะสอดคล้องกัน และลักษณะเด่นที่ตรวจพบจะถูกจัดเรียงตามทิศทางการไล่ระดับที่เด่นชัด ดังนั้นจุดที่ (1, 0) ในระบบพิกัดเฉพาะของรูปสี่เหลี่ยมด้านขนานของลักษณะเด่นก็จะสอดคล้องกันเช่นกัน เช่นเดียวกับจุด (0, 1) ในพิกัดเฉพาะของรูปสี่เหลี่ยมด้านขนาน ดังนั้น สำหรับทุกคู่ของลักษณะเด่นที่ตรงกันในมุมมองใกล้เคียง จะทราบความสอดคล้องของคู่จุดสามคู่ เมื่อพิจารณาจากลักษณะเด่นที่ตรงกันอย่างน้อยสองอย่างโครงสร้างอะฟฟีนแบบหลายมุมมองจากอัลกอริทึมการเคลื่อนที่ (ดู [Tomasi and Kanade 1992]) สามารถใช้เพื่อสร้างการประมาณตำแหน่งของจุด (จนถึงการแปลงอะฟฟีนใดๆ) บทความของ Rothganger และคณะ ดังนั้นจึงเลือกมุมมองที่อยู่ติดกันสองมุมมอง ใช้ วิธีการคล้าย RANSACเพื่อเลือกคู่คุณลักษณะที่สอดคล้องกันสองคู่ และเพิ่มคุณลักษณะใหม่ลงในแบบจำลองบางส่วนที่สร้างโดย RANSAC ตราบใดที่คุณลักษณะเหล่านั้นอยู่ภายใต้เงื่อนไขความคลาดเคลื่อน ดังนั้น สำหรับคู่มุมมองที่อยู่ติดกันใดๆ ที่กำหนด อัลกอริทึมจะสร้างแบบจำลองบางส่วนของคุณลักษณะทั้งหมดที่มองเห็นได้ในทั้งสองมุมมอง

แบบจำลองขั้นสุดท้ายที่ผสานรวมคุณลักษณะของตุ๊กตาหมีเท็ดดี้ หลังจากการปรับปรุงแบบยุคลิด เพื่อการจดจำ แบบจำลองนี้จะถูกจับคู่กับภาพถ่ายของฉากโดยใช้ RANSAC นำมาจาก [Rothganger et al. 2004]

เพื่อสร้างแบบจำลองรวม บทความนี้ใช้แบบจำลองย่อยที่ใหญ่ที่สุด แล้วค่อยๆ จัดแนวแบบจำลองย่อยที่เล็กกว่าทั้งหมดให้สอดคล้องกับแบบจำลองนั้น มีการใช้การย่อขนาดแบบทั่วไปเพื่อลดความคลาดเคลื่อน จากนั้นจึงใช้การอัปเกรดแบบยุคลิดเพื่อเปลี่ยนตำแหน่งคุณลักษณะของแบบจำลองจากพิกัด 3 มิติเฉพาะไปจนถึงการแปลงแบบแอฟฟีน เป็นพิกัด 3 มิติเฉพาะไปจนถึงการเคลื่อนที่แบบยุคลิดเมื่อสิ้นสุดขั้นตอนนี้ เราจะได้แบบจำลองของวัตถุเป้าหมาย ซึ่งประกอบด้วยคุณลักษณะที่ฉายลงในพื้นที่ 3 มิติร่วมกัน

ในการจดจำวัตถุในภาพอินพุตใดๆ งานวิจัยนี้จะตรวจจับลักษณะเฉพาะ แล้วใช้RANSACเพื่อค้นหาเมทริกซ์การฉายภาพแบบแอฟฟีนที่เหมาะสมที่สุดกับแบบจำลองวัตถุแบบรวมในฉาก 2 มิติ หากวิธีการของ RANSAC นี้มีข้อผิดพลาดต่ำเพียงพอ เมื่อประสบความสำเร็จ อัลกอริทึมจะจดจำวัตถุและแสดงตำแหน่งของวัตถุในรูปของการฉายภาพแบบแอฟฟีน ภายใต้เงื่อนไขที่สมมติขึ้น วิธีการนี้โดยทั่วไปจะมีอัตราการจดจำประมาณ 95%

ดูเพิ่มเติม

สืบค้นจาก "https://en.wikipedia.org/w/index.php?title=3D_object_recognition&oldid=1085905153"

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การจดจำวัตถุสามมิติ

ในวิชั่นคอมพิวเตอร์การรู้จำวัตถุ 3 มิติเกี่ยวข้องกับการรู้จำและระบุข้อมูล 3 มิติ เช่นท่าทางปริมาตร หรือรูปร่างของวัตถุ 3 มิติ ที่ผู้ใช้เลือก ในภาพถ่ายหรือภาพสแกนโดยทั่วไป...

คำถามที่พบบ่อยเกี่ยวกับ การจดจำวัตถุสามมิติ

ในวิชั่นคอมพิวเตอร์การรู้จำวัตถุ 3 มิติเกี่ยวข้องกับการรู้จำและระบุข้อมูล 3 มิติ เช่นท่าทางปริมาตร หรือรูปร่างของวัตถุ 3 มิติ ที่ผู้ใช้เลือก ในภาพถ่ายหรือภาพสแกนโดยทั่วไป ตัวอย่างของวัตถุที่…

ภาพรวม

ในวิชั่นคอมพิวเตอร์การรู้จำวัตถุ 3 มิติเกี่ยวข้องกับการรู้จำและระบุข้อมูล 3 มิติ เช่นท่าทางปริมาตร หรือรูปร่างของวัตถุ 3 มิติ ที่ผู้ใช้เลือก ในภาพถ่ายหรือภาพสแกนโดยทั่วไป ตัวอย่างของวัตถุที่…

การจดจำวัตถุเดี่ยวแบบสามมิติในภาพถ่าย

วิธีการจดจำวัตถุสามมิติขึ้นอยู่กับคุณสมบัติของวัตถุ เพื่อความเรียบง่าย อัลกอริทึมที่มีอยู่มากมายจึงมุ่งเน้นไปที่การจดจำวัตถุแข็งที่ประกอบด้วยชิ้นส่วนเดียว นั่นคือวัตถุที่มีการแปลงเชิงพื้นที่…