กลับไปหน้าบทความ

อ่าน 5 นาที

การมองเห็นเชิงรุก

วิชั่นเชิงรุก (Active Vision ) หรือบางครั้งเรียกว่าวิชั่นคอมพิวเตอร์เชิงรุก (Active Computer Vision) เป็นสาขาหนึ่งของ คอมพิวเตอร์ วิชั่น

การมองเห็นเชิงรุก

วิชั่นเชิงรุก (Active Vision ) หรือบางครั้งเรียกว่าวิชั่นคอมพิวเตอร์เชิงรุก (Active Computer Vision) เป็นสาขาหนึ่งของ คอมพิวเตอร์ วิชั่น ระบบวิชั่นเชิงรุกคือระบบที่สามารถปรับมุมมองของกล้องเพื่อสำรวจสภาพแวดล้อมและรับข้อมูลที่ดีขึ้นจากสภาพแวดล้อมนั้น[ 1 ] [ 2 ] [ 3 ] [ 4 ]

พื้นหลัง

ความสนใจในระบบกล้องแบบแอคทีฟเริ่มขึ้นเมื่อสองทศวรรษที่แล้ว โดยเริ่มตั้งแต่ปลายทศวรรษที่ 1980 Aloimonos และคณะได้นำเสนอกรอบการทำงานทั่วไปแรกสำหรับการมองเห็นแบบแอคทีฟเพื่อปรับปรุงคุณภาพการรับรู้ของผลลัพธ์การติดตาม[ 3 ] การมองเห็นแบบแอคทีฟมีความสำคัญอย่างยิ่งในการรับมือกับปัญหาต่างๆ เช่น การบดบังมุมมองภาพ ที่จำกัด และความละเอียดของกล้องที่จำกัด[ 5 ]ข้อดีอื่นๆ ได้แก่ การลดความเบลอจากการเคลื่อนไหวของวัตถุ[ 6 ]และการเพิ่มการรับรู้ความลึกของวัตถุโดยการโฟกัสกล้องสองตัวไปที่วัตถุเดียวกันหรือการเคลื่อนย้ายกล้อง[ 3 ] การควบคุมมุมมองของกล้องแบบแอคทีฟยังช่วยในการโฟกัสทรัพยากรการคำนวณไปที่องค์ประกอบที่เกี่ยวข้องของฉาก[ 7 ]ในแง่ที่เลือกได้นี้ การมองเห็นแบบแอคทีฟสามารถมองได้ว่ามีความเกี่ยวข้องอย่างใกล้ชิดกับความสนใจทางสายตา (ทั้งแบบเปิดเผยและแบบซ่อนเร้น) ในสิ่งมีชีวิต ซึ่งแสดงให้เห็นว่าช่วยเพิ่มการรับรู้ส่วนที่เลือกของสนามภาพ ลักษณะเฉพาะของการมองเห็น (แบบแอคทีฟ) ของมนุษย์นี้สามารถเชื่อมโยงกับโครงสร้างโฟเวียของดวงตาของมนุษย์ได้อย่างง่ายดาย[ 8 ] [ 9 ]ซึ่งในเรตินาประมาณ 5% มีตัวรับสีมากกว่า 50%

นอกจากนี้ ยังมีข้อเสนอแนะว่าความสนใจทางสายตาและลักษณะการเลือกสรรของการควบคุมกล้องแบบแอคทีฟสามารถช่วยในงานอื่นๆ เช่น การเรียนรู้โมเดลวัตถุและสภาพแวดล้อมที่แข็งแกร่งยิ่งขึ้นด้วยตัวอย่างที่มีป้ายกำกับน้อยลงหรือแบบอัตโนมัติ[ 4 ] [ 10 ]

[ 11 ]

แนวทาง

แนวทางการใช้กล้องอัตโนมัติ

กล้องอัตโนมัติคือกล้องที่สามารถควบคุมทิศทางของตัวเองในสภาพแวดล้อมได้ มีงานวิจัยล่าสุดที่ใช้วิธีการนี้อยู่บ้าง ในงานของ Denzler et al. การเคลื่อนที่ของวัตถุที่ติดตามจะถูกจำลองโดยใช้ตัวกรอง Kalman ในขณะที่ความยาวโฟกัสที่ลดความไม่แน่นอนในการประมาณสถานะให้น้อยที่สุดจะถูกนำมาใช้ มีการใช้การตั้งค่าสเตอริโอที่มีกล้องซูมสองตัว มีเอกสารจำนวนหนึ่งที่เขียนเกี่ยวกับการควบคุมการซูมและไม่ได้กล่าวถึงการประมาณตำแหน่งกล้องและวัตถุโดยรวม ความพยายามที่จะรวมการประมาณและการควบคุมเข้าไว้ในกรอบเดียวกันสามารถพบได้ในงานของ Bagdanov et al. ซึ่งใช้กล้อง Pan-Tilt-Zoom ในการติดตามใบหน้า[ 12 ] ทั้งแบบจำลองการประมาณและการควบคุมที่ใช้เป็นแบบเฉพาะกิจ และวิธีการประมาณจะขึ้นอยู่กับคุณลักษณะของภาพมากกว่าคุณสมบัติ 3 มิติของเป้าหมายที่กำลังติดตาม[ 13 ]

แนวทางนาย/ทาส

ในการกำหนดค่าแบบมาสเตอร์/สเลฟ กล้องคงที่ที่ใช้ในการกำกับดูแลจะใช้ในการตรวจสอบมุมมองภาพกว้างและติดตามเป้าหมายที่เคลื่อนที่แต่ละเป้าหมายที่สนใจ ตำแหน่งของเป้าหมายแต่ละเป้าหมายเมื่อเวลาผ่านไปจะถูกส่งไปยังกล้องโฟเวียล ซึ่งพยายามสังเกตเป้าหมายด้วยความละเอียดที่สูงขึ้น ทั้งกล้องคงที่และกล้องแอคทีฟได้รับการปรับเทียบกับจุดอ้างอิงร่วมกัน เพื่อให้ข้อมูลที่มาจากกล้องตัวหนึ่งสามารถฉายไปยังอีกตัวหนึ่งได้อย่างง่ายดาย เพื่อประสานการควบคุมของเซ็นเซอร์แอคทีฟ การใช้งานที่เป็นไปได้อีกอย่างหนึ่งของแนวทางมาสเตอร์/สเลฟคือ กล้องคงที่ (มาสเตอร์) ดึงคุณลักษณะทางภาพของวัตถุที่สนใจ ในขณะที่เซ็นเซอร์แอคทีฟ (สเลฟ) ใช้คุณลักษณะเหล่านี้ในการตรวจจับวัตถุที่ต้องการโดยไม่จำเป็นต้องมีข้อมูลการฝึกอบรมใดๆ[ 13 ] [ 14 ]

ในช่วงไม่กี่ปีที่ผ่านมา มีความสนใจเพิ่มมากขึ้นในการสร้างเครือข่ายของกล้องแอคทีฟและกล้องคงที่เสริม เพื่อให้สามารถครอบคลุมพื้นที่ขนาดใหญ่ในขณะที่ยังคงความละเอียดสูงของเป้าหมายหลายเป้าหมาย นี่เป็นเวอร์ชันที่ขยายขนาดของวิธีการมาสเตอร์/สเลฟหรือวิธีการกล้องอัตโนมัติ วิธีการนี้มีประสิทธิภาพสูง แต่ก็มีค่าใช้จ่ายสูงมากเช่นกัน ไม่เพียงแต่ต้องใช้กล้องหลายตัวเท่านั้น แต่ยังต้องให้กล้องเหล่านั้นสื่อสารกัน ซึ่งอาจต้องใช้การคำนวณสูง[ 13 ] [ 14 ] 6th Jeff Foster

กรอบวิสัยทัศน์เชิงรุกที่ควบคุมได้

การมองเห็นแบบแอคทีฟที่ควบคุมได้สามารถนิยามได้ว่าเป็นการเคลื่อนที่ที่ควบคุมได้ของเซ็นเซอร์การมองเห็น ซึ่งสามารถเพิ่มประสิทธิภาพสูงสุดของอัลกอริธึมหุ่นยนต์ใดๆ ที่เกี่ยวข้องกับเซ็นเซอร์การมองเห็นที่เคลื่อนที่ได้ เป็นการผสมผสานระหว่างทฤษฎีการควบคุมและการมองเห็นแบบดั้งเดิม การประยุกต์ใช้กรอบงานนี้คือการควบคุมหุ่นยนต์แบบเรียลไทม์รอบวัตถุ 3 มิติแบบคงที่หรือเคลื่อนที่ได้ ดู Visual Servoing อัลกอริธึมที่รวมการใช้หน้าต่างหลายบานและการวัดความเชื่อมั่นที่เสถียรเชิงตัวเลขเข้ากับตัวควบคุมแบบสุ่ม เพื่อให้ได้วิธีแก้ปัญหาที่น่าพอใจสำหรับปัญหาการติดตามที่เกิดจากการรวมคอมพิวเตอร์วิชั่นและการควบคุม ในกรณีที่แบบจำลองของสภาพแวดล้อมไม่แม่นยำ อาจมีการนำเทคนิคการควบคุมแบบปรับตัวมาใช้ ข้อมูลข้างต้นและการแสดงทางคณิตศาสตร์เพิ่มเติมของการมองเห็นแบบแอคทีฟที่ควบคุมได้สามารถดูได้ในวิทยานิพนธ์ของ Nikolaos Papanikolopoulos [ 15 ]

ตัวอย่าง

ตัวอย่างของระบบการมองเห็นแบบแอคทีฟมักเกี่ยวข้องกับกล้องที่ติดตั้งบนหุ่นยนต์[ 16 ]แต่ระบบอื่นๆ ได้ใช้กล้องที่ติดตั้งบนผู้ปฏิบัติงานที่เป็นมนุษย์ (หรือที่เรียกว่า "อุปกรณ์สวมใส่") [ 17 ] การใช้งานรวมถึงการเฝ้าระวังอัตโนมัติ การโต้ตอบระหว่างมนุษย์กับหุ่นยนต์ (วิดีโอ) [ 18 ] [ 19 ] SLAMการวางแผนเส้นทาง[ 20 ]เป็นต้นในการแข่งขันDARPA Grand Challengeทีมส่วนใหญ่ใช้LIDARร่วมกับระบบการมองเห็นแบบแอคทีฟเพื่อนำทางยานพาหนะไร้คนขับข้ามเส้นทางออฟโรด

ตัวอย่างที่ดีของระบบการมองเห็นแบบแอคทีฟสามารถดูได้จากวิดีโอ YouTube นี้ ซึ่งแสดงการติดตามใบหน้าโดยใช้ระบบการมองเห็นแบบแอคทีฟร่วมกับระบบกล้องแบบแพนและเอียง https://www.youtube.com/watch?v=N0FjDOTnmm0

การมองเห็นเชิงรุกยังมีความสำคัญต่อการทำความเข้าใจว่ามนุษย์[ 8 ] [ 21 ] และสิ่งมีชีวิตที่มีเซ็นเซอร์รับภาพ มองเห็นโลกอย่างไร โดยคำนึงถึงข้อจำกัดของเซ็นเซอร์ ความหลากหลายและความแปรปรวนอย่างต่อเนื่องของสัญญาณภาพ และผลกระทบของการกระทำและเป้าหมายที่มีต่อการรับรู้[ 7 ] [ 22 ] [ 23 ]

กรอบงานการมองเห็นเชิงรุกที่ควบคุมได้สามารถนำไปใช้ได้หลายวิธี ตัวอย่างบางส่วนได้แก่การติดตามยานพาหนะแอปพลิเคชันหุ่นยนต์[ 24 ]และการแบ่งส่วน MRI แบบโต้ตอบ[ 25 ]

การแบ่งส่วน MRI แบบโต้ตอบใช้การมองเห็นแบบแอคทีฟที่ควบคุมได้โดยใช้การออกแบบการควบคุม Lyapanov เพื่อสร้างสมดุลระหว่างอิทธิพลของการไหลของเกรเดียนต์ที่ขับเคลื่อนด้วยข้อมูลและการป้อนข้อมูลของมนุษย์เมื่อเวลาผ่านไป วิธีนี้เชื่อมโยงการแบ่งส่วนอัตโนมัติเข้ากับการโต้ตอบได้อย่างราบรื่น สามารถดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีนี้ได้ ใน [ 25 ] การแบ่งส่วนใน MRI เป็นเรื่องยาก และต้องใช้ผู้เชี่ยวชาญในการติดตามส่วนที่ต้องการเนื่องจาก MRI ตรวจจับของเหลวและเนื้อเยื่อทั้งหมด ซึ่งอาจพิสูจน์ได้ว่าไม่สามารถทำได้จริงเพราะจะเป็นกระบวนการที่ยาวนานมาก วิธีการมองเห็นแบบแอคทีฟที่ควบคุมได้ที่อธิบายไว้ในเอกสารที่อ้างถึงสามารถช่วยปรับปรุงกระบวนการในขณะที่พึ่งพามนุษย์น้อยลง

  • กลุ่มวิจัยด้านการมองเห็นเชิงรุกณ มหาวิทยาลัยอ็อกซ์ฟอร์ด
  • ห้องปฏิบัติการการมองเห็นเชิงรุกมหาวิทยาลัยเอดินบะระ
  • ระบบติดตามภาพแบบแอคทีฟสำหรับโดรน (MAV)พัฒนาโดยมหาวิทยาลัยนิวเซาท์เวลส์
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Active_vision&oldid=1293517107 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การมองเห็นเชิงรุก

วิชั่นเชิงรุก (Active Vision ) หรือบางครั้งเรียกว่าวิชั่นคอมพิวเตอร์เชิงรุก (Active Computer Vision) เป็นสาขาหนึ่งของ คอมพิวเตอร์ วิชั่น

พื้นหลัง

ความสนใจในระบบกล้องแบบแอคทีฟเริ่มขึ้นเมื่อสองทศวรรษที่แล้ว โดยเริ่มตั้งแต่ปลายทศวรรษที่ 1980 Aloimonos และคณะได้นำเสนอกรอบการทำงานทั่วไปแรกสำหรับการมองเห็นแบบแอคทีฟเพื่อปรับปรุงคุณภาพการรับรู้ของผลลัพธ์การติดตาม [ 3 ]...

แนวทางการใช้กล้องอัตโนมัติ

กล้องอัตโนมัติคือกล้องที่สามารถควบคุมทิศทางของตัวเองในสภาพแวดล้อมได้ มีงานวิจัยล่าสุดที่ใช้วิธีการนี้อยู่บ้าง ในงานของ Denzler et al.

แนวทางนาย/ทาส

ในการกำหนดค่าแบบมาสเตอร์/สเลฟ กล้องคงที่ที่ใช้ในการกำกับดูแลจะใช้ในการตรวจสอบมุมมองภาพกว้างและติดตามเป้าหมายที่เคลื่อนที่แต่ละเป้าหมายที่สนใจ ตำแหน่งของเป้าหมายแต่ละเป้าหมายเมื่อเวลาผ่านไปจะถูกส่งไปยังกล้องโฟเวียล...