การมองเห็นเชิงรุก

Q: ข้อมูลสำคัญเกี่ยวกับ การมองเห็นเชิงรุก

วิชั่นเชิงรุก (Active Vision ) หรือบางครั้งเรียกว่าวิชั่นคอมพิวเตอร์เชิงรุก (Active Computer Vision) เป็นสาขาหนึ่งของ คอมพิวเตอร์ วิชั่น

วิชั่นเชิงรุก (Active Vision ) หรือบางครั้งเรียกว่าวิชั่นคอมพิวเตอร์เชิงรุก (Active Computer Vision) เป็นสาขาหนึ่งของ คอมพิวเตอร์ วิชั่น ระบบวิชั่นเชิงรุกคือระบบที่สามารถปรับมุมมองของกล้องเพื่อสำรวจสภาพแวดล้อมและรับข้อมูลที่ดีขึ้นจากสภาพแวดล้อมนั้น^{[ 1 ]}^{[ 2 ]}^{[ 3 ]}^{[ 4 ]}

พื้นหลัง

ความสนใจในระบบกล้องแบบแอคทีฟเริ่มขึ้นเมื่อสองทศวรรษที่แล้ว โดยเริ่มตั้งแต่ปลายทศวรรษที่ 1980 Aloimonos และคณะได้นำเสนอกรอบการทำงานทั่วไปแรกสำหรับการมองเห็นแบบแอคทีฟเพื่อปรับปรุงคุณภาพการรับรู้ของผลลัพธ์การติดตาม^{[ 3 ]} การมองเห็นแบบแอคทีฟมีความสำคัญอย่างยิ่งในการรับมือกับปัญหาต่างๆ เช่น การบดบังมุมมองภาพ ที่จำกัด และความละเอียดของกล้องที่จำกัด^{[ 5 ]}ข้อดีอื่นๆ ได้แก่ การลดความเบลอจากการเคลื่อนไหวของวัตถุ^{[ 6 ]}และการเพิ่มการรับรู้ความลึกของวัตถุโดยการโฟกัสกล้องสองตัวไปที่วัตถุเดียวกันหรือการเคลื่อนย้ายกล้อง^{[ 3 ]} การควบคุมมุมมองของกล้องแบบแอคทีฟยังช่วยในการโฟกัสทรัพยากรการคำนวณไปที่องค์ประกอบที่เกี่ยวข้องของฉาก^{[ 7 ]}ในแง่ที่เลือกได้นี้ การมองเห็นแบบแอคทีฟสามารถมองได้ว่ามีความเกี่ยวข้องอย่างใกล้ชิดกับความสนใจทางสายตา (ทั้งแบบเปิดเผยและแบบซ่อนเร้น) ในสิ่งมีชีวิต ซึ่งแสดงให้เห็นว่าช่วยเพิ่มการรับรู้ส่วนที่เลือกของสนามภาพ ลักษณะเฉพาะของการมองเห็น (แบบแอคทีฟ) ของมนุษย์นี้สามารถเชื่อมโยงกับโครงสร้างโฟเวียของดวงตาของมนุษย์ได้อย่างง่ายดาย^{[ 8 ]}^{[ 9 ]}ซึ่งในเรตินาประมาณ 5% มีตัวรับสีมากกว่า 50%

นอกจากนี้ ยังมีข้อเสนอแนะว่าความสนใจทางสายตาและลักษณะการเลือกสรรของการควบคุมกล้องแบบแอคทีฟสามารถช่วยในงานอื่นๆ เช่น การเรียนรู้โมเดลวัตถุและสภาพแวดล้อมที่แข็งแกร่งยิ่งขึ้นด้วยตัวอย่างที่มีป้ายกำกับน้อยลงหรือแบบอัตโนมัติ^{[ 4 ]}^{[ 10 ]}

^{[ 11 ]}

แนวทาง

แนวทางการใช้กล้องอัตโนมัติ

กล้องอัตโนมัติคือกล้องที่สามารถควบคุมทิศทางของตัวเองในสภาพแวดล้อมได้ มีงานวิจัยล่าสุดที่ใช้วิธีการนี้อยู่บ้าง ในงานของ Denzler et al. การเคลื่อนที่ของวัตถุที่ติดตามจะถูกจำลองโดยใช้ตัวกรอง Kalman ในขณะที่ความยาวโฟกัสที่ลดความไม่แน่นอนในการประมาณสถานะให้น้อยที่สุดจะถูกนำมาใช้ มีการใช้การตั้งค่าสเตอริโอที่มีกล้องซูมสองตัว มีเอกสารจำนวนหนึ่งที่เขียนเกี่ยวกับการควบคุมการซูมและไม่ได้กล่าวถึงการประมาณตำแหน่งกล้องและวัตถุโดยรวม ความพยายามที่จะรวมการประมาณและการควบคุมเข้าไว้ในกรอบเดียวกันสามารถพบได้ในงานของ Bagdanov et al. ซึ่งใช้กล้อง Pan-Tilt-Zoom ในการติดตามใบหน้า^{[ 12 ]} ทั้งแบบจำลองการประมาณและการควบคุมที่ใช้เป็นแบบเฉพาะกิจ และวิธีการประมาณจะขึ้นอยู่กับคุณลักษณะของภาพมากกว่าคุณสมบัติ 3 มิติของเป้าหมายที่กำลังติดตาม^{[ 13 ]}

แนวทางนาย/ทาส

ในการกำหนดค่าแบบมาสเตอร์/สเลฟ กล้องคงที่ที่ใช้ในการกำกับดูแลจะใช้ในการตรวจสอบมุมมองภาพกว้างและติดตามเป้าหมายที่เคลื่อนที่แต่ละเป้าหมายที่สนใจ ตำแหน่งของเป้าหมายแต่ละเป้าหมายเมื่อเวลาผ่านไปจะถูกส่งไปยังกล้องโฟเวียล ซึ่งพยายามสังเกตเป้าหมายด้วยความละเอียดที่สูงขึ้น ทั้งกล้องคงที่และกล้องแอคทีฟได้รับการปรับเทียบกับจุดอ้างอิงร่วมกัน เพื่อให้ข้อมูลที่มาจากกล้องตัวหนึ่งสามารถฉายไปยังอีกตัวหนึ่งได้อย่างง่ายดาย เพื่อประสานการควบคุมของเซ็นเซอร์แอคทีฟ การใช้งานที่เป็นไปได้อีกอย่างหนึ่งของแนวทางมาสเตอร์/สเลฟคือ กล้องคงที่ (มาสเตอร์) ดึงคุณลักษณะทางภาพของวัตถุที่สนใจ ในขณะที่เซ็นเซอร์แอคทีฟ (สเลฟ) ใช้คุณลักษณะเหล่านี้ในการตรวจจับวัตถุที่ต้องการโดยไม่จำเป็นต้องมีข้อมูลการฝึกอบรมใดๆ^{[ 13 ]}^{[ 14 ]}

ในช่วงไม่กี่ปีที่ผ่านมา มีความสนใจเพิ่มมากขึ้นในการสร้างเครือข่ายของกล้องแอคทีฟและกล้องคงที่เสริม เพื่อให้สามารถครอบคลุมพื้นที่ขนาดใหญ่ในขณะที่ยังคงความละเอียดสูงของเป้าหมายหลายเป้าหมาย นี่เป็นเวอร์ชันที่ขยายขนาดของวิธีการมาสเตอร์/สเลฟหรือวิธีการกล้องอัตโนมัติ วิธีการนี้มีประสิทธิภาพสูง แต่ก็มีค่าใช้จ่ายสูงมากเช่นกัน ไม่เพียงแต่ต้องใช้กล้องหลายตัวเท่านั้น แต่ยังต้องให้กล้องเหล่านั้นสื่อสารกัน ซึ่งอาจต้องใช้การคำนวณสูง^{[ 13 ]}^{[ 14 ]} 6th Jeff Foster

กรอบวิสัยทัศน์เชิงรุกที่ควบคุมได้

การมองเห็นแบบแอคทีฟที่ควบคุมได้สามารถนิยามได้ว่าเป็นการเคลื่อนที่ที่ควบคุมได้ของเซ็นเซอร์การมองเห็น ซึ่งสามารถเพิ่มประสิทธิภาพสูงสุดของอัลกอริธึมหุ่นยนต์ใดๆ ที่เกี่ยวข้องกับเซ็นเซอร์การมองเห็นที่เคลื่อนที่ได้ เป็นการผสมผสานระหว่างทฤษฎีการควบคุมและการมองเห็นแบบดั้งเดิม การประยุกต์ใช้กรอบงานนี้คือการควบคุมหุ่นยนต์แบบเรียลไทม์รอบวัตถุ 3 มิติแบบคงที่หรือเคลื่อนที่ได้ ดู Visual Servoing อัลกอริธึมที่รวมการใช้หน้าต่างหลายบานและการวัดความเชื่อมั่นที่เสถียรเชิงตัวเลขเข้ากับตัวควบคุมแบบสุ่ม เพื่อให้ได้วิธีแก้ปัญหาที่น่าพอใจสำหรับปัญหาการติดตามที่เกิดจากการรวมคอมพิวเตอร์วิชั่นและการควบคุม ในกรณีที่แบบจำลองของสภาพแวดล้อมไม่แม่นยำ อาจมีการนำเทคนิคการควบคุมแบบปรับตัวมาใช้ ข้อมูลข้างต้นและการแสดงทางคณิตศาสตร์เพิ่มเติมของการมองเห็นแบบแอคทีฟที่ควบคุมได้สามารถดูได้ในวิทยานิพนธ์ของ Nikolaos Papanikolopoulos ^{[ 15 ]}

ตัวอย่าง

ตัวอย่างของระบบการมองเห็นแบบแอคทีฟมักเกี่ยวข้องกับกล้องที่ติดตั้งบนหุ่นยนต์^{[ 16 ]}แต่ระบบอื่นๆ ได้ใช้กล้องที่ติดตั้งบนผู้ปฏิบัติงานที่เป็นมนุษย์ (หรือที่เรียกว่า "อุปกรณ์สวมใส่") ^{[ 17 ] การใช้งานรวมถึงการเฝ้าระวังอัตโนมัติ การโต้ตอบระหว่างมนุษย์กับหุ่นยนต์ (วิดีโอ) [ 18 ] [}^{19 ] SLAM}การวางแผนเส้นทาง^[²⁰^]^{เป็นต้น}^ในการแข่งขัน^DARPA^Grand^Challengeทีมส่วนใหญ่ใช้LIDARร่วมกับระบบการมองเห็นแบบแอคทีฟเพื่อนำทางยานพาหนะไร้คนขับข้ามเส้นทางออฟโรด

ตัวอย่างที่ดีของระบบการมองเห็นแบบแอคทีฟสามารถดูได้จากวิดีโอ YouTube นี้ ซึ่งแสดงการติดตามใบหน้าโดยใช้ระบบการมองเห็นแบบแอคทีฟร่วมกับระบบกล้องแบบแพนและเอียง https://www.youtube.com/watch?v=N0FjDOTnmm0

การมองเห็นเชิงรุกยังมีความสำคัญต่อการทำความเข้าใจว่ามนุษย์^{[ 8 ]}^{[ 21 ]} และสิ่งมีชีวิตที่มีเซ็นเซอร์รับภาพ มองเห็นโลกอย่างไร โดยคำนึงถึงข้อจำกัดของเซ็นเซอร์ ความหลากหลายและความแปรปรวนอย่างต่อเนื่องของสัญญาณภาพ และผลกระทบของการกระทำและเป้าหมายที่มีต่อการรับรู้^{[ 7 ]}^{[ 22 ]}^{[ 23 ]}

กรอบงานการมองเห็นเชิงรุกที่ควบคุมได้สามารถนำไปใช้ได้หลายวิธี ตัวอย่างบางส่วนได้แก่การติดตามยานพาหนะแอปพลิเคชันหุ่นยนต์^{[ 24 ]}และการแบ่งส่วน MRI แบบโต้ตอบ^{[ 25 ]}

การแบ่งส่วน MRI แบบโต้ตอบใช้การมองเห็นแบบแอคทีฟที่ควบคุมได้โดยใช้การออกแบบการควบคุม Lyapanov เพื่อสร้างสมดุลระหว่างอิทธิพลของการไหลของเกรเดียนต์ที่ขับเคลื่อนด้วยข้อมูลและการป้อนข้อมูลของมนุษย์เมื่อเวลาผ่านไป วิธีนี้เชื่อมโยงการแบ่งส่วนอัตโนมัติเข้ากับการโต้ตอบได้อย่างราบรื่น สามารถดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีนี้ได้ ใน ^{[ 25 ]} การแบ่งส่วนใน MRI เป็นเรื่องยาก และต้องใช้ผู้เชี่ยวชาญในการติดตามส่วนที่ต้องการเนื่องจาก MRI ตรวจจับของเหลวและเนื้อเยื่อทั้งหมด ซึ่งอาจพิสูจน์ได้ว่าไม่สามารถทำได้จริงเพราะจะเป็นกระบวนการที่ยาวนานมาก วิธีการมองเห็นแบบแอคทีฟที่ควบคุมได้ที่อธิบายไว้ในเอกสารที่อ้างถึงสามารถช่วยปรับปรุงกระบวนการในขณะที่พึ่งพามนุษย์น้อยลง

ลิงก์ภายนอก

กลุ่มวิจัยด้านการมองเห็นเชิงรุกณ มหาวิทยาลัยอ็อกซ์ฟอร์ด
ห้องปฏิบัติการการมองเห็นเชิงรุกมหาวิทยาลัยเอดินบะระ
ระบบติดตามภาพแบบแอคทีฟสำหรับโดรน (MAV)พัฒนาโดยมหาวิทยาลัยนิวเซาท์เวลส์

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ] การใช้งานรวมถึงการเฝ้าระวังอัตโนมัติ การโต้ตอบระหว่างมนุษย์กับหุ่นยนต์ (วิดีโอ) [ 18 ] [

19 ] SLAM

[

DARPA

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]