อ่าน 8 นาที
โครงสร้างจากการเคลื่อนไหว
โครงสร้างจากการเคลื่อนไหว ( SfM ) เป็น เทคนิค การสร้างภาพระยะทางโฟโตแกรมเมตริก สำหรับการประมาณโครงสร้างสามมิติจากลำดับภาพสองมิติที่อาจเชื่อมโยงกับสัญญาณการเคลื่อนไหว ในพื้นที่
โครงสร้างจากการเคลื่อนไหว
โครงสร้างจากการเคลื่อนไหว ( SfM ) [ 1 ]เป็น เทคนิค การสร้างภาพระยะทางโฟโตแกรมเมตริก สำหรับการประมาณโครงสร้างสามมิติจากลำดับภาพสองมิติที่อาจเชื่อมโยงกับสัญญาณการเคลื่อนไหว ในพื้นที่ เป็นปัญหาคลาสสิกที่ศึกษาในสาขาวิทยาการคอมพิวเตอร์และการรับรู้ทางสายตาในวิทยาการคอมพิวเตอร์ ปัญหาของ SfM คือการออกแบบอัลกอริทึมเพื่อดำเนินการงานนี้ ในการรับรู้ทางสายตา ปัญหาของ SfM คือการค้นหาอัลกอริทึมที่สิ่งมีชีวิตทางชีวภาพดำเนินการงานนี้
หลักการ



มนุษย์รับรู้ข้อมูลมากมายเกี่ยวกับโครงสร้างสามมิติในสภาพแวดล้อมโดยการเคลื่อนที่ไปรอบๆ เมื่อผู้สังเกตเคลื่อนที่ วัตถุรอบตัวจะเคลื่อนที่ในปริมาณที่แตกต่างกันขึ้นอยู่กับระยะห่างจากผู้สังเกต ปรากฏการณ์นี้เรียกว่าพาราแลกซ์การเคลื่อนที่และข้อมูลความลึกนี้สามารถใช้สร้างภาพสามมิติที่แม่นยำของโลกรอบตัวได้[ 2 ]
การค้นหาโครงสร้างจากภาพเคลื่อนไหวเป็นปัญหาที่คล้ายคลึงกับการค้นหาโครงสร้างจากภาพสามมิติ ในทั้งสองกรณี จำเป็นต้องค้นหา ความสอดคล้องระหว่างภาพและการสร้าง วัตถุสามมิติขึ้นมาใหม่
เพื่อค้นหาความสอดคล้องกันระหว่างภาพ คุณลักษณะต่างๆ เช่น จุดมุม (ขอบที่มีการไล่ระดับในหลายทิศทาง) จะถูกติดตามจากภาพหนึ่งไปยังอีกภาพหนึ่ง ตัวตรวจจับคุณลักษณะที่ใช้กันอย่างแพร่หลายที่สุดตัวหนึ่งคือการแปลงคุณลักษณะที่ไม่ขึ้นกับมาตราส่วน (SIFT) โดยใช้ค่าสูงสุดจาก พีระมิด ความแตกต่างของเกาส์เซียน (DOG) เป็นคุณลักษณะ ขั้นตอนแรกใน SIFT คือการค้นหาทิศทางการไล่ระดับที่เด่นชัด เพื่อให้ไม่ขึ้นกับการหมุน ตัวอธิบายจะถูกหมุนให้เข้ากับทิศทางนี้[ 3 ] ตัวตรวจจับคุณลักษณะทั่วไปอีกตัวหนึ่งคือSURF ( speeded-up robust features ) [ 4 ]ใน SURF นั้น DOG จะถูกแทนที่ด้วย ตัวตรวจจับบล็อบที่ใช้ เมทริกซ์เฮสเซียนนอกจากนี้ แทนที่จะประเมินฮิสโตแกรมการไล่ระดับ SURF จะคำนวณผลรวมของส่วนประกอบการไล่ระดับและผลรวมของค่าสัมบูรณ์ของส่วนประกอบเหล่านั้น[ 5 ]การใช้ภาพอินทิกรัลทำให้สามารถตรวจจับคุณลักษณะได้อย่างรวดเร็วมากด้วยอัตราการตรวจจับที่สูง[ 6 ]ดังนั้น เมื่อเปรียบเทียบกับ SIFT แล้ว SURF จึงเป็นตัวตรวจจับคุณลักษณะที่เร็วกว่า แต่มีข้อเสียคือความแม่นยำในการระบุตำแหน่งคุณลักษณะน้อยกว่า[ 5 ] คุณลักษณะอีกประเภทหนึ่งที่เพิ่งนำมาใช้ได้จริงสำหรับการสร้างโครงสร้างจากการเคลื่อนไหวคือเส้นโค้งทั่วไป (เช่น ขอบที่มีการไล่ระดับในทิศทางเดียว) ซึ่งเป็นส่วนหนึ่งของเทคโนโลยีที่เรียกว่าSfM แบบไร้จุด[ 7 ] [ 8 ] ซึ่งมีประโยชน์เมื่อคุณลักษณะแบบจุดไม่เพียงพอ และพบได้ทั่วไปในสภาพแวดล้อมที่มนุษย์สร้างขึ้น[ 9 ]
จากนั้นคุณสมบัติที่ตรวจพบจากภาพทั้งหมดจะถูกจับคู่ หนึ่งในอัลกอริธึมการจับคู่ที่ติดตามคุณสมบัติจากภาพหนึ่งไปยังอีกภาพหนึ่งคือ ตัว ติดตามLucas–Kanade [ 10 ]
บางครั้งฟีเจอร์ที่ตรงกันบางส่วนอาจตรงกันอย่างไม่ถูกต้อง นี่คือเหตุผลที่ควรกรองการจับคู่ด้วยRANSAC (random sample consensus) เป็นอัลกอริธึมที่มักใช้เพื่อลบการจับคู่ที่ผิดปกติ ในบทความของ Fischler และ Bolles ได้ใช้ RANSAC เพื่อแก้ปัญหาการกำหนดตำแหน่ง (LDP) โดยมีวัตถุประสงค์เพื่อกำหนดจุดในอวกาศที่ฉายลงบนภาพไปยังชุดของจุดสังเกตที่มีตำแหน่งที่ทราบ[ 11 ]
จากนั้นจะใช้เส้นทางการเคลื่อนที่ของฟีเจอร์เมื่อเวลาผ่านไปเพื่อสร้างตำแหน่ง 3 มิติและการเคลื่อนที่ของกล้องขึ้นใหม่[ 12 ] อีกทางเลือกหนึ่งคือวิธีการที่เรียกว่าวิธีการโดยตรง ซึ่งข้อมูลทางเรขาคณิต (โครงสร้าง 3 มิติและการเคลื่อนที่ของกล้อง) จะถูกประมาณโดยตรงจากภาพโดยไม่ต้องมีการสร้างนามธรรมระดับกลางไปยังฟีเจอร์หรือมุม[ 13 ]
มีหลายแนวทางในการสร้างโครงสร้างจากการเคลื่อนไหว ใน SfM แบบเพิ่มทีละขั้น[ 14 ]ตำแหน่งของกล้องจะถูกหาคำตอบและเพิ่มทีละตัวลงในชุดข้อมูล ใน SfM แบบทั่วโลก[ 15 ] [ 16 ]ตำแหน่งของกล้องทั้งหมดจะถูกหาคำตอบพร้อมกัน แนวทางที่อยู่ระหว่างกลางคือ SfM นอกแกนหลักซึ่งการสร้างใหม่บางส่วนหลายรายการจะถูกคำนวณแล้วรวมเข้ากับโซลูชันทั่วโลก
แอปพลิเคชัน
ธรณีศาสตร์
การสร้างภาพสามมิติจากภาพเคลื่อนไหวด้วยสเตอริโอหลายมุมมองช่วยให้สามารถสร้างแบบจำลองภูมิประเทศขนาดใหญ่พิเศษได้โดยใช้ภาพที่ได้จากกล้องดิจิทัลหลายตัว และอาจใช้เครือข่ายจุดควบคุมภาคพื้นดินด้วย เทคนิคนี้ไม่จำกัดความถี่เชิงเวลา และสามารถให้ข้อมูลจุดเมฆที่มีความหนาแน่นและความแม่นยำเทียบเท่ากับข้อมูลที่สร้างโดยการสแกนด้วยเลเซอร์ภาคพื้นดินและทางอากาศในราคาที่ต่ำกว่ามาก[ 17 ] [ 18 ] [ 19 ]การสร้างภาพสามมิติจากภาพเคลื่อนไหวยังมีประโยชน์ในสภาพแวดล้อมที่ห่างไกลหรือขรุขระ ซึ่งการสแกนด้วยเลเซอร์ภาคพื้นดินมีข้อจำกัดด้านความสะดวกในการพกพาอุปกรณ์ และการสแกนด้วยเลเซอร์ทางอากาศมีข้อจำกัดด้านความขรุขระของภูมิประเทศ ทำให้ข้อมูลสูญหายและภาพบิดเบี้ยว เทคนิคนี้ถูกนำไปใช้ในหลายพื้นที่ เช่น แม่น้ำ[ 20 ]พื้นที่แห้งแล้ง[ 21 ]ชายฝั่งทราย[ 22 ] [ 23 ]เขตแนวรอยเลื่อน[ 24 ]ดินถล่ม[ 25 ] [ 26 ]และแนวปะการัง[ 27 ] SfM ยังถูกนำไปใช้ในการประเมินการเปลี่ยนแปลง[ 28 ]และปริมาณการสะสมไม้ขนาดใหญ่[ 29 ]และความพรุน[ 30 ]ในระบบแม่น้ำ การกำหนดลักษณะของมวลหินผ่านการกำหนดคุณสมบัติบางอย่าง เช่น การวางแนว ความต่อเนื่อง ฯลฯ ของรอยแตก[ 31 ] [ 32 ]รวมถึงการประเมินเสถียรภาพของลาดหินที่ถูกตัด[ 33 ]สามารถใช้กล้องดิจิทัลได้หลากหลายประเภท รวมถึงกล้อง SLR ดิจิทัล กล้องดิจิทัลขนาดกะทัดรัด และแม้แต่สมาร์ทโฟน โดยทั่วไปแล้ว ข้อมูลที่มีความแม่นยำสูงกว่าจะได้รับจากกล้องที่มีราคาแพงกว่า ซึ่งมีเลนส์ที่มีคุณภาพทางแสงสูงกว่า ดังนั้นเทคนิคนี้จึงมอบโอกาสที่น่าตื่นเต้นในการกำหนดลักษณะภูมิประเทศของพื้นผิวในรายละเอียดที่ไม่เคยมีมาก่อน และด้วยข้อมูลหลายช่วงเวลา สามารถตรวจจับการเปลี่ยนแปลงระดับความสูง ตำแหน่ง และปริมาตรที่เป็นอาการของกระบวนการบนพื้นผิวโลกได้ โครงสร้างจากการเคลื่อนไหวสามารถนำไปเปรียบเทียบกับวิธีการสำรวจดิจิทัลอื่นๆ ได้
มรดกทางวัฒนธรรม
มรดกทางวัฒนธรรมมีอยู่ทุกหนทุกแห่ง การควบคุมโครงสร้าง การจัดทำเอกสาร และการอนุรักษ์เป็นหนึ่งในหน้าที่หลักของมนุษยชาติ ( UNESCO ) ภายใต้มุมมองนี้ SfM ถูกนำมาใช้เพื่อประเมินสถานการณ์อย่างเหมาะสม รวมถึงความพยายามและค่าใช้จ่ายในการวางแผนและบำรุงรักษา การควบคุม และการบูรณะ เนื่องจากมักมีข้อจำกัดที่สำคัญเกี่ยวกับการเข้าถึงสถานที่และความเป็นไปไม่ได้ในการติดตั้งเสาสำรวจแบบรุกรานซึ่งไม่อนุญาตให้ใช้ขั้นตอนการสำรวจแบบดั้งเดิม (เช่น สถานีรวม) SfM จึงเป็นแนวทางที่ไม่รุกรานสำหรับโครงสร้าง โดยไม่มีปฏิสัมพันธ์โดยตรงระหว่างโครงสร้างและผู้ปฏิบัติงาน การใช้งานมีความแม่นยำเนื่องจากต้องการเพียงการพิจารณาเชิงคุณภาพเท่านั้น และรวดเร็วเพียงพอที่จะตอบสนองความต้องการการจัดการอนุสรณ์สถานในทันที[ 34 ] ขั้นตอนการดำเนินงานแรกคือการเตรียมการสำรวจโฟโตแกรมเมตริกอย่างแม่นยำ โดยกำหนดความสัมพันธ์ระหว่างระยะห่างที่ดีที่สุดจากวัตถุ ความยาวโฟกัส ระยะการสุ่มตัวอย่างภาคพื้นดิน (GSD) และความละเอียดของเซ็นเซอร์ ด้วยข้อมูลนี้ การได้มาซึ่งภาพถ่ายที่ตั้งโปรแกรมไว้จะต้องทำโดยใช้การซ้อนทับในแนวตั้งอย่างน้อย 60% [ 35 ]
นอกจากนี้ โครงสร้างจากภาพเคลื่อนไหวโฟโตแกรมเมตรีแสดงถึงวิธีการที่ไม่รุกราน มีความยืดหยุ่นสูง และต้นทุนต่ำในการแปลงเอกสารทางประวัติศาสตร์ให้เป็นดิจิทัล[ 36 ]
ดูเพิ่มเติม
- การแปลง 2 มิติเป็น 3 มิติ
- การสร้างภาพสามมิติจากภาพหลายภาพ
- การปรับชุด
- การเปรียบเทียบซอฟต์แวร์โฟโตแกรมเมตรี
- ระบบภาพสามมิติด้วยคอมพิวเตอร์
- เรขาคณิตเอพิโพลาร์
- ผลกระทบเชิงความลึกจลน์
- การแข่งขันกำลังดำเนินไป
- สนามการเคลื่อนที่
- พารัลแลกซ์การเคลื่อนไหว
- การจับคู่แบบกึ่งทั่วโลก
- การระบุตำแหน่งและการสร้างแผนที่พร้อมกัน
- การถ่ายภาพสามมิติ
- จอแสดงผลแบบกวาดระนาบ
- การแยกตัวประกอบโทมาซี-คานาเด
อ่านเพิ่มเติม
- Jonathan L. Carrivick, Mark W. Smith, Duncan J. Quincey (2016). โครงสร้างจากความเคลื่อนไหวในธรณีศาสตร์ . Wiley-Blackwell. 208 หน้า. ISBN 978-1-118-89584-9
- Richard Hartley & Andrew Zisserman (2003). เรขาคณิตหลายมุมมองในคอมพิวเตอร์วิชั่น . สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. ISBN 978-0-521-54051-3.
- Olivier Faugerasและ Quang-Tuan Luong และ Theodore Papadopoulo (2001). เรขาคณิตของภาพหลายภาพ . สำนักพิมพ์ MIT. ISBN 978-0-262-06220-6.
- Yi Ma; S. Shankar Sastry ; Jana Kosecka ; Stefano Soatto (พฤศจิกายน 2003). คำเชิญชวนสู่การมองเห็นสามมิติ: จากภาพสู่แบบจำลองทางเรขาคณิต . ชุดคณิตศาสตร์ประยุกต์สหวิทยาการ, เล่มที่ 26. Springer-Verlag นิวยอร์ก, LLC. ISBN 978-0-387-00893-6.
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ โครงสร้างจากการเคลื่อนไหว
โครงสร้างจากการเคลื่อนไหว ( SfM ) เป็น เทคนิค การสร้างภาพระยะทางโฟโตแกรมเมตริก สำหรับการประมาณโครงสร้างสามมิติจากลำดับภาพสองมิติที่อาจเชื่อมโยงกับสัญญาณการเคลื่อนไหว ในพื้นที่
หลักการ
มนุษย์รับรู้ข้อมูลมากมายเกี่ยวกับโครงสร้างสามมิติในสภาพแวดล้อมโดยการเคลื่อนที่ไปรอบๆ เมื่อผู้สังเกตเคลื่อนที่ วัตถุรอบตัวจะเคลื่อนที่ในปริมาณที่แตกต่างกันขึ้นอยู่กับระยะห่างจากผู้สังเกต ปรากฏการณ์นี้เรียกว่า พาราแลกซ์การเคลื่อนที่...
ธรณีศาสตร์
การสร้างภาพสามมิติจากภาพเคลื่อนไหวด้วยสเตอริโอหลายมุมมองช่วยให้สามารถสร้างแบบจำลองภูมิประเทศขนาดใหญ่พิเศษได้โดยใช้ภาพที่ได้จากกล้องดิจิทัลหลายตัว และอาจใช้เครือข่ายจุดควบคุมภาคพื้นดินด้วย เทคนิคนี้ไม่จำกัดความถี่เชิงเวลา...
มรดกทางวัฒนธรรม
มรดกทางวัฒนธรรมมีอยู่ทุกหนทุกแห่ง การควบคุมโครงสร้าง การจัดทำเอกสาร และการอนุรักษ์เป็นหนึ่งในหน้าที่หลักของมนุษยชาติ ( UNESCO ) ภายใต้มุมมองนี้ SfM ถูกนำมาใช้เพื่อประเมินสถานการณ์อย่างเหมาะสม รวมถึงความพยายามและค่าใช้จ่ายในการวางแผนและบำรุงรักษา การควบคุม...