การรับรู้ทางสายตา

Q: ข้อมูลสำคัญเกี่ยวกับ การรับรู้ทางสายตา

การรับรู้ทางสายตาคือความสามารถในการตรวจจับแสงและใช้แสงนั้นในการสร้างภาพของสภาพแวดล้อมโดย รอบ การตรวจจับแสงโดยไม่สร้างภาพจัดเป็นการรับรู้แสงในสัตว์มีกระดูกสันหลังส่วนใหญ่

Q: การศึกษาเบื้องต้น

มีสำนักคิดหลักสอง สำนัก ในสมัยกรีกโบราณ ซึ่งให้คำอธิบายเบื้องต้นเกี่ยวกับวิธีการทำงานของการมองเห็น

การรับรู้ทางสายตาคือความสามารถในการตรวจจับแสงและใช้แสงนั้นในการสร้างภาพของสภาพแวดล้อมโดย รอบ ^{[ 1 ]}การตรวจจับแสงโดยไม่สร้างภาพจัดเป็นการรับรู้แสงในสัตว์มีกระดูกสันหลังส่วนใหญ่ การรับรู้ทางสายตาสามารถเกิดขึ้นได้จากการมองเห็นในเวลากลางวัน (photopic vision) หรือ การมองเห็น ในเวลากลางคืน ( scotopic vision) โดยสัตว์มีกระดูกสันหลังส่วนใหญ่มีทั้งสองอย่าง การรับรู้ทางสายตาตรวจจับแสง (โฟตอน) ใน สเปกตรัมที่มองเห็นได้ซึ่งสะท้อนจากวัตถุในสภาพแวดล้อมหรือปล่อยออกมาจากแหล่งกำเนิดแสงช่วงของแสงที่มองเห็นได้ถูกกำหนดโดยสิ่งที่มนุษย์สามารถรับรู้ได้ง่าย แม้ว่าการรับรู้ทางสายตาของสิ่งมีชีวิตที่ไม่ใช่มนุษย์มักจะขยายออกไปนอกเหนือสเปกตรัมที่มองเห็นได้ การรับรู้ที่เกิดขึ้นนี้เรียกอีกอย่างว่า การมองเห็น การมองเห็น หรือสายตา (คำคุณศัพท์คือ visual, opticalและocular ตามลำดับ)ส่วนประกอบทางสรีรวิทยาต่างๆที่เกี่ยวข้องกับการมองเห็นเรียกรวมกันว่าระบบการมองเห็นและเป็นจุดสนใจของการวิจัยมากมายในด้านภาษาศาสตร์จิตวิทยาวิทยาศาสตร์การรู้คิด ประสาทวิทยาศาสตร์และชีววิทยาโมเลกุลซึ่งเรียกรวมกันว่าวิทยาศาสตร์การมองเห็น

การรับรู้ทางสายตาไม่ได้เกี่ยวข้องเฉพาะกับสิ่งที่เรามองเห็นเท่านั้น แต่ยังรวมถึงวิธีที่สมองของเราประมวลผลข้อมูล ซึ่งเป็นกระบวนการปรับตัวและได้รับอิทธิพลจากทั้งประสบการณ์ตลอดชีวิตและความสามารถทางปัญญาที่เปลี่ยนแปลงไป^{[ 2 ]}^{[ 3 ]}

ระบบภาพ

สัตว์มีกระดูกสันหลังส่วนใหญ่มองเห็นผ่านระบบการมองเห็นที่คล้ายคลึงกัน โดยทั่วไป แสงจะเข้าสู่ดวงตาผ่านกระจกตาและถูกโฟกัสโดยเลนส์ไปยังเรตินาซึ่งเป็นเยื่อที่ไวต่อแสงที่ด้านหลังของดวงตาเซลล์รับ แสงเฉพาะ ในเรตินาทำหน้าที่เป็นตัวแปลงสัญญาณ โดยแปลง แสงให้เป็นกระแสประสาท เซลล์รับแสง แบ่งออกเป็นสองประเภทใหญ่ๆ คือเซลล์รูปกรวยและเซลล์รูปแท่งซึ่งช่วยให้มองเห็นในที่สว่างและในที่มืดตามลำดับ สัญญาณจากเซลล์รับแสงเหล่านี้จะถูกส่งผ่านเส้นประสาทตาจากเรตินาไปยังปมประสาท ส่วนกลาง ในสมอง นิวเคลียส เจนิคิวเลตด้านข้างจะส่งข้อมูลไปยังคอร์เทกซ์การมองเห็นสัญญาณจากเรตินายังเดินทางโดยตรงจากเรตินาไปยังซูพีเรียร์คอลลิคูลัสด้วย^{[ 4 ]}

นิวเคลียสเจนิคิวเลตด้านข้างส่งสัญญาณไป ยัง คอร์เทกซ์การมองเห็นหลักหรือที่เรียกว่าคอร์เทกซ์ลาย คอร์เทกซ์นอกลายหรือที่เรียกว่าคอร์เทกซ์เชื่อมโยงการมองเห็นคือชุดของโครงสร้างคอร์เทกซ์ที่รับข้อมูลจากคอร์เทกซ์ลาย รวมถึงรับข้อมูลจากกันและกันด้วย^{[ 5 ]} คำอธิบายล่าสุดของคอร์เทกซ์เชื่อม โยง การมองเห็นอธิบายถึงการแบ่งออกเป็นสองเส้นทางการทำงาน คือ เส้นทางด้านล่างและ เส้นทาง ด้านบนข้อสันนิษฐานนี้เรียกว่าสมมติฐานสองกระแส

ศึกษา

ปัญหาสำคัญในการรับรู้ทางสายตาคือ สิ่งที่ผู้คนมองเห็นนั้นไม่ใช่เพียงแค่การแปลความของสิ่งเร้าบนเรตินา (เช่น ภาพบนเรตินา) โดยที่สมองทำการเปลี่ยนแปลงข้อมูลพื้นฐานที่ได้รับเข้ามา ดังนั้น ผู้ที่สนใจในเรื่องการรับรู้จึงพยายามอย่างหนักมานานแล้วที่จะอธิบายว่ากระบวนการประมวลผลทางสายตาทำอะไรเพื่อสร้างสิ่งที่มองเห็นจริง ๆ

การศึกษาเบื้องต้น

มีสำนักคิดหลักสอง สำนัก ในสมัยกรีกโบราณซึ่งให้คำอธิบายเบื้องต้นเกี่ยวกับวิธีการทำงานของการมองเห็น

ทฤษฎีแรกคือ " ทฤษฎีการปล่อยรังสี " ของการมองเห็น ซึ่งกล่าวว่าการมองเห็นเกิดขึ้นเมื่อรังสีออกจากดวงตาและถูกวัตถุที่มองเห็นได้หักเห หากมองเห็นวัตถุโดยตรง จะเป็นเพราะ "รังสี" ที่ออกมาจากดวงตาและตกกระทบวัตถุนั้นอีกครั้ง อย่างไรก็ตาม ภาพที่หักเหก็มองเห็นได้ด้วย "รังสี" เช่นกัน ซึ่งออกจากดวงตา เดินทางผ่านอากาศ และหลังจากหักเหแล้ว ตกกระทบวัตถุที่มองเห็นได้ ซึ่งถูกมองเห็นเป็นผลมาจากการเคลื่อนที่ของรังสีจากดวงตา ทฤษฎีนี้ได้รับการสนับสนุนจากนักวิชาการที่ยึดถือทัศนศาสตร์ ของยูคลิดและ ป โตเลมี

โรงเรียนที่สองสนับสนุนแนวทางที่เรียกว่า 'การสอดแทรก' ซึ่งมองว่าการมองเห็นมาจากการที่บางสิ่งบางอย่างที่เป็นตัวแทนของวัตถุเข้าไปในดวงตา ทฤษฎีนี้ดูเหมือนจะมีความเชื่อมโยงกับทฤษฎีสมัยใหม่เกี่ยวกับการมองเห็นที่แท้จริง โดยมีอริสโตเติล ( De Sensu ) เป็นผู้เผยแพร่หลัก ^{[ 6 ]}และผู้ติดตามของเขา^{[ 6 ]}แต่ทฤษฎีนี้ยังคงเป็นเพียงการคาดเดาที่ขาดพื้นฐานการทดลอง

การพัฒนาที่สำคัญที่สุดของทฤษฎีการรับเข้ามาจากผลงานของนักวิชาการในศตวรรษที่ 11 ชื่อ อิบนุ อัล-ฮัยธัม (อัลฮาเซน)ในหนังสือทัศนศาสตร์ ของเขา ( Kitāb al-Manāẓirประมาณปี 1021) เขาปฏิเสธทั้งทฤษฎีการส่งออกของยูคลิดและปโตเลมี และคำอธิบายเชิงคาดเดาล้วนๆ ของอริสโตเติล ผ่านการทดลองอย่างเป็นระบบ เขาแสดงให้เห็นว่าการมองเห็นเกิดขึ้นเมื่อรังสีแสงที่สะท้อนจากวัตถุเข้าสู่ดวงตา ซึ่งเลนส์จะโฟกัสไปที่เรตินา วิธีการเชิงประจักษ์นี้ถือเป็นจุดเปลี่ยน: อัลฮาเซนไม่เพียงแต่ให้คำอธิบายที่ถูกต้องครั้งแรกเกี่ยวกับการมองเห็นในแง่ของการรับเข้า^{[ 7 ]}แต่ยังแนะนำวิธีการทดลองที่มีอิทธิพลต่อนักวิชาการชาวยุโรปในภายหลัง เช่นโรเจอร์ เบคอนเคปเลอร์และในที่สุดก็คือนิวตัน^{[ 8 ]}^{[ 9 ]}

ทั้งสองสำนักคิดอาศัยหลักการที่ว่า "สิ่งที่คล้ายกันจะรู้จักได้ก็ต่อเมื่อเหมือนกันเท่านั้น" และด้วยเหตุนี้จึงอาศัยแนวคิดที่ว่าดวงตาประกอบด้วย "ไฟภายใน" บางอย่างที่ทำปฏิกิริยากับ "ไฟภายนอก" ของแสงที่มองเห็นได้และทำให้การมองเห็นเป็นไปได้เพลโตกล่าวอ้างเช่นนี้ในบทสนทนาTimaeus ของเขา (45b และ 46b) เช่นเดียวกับเอมเปโดคลีส (ตามที่อริสโตเติลรายงานไว้ในDe Sensuของ เขา DK frag. B17) ^{[ 6 ]}

อัลฮาเซน (965 – ประมาณ 1040) ได้ทำการวิจัยและทดลองเกี่ยวกับการรับรู้ทางสายตามากมาย ขยายงานของปโตเลมีเกี่ยวกับการมองเห็นแบบสองตาและแสดงความคิดเห็นเกี่ยวกับงานกายวิภาคของกาเลน^{[ 10 ]}^{[ 11 ]}เขาเป็นคนแรกที่อธิบายว่าการมองเห็นเกิดขึ้นเมื่อแสงสะท้อนจากวัตถุแล้วส่งตรงไปยังดวงตา^{[ 12 ]}

เชื่อกันว่า เลโอนาร์โด ดา วินชี (1452–1519) เป็นคนแรกที่ตระหนักถึงคุณสมบัติทางแสงพิเศษของดวงตา เขาเขียนว่า "หน้าที่ของดวงตาของมนุษย์... ได้รับการอธิบายโดยผู้เขียนจำนวนมากในลักษณะหนึ่ง แต่ฉันพบว่ามันแตกต่างออกไปโดยสิ้นเชิง" การค้นพบเชิงทดลองหลักของเขาคือ มีการมองเห็นที่ชัดเจนและคมชัดเฉพาะที่แนวสายตา—เส้นแสงที่สิ้นสุดที่โฟเวีย แม้ว่าเขาจะไม่ได้ใช้คำเหล่านี้อย่างตรงตัว แต่เขาก็ถือเป็นบิดาแห่งการแยกแยะระหว่างการมองเห็นที่โฟเวี ย และ การมองเห็นรอบข้างในยุคปัจจุบัน^{[ 13 ]}

ไอแซค นิวตัน (1642–1726/27) เป็นคนแรกที่ค้นพบจากการทดลอง โดยการแยกสีแต่ละสีของสเปกตรัมของแสงที่ผ่านปริซึมว่าสีที่มองเห็นได้ของวัตถุนั้นเกิดขึ้นเนื่องจากลักษณะของแสงที่วัตถุสะท้อน และสีที่แยกออกมาเหล่านี้ไม่สามารถเปลี่ยนเป็นสีอื่นได้ ซึ่งขัดกับความคาดหวังทางวิทยาศาสตร์ในสมัยนั้น^{[ 14 ]}

การอนุมานโดยไม่รู้ตัว

เฮอร์มันน์ ฟอน เฮล์มโฮลทซ์มักได้รับการยกย่องว่าเป็นผู้ทำการศึกษาการรับรู้ทางสายตาสมัยใหม่เป็นคนแรก เฮล์มโฮลทซ์ได้ตรวจสอบดวงตาของมนุษย์และสรุปว่าดวงตาไม่สามารถสร้างภาพที่มีคุณภาพสูงได้ ข้อมูลที่ไม่เพียงพอทำให้การมองเห็นเป็นไปไม่ได้ ดังนั้น เขาจึงสรุปว่าการมองเห็นอาจเป็นผลมาจาก "การอนุมานโดยไม่รู้ตัว" บางรูปแบบ โดยบัญญัติศัพท์นี้ขึ้นในปี 1867 เขาเสนอว่าสมองกำลังสร้างสมมติฐานและข้อสรุปจากข้อมูลที่ไม่สมบูรณ์ โดยอิงจากประสบการณ์ก่อนหน้านี้^{[ 15 ]}

การอนุมานต้องอาศัยประสบการณ์เกี่ยวกับโลกมาก่อน

ตัวอย่างของข้อสันนิษฐานที่เป็นที่รู้จักกันดี ซึ่งอิงจากประสบการณ์ทางสายตา ได้แก่:

แสงมาจากด้านบน;
โดยปกติแล้วเราจะไม่เห็นวัตถุจากด้านล่าง
ใบหน้าถูกมองเห็น (และจดจำ) ในแนวตั้ง^{[ 16 ]}
วัตถุที่อยู่ใกล้สามารถบดบังทัศนวิสัยของวัตถุที่อยู่ไกลออกไปได้ แต่ในทางกลับกันนั้นไม่เป็นเช่นนั้น และ
รูปทรงต่างๆ (เช่น วัตถุในฉากหน้า) มักจะมีขอบนูน

การศึกษาภาพลวงตา (กรณีที่กระบวนการอนุมานผิดพลาด) ได้ให้ข้อมูลเชิงลึกมากมายเกี่ยวกับสมมติฐานต่างๆ ที่ระบบการมองเห็นใช้

สมมติฐานการอนุมานโดยไม่รู้ตัวอีกประเภทหนึ่ง (โดยอิงจากความน่าจะเป็น) เพิ่งได้รับการฟื้นฟูขึ้นมาใหม่ในการศึกษาที่เรียกว่า การศึกษาแบบ เบย์เซียนเกี่ยวกับการรับรู้ทางสายตา^{[ 17 ]}ผู้สนับสนุนแนวทางนี้พิจารณาว่าระบบการมองเห็นทำการอนุมานแบบเบย์เซียน บางรูปแบบ เพื่ออนุมานการรับรู้จากข้อมูลทางประสาทสัมผัส อย่างไรก็ตาม ยังไม่ชัดเจนว่าผู้สนับสนุนมุมมองนี้อนุมานความน่าจะเป็นที่เกี่ยวข้องซึ่งจำเป็นสำหรับสมการแบบเบย์เซียนได้อย่างไรในหลักการ แบบจำลองที่อิงตามแนวคิดนี้ถูกนำมาใช้เพื่ออธิบายหน้าที่การรับรู้ทางสายตาต่างๆ เช่น การรับรู้การเคลื่อนไหวการรับรู้ความลึกและการรับรู้ภาพพื้นหลังและภาพหลัก^{[ 18 ]}^{[ 19 ]} "ทฤษฎีการรับรู้เชิงประจักษ์โดยสมบูรณ์" เป็นแนวทางที่เกี่ยวข้องและใหม่กว่าซึ่งให้เหตุผลเกี่ยวกับการรับ รู้ทางสายตาโดยไม่ต้องอ้างถึงรูปแบบแบบเบย์เซียนอย่างชัดเจน

ทฤษฎีเกสตัลท์

นักจิตวิทยาเกสตัลท์ที่ทำงานเป็นหลักในช่วงทศวรรษ 1930 และ 1940 ได้ตั้งคำถามวิจัยมากมายที่นักวิทยาศาสตร์ด้านการมองเห็นศึกษาอยู่ในปัจจุบัน^{[ 20 ]}

กฎแห่งการจัดระเบียบของเกสตัลต์ได้ชี้นำการศึกษาว่าผู้คนรับรู้ส่วนประกอบทางสายตาในรูปแบบที่จัดระเบียบหรือเป็นองค์รวมได้อย่างไร แทนที่จะเป็นส่วนต่างๆ มากมาย "เกสตัลต์" เป็นคำภาษาเยอรมันที่แปลได้บางส่วนว่า "การจัดเรียงหรือรูปแบบ" พร้อมกับ "โครงสร้างที่เป็นองค์รวมหรือเกิดขึ้นใหม่" ตามทฤษฎีนี้ มีปัจจัยหลักแปดประการที่กำหนดว่าระบบการมองเห็นจะจัดกลุ่มองค์ประกอบต่างๆ เป็นรูปแบบโดยอัตโนมัติอย่างไร ได้แก่ ความใกล้เคียง ความคล้ายคลึง การปิด ความสมมาตร ชะตากรรมร่วมกัน (เช่น การเคลื่อนไหวร่วมกัน) ความต่อเนื่อง ตลอดจนเกสตัลต์ที่ดี (รูปแบบที่สม่ำเสมอ เรียบง่าย และเป็นระเบียบ) และประสบการณ์ในอดีต^{[ 21 ]}

แบบจำลองภาษา

ตามรอยเท้าของจอร์จ เบิร์กลีย์นักปรัชญาชาวออสเตรเลียโคลิน เมอร์เรย์ เทอร์เบย์นได้เสนอทางเลือกอื่นนอกเหนือจาก "แบบจำลองทางเรขาคณิต" แบบดั้งเดิมของการรับรู้ทางสายตา โดยกล่าวว่าแง่มุมต่างๆ ของแบบจำลองดังกล่าวได้บดบังความเข้าใจของเราเกี่ยวกับการมองเห็นโดยไม่จำเป็นมาตั้งแต่สมัยของยูคลิด โดยอ้างอิงถึงประติมากรNaum Gaboเขาตั้งข้อสังเกตว่า “เส้น รูปร่าง สี และการเคลื่อนไหวมีภาษาของตัวเอง แต่การอ่านต้องใช้เวลา การมองอย่างเดียวไม่เพียงพอ คุณต้องเห็น และ “เห็น” หมายถึง “อ่าน” ^{[ 22 ]} Turbayne โต้แย้งว่า “แบบจำลองภาษาช่วยให้เข้าใจปัญหาโบราณเกี่ยวกับการมองเห็นของเราได้ดียิ่งขึ้น โดยส่องแสงสว่างไปยังพื้นที่มืดที่คู่แข่งสำคัญมองไม่เห็น” ^{[ 23 ]}โดยเฉพาะอย่างยิ่ง เขาเน้นย้ำถึงข้อจำกัดที่พบใน คำอธิบาย เชิงกลไก ล้วนๆ เกี่ยวกับการมองเห็น โดยโต้แย้งว่า “ภาพลวงตา” หลายกรณีสามารถอธิบายได้อย่างเหมาะสมยิ่งขึ้นผ่านการใช้คำศัพท์ที่พบในแบบจำลองภาษาดังกล่าว ด้วยเหตุนี้ เขาจึงนำเสนอการวิเคราะห์เปรียบเทียบตัวอย่างเฉพาะของการบิดเบือนภาพ ได้แก่ “กรณี Barrovian” กรณี “ดวงจันทร์แนวนอน” และกรณี “ภาพเรตินากลับหัว” ^{[ 24 ]}^{[ 25 ]}^{[ 26 ]}

การวิเคราะห์การเคลื่อนไหวของดวงตา

ในช่วงทศวรรษ 1960 การพัฒนาทางเทคนิคทำให้สามารถบันทึกการเคลื่อนไหวของดวงตาอย่างต่อเนื่องในระหว่างการอ่าน^{[ 27 ]}ในการดูภาพ^{[ 28 ]}และต่อมาในการแก้ปัญหาด้วยภาพ^{[ 29 ]}และเมื่อกล้องแบบสวมศีรษะพร้อมใช้งาน ก็สามารถบันทึกได้ในระหว่างการขับรถด้วย^{[ 30 ]}

ภาพทางด้านขวาแสดงให้เห็นสิ่งที่อาจเกิดขึ้นในช่วงสองวินาทีแรกของการตรวจสอบด้วยสายตา ในขณะที่พื้นหลังเบลอ ซึ่งแสดงถึงการมองเห็นรอบข้างการเคลื่อนไหวของดวงตาครั้งแรกจะมุ่งไปที่รองเท้าบู๊ตของชายคนนั้น (เพียงเพราะรองเท้าบู๊ตอยู่ใกล้กับจุดเริ่มต้นการจ้องมองและมีความคมชัดพอสมควร) การเคลื่อนไหวของดวงตาทำหน้าที่ในการเลือกความสนใจกล่าวคือ เลือกส่วนหนึ่งของข้อมูลภาพทั้งหมดเพื่อการประมวลผลที่ลึกขึ้นโดยสมอง^{[ 31 ]}

การจ้องมองต่อไปนี้จะเปลี่ยนจากใบหน้าหนึ่งไปยังอีกใบหน้าหนึ่ง พวกเขายังอาจอนุญาตให้เปรียบเทียบใบหน้าได้อีกด้วย^{[ 32 ]}

อาจสรุปได้ว่าไอคอนรูปหน้า นั้น เป็นไอคอนค้นหาที่ดึงดูดใจมากในบริเวณรอบนอกของสายตา การมองเห็นในจุดศูนย์กลางของสายตาจะเพิ่มรายละเอียดเพิ่มเติมให้กับความประทับใจแรกเห็นใน บริเวณรอบนอก

นอกจากนี้ยังสังเกตได้ว่ามีการเคลื่อนไหวของดวงตาหลายประเภท ได้แก่การเคลื่อนไหวของดวงตาเพื่อตรึงสายตา ( ไมโครแซคเคดการเคลื่อนของดวงตา และการสั่น) การเคลื่อนไหวแบบรวมสายตา การเคลื่อนไหวแบบแซคเคด และการเคลื่อนไหวแบบติดตาม การตรึงสายตาเป็นจุดคงที่ที่ดวงตาพักอยู่ อย่างไรก็ตาม ดวงตาไม่เคยอยู่นิ่งสนิท และตำแหน่งการมองจะเคลื่อนไป การเคลื่อนไปเหล่านี้จะได้รับการแก้ไขโดยไมโครแซคเคด ซึ่งเป็นการเคลื่อนไหวของดวงตาเพื่อตรึงสายตาที่เล็กมากการเคลื่อนไหวแบบรวมสายตาเกี่ยวข้องกับการทำงานร่วมกันของดวงตาทั้งสองข้างเพื่อให้ภาพตกกระทบลงบนพื้นที่เดียวกันของเรตินาทั้งสองข้าง ส่งผลให้ได้ภาพที่โฟกัสเพียงภาพเดียวการเคลื่อนไหวแบบแซคเคดเป็นการเคลื่อนไหวของดวงตาประเภทที่กระโดดจากตำแหน่งหนึ่งไปยังอีกตำแหน่งหนึ่ง และใช้ในการสแกนฉาก/ภาพเฉพาะอย่างรวดเร็ว สุดท้ายการเคลื่อนไหวแบบติดตามเป็นการเคลื่อนไหวของดวงตาที่ราบรื่นและใช้ในการติดตามวัตถุที่กำลังเคลื่อนที่^{[ 33 ]}

การจดจำใบหน้าและวัตถุ

มีหลักฐานมากมายที่แสดงว่าการจดจำใบหน้าและวัตถุเกิดขึ้นจากระบบที่แตกต่างกัน ตัวอย่างเช่นผู้ป่วยโรคprosopagnosia แสดงความบกพร่องในการประมวลผลใบหน้า แต่ไม่ใช่การประมวลผลวัตถุ ในขณะที่ผู้ป่วยโรค object agnosia (โดยเฉพาะอย่างยิ่งผู้ป่วย CK ) แสดงความบกพร่องในการประมวลผลวัตถุโดยที่การประมวลผลใบหน้ายังคงปกติ^{[ 34 ]}ในเชิงพฤติกรรม พบว่าใบหน้า แต่ไม่ใช่วัตถุ ได้รับผลกระทบจากการกลับด้าน ทำให้เกิดข้ออ้างว่าใบหน้าเป็น "สิ่งพิเศษ" ^{[ 34 ]}^{[ 35 ]}นอกจากนี้ การประมวลผลใบหน้าและวัตถุยังใช้ระบบประสาทที่แตกต่างกัน^{[ 36 ]}ที่น่าสังเกตคือ บางคนโต้แย้งว่าความเชี่ยวชาญที่เห็นได้ชัดของสมองมนุษย์ในการประมวลผลใบหน้าไม่ได้สะท้อนถึงความเฉพาะเจาะจงของโดเมนที่แท้จริง แต่เป็นกระบวนการทั่วไปของการจำแนกระดับผู้เชี่ยวชาญภายในกลุ่มของสิ่งเร้าที่กำหนด^{[ 37 ]}แม้ว่าข้ออ้างหลังนี้จะเป็นหัวข้อของการถกเถียงอย่างมาก ก็ตาม Doris Tsao และเพื่อนร่วมงานได้อธิบายถึงบริเวณสมองและกลไกสำหรับการจดจำใบหน้าในลิงมาคาก โดยใช้ fMRI และสรีรวิทยาไฟฟ้า ^{[ 38 ]}

คอร์เทกซ์อินเฟอโรเทมโพรัลมีบทบาทสำคัญในงานการรับรู้และการแยกแยะวัตถุต่างๆ การศึกษาโดย MIT แสดงให้เห็นว่าภูมิภาคย่อยของคอร์เทกซ์ IT มีหน้าที่รับผิดชอบวัตถุต่างๆ^{[ 39 ]}โดยการปิดการทำงานของระบบประสาทในพื้นที่เล็กๆ หลายแห่งของคอร์เทกซ์อย่างเลือกสรร สัตว์จะไม่สามารถแยกแยะความแตกต่างระหว่างวัตถุบางคู่ได้ ซึ่งแสดงให้เห็นว่าคอร์เทกซ์ IT แบ่งออกเป็นภูมิภาคที่ตอบสนองต่อคุณลักษณะทางสายตาที่แตกต่างกันและเฉพาะเจาะจง ในทำนองเดียวกัน บางส่วนของคอร์เทกซ์และภูมิภาคเฉพาะมีส่วนเกี่ยวข้องกับการจดจำใบหน้ามากกว่าการจดจำวัตถุอื่นๆ

การศึกษาบางชิ้นมีแนวโน้มที่จะแสดงให้เห็นว่า แทนที่จะเป็นภาพรวมที่เป็นเอกภาพ คุณลักษณะเฉพาะบางอย่างและบริเวณที่น่าสนใจของวัตถุเป็นองค์ประกอบสำคัญเมื่อสมองต้องการจดจำวัตถุในภาพ^{[ 40 ]}^{[ 41 ]}ด้วยวิธีนี้ การมองเห็นของมนุษย์จึงมีความอ่อนไหวต่อการเปลี่ยนแปลงเล็กน้อยเฉพาะเจาะจงในภาพ เช่น การรบกวนขอบของวัตถุ การปรับเปลี่ยนพื้นผิว หรือการเปลี่ยนแปลงเล็กน้อยใดๆ ในบริเวณสำคัญของภาพ^{[ 42 ]}

การศึกษาในผู้ที่การมองเห็นกลับคืนมาหลังจากตาบอดเป็นเวลานานเผยให้เห็นว่าพวกเขาไม่สามารถจดจำวัตถุและใบหน้าได้ (ตรงข้ามกับสี การเคลื่อนไหว และรูปทรงเรขาคณิตอย่างง่าย) บางคนตั้งสมมติฐานว่าการตาบอดในวัยเด็กทำให้ระบบการมองเห็นบางส่วนที่จำเป็นสำหรับงานระดับสูงเหล่านี้ไม่สามารถพัฒนาได้อย่างเหมาะสม^{[ 43 ]}ความเชื่อทั่วไปที่ว่าช่วงเวลาวิกฤตจะคงอยู่จนถึงอายุ 5 หรือ 6 ขวบนั้นถูกท้าทายโดยการศึกษาในปี 2007 ที่พบว่าผู้ป่วยที่มีอายุมากกว่าสามารถพัฒนาความสามารถเหล่านี้ได้ด้วยการสัมผัสเป็นเวลาหลายปี^{[ 44 ]}

แนวทางด้านการรับรู้และการคำนวณ

ในทศวรรษ 1970 เดวิด มาร์ได้พัฒนาทฤษฎีการมองเห็นแบบหลายระดับ ซึ่งวิเคราะห์กระบวนการมองเห็นในระดับนามธรรมที่แตกต่างกัน เพื่อที่จะมุ่งเน้นไปที่การทำความเข้าใจปัญหาเฉพาะในด้านการมองเห็น เขาได้ระบุระดับการวิเคราะห์ไว้ 3 ระดับ ได้แก่ ระดับ การคำนวณระดับ อัลก อริทึมและ ระดับ การนำไปใช้นักวิทยาศาสตร์ด้านการมองเห็นหลายคน รวมถึงโทมาโซ ป็อกจิโอได้นำระดับการวิเคราะห์เหล่านี้มาใช้และนำไปใช้เพื่ออธิบายลักษณะการมองเห็นจากมุมมองการคำนวณเพิ่มเติม^{[ 45 ]}

ระดับการคำนวณจะกล่าวถึงปัญหาที่ระบบการมองเห็นต้องเอาชนะในระดับนามธรรมสูงระดับอัลกอริทึมพยายามระบุกลยุทธ์ที่อาจนำมาใช้แก้ปัญหาเหล่านี้ และสุดท้ายระดับการนำไปใช้พยายามอธิบายว่าวิธีการแก้ปัญหาเหล่านี้เกิดขึ้นได้อย่างไรในวงจรประสาท

มาร์เสนอว่าเป็นไปได้ที่จะศึกษาการมองเห็นในแต่ละระดับเหล่านี้โดยอิสระ มาร์อธิบายว่าการมองเห็นเริ่มต้นจาก ภาพ สองมิติ (บนเรตินา) ไปสู่ ภาพ สามมิติที่แสดงถึงโลกภายนอก ขั้นตอนการมองเห็นของเขามีดังนี้:

ภาพร่างสองมิติหรือภาพร่างเบื้องต้นของฉาก โดยอิงจากการสกัดคุณลักษณะขององค์ประกอบพื้นฐานของฉาก รวมถึงขอบ พื้นที่ ฯลฯ โปรดสังเกตความคล้ายคลึงกันในเชิงแนวคิดกับภาพร่างด้วยดินสอที่ศิลปินวาดอย่างรวดเร็วเพื่อแสดงความรู้สึก
ภาพร่าง2 1/2 มิติของฉาก ซึ่งแสดงให้เห็นถึงพื้นผิวต่างๆ เป็นต้น สังเกตความคล้ายคลึงกันในแนวคิดกับขั้นตอนการวาดภาพที่ศิลปินใช้แสงเงาหรือเงาแรเงาในส่วนต่างๆ ของฉากเพื่อให้เกิดมิติความลึก
แบบจำลอง 3 มิติซึ่งฉากจะถูกแสดงภาพในแผนที่ 3 มิติแบบต่อเนื่อง^{[ 46 ]}

ภาพร่าง 2 1/2 มิติของ Marr ถือว่ามีการสร้างแผนที่ความลึก และแผนที่นี้เป็นพื้นฐานของ การรับรู้ รูปร่าง 3 มิติ อย่างไรก็ตาม ทั้งการรับรู้ แบบสเตอริโอสโคปิกและแบบภาพ รวมถึงการมองด้วยตาเดียว แสดงให้เห็นอย่างชัดเจนว่าการรับรู้รูปร่าง 3 มิติเกิดขึ้นก่อน และไม่ได้ขึ้นอยู่กับการรับรู้ความลึกของจุด ไม่ชัดเจนว่าในทางทฤษฎีแล้วจะสร้างแผนที่ความลึกเบื้องต้นได้อย่างไร และสิ่งนี้จะตอบคำถามเกี่ยวกับการจัดระเบียบหรือการจัดกลุ่มรูปและพื้นหลังได้อย่างไร บทบาทของข้อจำกัดในการจัดระเบียบการรับรู้ ซึ่ง Marr มองข้ามไป ในการสร้างการรับรู้รูปร่าง 3 มิติจากวัตถุ 3 มิติที่มองด้วยตาคู่ ได้รับการพิสูจน์แล้วในเชิงประจักษ์สำหรับกรณีของวัตถุเส้นลวด 3 มิติ เช่น^[⁴⁷^]^[⁴⁸^]สำหรับการอภิปรายโดยละเอียดเพิ่มเติม โปรดดู Pizlo (2008) ^[⁴⁹^]

กรอบแนวคิดทางเลือกที่ทันสมัยกว่าเสนอว่าการมองเห็นประกอบด้วยสามขั้นตอนต่อไปนี้: การเข้ารหัส การเลือก และการถอดรหัส^{[ 50 ]}การเข้ารหัสคือการสุ่มตัวอย่างและแสดงข้อมูลภาพ (เช่น การแสดงข้อมูลภาพเป็นกิจกรรมทางประสาทในเรตินา) การเลือก หรือการเลือกโดยอาศัยความสนใจคือการเลือกข้อมูลภาพเพียงเศษเสี้ยวเล็กๆ เพื่อประมวลผลต่อไป เช่นการเปลี่ยนสายตาไปยังวัตถุหรือตำแหน่งภาพเพื่อประมวลผลสัญญาณภาพในตำแหน่งนั้นได้ดียิ่งขึ้น การถอดรหัสคือการอนุมานหรือจดจำสัญญาณภาพที่เลือก เช่น การจดจำวัตถุที่อยู่ตรงกลางสายตาว่าเป็นใบหน้าของใครบางคน ในกรอบแนวคิดนี้^{[ 51 ]}การเลือกโดยอาศัยความสนใจเริ่มต้นที่คอร์เทกซ์ภาพหลักตามเส้นทางภาพ และข้อจำกัดของความสนใจจะกำหนดความแตกต่างระหว่างสนามภาพส่วนกลางและส่วนรอบนอกสำหรับการจดจำหรือการถอดรหัสภาพ

การแปลงสัญญาณ

การแปลงพลังงานเป็นกิจกรรมทางประสาทเรียกว่าทรานสดักชัน จอประสาทตาประกอบด้วยเซลล์ 3 ชั้น ได้แก่ ชั้นเซลล์รับแสง ชั้นเซลล์ไบโพลาร์ และชั้นเซลล์แกงลีออน ชั้นเซลล์รับแสงซึ่งเป็นที่เกิดการแปลงพลังงานอยู่ไกลจากเลนส์ที่สุด ประกอบด้วยเซลล์รับแสงที่มีความไวต่างกันเรียกว่าเซลล์แท่งและเซลล์กรวย เซลล์กรวยมีหน้าที่ในการรับรู้สีและมี 3 ชนิดที่แตกต่างกัน ได้แก่ สีแดง สีเขียว และสีน้ำเงิน เซลล์แท่งมีหน้าที่ในการรับรู้วัตถุในที่แสงน้อย^{[ 52 ]}เซลล์รับแสงมีสารเคมีพิเศษที่เรียกว่าโฟโตพิกเมนต์ ซึ่งฝังอยู่ในเยื่อหุ้มของลามิลลา เซลล์แท่งของมนุษย์หนึ่งเซลล์มีโฟโตพิกเมนต์ประมาณ 10 ล้านเซลล์ โมเลกุลของโฟโตพิกเมนต์ประกอบด้วย 2 ส่วน คือ ออปซิน (โปรตีน) และเรตินัล (ไขมัน) ^{[ 53 ]}มีโฟโตพิกเมนต์เฉพาะ 3 ชนิด (แต่ละชนิดมีความไวต่อความยาวคลื่นของตัวเอง) ที่ตอบสนองต่อแสงที่มองเห็นได้ตลอดช่วงสเปกตรัม เมื่อความยาวคลื่นที่เหมาะสม (ความยาวคลื่นที่รงควัตถุรับแสงเฉพาะนั้นไวต่อ) กระทบกับตัวรับแสง รงควัตถุรับแสงจะแยกออกเป็นสองส่วน ซึ่งจะส่งสัญญาณไปยังชั้นเซลล์ไบโพลาร์ จากนั้นเซลล์ไบโพลาร์จะส่งสัญญาณต่อไปยังเซลล์แกงลีออน ซึ่งแอกซอนของเซลล์เหล่านี้จะก่อตัวเป็นเส้นประสาทตาและส่งข้อมูลไปยังสมอง หากเซลล์รูปกรวยชนิดใดชนิดหนึ่งขาดหายไปหรือผิดปกติเนื่องจากความผิดปกติทางพันธุกรรม จะทำให้เกิด ความบกพร่องในการมองเห็นสีซึ่งบางครั้งเรียกว่าตาบอดสี^{[ 54 ]}

กระบวนการฝ่ายตรงข้าม

กระบวนการส่งสัญญาณเกี่ยวข้องกับการส่งข้อความทางเคมีจากเซลล์รับแสงไปยังเซลล์ไบโพลาร์และเซลล์แกงลีออน เซลล์รับแสงหลายเซลล์อาจส่งข้อมูลไปยังเซลล์แกงลีออนหนึ่งเซลล์ เซลล์แกงลีออนมีสองประเภท ได้แก่ สีแดง/เขียวและสีเหลือง/น้ำเงิน เซลล์ประสาทเหล่านี้ทำงานอยู่ตลอดเวลา แม้ว่าจะไม่ได้รับการกระตุ้นก็ตาม สมองจะตีความสีต่างๆ (และด้วยข้อมูลจำนวนมาก ก็คือภาพ) เมื่ออัตราการทำงานของเซลล์ประสาทเหล่านี้เปลี่ยนแปลงไป แสงสีแดงกระตุ้นเซลล์รูปกรวยสีแดง ซึ่งจะกระตุ้นเซลล์แกงลีออนสีแดง/เขียว ในทำนองเดียวกัน แสงสีเขียวกระตุ้นเซลล์รูปกรวยสีเขียว ซึ่งจะกระตุ้นเซลล์แกงลีออนสีเขียว/แดง และแสงสีน้ำเงินกระตุ้นเซลล์รูปกรวยสีน้ำเงิน ซึ่งจะกระตุ้นเซลล์แกงลีออนสีน้ำเงิน/เหลือง อัตราการทำงานของเซลล์แกงลีออนจะเพิ่มขึ้นเมื่อได้รับสัญญาณจากเซลล์รูปกรวยหนึ่ง และลดลง (ถูกยับยั้ง) เมื่อได้รับสัญญาณจากเซลล์รูปกรวยอีกเซลล์หนึ่ง สีแรกในชื่อของเซลล์แกงลีออนคือสีที่กระตุ้นเซลล์นั้น และสีที่สองคือสีที่ยับยั้งเซลล์นั้น เช่น กรวยสีแดงจะกระตุ้นเซลล์แกงลีออนสีแดง/เขียว และกรวยสีเขียวจะยับยั้งเซลล์แกงลีออนสีแดง/เขียว นี่คือกระบวนการตรงข้ามหากอัตราการยิงของเซลล์แกงลีออนสีแดง/เขียวเพิ่มขึ้น สมองจะรู้ว่าแสงนั้นเป็นสีแดง หากอัตราลดลง สมองจะรู้ว่าสีของแสงนั้นเป็นสีเขียว^{[ 54 ]}

การรับรู้ภาพเทียม

การรับรู้ภาพเทียมกำลังพัฒนาและสอนเครื่องจักรให้เข้าใจฉากต่างๆ ไม่ใช่แค่ระบุวัตถุ แต่ยังทำให้เครื่องจักรมีความฉลาดในการมองเห็นในสถานการณ์จริงอีกด้วย^{[ 55 ]}

ทฤษฎีและการสังเกตเกี่ยวกับการรับรู้ทางสายตาเป็นแหล่งที่มาหลักของแรงบันดาลใจสำหรับวิทยาการคอมพิวเตอร์ด้าน การมองเห็น (หรือที่เรียกว่าการมองเห็นด้วยเครื่องจักรหรือ การมองเห็นเชิงคำนวณ) โครงสร้างฮาร์ดแวร์พิเศษและอัลกอริธึมซอฟต์แวร์ช่วยให้เครื่องจักรมีความสามารถในการตีความภาพที่มาจากกล้องหรือเซ็นเซอร์

ดูเพิ่มเติม

ความบกพร่องหรือความผิดปกติทางการมองเห็น

สาขาวิชาที่เกี่ยวข้อง

อ่านเพิ่มเติม

วอน เฮล์มโฮลทซ์, แฮร์มันน์ (2410) Handbuch der สรีรวิทยา Optik . ฉบับที่ 3. ไลป์ซิก : โวสส์ข้อความที่ยกมานั้นมาจากฉบับแปลภาษาอังกฤษที่จัดทำโดยสมาคมทัศนศาสตร์แห่งอเมริกา (ค.ศ. 1924–25): ตำราว่าด้วยทัศนศาสตร์เชิงสรีรวิทยา (Treatise on Physiological Optics) ซึ่งเก็บถาวรไว้เมื่อวันที่ 27 กันยายน ค.ศ. 2018 ที่Wayback Machine

ลิงก์ภายนอก

โครงสร้างของเรตินาและระบบการมองเห็น
ผลกระทบของรายละเอียดต่อการรับรู้ทางสายตาโดย จอน แม็คโลน จากโครงการสาธิตของวูลฟราม
ความสุขแห่งการรับรู้ทางสายตาแหล่งข้อมูลเกี่ยวกับความสามารถในการรับรู้ของดวงตา
VisionScience แหล่งข้อมูลสำหรับการวิจัยด้านการมองเห็นของมนุษย์และสัตว์แหล่งรวบรวมทรัพยากรด้านวิทยาศาสตร์การมองเห็นและการรับรู้
การมองเห็นและจิตสัมผัส
การมองเห็นบทความจากผู้เชี่ยวชาญเกี่ยวกับการมองเห็นใน Scholarpedia
ขีดจำกัดของการมองเห็นของมนุษย์คืออะไร?

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[

[

[

[ 50 ]

[ 51 ]

[ 52 ]

[ 53 ]

[ 54 ]

[ 55 ]