อ่าน 12 นาที
การรับรู้ทางสายตา
การรับรู้ทางสายตาคือความสามารถในการตรวจจับแสงและใช้แสงนั้นในการสร้างภาพของสภาพแวดล้อมโดย รอบ การตรวจจับแสงโดยไม่สร้างภาพจัดเป็นการรับรู้แสงในสัตว์มีกระดูกสันหลังส่วนใหญ่
การรับรู้ทางสายตา
| ส่วนหนึ่งของชุดบทความเกี่ยวกับ |
| จิตวิทยา |
|---|
การรับรู้ทางสายตาคือความสามารถในการตรวจจับแสงและใช้แสงนั้นในการสร้างภาพของสภาพแวดล้อมโดย รอบ [ 1 ]การตรวจจับแสงโดยไม่สร้างภาพจัดเป็นการรับรู้แสงในสัตว์มีกระดูกสันหลังส่วนใหญ่ การรับรู้ทางสายตาสามารถเกิดขึ้นได้จากการมองเห็นในเวลากลางวัน (photopic vision) หรือ การมองเห็น ในเวลากลางคืน ( scotopic vision) โดยสัตว์มีกระดูกสันหลังส่วนใหญ่มีทั้งสองอย่าง การรับรู้ทางสายตาตรวจจับแสง (โฟตอน) ใน สเปกตรัมที่มองเห็นได้ซึ่งสะท้อนจากวัตถุในสภาพแวดล้อมหรือปล่อยออกมาจากแหล่งกำเนิดแสงช่วงของแสงที่มองเห็นได้ถูกกำหนดโดยสิ่งที่มนุษย์สามารถรับรู้ได้ง่าย แม้ว่าการรับรู้ทางสายตาของสิ่งมีชีวิตที่ไม่ใช่มนุษย์มักจะขยายออกไปนอกเหนือสเปกตรัมที่มองเห็นได้ การรับรู้ที่เกิดขึ้นนี้เรียกอีกอย่างว่า การมองเห็น การมองเห็น หรือสายตา (คำคุณศัพท์คือ visual, opticalและocular ตามลำดับ)ส่วนประกอบทางสรีรวิทยาต่างๆที่เกี่ยวข้องกับการมองเห็นเรียกรวมกันว่าระบบการมองเห็นและเป็นจุดสนใจของการวิจัยมากมายในด้านภาษาศาสตร์จิตวิทยาวิทยาศาสตร์การรู้คิด ประสาทวิทยาศาสตร์และชีววิทยาโมเลกุลซึ่งเรียกรวมกันว่าวิทยาศาสตร์การมองเห็น
การรับรู้ทางสายตาไม่ได้เกี่ยวข้องเฉพาะกับสิ่งที่เรามองเห็นเท่านั้น แต่ยังรวมถึงวิธีที่สมองของเราประมวลผลข้อมูล ซึ่งเป็นกระบวนการปรับตัวและได้รับอิทธิพลจากทั้งประสบการณ์ตลอดชีวิตและความสามารถทางปัญญาที่เปลี่ยนแปลงไป[ 2 ] [ 3 ]
ระบบภาพ
สัตว์มีกระดูกสันหลังส่วนใหญ่มองเห็นผ่านระบบการมองเห็นที่คล้ายคลึงกัน โดยทั่วไป แสงจะเข้าสู่ดวงตาผ่านกระจกตาและถูกโฟกัสโดยเลนส์ไปยังเรตินาซึ่งเป็นเยื่อที่ไวต่อแสงที่ด้านหลังของดวงตาเซลล์รับ แสงเฉพาะ ในเรตินาทำหน้าที่เป็นตัวแปลงสัญญาณ โดยแปลง แสงให้เป็นกระแสประสาท เซลล์รับแสง แบ่งออกเป็นสองประเภทใหญ่ๆ คือเซลล์รูปกรวยและเซลล์รูปแท่งซึ่งช่วยให้มองเห็นในที่สว่างและในที่มืดตามลำดับ สัญญาณจากเซลล์รับแสงเหล่านี้จะถูกส่งผ่านเส้นประสาทตาจากเรตินาไปยังปมประสาท ส่วนกลาง ในสมอง นิวเคลียส เจนิคิวเลตด้านข้างจะส่งข้อมูลไปยังคอร์เทกซ์การมองเห็นสัญญาณจากเรตินายังเดินทางโดยตรงจากเรตินาไปยังซูพีเรียร์คอลลิคูลัสด้วย[ 4 ]
นิวเคลียสเจนิคิวเลตด้านข้างส่งสัญญาณไป ยัง คอร์เทกซ์การมองเห็นหลักหรือที่เรียกว่าคอร์เทกซ์ลาย คอร์เทกซ์นอกลายหรือที่เรียกว่าคอร์เทกซ์เชื่อมโยงการมองเห็นคือชุดของโครงสร้างคอร์เทกซ์ที่รับข้อมูลจากคอร์เทกซ์ลาย รวมถึงรับข้อมูลจากกันและกันด้วย[ 5 ] คำอธิบายล่าสุดของคอร์เทกซ์เชื่อม โยง การมองเห็นอธิบายถึงการแบ่งออกเป็นสองเส้นทางการทำงาน คือ เส้นทางด้านล่างและ เส้นทาง ด้านบนข้อสันนิษฐานนี้เรียกว่าสมมติฐานสองกระแส
ศึกษา
ปัญหาสำคัญในการรับรู้ทางสายตาคือ สิ่งที่ผู้คนมองเห็นนั้นไม่ใช่เพียงแค่การแปลความของสิ่งเร้าบนเรตินา (เช่น ภาพบนเรตินา) โดยที่สมองทำการเปลี่ยนแปลงข้อมูลพื้นฐานที่ได้รับเข้ามา ดังนั้น ผู้ที่สนใจในเรื่องการรับรู้จึงพยายามอย่างหนักมานานแล้วที่จะอธิบายว่ากระบวนการประมวลผลทางสายตาทำอะไรเพื่อสร้างสิ่งที่มองเห็นจริง ๆ
การศึกษาเบื้องต้น

มีสำนักคิดหลักสอง สำนัก ในสมัยกรีกโบราณซึ่งให้คำอธิบายเบื้องต้นเกี่ยวกับวิธีการทำงานของการมองเห็น
ทฤษฎีแรกคือ " ทฤษฎีการปล่อยรังสี " ของการมองเห็น ซึ่งกล่าวว่าการมองเห็นเกิดขึ้นเมื่อรังสีออกจากดวงตาและถูกวัตถุที่มองเห็นได้หักเห หากมองเห็นวัตถุโดยตรง จะเป็นเพราะ "รังสี" ที่ออกมาจากดวงตาและตกกระทบวัตถุนั้นอีกครั้ง อย่างไรก็ตาม ภาพที่หักเหก็มองเห็นได้ด้วย "รังสี" เช่นกัน ซึ่งออกจากดวงตา เดินทางผ่านอากาศ และหลังจากหักเหแล้ว ตกกระทบวัตถุที่มองเห็นได้ ซึ่งถูกมองเห็นเป็นผลมาจากการเคลื่อนที่ของรังสีจากดวงตา ทฤษฎีนี้ได้รับการสนับสนุนจากนักวิชาการที่ยึดถือทัศนศาสตร์ ของยูคลิดและ ป โตเลมี
โรงเรียนที่สองสนับสนุนแนวทางที่เรียกว่า 'การสอดแทรก' ซึ่งมองว่าการมองเห็นมาจากการที่บางสิ่งบางอย่างที่เป็นตัวแทนของวัตถุเข้าไปในดวงตา ทฤษฎีนี้ดูเหมือนจะมีความเชื่อมโยงกับทฤษฎีสมัยใหม่เกี่ยวกับการมองเห็นที่แท้จริง โดยมีอริสโตเติล ( De Sensu ) เป็นผู้เผยแพร่หลัก [ 6 ]และผู้ติดตามของเขา[ 6 ]แต่ทฤษฎีนี้ยังคงเป็นเพียงการคาดเดาที่ขาดพื้นฐานการทดลอง
การพัฒนาที่สำคัญที่สุดของทฤษฎีการรับเข้ามาจากผลงานของนักวิชาการในศตวรรษที่ 11 ชื่อ อิบนุ อัล-ฮัยธัม (อัลฮาเซน)ในหนังสือทัศนศาสตร์ ของเขา ( Kitāb al-Manāẓirประมาณปี 1021) เขาปฏิเสธทั้งทฤษฎีการส่งออกของยูคลิดและปโตเลมี และคำอธิบายเชิงคาดเดาล้วนๆ ของอริสโตเติล ผ่านการทดลองอย่างเป็นระบบ เขาแสดงให้เห็นว่าการมองเห็นเกิดขึ้นเมื่อรังสีแสงที่สะท้อนจากวัตถุเข้าสู่ดวงตา ซึ่งเลนส์จะโฟกัสไปที่เรตินา วิธีการเชิงประจักษ์นี้ถือเป็นจุดเปลี่ยน: อัลฮาเซนไม่เพียงแต่ให้คำอธิบายที่ถูกต้องครั้งแรกเกี่ยวกับการมองเห็นในแง่ของการรับเข้า[ 7 ]แต่ยังแนะนำวิธีการทดลองที่มีอิทธิพลต่อนักวิชาการชาวยุโรปในภายหลัง เช่นโรเจอร์ เบคอนเคปเลอร์และในที่สุดก็คือนิวตัน[ 8 ] [ 9 ]
ทั้งสองสำนักคิดอาศัยหลักการที่ว่า "สิ่งที่คล้ายกันจะรู้จักได้ก็ต่อเมื่อเหมือนกันเท่านั้น" และด้วยเหตุนี้จึงอาศัยแนวคิดที่ว่าดวงตาประกอบด้วย "ไฟภายใน" บางอย่างที่ทำปฏิกิริยากับ "ไฟภายนอก" ของแสงที่มองเห็นได้และทำให้การมองเห็นเป็นไปได้เพลโตกล่าวอ้างเช่นนี้ในบทสนทนาTimaeus ของเขา (45b และ 46b) เช่นเดียวกับเอมเปโดคลีส (ตามที่อริสโตเติลรายงานไว้ในDe Sensuของ เขา DK frag. B17) [ 6 ]

อัลฮาเซน (965 – ประมาณ 1040) ได้ทำการวิจัยและทดลองเกี่ยวกับการรับรู้ทางสายตามากมาย ขยายงานของปโตเลมีเกี่ยวกับการมองเห็นแบบสองตาและแสดงความคิดเห็นเกี่ยวกับงานกายวิภาคของกาเลน[ 10 ] [ 11 ]เขาเป็นคนแรกที่อธิบายว่าการมองเห็นเกิดขึ้นเมื่อแสงสะท้อนจากวัตถุแล้วส่งตรงไปยังดวงตา[ 12 ]
เชื่อกันว่า เลโอนาร์โด ดา วินชี (1452–1519) เป็นคนแรกที่ตระหนักถึงคุณสมบัติทางแสงพิเศษของดวงตา เขาเขียนว่า "หน้าที่ของดวงตาของมนุษย์... ได้รับการอธิบายโดยผู้เขียนจำนวนมากในลักษณะหนึ่ง แต่ฉันพบว่ามันแตกต่างออกไปโดยสิ้นเชิง" การค้นพบเชิงทดลองหลักของเขาคือ มีการมองเห็นที่ชัดเจนและคมชัดเฉพาะที่แนวสายตา—เส้นแสงที่สิ้นสุดที่โฟเวีย แม้ว่าเขาจะไม่ได้ใช้คำเหล่านี้อย่างตรงตัว แต่เขาก็ถือเป็นบิดาแห่งการแยกแยะระหว่างการมองเห็นที่โฟเวี ย และ การมองเห็นรอบข้างในยุคปัจจุบัน[ 13 ]
ไอแซค นิวตัน (1642–1726/27) เป็นคนแรกที่ค้นพบจากการทดลอง โดยการแยกสีแต่ละสีของสเปกตรัมของแสงที่ผ่านปริซึมว่าสีที่มองเห็นได้ของวัตถุนั้นเกิดขึ้นเนื่องจากลักษณะของแสงที่วัตถุสะท้อน และสีที่แยกออกมาเหล่านี้ไม่สามารถเปลี่ยนเป็นสีอื่นได้ ซึ่งขัดกับความคาดหวังทางวิทยาศาสตร์ในสมัยนั้น[ 14 ]
การอนุมานโดยไม่รู้ตัว
เฮอร์มันน์ ฟอน เฮล์มโฮลทซ์มักได้รับการยกย่องว่าเป็นผู้ทำการศึกษาการรับรู้ทางสายตาสมัยใหม่เป็นคนแรก เฮล์มโฮลทซ์ได้ตรวจสอบดวงตาของมนุษย์และสรุปว่าดวงตาไม่สามารถสร้างภาพที่มีคุณภาพสูงได้ ข้อมูลที่ไม่เพียงพอทำให้การมองเห็นเป็นไปไม่ได้ ดังนั้น เขาจึงสรุปว่าการมองเห็นอาจเป็นผลมาจาก "การอนุมานโดยไม่รู้ตัว" บางรูปแบบ โดยบัญญัติศัพท์นี้ขึ้นในปี 1867 เขาเสนอว่าสมองกำลังสร้างสมมติฐานและข้อสรุปจากข้อมูลที่ไม่สมบูรณ์ โดยอิงจากประสบการณ์ก่อนหน้านี้[ 15 ]
การอนุมานต้องอาศัยประสบการณ์เกี่ยวกับโลกมาก่อน
ตัวอย่างของข้อสันนิษฐานที่เป็นที่รู้จักกันดี ซึ่งอิงจากประสบการณ์ทางสายตา ได้แก่:
- แสงมาจากด้านบน;
- โดยปกติแล้วเราจะไม่เห็นวัตถุจากด้านล่าง
- ใบหน้าถูกมองเห็น (และจดจำ) ในแนวตั้ง[ 16 ]
- วัตถุที่อยู่ใกล้สามารถบดบังทัศนวิสัยของวัตถุที่อยู่ไกลออกไปได้ แต่ในทางกลับกันนั้นไม่เป็นเช่นนั้น และ
- รูปทรงต่างๆ (เช่น วัตถุในฉากหน้า) มักจะมีขอบนูน
การศึกษาภาพลวงตา (กรณีที่กระบวนการอนุมานผิดพลาด) ได้ให้ข้อมูลเชิงลึกมากมายเกี่ยวกับสมมติฐานต่างๆ ที่ระบบการมองเห็นใช้
สมมติฐานการอนุมานโดยไม่รู้ตัวอีกประเภทหนึ่ง (โดยอิงจากความน่าจะเป็น) เพิ่งได้รับการฟื้นฟูขึ้นมาใหม่ในการศึกษาที่เรียกว่า การศึกษาแบบ เบย์เซียนเกี่ยวกับการรับรู้ทางสายตา[ 17 ]ผู้สนับสนุนแนวทางนี้พิจารณาว่าระบบการมองเห็นทำการอนุมานแบบเบย์เซียน บางรูปแบบ เพื่ออนุมานการรับรู้จากข้อมูลทางประสาทสัมผัส อย่างไรก็ตาม ยังไม่ชัดเจนว่าผู้สนับสนุนมุมมองนี้อนุมานความน่าจะเป็นที่เกี่ยวข้องซึ่งจำเป็นสำหรับสมการแบบเบย์เซียนได้อย่างไรในหลักการ แบบจำลองที่อิงตามแนวคิดนี้ถูกนำมาใช้เพื่ออธิบายหน้าที่การรับรู้ทางสายตาต่างๆ เช่น การรับรู้การเคลื่อนไหวการรับรู้ความลึกและการรับรู้ภาพพื้นหลังและภาพหลัก[ 18 ] [ 19 ] "ทฤษฎีการรับรู้เชิงประจักษ์โดยสมบูรณ์" เป็นแนวทางที่เกี่ยวข้องและใหม่กว่าซึ่งให้เหตุผลเกี่ยวกับการรับ รู้ทางสายตาโดยไม่ต้องอ้างถึงรูปแบบแบบเบย์เซียนอย่างชัดเจน
ทฤษฎีเกสตัลท์
นักจิตวิทยาเกสตัลท์ที่ทำงานเป็นหลักในช่วงทศวรรษ 1930 และ 1940 ได้ตั้งคำถามวิจัยมากมายที่นักวิทยาศาสตร์ด้านการมองเห็นศึกษาอยู่ในปัจจุบัน[ 20 ]
กฎแห่งการจัดระเบียบของเกสตัลต์ได้ชี้นำการศึกษาว่าผู้คนรับรู้ส่วนประกอบทางสายตาในรูปแบบที่จัดระเบียบหรือเป็นองค์รวมได้อย่างไร แทนที่จะเป็นส่วนต่างๆ มากมาย "เกสตัลต์" เป็นคำภาษาเยอรมันที่แปลได้บางส่วนว่า "การจัดเรียงหรือรูปแบบ" พร้อมกับ "โครงสร้างที่เป็นองค์รวมหรือเกิดขึ้นใหม่" ตามทฤษฎีนี้ มีปัจจัยหลักแปดประการที่กำหนดว่าระบบการมองเห็นจะจัดกลุ่มองค์ประกอบต่างๆ เป็นรูปแบบโดยอัตโนมัติอย่างไร ได้แก่ ความใกล้เคียง ความคล้ายคลึง การปิด ความสมมาตร ชะตากรรมร่วมกัน (เช่น การเคลื่อนไหวร่วมกัน) ความต่อเนื่อง ตลอดจนเกสตัลต์ที่ดี (รูปแบบที่สม่ำเสมอ เรียบง่าย และเป็นระเบียบ) และประสบการณ์ในอดีต[ 21 ]
แบบจำลองภาษา
ตามรอยเท้าของจอร์จ เบิร์กลีย์นักปรัชญาชาวออสเตรเลียโคลิน เมอร์เรย์ เทอร์เบย์นได้เสนอทางเลือกอื่นนอกเหนือจาก "แบบจำลองทางเรขาคณิต" แบบดั้งเดิมของการรับรู้ทางสายตา โดยกล่าวว่าแง่มุมต่างๆ ของแบบจำลองดังกล่าวได้บดบังความเข้าใจของเราเกี่ยวกับการมองเห็นโดยไม่จำเป็นมาตั้งแต่สมัยของยูคลิด โดยอ้างอิงถึงประติมากรNaum Gaboเขาตั้งข้อสังเกตว่า “เส้น รูปร่าง สี และการเคลื่อนไหวมีภาษาของตัวเอง แต่การอ่านต้องใช้เวลา การมองอย่างเดียวไม่เพียงพอ คุณต้องเห็น และ “เห็น” หมายถึง “อ่าน” [ 22 ] Turbayne โต้แย้งว่า “แบบจำลองภาษาช่วยให้เข้าใจปัญหาโบราณเกี่ยวกับการมองเห็นของเราได้ดียิ่งขึ้น โดยส่องแสงสว่างไปยังพื้นที่มืดที่คู่แข่งสำคัญมองไม่เห็น” [ 23 ]โดยเฉพาะอย่างยิ่ง เขาเน้นย้ำถึงข้อจำกัดที่พบใน คำอธิบาย เชิงกลไก ล้วนๆ เกี่ยวกับการมองเห็น โดยโต้แย้งว่า “ภาพลวงตา” หลายกรณีสามารถอธิบายได้อย่างเหมาะสมยิ่งขึ้นผ่านการใช้คำศัพท์ที่พบในแบบจำลองภาษาดังกล่าว ด้วยเหตุนี้ เขาจึงนำเสนอการวิเคราะห์เปรียบเทียบตัวอย่างเฉพาะของการบิดเบือนภาพ ได้แก่ “กรณี Barrovian” กรณี “ดวงจันทร์แนวนอน” และกรณี “ภาพเรตินากลับหัว” [ 24 ] [ 25 ] [ 26 ]
การวิเคราะห์การเคลื่อนไหวของดวงตา

ในช่วงทศวรรษ 1960 การพัฒนาทางเทคนิคทำให้สามารถบันทึกการเคลื่อนไหวของดวงตาอย่างต่อเนื่องในระหว่างการอ่าน[ 27 ]ในการดูภาพ[ 28 ]และต่อมาในการแก้ปัญหาด้วยภาพ[ 29 ]และเมื่อกล้องแบบสวมศีรษะพร้อมใช้งาน ก็สามารถบันทึกได้ในระหว่างการขับรถด้วย[ 30 ]
ภาพทางด้านขวาแสดงให้เห็นสิ่งที่อาจเกิดขึ้นในช่วงสองวินาทีแรกของการตรวจสอบด้วยสายตา ในขณะที่พื้นหลังเบลอ ซึ่งแสดงถึงการมองเห็นรอบข้างการเคลื่อนไหวของดวงตาครั้งแรกจะมุ่งไปที่รองเท้าบู๊ตของชายคนนั้น (เพียงเพราะรองเท้าบู๊ตอยู่ใกล้กับจุดเริ่มต้นการจ้องมองและมีความคมชัดพอสมควร) การเคลื่อนไหวของดวงตาทำหน้าที่ในการเลือกความสนใจกล่าวคือ เลือกส่วนหนึ่งของข้อมูลภาพทั้งหมดเพื่อการประมวลผลที่ลึกขึ้นโดยสมอง[ 31 ]
การจ้องมองต่อไปนี้จะเปลี่ยนจากใบหน้าหนึ่งไปยังอีกใบหน้าหนึ่ง พวกเขายังอาจอนุญาตให้เปรียบเทียบใบหน้าได้อีกด้วย[ 32 ]
อาจสรุปได้ว่าไอคอนรูปหน้า นั้น เป็นไอคอนค้นหาที่ดึงดูดใจมากในบริเวณรอบนอกของสายตา การมองเห็นในจุดศูนย์กลางของสายตาจะเพิ่มรายละเอียดเพิ่มเติมให้กับความประทับใจแรกเห็นใน บริเวณรอบนอก
นอกจากนี้ยังสังเกตได้ว่ามีการเคลื่อนไหวของดวงตาหลายประเภท ได้แก่การเคลื่อนไหวของดวงตาเพื่อตรึงสายตา ( ไมโครแซคเคดการเคลื่อนของดวงตา และการสั่น) การเคลื่อนไหวแบบรวมสายตา การเคลื่อนไหวแบบแซคเคด และการเคลื่อนไหวแบบติดตาม การตรึงสายตาเป็นจุดคงที่ที่ดวงตาพักอยู่ อย่างไรก็ตาม ดวงตาไม่เคยอยู่นิ่งสนิท และตำแหน่งการมองจะเคลื่อนไป การเคลื่อนไปเหล่านี้จะได้รับการแก้ไขโดยไมโครแซคเคด ซึ่งเป็นการเคลื่อนไหวของดวงตาเพื่อตรึงสายตาที่เล็กมากการเคลื่อนไหวแบบรวมสายตาเกี่ยวข้องกับการทำงานร่วมกันของดวงตาทั้งสองข้างเพื่อให้ภาพตกกระทบลงบนพื้นที่เดียวกันของเรตินาทั้งสองข้าง ส่งผลให้ได้ภาพที่โฟกัสเพียงภาพเดียวการเคลื่อนไหวแบบแซคเคดเป็นการเคลื่อนไหวของดวงตาประเภทที่กระโดดจากตำแหน่งหนึ่งไปยังอีกตำแหน่งหนึ่ง และใช้ในการสแกนฉาก/ภาพเฉพาะอย่างรวดเร็ว สุดท้ายการเคลื่อนไหวแบบติดตามเป็นการเคลื่อนไหวของดวงตาที่ราบรื่นและใช้ในการติดตามวัตถุที่กำลังเคลื่อนที่[ 33 ]
การจดจำใบหน้าและวัตถุ
มีหลักฐานมากมายที่แสดงว่าการจดจำใบหน้าและวัตถุเกิดขึ้นจากระบบที่แตกต่างกัน ตัวอย่างเช่นผู้ป่วยโรคprosopagnosia แสดงความบกพร่องในการประมวลผลใบหน้า แต่ไม่ใช่การประมวลผลวัตถุ ในขณะที่ผู้ป่วยโรค object agnosia (โดยเฉพาะอย่างยิ่งผู้ป่วย CK ) แสดงความบกพร่องในการประมวลผลวัตถุโดยที่การประมวลผลใบหน้ายังคงปกติ[ 34 ]ในเชิงพฤติกรรม พบว่าใบหน้า แต่ไม่ใช่วัตถุ ได้รับผลกระทบจากการกลับด้าน ทำให้เกิดข้ออ้างว่าใบหน้าเป็น "สิ่งพิเศษ" [ 34 ] [ 35 ]นอกจากนี้ การประมวลผลใบหน้าและวัตถุยังใช้ระบบประสาทที่แตกต่างกัน[ 36 ]ที่น่าสังเกตคือ บางคนโต้แย้งว่าความเชี่ยวชาญที่เห็นได้ชัดของสมองมนุษย์ในการประมวลผลใบหน้าไม่ได้สะท้อนถึงความเฉพาะเจาะจงของโดเมนที่แท้จริง แต่เป็นกระบวนการทั่วไปของการจำแนกระดับผู้เชี่ยวชาญภายในกลุ่มของสิ่งเร้าที่กำหนด[ 37 ]แม้ว่าข้ออ้างหลังนี้จะเป็นหัวข้อของการถกเถียงอย่างมาก ก็ตาม Doris Tsao และเพื่อนร่วมงานได้อธิบายถึงบริเวณสมองและกลไกสำหรับการจดจำใบหน้าในลิงมาคาก โดยใช้ fMRI และสรีรวิทยาไฟฟ้า [ 38 ]
คอร์เทกซ์อินเฟอโรเทมโพรัลมีบทบาทสำคัญในงานการรับรู้และการแยกแยะวัตถุต่างๆ การศึกษาโดย MIT แสดงให้เห็นว่าภูมิภาคย่อยของคอร์เทกซ์ IT มีหน้าที่รับผิดชอบวัตถุต่างๆ[ 39 ]โดยการปิดการทำงานของระบบประสาทในพื้นที่เล็กๆ หลายแห่งของคอร์เทกซ์อย่างเลือกสรร สัตว์จะไม่สามารถแยกแยะความแตกต่างระหว่างวัตถุบางคู่ได้ ซึ่งแสดงให้เห็นว่าคอร์เทกซ์ IT แบ่งออกเป็นภูมิภาคที่ตอบสนองต่อคุณลักษณะทางสายตาที่แตกต่างกันและเฉพาะเจาะจง ในทำนองเดียวกัน บางส่วนของคอร์เทกซ์และภูมิภาคเฉพาะมีส่วนเกี่ยวข้องกับการจดจำใบหน้ามากกว่าการจดจำวัตถุอื่นๆ
การศึกษาบางชิ้นมีแนวโน้มที่จะแสดงให้เห็นว่า แทนที่จะเป็นภาพรวมที่เป็นเอกภาพ คุณลักษณะเฉพาะบางอย่างและบริเวณที่น่าสนใจของวัตถุเป็นองค์ประกอบสำคัญเมื่อสมองต้องการจดจำวัตถุในภาพ[ 40 ] [ 41 ]ด้วยวิธีนี้ การมองเห็นของมนุษย์จึงมีความอ่อนไหวต่อการเปลี่ยนแปลงเล็กน้อยเฉพาะเจาะจงในภาพ เช่น การรบกวนขอบของวัตถุ การปรับเปลี่ยนพื้นผิว หรือการเปลี่ยนแปลงเล็กน้อยใดๆ ในบริเวณสำคัญของภาพ[ 42 ]
การศึกษาในผู้ที่การมองเห็นกลับคืนมาหลังจากตาบอดเป็นเวลานานเผยให้เห็นว่าพวกเขาไม่สามารถจดจำวัตถุและใบหน้าได้ (ตรงข้ามกับสี การเคลื่อนไหว และรูปทรงเรขาคณิตอย่างง่าย) บางคนตั้งสมมติฐานว่าการตาบอดในวัยเด็กทำให้ระบบการมองเห็นบางส่วนที่จำเป็นสำหรับงานระดับสูงเหล่านี้ไม่สามารถพัฒนาได้อย่างเหมาะสม[ 43 ]ความเชื่อทั่วไปที่ว่าช่วงเวลาวิกฤตจะคงอยู่จนถึงอายุ 5 หรือ 6 ขวบนั้นถูกท้าทายโดยการศึกษาในปี 2007 ที่พบว่าผู้ป่วยที่มีอายุมากกว่าสามารถพัฒนาความสามารถเหล่านี้ได้ด้วยการสัมผัสเป็นเวลาหลายปี[ 44 ]
แนวทางด้านการรับรู้และการคำนวณ
ในทศวรรษ 1970 เดวิด มาร์ได้พัฒนาทฤษฎีการมองเห็นแบบหลายระดับ ซึ่งวิเคราะห์กระบวนการมองเห็นในระดับนามธรรมที่แตกต่างกัน เพื่อที่จะมุ่งเน้นไปที่การทำความเข้าใจปัญหาเฉพาะในด้านการมองเห็น เขาได้ระบุระดับการวิเคราะห์ไว้ 3 ระดับ ได้แก่ ระดับ การคำนวณระดับ อัลก อริทึมและ ระดับ การนำไปใช้นักวิทยาศาสตร์ด้านการมองเห็นหลายคน รวมถึงโทมาโซ ป็อกจิโอได้นำระดับการวิเคราะห์เหล่านี้มาใช้และนำไปใช้เพื่ออธิบายลักษณะการมองเห็นจากมุมมองการคำนวณเพิ่มเติม[ 45 ]
ระดับการคำนวณจะกล่าวถึงปัญหาที่ระบบการมองเห็นต้องเอาชนะในระดับนามธรรมสูงระดับอัลกอริทึมพยายามระบุกลยุทธ์ที่อาจนำมาใช้แก้ปัญหาเหล่านี้ และสุดท้ายระดับการนำไปใช้พยายามอธิบายว่าวิธีการแก้ปัญหาเหล่านี้เกิดขึ้นได้อย่างไรในวงจรประสาท
มาร์เสนอว่าเป็นไปได้ที่จะศึกษาการมองเห็นในแต่ละระดับเหล่านี้โดยอิสระ มาร์อธิบายว่าการมองเห็นเริ่มต้นจาก ภาพ สองมิติ (บนเรตินา) ไปสู่ ภาพ สามมิติที่แสดงถึงโลกภายนอก ขั้นตอนการมองเห็นของเขามีดังนี้:
- ภาพร่างสองมิติหรือภาพร่างเบื้องต้นของฉาก โดยอิงจากการสกัดคุณลักษณะขององค์ประกอบพื้นฐานของฉาก รวมถึงขอบ พื้นที่ ฯลฯ โปรดสังเกตความคล้ายคลึงกันในเชิงแนวคิดกับภาพร่างด้วยดินสอที่ศิลปินวาดอย่างรวดเร็วเพื่อแสดงความรู้สึก
- ภาพร่าง2 1/2 มิติของฉาก ซึ่งแสดงให้เห็นถึงพื้นผิวต่างๆ เป็นต้น สังเกตความคล้ายคลึงกันในแนวคิดกับขั้นตอนการวาดภาพที่ศิลปินใช้แสงเงาหรือเงาแรเงาในส่วนต่างๆ ของฉากเพื่อให้เกิดมิติความลึก
- แบบจำลอง 3 มิติซึ่งฉากจะถูกแสดงภาพในแผนที่ 3 มิติแบบต่อเนื่อง[ 46 ]
ภาพร่าง 2 1/2 มิติของ Marr ถือว่ามีการสร้างแผนที่ความลึก และแผนที่นี้เป็นพื้นฐานของ การรับรู้ รูปร่าง 3 มิติ อย่างไรก็ตาม ทั้งการรับรู้ แบบสเตอริโอสโคปิกและแบบภาพ รวมถึงการมองด้วยตาเดียว แสดงให้เห็นอย่างชัดเจนว่าการรับรู้รูปร่าง 3 มิติเกิดขึ้นก่อน และไม่ได้ขึ้นอยู่กับการรับรู้ความลึกของจุด ไม่ชัดเจนว่าในทางทฤษฎีแล้วจะสร้างแผนที่ความลึกเบื้องต้นได้อย่างไร และสิ่งนี้จะตอบคำถามเกี่ยวกับการจัดระเบียบหรือการจัดกลุ่มรูปและพื้นหลังได้อย่างไร บทบาทของข้อจำกัดในการจัดระเบียบการรับรู้ ซึ่ง Marr มองข้ามไป ในการสร้างการรับรู้รูปร่าง 3 มิติจากวัตถุ 3 มิติที่มองด้วยตาคู่ ได้รับการพิสูจน์แล้วในเชิงประจักษ์สำหรับกรณีของวัตถุเส้นลวด 3 มิติ เช่น[ 47 ] [ 48 ]สำหรับการอภิปรายโดยละเอียดเพิ่มเติม โปรดดู Pizlo (2008) [ 49 ]
กรอบแนวคิดทางเลือกที่ทันสมัยกว่าเสนอว่าการมองเห็นประกอบด้วยสามขั้นตอนต่อไปนี้: การเข้ารหัส การเลือก และการถอดรหัส[ 50 ]การเข้ารหัสคือการสุ่มตัวอย่างและแสดงข้อมูลภาพ (เช่น การแสดงข้อมูลภาพเป็นกิจกรรมทางประสาทในเรตินา) การเลือก หรือการเลือกโดยอาศัยความสนใจคือการเลือกข้อมูลภาพเพียงเศษเสี้ยวเล็กๆ เพื่อประมวลผลต่อไป เช่นการเปลี่ยนสายตาไปยังวัตถุหรือตำแหน่งภาพเพื่อประมวลผลสัญญาณภาพในตำแหน่งนั้นได้ดียิ่งขึ้น การถอดรหัสคือการอนุมานหรือจดจำสัญญาณภาพที่เลือก เช่น การจดจำวัตถุที่อยู่ตรงกลางสายตาว่าเป็นใบหน้าของใครบางคน ในกรอบแนวคิดนี้[ 51 ]การเลือกโดยอาศัยความสนใจเริ่มต้นที่คอร์เทกซ์ภาพหลักตามเส้นทางภาพ และข้อจำกัดของความสนใจจะกำหนดความแตกต่างระหว่างสนามภาพส่วนกลางและส่วนรอบนอกสำหรับการจดจำหรือการถอดรหัสภาพ
การแปลงสัญญาณ
การแปลงพลังงานเป็นกิจกรรมทางประสาทเรียกว่าทรานสดักชัน จอประสาทตาประกอบด้วยเซลล์ 3 ชั้น ได้แก่ ชั้นเซลล์รับแสง ชั้นเซลล์ไบโพลาร์ และชั้นเซลล์แกงลีออน ชั้นเซลล์รับแสงซึ่งเป็นที่เกิดการแปลงพลังงานอยู่ไกลจากเลนส์ที่สุด ประกอบด้วยเซลล์รับแสงที่มีความไวต่างกันเรียกว่าเซลล์แท่งและเซลล์กรวย เซลล์กรวยมีหน้าที่ในการรับรู้สีและมี 3 ชนิดที่แตกต่างกัน ได้แก่ สีแดง สีเขียว และสีน้ำเงิน เซลล์แท่งมีหน้าที่ในการรับรู้วัตถุในที่แสงน้อย[ 52 ]เซลล์รับแสงมีสารเคมีพิเศษที่เรียกว่าโฟโตพิกเมนต์ ซึ่งฝังอยู่ในเยื่อหุ้มของลามิลลา เซลล์แท่งของมนุษย์หนึ่งเซลล์มีโฟโตพิกเมนต์ประมาณ 10 ล้านเซลล์ โมเลกุลของโฟโตพิกเมนต์ประกอบด้วย 2 ส่วน คือ ออปซิน (โปรตีน) และเรตินัล (ไขมัน) [ 53 ]มีโฟโตพิกเมนต์เฉพาะ 3 ชนิด (แต่ละชนิดมีความไวต่อความยาวคลื่นของตัวเอง) ที่ตอบสนองต่อแสงที่มองเห็นได้ตลอดช่วงสเปกตรัม เมื่อความยาวคลื่นที่เหมาะสม (ความยาวคลื่นที่รงควัตถุรับแสงเฉพาะนั้นไวต่อ) กระทบกับตัวรับแสง รงควัตถุรับแสงจะแยกออกเป็นสองส่วน ซึ่งจะส่งสัญญาณไปยังชั้นเซลล์ไบโพลาร์ จากนั้นเซลล์ไบโพลาร์จะส่งสัญญาณต่อไปยังเซลล์แกงลีออน ซึ่งแอกซอนของเซลล์เหล่านี้จะก่อตัวเป็นเส้นประสาทตาและส่งข้อมูลไปยังสมอง หากเซลล์รูปกรวยชนิดใดชนิดหนึ่งขาดหายไปหรือผิดปกติเนื่องจากความผิดปกติทางพันธุกรรม จะทำให้เกิด ความบกพร่องในการมองเห็นสีซึ่งบางครั้งเรียกว่าตาบอดสี[ 54 ]
กระบวนการฝ่ายตรงข้าม
กระบวนการส่งสัญญาณเกี่ยวข้องกับการส่งข้อความทางเคมีจากเซลล์รับแสงไปยังเซลล์ไบโพลาร์และเซลล์แกงลีออน เซลล์รับแสงหลายเซลล์อาจส่งข้อมูลไปยังเซลล์แกงลีออนหนึ่งเซลล์ เซลล์แกงลีออนมีสองประเภท ได้แก่ สีแดง/เขียวและสีเหลือง/น้ำเงิน เซลล์ประสาทเหล่านี้ทำงานอยู่ตลอดเวลา แม้ว่าจะไม่ได้รับการกระตุ้นก็ตาม สมองจะตีความสีต่างๆ (และด้วยข้อมูลจำนวนมาก ก็คือภาพ) เมื่ออัตราการทำงานของเซลล์ประสาทเหล่านี้เปลี่ยนแปลงไป แสงสีแดงกระตุ้นเซลล์รูปกรวยสีแดง ซึ่งจะกระตุ้นเซลล์แกงลีออนสีแดง/เขียว ในทำนองเดียวกัน แสงสีเขียวกระตุ้นเซลล์รูปกรวยสีเขียว ซึ่งจะกระตุ้นเซลล์แกงลีออนสีเขียว/แดง และแสงสีน้ำเงินกระตุ้นเซลล์รูปกรวยสีน้ำเงิน ซึ่งจะกระตุ้นเซลล์แกงลีออนสีน้ำเงิน/เหลือง อัตราการทำงานของเซลล์แกงลีออนจะเพิ่มขึ้นเมื่อได้รับสัญญาณจากเซลล์รูปกรวยหนึ่ง และลดลง (ถูกยับยั้ง) เมื่อได้รับสัญญาณจากเซลล์รูปกรวยอีกเซลล์หนึ่ง สีแรกในชื่อของเซลล์แกงลีออนคือสีที่กระตุ้นเซลล์นั้น และสีที่สองคือสีที่ยับยั้งเซลล์นั้น เช่น กรวยสีแดงจะกระตุ้นเซลล์แกงลีออนสีแดง/เขียว และกรวยสีเขียวจะยับยั้งเซลล์แกงลีออนสีแดง/เขียว นี่คือกระบวนการตรงข้ามหากอัตราการยิงของเซลล์แกงลีออนสีแดง/เขียวเพิ่มขึ้น สมองจะรู้ว่าแสงนั้นเป็นสีแดง หากอัตราลดลง สมองจะรู้ว่าสีของแสงนั้นเป็นสีเขียว[ 54 ]
การรับรู้ภาพเทียม
การรับรู้ภาพเทียมกำลังพัฒนาและสอนเครื่องจักรให้เข้าใจฉากต่างๆ ไม่ใช่แค่ระบุวัตถุ แต่ยังทำให้เครื่องจักรมีความฉลาดในการมองเห็นในสถานการณ์จริงอีกด้วย[ 55 ]
ทฤษฎีและการสังเกตเกี่ยวกับการรับรู้ทางสายตาเป็นแหล่งที่มาหลักของแรงบันดาลใจสำหรับวิทยาการคอมพิวเตอร์ด้าน การมองเห็น (หรือที่เรียกว่าการมองเห็นด้วยเครื่องจักรหรือ การมองเห็นเชิงคำนวณ) โครงสร้างฮาร์ดแวร์พิเศษและอัลกอริธึมซอฟต์แวร์ช่วยให้เครื่องจักรมีความสามารถในการตีความภาพที่มาจากกล้องหรือเซ็นเซอร์
ดูเพิ่มเติม
- การมองเห็นสี
- วิชั่นคอมพิวเตอร์
- การรับรู้เชิงลึก
- ปรากฏการณ์เอนโทปติก
- จิตวิทยาเกสตัลท์
- การบดบังด้านข้าง
- คุกคาม
- ตาเปล่า
- การมองเห็นด้วยเครื่องจักร
- การทดสอบความผิดปกติของภาพ McGill
- การรับรู้การเคลื่อนไหว
- การบูรณาการประสาทสัมผัสหลายด้าน
- การตีความ (ปรัชญา)
- ความถี่เชิงพื้นที่
- ความคมชัดของการมองเห็น
- ภาพลวงตา
- การประมวลผลภาพ
- ระบบภาพ
- ความรู้สึก
ความบกพร่องหรือความผิดปกติทางการมองเห็น
สาขาวิชาที่เกี่ยวข้อง
อ่านเพิ่มเติม
- วอน เฮล์มโฮลทซ์, แฮร์มันน์ (2410) Handbuch der สรีรวิทยา Optik . ฉบับที่ 3. ไลป์ซิก : โวสส์ข้อความที่ยกมานั้นมาจากฉบับแปลภาษาอังกฤษที่จัดทำโดยสมาคมทัศนศาสตร์แห่งอเมริกา (ค.ศ. 1924–25): ตำราว่าด้วยทัศนศาสตร์เชิงสรีรวิทยา (Treatise on Physiological Optics) ซึ่งเก็บถาวรไว้เมื่อวันที่ 27 กันยายน ค.ศ. 2018 ที่Wayback Machine
ลิงก์ภายนอก
- โครงสร้างของเรตินาและระบบการมองเห็น
- ผลกระทบของรายละเอียดต่อการรับรู้ทางสายตาโดย จอน แม็คโลน จากโครงการสาธิตของวูลฟราม
- ความสุขแห่งการรับรู้ทางสายตาแหล่งข้อมูลเกี่ยวกับความสามารถในการรับรู้ของดวงตา
- VisionScience แหล่งข้อมูลสำหรับการวิจัยด้านการมองเห็นของมนุษย์และสัตว์แหล่งรวบรวมทรัพยากรด้านวิทยาศาสตร์การมองเห็นและการรับรู้
- การมองเห็นและจิตสัมผัส
- การมองเห็นบทความจากผู้เชี่ยวชาญเกี่ยวกับการมองเห็นใน Scholarpedia
- ขีดจำกัดของการมองเห็นของมนุษย์คืออะไร?
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การรับรู้ทางสายตา
การรับรู้ทางสายตาคือความสามารถในการตรวจจับแสงและใช้แสงนั้นในการสร้างภาพของสภาพแวดล้อมโดย รอบ การตรวจจับแสงโดยไม่สร้างภาพจัดเป็นการรับรู้แสงในสัตว์มีกระดูกสันหลังส่วนใหญ่
ระบบภาพ
สัตว์มีกระดูกสันหลังส่วนใหญ่มองเห็นผ่านระบบการมองเห็นที่คล้ายคลึงกัน โดยทั่วไป แสงจะเข้าสู่ดวงตาผ่าน กระจกตา และถูกโฟกัสโดย เลนส์ ไปยัง เรตินา ซึ่งเป็นเยื่อที่ไวต่อแสงที่ด้านหลังของดวงตา เซลล์รับ แสงเฉพาะ ในเรตินาทำหน้าที่เป็น ตัวแปลงสัญญาณ โดยแปลง แสงให้เป็น...
ศึกษา
ปัญหาสำคัญในการรับรู้ทางสายตาคือ สิ่งที่ผู้คนมองเห็นนั้นไม่ใช่เพียงแค่การแปลความของสิ่งเร้าบนเรตินา (เช่น ภาพบนเรตินา) โดยที่สมองทำการเปลี่ยนแปลงข้อมูลพื้นฐานที่ได้รับเข้ามา ดังนั้น ผู้ที่สนใจในเรื่องการรับรู้จึงพยายามอย่างหนักมานานแล้วที่จะอธิบายว่า...
การศึกษาเบื้องต้น
มีสำนักคิดหลักสอง สำนัก ในสมัยกรีกโบราณ ซึ่งให้คำอธิบายเบื้องต้นเกี่ยวกับวิธีการทำงานของการมองเห็น