กลับไปหน้าบทความ

อ่าน 6 นาที

จิตวิทยาเสียง

จิตวิทยาเสียงเป็นสาขาหนึ่งของจิตวิทยากายภาพที่เกี่ยวข้องกับการศึกษาทางวิทยาศาสตร์เกี่ยวกับการรับรู้เสียงโดยระบบการได้ยิน ของมนุษย์ เป็นสาขาวิทยาศาสตร์ที่ศึกษา การตอบสนอง...

จิตวิทยาเสียง

จิตวิทยาเสียงเป็นสาขาหนึ่งของจิตวิทยากายภาพที่เกี่ยวข้องกับการศึกษาทางวิทยาศาสตร์เกี่ยวกับการรับรู้เสียงโดยระบบการได้ยิน ของมนุษย์ เป็นสาขาวิทยาศาสตร์ที่ศึกษา การตอบสนอง ทางจิตวิทยาที่เกี่ยวข้องกับเสียง รวมถึงเสียงรบกวนเสียงพูดและดนตรีจิตวิทยาเสียงเป็นสาขาสหวิทยาการที่รวมถึงจิตวิทยาเสียงวิศวกรรมอิเล็กทรอนิกส์ ฟิสิกส์ ชีววิทยา สรีรวิทยา และวิทยาศาสตร์คอมพิวเตอร์[ 1 ]

พื้นหลัง

การได้ยินไม่ใช่เพียงปรากฏการณ์เชิงกลของการแพร่กระจายคลื่นเท่านั้น แต่ยังเป็นเหตุการณ์ทางประสาทสัมผัสและการรับรู้ด้วย เมื่อคนได้ยินอะไรบางอย่าง สิ่งนั้นจะมาถึงหูในรูปของคลื่นเสียงเชิงกลที่เดินทางผ่านอากาศ แต่ภายในหูมันจะถูกเปลี่ยนเป็นศักยภาพการกระทำของ เซลล์ประสาท จากนั้นพัลส์ประสาทเหล่านี้จะเดินทางไปยังสมองซึ่งเป็นที่รับรู้ ดังนั้น ในปัญหาทางด้านเสียงหลายๆ ปัญหา เช่นการประมวลผลเสียงจึงเป็นประโยชน์ที่จะคำนึงถึงไม่เพียงแต่กลไกของสภาพแวดล้อมเท่านั้น แต่ยังรวมถึงข้อเท็จจริงที่ว่าทั้งหูและสมองมีส่วนเกี่ยวข้องในประสบการณ์การฟังของบุคคลด้วย

ตัวอย่างเช่น หูชั้นในทำหน้าที่ประมวลผลสัญญาณอย่างมีนัยสำคัญในการแปลงรูปคลื่นเสียงให้เป็นสิ่งเร้าทางประสาท การประมวลผลนี้ทำให้ความแตกต่างบางอย่างระหว่างรูปคลื่นไม่สามารถรับรู้ได้[ 2 ] เทคนิค การบีบอัดข้อมูลเช่นMP3ใช้ประโยชน์จากข้อเท็จจริงนี้[ 3 ]นอกจากนี้ หูยังมีการตอบสนองแบบไม่เชิงเส้นต่อเสียงที่มีระดับความเข้มต่างกัน การตอบสนองแบบไม่เชิงเส้นนี้เรียกว่าความดังระบบเครือข่ายโทรศัพท์และ ระบบ ลดเสียง รบกวน ใช้ประโยชน์จากข้อเท็จจริงนี้โดยการบีบอัดตัวอย่างข้อมูลแบบไม่เชิงเส้นก่อนการส่งและขยายเพื่อการเล่น[ 4 ]ผลกระทบอีกประการหนึ่งของการตอบสนองแบบไม่เชิงเส้นของหูคือเสียงที่มีความถี่ใกล้เคียงกันจะสร้างเสียงบีทเสมือนหรือผลิตภัณฑ์การบิดเบือนแบบอินเตอร์โมดูเลชัน[ 5 ]

มีคุณลักษณะอย่างน้อยห้าประการที่ใช้ในการระบุแนวทางการปฏิบัติทางจิตวิทยาเสียงที่มีประสิทธิภาพ ได้แก่ ความดัง (การวัดระดับเสียงที่รับรู้ได้), ความหยาบ (ความไม่ลงรอยกันทางประสาทสัมผัส), ความคมชัด (การกระจายสเปกตรัม), ความเป็นโทนเสียง (อัตราส่วนของจุดสูงสุดของสเปกตรัมโทนเสียง) และความกว้างขวาง (เพื่อทำนายความกว้างขวางที่รับรู้ได้)

อีกวิธีหนึ่งในการจำแนกประเภทดนตรีหรือแนะนำเพลงคือการกำจัดคุณลักษณะเชิงวัตถุที่หลากหลายซึ่งไม่เกี่ยวข้องกับการรับรู้ของมนุษย์โดยตรง อย่างไรก็ตาม ยังมีคุณลักษณะระดับต่ำบางอย่างที่ไม่เกี่ยวข้องกับการรับรู้ของมนุษย์/ทางกายภาพ แต่สามารถช่วยปรับปรุงการค้นพบทางด้านจิตวิทยาเสียงได้

วิธีแรกคือ Root Mean Square (RMS) ซึ่งเป็นอีกวิธีหนึ่งในการวัดเสียง โดยเฉพาะความดัง RMS เป็นกระบวนการวัดที่สำคัญเพราะช่วยให้ผู้คนตรวจสอบระดับเสียงได้ Spectral Rolloff ช่วยปรับความถี่ให้สมดุล Spectral Flatness ใช้เพื่อกำหนดว่าช่วงเสียงนั้นดังหรือเบาแค่ไหน สุดท้าย Inter Channel Cross Correlation ประมาณความสัมพันธ์ระหว่างการรับรู้เสียงของหูข้างหนึ่งกับหูอีกข้างหนึ่ง[ 6 ]

ขีดจำกัดของการรับรู้

เส้นโค้งความดังเท่ากันโปรดสังเกตความไวสูงสุดบริเวณ2–4  กิโลเฮิร์ตซ์ซึ่งอยู่ตรงกลางของย่านความถี่เสียง

โดยทั่วไปแล้วหูของมนุษย์สามารถได้ยินเสียงในช่วงความถี่ต่างๆ ดังนี้20 ถึง 20,000 เฮิรตซ์ ขีดจำกัดบนมักจะลดลงตามอายุ ผู้ใหญ่ส่วนใหญ่ไม่สามารถได้ยินเสียงที่ความถี่สูงกว่านี้ได้16,000 เฮิรตซ์ภายใต้สภาวะห้องปฏิบัติการที่เหมาะสม ความถี่ต่ำสุดที่ระบุว่าเป็นเสียงดนตรีคือ 12 เฮิรตซ์[ 7 ] เสียงระหว่าง 4 ถึง 16 เฮิรตซ์สามารถรับรู้ได้  ผ่านประสาท สัมผัสของร่างกาย

การรับรู้ความแตกต่างด้านเวลาของสัญญาณเสียงของมนุษย์นั้นวัดได้ว่าน้อยกว่า10  ไมโครวินาที นี่ไม่ได้หมายความว่าความถี่ที่สูงกว่านี้100  kHz (1/10 μs )สามารถได้ยินได้ แต่การแยกแยะเวลาดังกล่าวไม่ได้เชื่อมโยงโดยตรงกับช่วงความถี่ [ 8 ] [ 9 ]

ความละเอียดในการแยกแยะความถี่ของหูนั้นอยู่ที่ประมาณ 3.6 เฮิรตซ์ ภายในช่วงอ็อกเทฟ1000–2000 เฮิรตซ์ นั่นคือ การเปลี่ยนแปลงระดับเสียงที่มากกว่า 3.6 เฮิรตซ์ สามารถรับรู้ได้ในบริบททางคลินิก[ 7 ]อย่างไรก็ตาม แม้แต่ความแตกต่างของระดับเสียงที่เล็กกว่านั้นก็สามารถรับรู้ได้ด้วยวิธีการอื่น ตัวอย่างเช่น การรบกวนของระดับเสียงสองระดับมักจะได้ยินเป็นการเปลี่ยนแปลงซ้ำๆ ในระดับเสียงของโทนเสียง การปรับแอมพลิจูดนี้เกิดขึ้นด้วยความถี่ที่เท่ากับความแตกต่างของความถี่ของโทนเสียงทั้งสอง และเรียกว่าการบี

บันได เสียง เซมิโทนที่ใช้ในโน้ตดนตรีตะวันตกไม่ใช่บันไดเสียงความถี่เชิงเส้น แต่เป็นบันไดเสียงลอการิทึมบันไดเสียงอื่นๆ ได้มาจากการทดลองเกี่ยวกับการรับรู้การได้ยินของมนุษย์โดยตรง เช่นบันไดเสียงเมลและบันไดเสียงบาร์ก (ซึ่งใช้ในการศึกษาการรับรู้ แต่โดยทั่วไปไม่ได้ใช้ในงานประพันธ์ดนตรี) และบันไดเสียงเหล่านี้จะมีลักษณะเป็นลอการิทึมโดยประมาณในความถี่สูง แต่เกือบจะเป็นเชิงเส้นในความถี่ต่ำ

ช่วงความเข้มของเสียงที่มนุษย์ได้ยินนั้นกว้างมาก เยื่อแก้วหูของมนุษย์ไวต่อการเปลี่ยนแปลงของความดันเสียง และสามารถตรวจจับการเปลี่ยนแปลงของความดันได้ตั้งแต่ระดับเล็กน้อยเพียงไม่กี่ไมโครปาสคาล (μPa) ไปจนถึงระดับที่มากกว่านั้น100  kPaด้วยเหตุนี้ระดับความดันเสียงจึงวัดด้วยวิธีลอการิทึม โดยอ้างอิงความดันทั้งหมดกับ 100 kPa20 μPa (หรือ1.973 85 × 10 −10  atm ) ดังนั้นขีดจำกัดล่างของการได้ยินจึงถูกกำหนดเป็นเดซิเบลแต่ขีดจำกัดบนนั้นไม่ชัดเจนนัก ขีดจำกัดบนนั้นเป็นเรื่องของศักยภาพที่จะก่อให้เกิด การ สูญ เสียการได้ยินจากเสียง ดังมากกว่า

การสำรวจขีดจำกัดล่างของการได้ยินอย่างละเอียดถี่ถ้วนยิ่งขึ้น พบว่าระดับความไวต่ำสุดที่สามารถได้ยินเสียงได้นั้นขึ้นอยู่กับความถี่ โดยการวัดความเข้มต่ำสุดนี้สำหรับโทนเสียงทดสอบที่มีความถี่ต่างๆ กัน สามารถสร้างกราฟแสดง ระดับความไวในการได้ยิน สัมบูรณ์ (ATH) ที่ขึ้นอยู่กับความถี่ได้ โดยทั่วไป หูจะแสดงความไวสูงสุด (เช่น ATH ต่ำสุด) ระหว่าง1–5 kHzแม้ว่าเกณฑ์จะเปลี่ยนแปลงไปตามอายุ โดยหูของผู้สูงอายุจะแสดงความไวที่ลดลงเหนือ 2 kHz [ 10 ]

เส้น ATH คือเส้นที่ต่ำที่สุดของเส้นโค้งความดังเท่ากัน เส้นโค้งความดังเท่ากันแสดงระดับความดันเสียง (dB SPL) ในช่วงความถี่เสียงที่รับรู้ว่ามีความดังเท่ากัน เส้นโค้งความดังเท่ากันถูกวัดครั้งแรกโดยเฟลตเชอร์และมุนสันที่ห้องปฏิบัติการเบลล์ในปี 1933 โดยใช้โทนเสียงบริสุทธิ์ที่สร้างขึ้นใหม่ผ่านหูฟัง และข้อมูลที่พวกเขารวบรวมเรียกว่าเส้นโค้งเฟลตเชอร์-มันสันเนื่องจากเป็นการยากที่จะวัดความดังตามความรู้สึกส่วนตัว เส้นโค้งเฟลตเชอร์-มันสันจึงถูกหาค่าเฉลี่ยจากผู้ทดสอบจำนวนมาก โรบินสันและแดดสันได้ปรับปรุงกระบวนการในปี 1956 เพื่อให้ได้ชุดเส้นโค้งความดังเท่ากันใหม่สำหรับแหล่งกำเนิดเสียงด้านหน้าซึ่งวัดในห้องเก็บเสียงเส้นโค้งโรบินสัน-แดดสันได้รับการกำหนดมาตรฐานเป็นISO 226ในปี 1986 ในปี 2003 ISO 226ได้รับการแก้ไขโดยใช้ข้อมูลที่รวบรวมจากการศึกษาระหว่างประเทศ 12 เรื่อง

การระบุตำแหน่งเสียง

การระบุตำแหน่งเสียงคือกระบวนการกำหนดตำแหน่งของแหล่งกำเนิดเสียง สมองใช้ความแตกต่างเล็กน้อยในความดัง โทนเสียง และจังหวะเวลา ระหว่างหูทั้งสองข้าง เพื่อให้เราสามารถระบุตำแหน่งแหล่งกำเนิดเสียงได้[ 11 ]การระบุตำแหน่งสามารถอธิบายได้ในแง่ของตำแหน่งสามมิติ ได้แก่ มุม ราบหรือมุมแนวนอน มุมเงยหรือมุมแนวตั้ง และระยะทาง (สำหรับเสียงนิ่ง) หรือความเร็ว (สำหรับเสียงเคลื่อนที่) [ 12 ]มนุษย์ เช่นเดียวกับสัตว์สี่ขา หลายชนิด มีความสามารถในการตรวจจับทิศทางในแนวนอนได้ดี แต่ไม่ค่อยเก่งในทิศทางแนวตั้ง เนื่องจากหูวางอยู่สมมาตรกันนกฮูก บางชนิด มีหูวางอยู่ไม่สมมาตร และสามารถตรวจจับเสียงได้ในระนาบทั้งสาม ซึ่งเป็นการปรับตัวเพื่อล่าสัตว์เลี้ยงลูกด้วยนมขนาดเล็กในที่มืด[ 13 ]

เอฟเฟกต์การบดบัง

กราฟการบดบังเสียง

สมมติว่าผู้ฟังสามารถได้ยินสัญญาณเสียงหนึ่งๆ ได้ภายใต้สภาวะเงียบสนิท เมื่อมีสัญญาณเสียงหนึ่งเล่นพร้อมกับเสียงอีกเสียงหนึ่ง สัญญาณเสียงนั้นจะต้องแรงกว่าเพื่อให้ผู้ฟังได้ยิน สัญญาณรบกวนนั้นเรียกว่า ตัวบดบัง (masker)และการฟังที่ถูกขัดขวางเรียกว่าการบดบัง (masking ) ตัวบดบังไม่จำเป็นต้องมีส่วนประกอบความถี่ของสัญญาณเสียงต้นฉบับเพื่อให้เกิดการบดบัง สัญญาณที่ถูกบดบังยังคงได้ยินได้แม้ว่าจะอ่อนกว่าตัวบดบัง การบดบังเกิดขึ้นเมื่อสัญญาณเสียงและตัวบดบังเล่นพร้อมกัน เช่น เมื่อคนหนึ่งกระซิบขณะที่อีกคนหนึ่งตะโกน และผู้ฟังจะไม่ได้ยินสัญญาณเสียงที่อ่อนกว่าเนื่องจากถูกบดบังด้วยตัวบดบังที่ดังกว่า การบดบังยังสามารถเกิดขึ้นกับสัญญาณเสียงก่อนที่ตัวบดบังจะเริ่มหรือหลังจากที่ตัวบดบังหยุดลง ตัวอย่างเช่น เสียงปรบมือดังๆ อย่างกะทันหันสามารถทำให้เสียงที่อยู่ก่อนหน้าหรือหลังจากนั้นไม่ได้ยินได้ทันที ผลของการบดบังย้อนหลังนั้นอ่อนกว่าการบดบังไปข้างหน้า[ 10 ] ผลกระทบของการบดบังได้รับการศึกษาอย่างกว้างขวางในการวิจัยด้านจิตวิทยาเสียงและถูกนำไปใช้ในการเข้ารหัสเสียง แบบ สูญเสีย เช่นMP3

ขาดพื้นฐานที่สำคัญ

เมื่อนำเสนอชุดความถี่ฮาร์มอนิกในความสัมพันธ์ 2f , 3f , 4f , 5f เป็นต้น (โดยที่fเป็นความถี่เฉพาะ) มนุษย์มักจะรับรู้ว่าระดับเสียงคือfตัวอย่างที่ได้ยินสามารถพบได้ใน YouTube [ 14 ]

ดนตรี

จิตวิทยาเสียงประกอบด้วยหัวข้อและการศึกษาที่เกี่ยวข้องกับจิตวิทยาดนตรีและการบำบัดด้วยดนตรีนักทฤษฎีเช่นเบนจามิน โบเรตซ์ถือว่าผลลัพธ์บางอย่างของจิตวิทยาเสียงมีความหมายเฉพาะในบริบททางดนตรีเท่านั้น[ 15 ]

แผ่นเสียง ชุด EnvironmentsของIrv Teibel (พ.ศ. 2512–2512) เป็นตัวอย่างแรกๆ ของเสียงที่วางจำหน่ายในเชิงพาณิชย์ซึ่งเผยแพร่เพื่อเสริมสร้างความสามารถทางจิตวิทยาโดยเฉพาะ[ 16 ]

จิตวิทยาเสียงประยุกต์

แบบจำลองจิตวิทยาเสียง

จิตวิทยาเสียงมีความสัมพันธ์ที่เกื้อกูลกันมายาวนานกับวิทยาศาสตร์คอมพิวเตอร์เจซีอาร์ ลิคไลเดอร์และบ็อบ เทย์เลอร์ผู้บุกเบิกอินเทอร์เน็ตต่างก็สำเร็จการศึกษาระดับปริญญาโทด้านจิตวิทยาเสียง ในขณะที่บริษัท บีบีเอ็น เทคโนโลยีส์เดิมทีเชี่ยวชาญด้านการให้คำปรึกษาเกี่ยวกับประเด็นด้านเสียง ก่อนที่จะเริ่มสร้างเครือข่ายแบบแพ็กเก็ตสวิตช์ เป็นครั้ง แรก

Licklider เขียนบทความชื่อ "ทฤษฎีคู่ของการรับรู้ระดับเสียง" [ 17 ]

จิตวิทยาเสียงถูกนำไปประยุกต์ใช้ในหลายสาขาของการพัฒนาซอฟต์แวร์ โดยนักพัฒนาจะแมปรูปแบบทางคณิตศาสตร์ที่ได้รับการพิสูจน์แล้วและรูปแบบทดลองในการประมวลผลสัญญาณดิจิทัล ตัวแปลงสัญญาณการบีบอัดเสียงหลายตัว เช่นMP3และOpusใช้แบบจำลองจิตวิทยาเสียงเพื่อเพิ่มอัตราส่วนการบีบอัด ความสำเร็จของระบบเสียงแบบดั้งเดิมสำหรับการเล่นดนตรีในโรงละครและบ้านสามารถนำมาอ้างอิงถึงจิตวิทยาเสียงได้[ 18 ]และการพิจารณาจิตวิทยาเสียงทำให้เกิดระบบเสียงแบบใหม่ เช่นการสังเคราะห์สนามเสียง จิตวิทยา เสียง[ 19 ]นอกจากนี้ นักวิทยาศาสตร์ยังได้ทดลองสร้างอาวุธเสียงแบบใหม่ซึ่งปล่อยความถี่ที่อาจทำให้เกิดความเสียหาย บาดเจ็บ หรือเสียชีวิตได้ แต่ประสบความสำเร็จในระดับจำกัด[ 20 ]จิตวิทยาเสียงยังถูกนำมาใช้ใน การสร้าง เสียงเพื่อทำให้มิติข้อมูลอิสระหลายมิติสามารถได้ยินและตีความได้ง่าย[ 21 ]ซึ่งช่วยให้สามารถแนะนำด้วยเสียงได้โดยไม่จำเป็นต้องใช้เสียงเชิงพื้นที่ และในเกมคอมพิวเตอร์แบบสร้างเสียง[ 22 ]และแอปพลิเคชันอื่นๆ เช่น การบิน โดรนและ การ ผ่าตัดนำทางด้วยภาพ[ 23 ]ปัจจุบันนี้ยังมีการนำไปใช้ในดนตรีด้วย โดยนักดนตรีและศิลปินยังคงสร้างประสบการณ์การฟังใหม่ๆ โดยการบดบังความถี่ที่ไม่ต้องการของเครื่องดนตรี ทำให้ความถี่อื่นๆ ถูกเน้นให้เด่นชัดขึ้น การประยุกต์ใช้อีกประการหนึ่งคือการออกแบบลำโพงขนาดเล็กหรือคุณภาพต่ำ ซึ่งสามารถใช้ปรากฏการณ์ของความถี่พื้นฐานที่หายไปเพื่อสร้างเอฟเฟกต์ของเสียงเบสที่ความถี่ต่ำกว่าที่ลำโพงสามารถสร้างได้ (ดูเอกสารอ้างอิง)

ผู้ผลิตรถยนต์ออกแบบเครื่องยนต์และแม้แต่ประตูเพื่อให้มีเสียงที่เฉพาะเจาะจง[ 24 ]

การเข้ารหัสเสียงเชิงรับรู้

การเข้ารหัสเสียงเชิงรับรู้ใช้อัลกอริธึมที่อิงตามหลักจิตวิทยาการได้ยิน

แบบจำลองทางจิตวิทยาเสียงช่วยให้ การบีบอัดสัญญาณเสียงแบบสูญเสียคุณภาพสูงโดยอธิบายว่าส่วนใดของสัญญาณเสียงดิจิทัลที่กำหนดสามารถลบออกหรือสร้างขึ้นใหม่ด้วยคุณภาพที่ลดลงโดยไม่สูญเสียคุณภาพเสียงที่รับรู้ได้อย่างมีนัยสำคัญ สิ่งนี้มีประโยชน์อย่างมากต่ออัตราส่วนการบีบอัดโดยรวม และการวิเคราะห์ทางจิตวิทยาเสียงมักนำไปสู่ไฟล์เพลงที่บีบอัดแล้วซึ่งมีขนาดเพียงหนึ่งในสิบถึงหนึ่งในสิบสองของไฟล์ต้นฉบับคุณภาพสูง แต่มีการสูญเสียคุณภาพในสัดส่วนที่น้อยกว่าอย่างเห็นได้ชัด การบีบอัดดังกล่าวเป็นคุณลักษณะของรูปแบบการบีบอัดเสียงแบบสูญเสียในปัจจุบันเกือบทั้งหมด บางรูปแบบเหล่านี้ได้แก่Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (ใช้สำหรับการออกอากาศเสียงดิจิทัลในหลายประเทศ) และATRACซึ่งเป็นการบีบอัดที่ใช้ในMiniDiscและWalkman บาง รุ่น

จิตวิทยาการได้ยินนั้นอาศัยพื้นฐานทางกายวิภาคของมนุษย์ เป็นอย่างมาก โดยเฉพาะอย่างยิ่งข้อจำกัดของหูในการรับรู้เสียงดังที่ได้กล่าวไว้ก่อนหน้านี้ สรุปได้ว่า ข้อจำกัดหลักๆ มีดังนี้:

อัลกอริทึมการบีบอัดสามารถกำหนดลำดับความสำคัญต่ำกว่าให้กับเสียงที่อยู่นอกช่วงการได้ยินของมนุษย์ และลดความแม่นยำของความถี่ต่างๆ ตามระดับการบดบังที่คาดการณ์ไว้ โดยการค่อยๆ ย้ายบิตออกจากส่วนประกอบที่ไม่สำคัญไปยังส่วนประกอบที่สำคัญ อัลกอริทึมนี้จะช่วยให้มั่นใจได้ว่าเสียงที่ผู้ฟังมีแนวโน้มที่จะรับรู้ได้มากที่สุดนั้นจะถูกแสดงผลได้อย่างแม่นยำที่สุด

ตัวเข้ารหัสเสียงจะวิเคราะห์เสียงโดยใช้แบบจำลองการรับรู้ (แบบจำลองทางจิตวิทยาเสียง) เพื่อคำนวณความแม่นยำที่ต้องการต่อย่านความถี่หรือช่วงเวลา ผลลัพธ์ของการคำนวณนี้จะถูกนำไปใช้ในการปรับความแม่นยำในการเข้ารหัสตามความถี่และเวลาผ่านชุดเครื่องมือการเข้ารหัสซึ่งขึ้นอยู่กับรูปแบบการเข้ารหัสเสียง เนื่องจากรูปแบบต่างๆ รองรับเครื่องมือการเข้ารหัสที่แตกต่างกัน

ตัวอย่างของเครื่องมือเขียนโค้ดดังกล่าว ได้แก่:

ในตัวเข้ารหัสหลายๆ ตัว อัลกอริทึมควบคุมอัตราจะช่วยให้มั่นใจได้ว่าอัตราบิตของเสียงที่เข้ารหัสแล้วนั้นอยู่ในขอบเขตที่กำหนดไว้ หาก ไม่สามารถเข้ารหัสแบบ โปร่งใสได้ที่อัตราบิตเป้าหมาย อัลกอริทึมควบคุมอัตราจะปรับความแม่นยำในการเข้ารหัส (และทำให้เกิดการบิดเบือน) ในส่วนต่างๆ ของสเปกตรัมเสียง โดยใช้ข้อมูลที่คำนวณจากแบบจำลองทางจิตวิทยาการได้ยินเป็นแนวทาง จนกว่าจะสามารถตรงกับอัตราบิตเป้าหมายได้

ดูเพิ่มเติม

  • หูที่ได้ยินเสียงดนตรี—การรับรู้เสียงในWayback Machine (เก็บถาวรเมื่อ 25 ธันวาคม 2005)
  • มึลเลอร์ ซี, ชไนเดอร์ พี, เพอร์สเตอเรอร์ เอ, โอพิทซ์ เอ็ม, เนฟโจโดวา เอ็มวี, เบอร์เกอร์ เอ็ม (1993) "จิตอะคูสติกประยุกต์ในการบินอวกาศ" เวียน เมด วอเชนชร์ (เยอรมัน) 143 ( 23– 24): 633– 5. PMID  8178525 .—การจำลองการได้ยินในสภาพแวดล้อมเปิดโดยใช้หูฟัง
  • การปิดบังชั่วคราว
  • แนวคิดไฮเปอร์ฟิสิกส์—เสียงและการได้ยิน
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Psychoacoustics&oldid=1352253932 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ จิตวิทยาเสียง

จิตวิทยาเสียงเป็นสาขาหนึ่งของจิตวิทยากายภาพที่เกี่ยวข้องกับการศึกษาทางวิทยาศาสตร์เกี่ยวกับการรับรู้เสียงโดยระบบการได้ยิน ของมนุษย์ เป็นสาขาวิทยาศาสตร์ที่ศึกษา การตอบสนอง...

พื้นหลัง

การได้ยินไม่ใช่เพียงปรากฏการณ์เชิงกลของ การแพร่กระจายคลื่น เท่านั้น แต่ยังเป็นเหตุการณ์ทางประสาทสัมผัสและการรับรู้ด้วย เมื่อคนได้ยินอะไรบางอย่าง สิ่งนั้นจะมาถึง หู ในรูปของคลื่นเสียงเชิงกลที่เดินทางผ่านอากาศ แต่ภายในหูมันจะถูกเปลี่ยนเป็น ศักยภาพการกระทำของ...

ขีดจำกัดของการรับรู้

โดยทั่วไปแล้วหูของมนุษย์สามารถได้ยินเสียงในช่วงความถี่ต่างๆ ดังนี้ 20 ถึง 20,000 เฮิรตซ์ ขีด จำกัดบนมักจะลดลงตามอายุ ผู้ใหญ่ส่วนใหญ่ไม่สามารถได้ยินเสียงที่ความถี่สูงกว่านี้ได้ 16,000 เฮิรตซ์ ภายใต้สภาวะห้องปฏิบัติการที่เหมาะสม...

การระบุตำแหน่งเสียง

การระบุตำแหน่งเสียง คือกระบวนการกำหนดตำแหน่งของแหล่งกำเนิดเสียง สมองใช้ความแตกต่างเล็กน้อยในความดัง โทนเสียง และจังหวะเวลา ระหว่างหูทั้งสองข้าง เพื่อให้เราสามารถระบุตำแหน่งแหล่งกำเนิดเสียงได้ [ 11 ] การระบุตำแหน่งสามารถอธิบายได้ในแง่ของตำแหน่งสามมิติ ได้แก่...