จิตวิทยาเสียง

จิตวิทยาเสียงเป็นสาขาหนึ่งของจิตวิทยากายภาพที่เกี่ยวข้องกับการศึกษาทางวิทยาศาสตร์เกี่ยวกับการรับรู้เสียงโดยระบบการได้ยิน ของมนุษย์ เป็นสาขาวิทยาศาสตร์ที่ศึกษา การตอบสนอง ทางจิตวิทยาที่เกี่ยวข้องกับเสียง รวมถึงเสียง รบกวนเสียงพูดและดนตรีจิตวิทยาเสียงเป็นสาขาสหวิทยาการที่รวมถึงจิตวิทยาเสียงวิศวกรรมอิเล็กทรอนิกส์ ฟิสิกส์ ชีววิทยา สรีรวิทยา และวิทยาศาสตร์คอมพิวเตอร์^[¹^]

พื้นหลัง

การได้ยินไม่ใช่เพียงปรากฏการณ์เชิงกลของการแพร่กระจายคลื่นเท่านั้น แต่ยังเป็นเหตุการณ์ทางประสาทสัมผัสและการรับรู้ด้วย เมื่อคนได้ยินอะไรบางอย่าง สิ่งนั้นจะมาถึงหูในรูปของคลื่นเสียงเชิงกลที่เดินทางผ่านอากาศ แต่ภายในหูมันจะถูกเปลี่ยนเป็นศักยภาพการกระทำของ เซลล์ประสาท จากนั้นพัลส์ประสาทเหล่านี้จะเดินทางไปยังสมองซึ่งเป็นที่รับรู้ ดังนั้น ในปัญหาทางด้านเสียงหลายๆ ปัญหา เช่นการประมวลผลเสียงจึงเป็นประโยชน์ที่จะคำนึงถึงไม่เพียงแต่กลไกของสภาพแวดล้อมเท่านั้น แต่ยังรวมถึงข้อเท็จจริงที่ว่าทั้งหูและสมองมีส่วนเกี่ยวข้องในประสบการณ์การฟังของบุคคลด้วย

ตัวอย่างเช่น หูชั้นในทำหน้าที่ประมวลผลสัญญาณอย่างมีนัยสำคัญในการ แปลงรูปคลื่นเสียงให้เป็นสิ่งเร้าทางประสาท การประมวลผลนี้ทำให้ความแตกต่างบางอย่างระหว่างรูปคลื่นไม่สามารถรับรู้ได้^{[ 2 ]} เทคนิค การบีบอัดข้อมูลเช่นMP3ใช้ประโยชน์จากข้อเท็จจริงนี้^{[ 3 ]}นอกจากนี้ หูยังมีการตอบสนองแบบไม่เชิงเส้นต่อเสียงที่มีระดับความเข้มต่างกัน การตอบสนองแบบไม่เชิงเส้นนี้เรียกว่าความดังระบบเครือข่ายโทรศัพท์และ ระบบ ลดเสียง รบกวน ใช้ประโยชน์จากข้อเท็จจริงนี้โดยการบีบอัดตัวอย่างข้อมูลแบบไม่เชิงเส้นก่อนการส่งและขยายเพื่อการเล่น^{[ 4 ]}ผลกระทบอีกประการหนึ่งของการตอบสนองแบบไม่เชิงเส้นของหูคือเสียงที่มีความถี่ใกล้เคียงกันจะสร้างเสียงบีทเสมือนหรือผลิตภัณฑ์การบิดเบือนแบบอินเตอร์โมดูเลชัน^{[ 5 ]}

มีคุณลักษณะอย่างน้อยห้าประการที่ใช้ในการระบุแนวทางการปฏิบัติทางจิตวิทยาเสียงที่มีประสิทธิภาพ ได้แก่ ความดัง (การวัดระดับเสียงที่รับรู้ได้), ความหยาบ (ความไม่ลงรอยกันทางประสาทสัมผัส), ความคมชัด (การกระจายสเปกตรัม), ความเป็นโทนเสียง (อัตราส่วนของจุดสูงสุดของสเปกตรัมโทนเสียง) และความกว้างขวาง (เพื่อทำนายความกว้างขวางที่รับรู้ได้)

อีกวิธีหนึ่งในการจำแนกประเภทดนตรีหรือแนะนำเพลงคือการกำจัดคุณลักษณะเชิงวัตถุที่หลากหลายซึ่งไม่เกี่ยวข้องกับการรับรู้ของมนุษย์โดยตรง อย่างไรก็ตาม ยังมีคุณลักษณะระดับต่ำบางอย่างที่ไม่เกี่ยวข้องกับการรับรู้ของมนุษย์/ทางกายภาพ แต่สามารถช่วยปรับปรุงการค้นพบทางด้านจิตวิทยาเสียงได้

วิธีแรกคือ Root Mean Square (RMS) ซึ่งเป็นอีกวิธีหนึ่งในการวัดเสียง โดยเฉพาะความดัง RMS เป็นกระบวนการวัดที่สำคัญเพราะช่วยให้ผู้คนตรวจสอบระดับเสียงได้ Spectral Rolloff ช่วยปรับความถี่ให้สมดุล Spectral Flatness ใช้เพื่อกำหนดว่าช่วงเสียงนั้นดังหรือเบาแค่ไหน สุดท้าย Inter Channel Cross Correlation ประมาณความสัมพันธ์ระหว่างการรับรู้เสียงของหูข้างหนึ่งกับหูอีกข้างหนึ่ง^{[ 6 ]}

ขีดจำกัดของการรับรู้

โดยทั่วไปแล้วหูของมนุษย์สามารถได้ยินเสียงในช่วงความถี่ต่างๆ ดังนี้20 ถึง 20,000 เฮิรตซ์ ขีดจำกัดบนมักจะลดลงตามอายุ ผู้ใหญ่ส่วนใหญ่ไม่สามารถได้ยินเสียงที่ความถี่สูงกว่านี้ได้16,000 เฮิรตซ์ภายใต้สภาวะห้องปฏิบัติการที่เหมาะสม ความถี่ต่ำสุดที่ระบุว่าเป็นเสียงดนตรีคือ 12 เฮิรตซ์^{[ 7 ]} เสียงระหว่าง 4 ถึง 16 เฮิรตซ์สามารถรับรู้ได้ ผ่านประสาท สัมผัสของร่างกาย

การรับรู้ความแตกต่างด้านเวลาของสัญญาณเสียงของมนุษย์นั้นวัดได้ว่าน้อยกว่า10 ไมโครวินาที นี่ไม่ได้หมายความว่าความถี่ที่สูงกว่านี้100 kHz (1/10 μs )สามารถได้ยินได้ แต่การแยกแยะเวลาดังกล่าวไม่ได้เชื่อมโยงโดยตรงกับช่วงความถี่^{[ 8 ]}^{[ 9 ]}

ความละเอียดในการแยกแยะความถี่ของหูนั้นอยู่ที่ประมาณ 3.6 เฮิรตซ์ ภายในช่วงอ็อกเทฟ1000–2000 เฮิรตซ์ นั่นคือ การเปลี่ยนแปลงระดับเสียงที่มากกว่า 3.6 เฮิรตซ์ สามารถรับรู้ได้ในบริบททางคลินิก^{[ 7 ]}อย่างไรก็ตาม แม้แต่ความแตกต่างของระดับเสียงที่เล็กกว่านั้นก็สามารถรับรู้ได้ด้วยวิธีการอื่น ตัวอย่างเช่น การรบกวนของระดับเสียงสองระดับมักจะได้ยินเป็นการเปลี่ยนแปลงซ้ำๆ ในระดับเสียงของโทนเสียง การปรับแอมพลิจูดนี้เกิดขึ้นด้วยความถี่ที่เท่ากับความแตกต่างของความถี่ของโทนเสียงทั้งสอง และเรียกว่าการบีต

บันได เสียง เซมิโทนที่ใช้ในโน้ตดนตรีตะวันตกไม่ใช่บันไดเสียงความถี่เชิงเส้น แต่เป็นบันไดเสียงลอการิทึมบันไดเสียงอื่นๆ ได้มาจากการทดลองเกี่ยวกับการรับรู้การได้ยินของมนุษย์โดยตรง เช่นบันไดเสียงเมลและบันไดเสียงบาร์ก (ซึ่งใช้ในการศึกษาการรับรู้ แต่โดยทั่วไปไม่ได้ใช้ในงานประพันธ์ดนตรี) และบันไดเสียงเหล่านี้จะมีลักษณะเป็นลอการิทึมโดยประมาณในความถี่สูง แต่เกือบจะเป็นเชิงเส้นในความถี่ต่ำ

ช่วงความเข้มของเสียงที่มนุษย์ได้ยินนั้นกว้างมาก เยื่อแก้วหูของมนุษย์ไวต่อการเปลี่ยนแปลงของความดันเสียง และสามารถตรวจจับการเปลี่ยนแปลงของความดันได้ตั้งแต่ระดับเล็กน้อยเพียงไม่กี่ไมโครปาสคาล (μPa) ไปจนถึงระดับที่มากกว่านั้น100 kPaด้วยเหตุนี้ระดับความดันเสียงจึงวัดด้วยวิธีลอการิทึม โดยอ้างอิงความดันทั้งหมดกับ 100 kPa20 μPa (หรือ1.973 85 × 10 ⁻¹⁰ atm ) ดังนั้นขีดจำกัดล่างของการได้ยินจึงถูกกำหนดเป็น0 เดซิเบลแต่ขีดจำกัดบนนั้นไม่ชัดเจนนัก ขีดจำกัดบนนั้นเป็นเรื่องของศักยภาพที่จะก่อให้เกิด การ สูญ เสียการได้ยินจากเสียง ดังมากกว่า

การสำรวจขีดจำกัดล่างของการได้ยินอย่างละเอียดถี่ถ้วนยิ่งขึ้น พบว่าระดับความไวต่ำสุดที่สามารถได้ยินเสียงได้นั้นขึ้นอยู่กับความถี่ โดยการวัดความเข้มต่ำสุดนี้สำหรับโทนเสียงทดสอบที่มีความถี่ต่างๆ กัน สามารถสร้างกราฟแสดง ระดับความไวในการได้ยิน สัมบูรณ์ (ATH) ที่ขึ้นอยู่กับความถี่ได้ โดยทั่วไป หูจะแสดงความไวสูงสุด (เช่น ATH ต่ำสุด) ระหว่าง1–5 kHzแม้ว่าเกณฑ์จะเปลี่ยนแปลงไปตามอายุ โดยหูของผู้สูงอายุจะแสดงความไวที่ลดลงเหนือ 2 kHz ^{[ 10 ]}

เส้น ATH คือเส้นที่ต่ำที่สุดของเส้นโค้งความดังเท่ากัน เส้นโค้งความดังเท่ากันแสดงระดับความดันเสียง (dB SPL) ในช่วงความถี่เสียงที่รับรู้ว่ามีความดังเท่ากัน เส้นโค้งความดังเท่ากันถูกวัดครั้งแรกโดยเฟลตเชอร์และมุนสันที่ห้องปฏิบัติการเบลล์ในปี 1933 โดยใช้โทนเสียงบริสุทธิ์ที่สร้างขึ้นใหม่ผ่านหูฟัง และข้อมูลที่พวกเขารวบรวมเรียกว่าเส้นโค้งเฟลตเชอร์-มันสันเนื่องจากเป็นการยากที่จะวัดความดังตามความรู้สึกส่วนตัว เส้นโค้งเฟลตเชอร์-มันสันจึงถูกหาค่าเฉลี่ยจากผู้ทดสอบจำนวนมาก โรบินสันและแดดสันได้ปรับปรุงกระบวนการในปี 1956 เพื่อให้ได้ชุดเส้นโค้งความดังเท่ากันใหม่สำหรับแหล่งกำเนิดเสียงด้านหน้าซึ่งวัดในห้องเก็บเสียงเส้นโค้งโรบินสัน-แดดสันได้รับการกำหนดมาตรฐานเป็นISO 226ในปี 1986 ในปี 2003 ISO 226ได้รับการแก้ไขโดยใช้ข้อมูลที่รวบรวมจากการศึกษาระหว่างประเทศ 12 เรื่อง

การระบุตำแหน่งเสียง

การระบุตำแหน่งเสียงคือกระบวนการกำหนดตำแหน่งของแหล่งกำเนิดเสียง สมองใช้ความแตกต่างเล็กน้อยในความดัง โทนเสียง และจังหวะเวลา ระหว่างหูทั้งสองข้าง เพื่อให้เราสามารถระบุตำแหน่งแหล่งกำเนิดเสียงได้^{[ 11 ]}การระบุตำแหน่งสามารถอธิบายได้ในแง่ของตำแหน่งสามมิติ ได้แก่ มุม ราบหรือมุมแนวนอน มุมเงยหรือมุมแนวตั้ง และระยะทาง (สำหรับเสียงนิ่ง) หรือความเร็ว (สำหรับเสียงเคลื่อนที่) ^{[ 12 ]}มนุษย์ เช่นเดียวกับสัตว์สี่ขา หลายชนิด มีความสามารถในการตรวจจับทิศทางในแนวนอนได้ดี แต่ไม่ค่อยเก่งในทิศทางแนวตั้ง เนื่องจากหูวางอยู่สมมาตรกันนกฮูก บางชนิด มีหูวางอยู่ไม่สมมาตร และสามารถตรวจจับเสียงได้ในระนาบทั้งสาม ซึ่งเป็นการปรับตัวเพื่อล่าสัตว์เลี้ยงลูกด้วยนมขนาดเล็กในที่มืด^{[ 13 ]}

เอฟเฟกต์การบดบัง

สมมติว่าผู้ฟังสามารถได้ยินสัญญาณเสียงหนึ่งๆ ได้ภายใต้สภาวะเงียบสนิท เมื่อมีสัญญาณเสียงหนึ่งเล่นพร้อมกับเสียงอีกเสียงหนึ่ง สัญญาณเสียงนั้นจะต้องแรงกว่าเพื่อให้ผู้ฟังได้ยิน สัญญาณรบกวนนั้นเรียกว่า ตัวบดบัง (masker)และการฟังที่ถูกขัดขวางเรียกว่าการบดบัง (masking ) ตัวบดบังไม่จำเป็นต้องมีส่วนประกอบความถี่ของสัญญาณเสียงต้นฉบับเพื่อให้เกิดการบดบัง สัญญาณที่ถูกบดบังยังคงได้ยินได้แม้ว่าจะอ่อนกว่าตัวบดบัง การบดบังเกิดขึ้นเมื่อสัญญาณเสียงและตัวบดบังเล่นพร้อมกัน เช่น เมื่อคนหนึ่งกระซิบขณะที่อีกคนหนึ่งตะโกน และผู้ฟังจะไม่ได้ยินสัญญาณเสียงที่อ่อนกว่าเนื่องจากถูกบดบังด้วยตัวบดบังที่ดังกว่า การบดบังยังสามารถเกิดขึ้นกับสัญญาณเสียงก่อนที่ตัวบดบังจะเริ่มหรือหลังจากที่ตัวบดบังหยุดลง ตัวอย่างเช่น เสียงปรบมือดังๆ อย่างกะทันหันสามารถทำให้เสียงที่อยู่ก่อนหน้าหรือหลังจากนั้นไม่ได้ยินได้ทันที ผลของการบดบังย้อนหลังนั้นอ่อนกว่าการบดบังไปข้างหน้า^{[ 10 ]} ผลกระทบของการบดบังได้รับการศึกษาอย่างกว้างขวางในการวิจัยด้านจิตวิทยาเสียงและถูกนำไปใช้ในการเข้ารหัสเสียง แบบ สูญเสีย เช่นMP3

ขาดพื้นฐานที่สำคัญ

เมื่อนำเสนอชุดความถี่ฮาร์มอนิกในความสัมพันธ์ 2f , 3f , 4f , 5f เป็นต้น (โดยที่fเป็นความถี่เฉพาะ) มนุษย์มักจะรับรู้ว่าระดับเสียงคือfตัวอย่างที่ได้ยินสามารถพบได้ใน YouTube ^{[ 14 ]}

ดนตรี

จิตวิทยาเสียงประกอบด้วยหัวข้อและการศึกษาที่เกี่ยวข้องกับจิตวิทยาดนตรีและการบำบัดด้วยดนตรีนักทฤษฎีเช่นเบนจามิน โบเรตซ์ถือว่าผลลัพธ์บางอย่างของจิตวิทยาเสียงมีความหมายเฉพาะในบริบททางดนตรีเท่านั้น^{[ 15 ]}

แผ่นเสียง ชุด EnvironmentsของIrv Teibel (พ.ศ. 2512–2512) เป็นตัวอย่างแรกๆ ของเสียงที่วางจำหน่ายในเชิงพาณิชย์ซึ่งเผยแพร่เพื่อเสริมสร้างความสามารถทางจิตวิทยาโดยเฉพาะ^{[ 16 ]}

จิตวิทยาเสียงประยุกต์

จิตวิทยาเสียงมีความสัมพันธ์ที่เกื้อกูลกันมายาวนานกับวิทยาศาสตร์คอมพิวเตอร์เจซีอาร์ ลิคไลเดอร์และบ็อบ เทย์เลอร์ผู้บุกเบิกอินเทอร์เน็ตต่างก็สำเร็จการศึกษาระดับปริญญาโทด้านจิตวิทยาเสียง ในขณะที่บริษัท บีบีเอ็น เทคโนโลยีส์เดิมทีเชี่ยวชาญด้านการให้คำปรึกษาเกี่ยวกับประเด็นด้านเสียง ก่อนที่จะเริ่มสร้างเครือข่ายแบบแพ็กเก็ตสวิตช์ เป็นครั้ง แรก

Licklider เขียนบทความชื่อ "ทฤษฎีคู่ของการรับรู้ระดับเสียง" ^{[ 17 ]}

จิตวิทยาเสียงถูกนำไปประยุกต์ใช้ในหลายสาขาของการพัฒนาซอฟต์แวร์ โดยนักพัฒนาจะแมปรูปแบบทางคณิตศาสตร์ที่ได้รับการพิสูจน์แล้วและรูปแบบทดลองในการประมวลผลสัญญาณดิจิทัล ตัวแปลงสัญญาณการบีบอัดเสียงหลายตัว เช่นMP3และOpusใช้แบบจำลองจิตวิทยาเสียงเพื่อเพิ่มอัตราส่วนการบีบอัด ความสำเร็จของระบบเสียงแบบดั้งเดิมสำหรับการเล่นดนตรีในโรงละครและบ้านสามารถนำมาอ้างอิงถึงจิตวิทยาเสียงได้^{[ 18 ]}และการพิจารณาจิตวิทยาเสียงทำให้เกิดระบบเสียงแบบใหม่ เช่นการสังเคราะห์สนามเสียง จิตวิทยา เสียง^{[ 19 ]}นอกจากนี้ นักวิทยาศาสตร์ยังได้ทดลองสร้างอาวุธเสียงแบบใหม่ซึ่งปล่อยความถี่ที่อาจทำให้เกิดความเสียหาย บาดเจ็บ หรือเสียชีวิตได้ แต่ประสบความสำเร็จในระดับจำกัด^{[ 20 ]}จิตวิทยาเสียงยังถูกนำมาใช้ใน การสร้าง เสียงเพื่อทำให้มิติข้อมูลอิสระหลายมิติสามารถได้ยินและตีความได้ง่าย^{[ 21 ]}ซึ่งช่วยให้สามารถแนะนำด้วยเสียงได้โดยไม่จำเป็นต้องใช้เสียงเชิงพื้นที่ และในเกมคอมพิวเตอร์แบบสร้างเสียง^[²²^]และแอปพลิเคชันอื่นๆ เช่น การบิน โดรนและ การ ผ่าตัดนำทางด้วยภาพ^[²³^]ปัจจุบันนี้ยังมีการนำไปใช้ในดนตรีด้วย โดยนักดนตรีและศิลปินยังคงสร้างประสบการณ์การฟังใหม่ๆ โดยการบดบังความถี่ที่ไม่ต้องการของเครื่องดนตรี ทำให้ความถี่อื่นๆ ถูกเน้นให้เด่นชัดขึ้น การประยุกต์ใช้อีกประการหนึ่งคือการออกแบบลำโพงขนาดเล็กหรือคุณภาพต่ำ ซึ่งสามารถใช้ปรากฏการณ์ของความถี่พื้นฐานที่หายไปเพื่อสร้างเอฟเฟกต์ของเสียงเบสที่ความถี่ต่ำกว่าที่ลำโพงสามารถสร้างได้ (ดูเอกสารอ้างอิง)

ผู้ผลิตรถยนต์ออกแบบเครื่องยนต์และแม้แต่ประตูเพื่อให้มีเสียงที่เฉพาะเจาะจง^{[ 24 ]}

การเข้ารหัสเสียงเชิงรับรู้

แบบจำลองทางจิตวิทยาเสียงช่วยให้ การบีบอัดสัญญาณเสียงแบบสูญเสียคุณภาพสูงโดยอธิบายว่าส่วนใดของสัญญาณเสียงดิจิทัลที่กำหนดสามารถลบออกหรือสร้างขึ้นใหม่ด้วยคุณภาพที่ลดลงโดยไม่สูญเสียคุณภาพเสียงที่รับรู้ได้อย่างมีนัยสำคัญ สิ่งนี้มีประโยชน์อย่างมากต่ออัตราส่วนการบีบอัดโดยรวม และการวิเคราะห์ทางจิตวิทยาเสียงมักนำไปสู่ไฟล์เพลงที่บีบอัดแล้วซึ่งมีขนาดเพียงหนึ่งในสิบถึงหนึ่งในสิบสองของไฟล์ต้นฉบับคุณภาพสูง แต่มีการสูญเสียคุณภาพในสัดส่วนที่น้อยกว่าอย่างเห็นได้ชัด การบีบอัดดังกล่าวเป็นคุณลักษณะของรูปแบบการบีบอัดเสียงแบบสูญเสียในปัจจุบันเกือบทั้งหมด บางรูปแบบเหล่านี้ได้แก่Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (ใช้สำหรับการออกอากาศเสียงดิจิทัลในหลายประเทศ) และATRACซึ่งเป็นการบีบอัดที่ใช้ในMiniDiscและWalkman บาง รุ่น

จิตวิทยาการได้ยินนั้นอาศัยพื้นฐานทางกายวิภาคของมนุษย์ เป็นอย่างมาก โดยเฉพาะอย่างยิ่งข้อจำกัดของหูในการรับรู้เสียงดังที่ได้กล่าวไว้ก่อนหน้านี้ สรุปได้ว่า ข้อจำกัดหลักๆ มีดังนี้:

ขีดจำกัดความถี่สูง
เกณฑ์การได้ยินสัมบูรณ์
การปิดกั้นทางเวลา (การปิดกั้นไปข้างหน้า การปิดกั้นย้อนกลับ)
การปิดกั้นสัญญาณพร้อมกัน (หรือที่เรียกว่าการปิดกั้นสัญญาณสเปกตรัม)

อัลกอริทึมการบีบอัดสามารถกำหนดลำดับความสำคัญต่ำกว่าให้กับเสียงที่อยู่นอกช่วงการได้ยินของมนุษย์ และลดความแม่นยำของความถี่ต่างๆ ตามระดับการบดบังที่คาดการณ์ไว้ โดยการค่อยๆ ย้ายบิตออกจากส่วนประกอบที่ไม่สำคัญไปยังส่วนประกอบที่สำคัญ อัลกอริทึมนี้จะช่วยให้มั่นใจได้ว่าเสียงที่ผู้ฟังมีแนวโน้มที่จะรับรู้ได้มากที่สุดนั้นจะถูกแสดงผลได้อย่างแม่นยำที่สุด

ตัวเข้ารหัสเสียงจะวิเคราะห์เสียงโดยใช้แบบจำลองการรับรู้ (แบบจำลองทางจิตวิทยาเสียง) เพื่อคำนวณความแม่นยำที่ต้องการต่อย่านความถี่หรือช่วงเวลา ผลลัพธ์ของการคำนวณนี้จะถูกนำไปใช้ในการปรับความแม่นยำในการเข้ารหัสตามความถี่และเวลาผ่านชุดเครื่องมือการเข้ารหัสซึ่งขึ้นอยู่กับรูปแบบการเข้ารหัสเสียง เนื่องจากรูปแบบต่างๆ รองรับเครื่องมือการเข้ารหัสที่แตกต่างกัน

ตัวอย่างของเครื่องมือเขียนโค้ดดังกล่าว ได้แก่:

ในตัวเข้ารหัสหลายๆ ตัว อัลกอริทึมควบคุมอัตราจะช่วยให้มั่นใจได้ว่าอัตราบิตของเสียงที่เข้ารหัสแล้วนั้นอยู่ในขอบเขตที่กำหนดไว้ หาก ไม่สามารถเข้ารหัสแบบ โปร่งใสได้ที่อัตราบิตเป้าหมาย อัลกอริทึมควบคุมอัตราจะปรับความแม่นยำในการเข้ารหัส (และทำให้เกิดการบิดเบือน) ในส่วนต่างๆ ของสเปกตรัมเสียง โดยใช้ข้อมูลที่คำนวณจากแบบจำลองทางจิตวิทยาการได้ยินเป็นแนวทาง จนกว่าจะสามารถตรงกับอัตราบิตเป้าหมายได้

ดูเพิ่มเติม

การถ่วงน้ำหนักแบบ A ซึ่ง เป็นฟังก์ชันการถ่ายโอนความดังที่รับรู้ได้ซึ่งใช้กันทั่วไป
การทดสอบ ABX
โสตวิทยา
การวิเคราะห์ฉากเสียงรวมถึงการรับรู้เสียงสามมิติและการระบุตำแหน่ง
บีนาอูรัลบีทส์
เสียง ขูดกระดานดำเสียงเล็บขูดกระดานดำ
แบนด์วิดท์สี่เหลี่ยมผืนผ้าเทียบเท่า (ERB)
ผลกระทบต่อสุขภาพจากเสียงดัง
ปรากฏการณ์ไฮเปอร์โซนิก
การประมวลผลภาษาในสมอง
มิโซโฟเนีย
การปรับแต่งดนตรี
ผลกระทบจากลำดับความสำคัญ
จิตวิทยาภาษาศาสตร์
ทฤษฎีอัตรา-ความบิดเบือน
การแยกสัญญาณ
การบดบังเสียง
การรับรู้คำพูด
การรู้จำเสียงพูด
ทิมเบอร์

ลิงก์ภายนอก

หูที่ได้ยินเสียงดนตรี—การรับรู้เสียงในWayback Machine (เก็บถาวรเมื่อ 25 ธันวาคม 2005)
มึลเลอร์ ซี, ชไนเดอร์ พี, เพอร์สเตอเรอร์ เอ, โอพิทซ์ เอ็ม, เนฟโจโดวา เอ็มวี, เบอร์เกอร์ เอ็ม (1993) "จิตอะคูสติกประยุกต์ในการบินอวกาศ" เวียน เมด วอเชนชร์ (เยอรมัน) 143 ( 23– 24): 633– 5. PMID 8178525 .—การจำลองการได้ยินในสภาพแวดล้อมเปิดโดยใช้หูฟัง
การปิดบังชั่วคราว
แนวคิดไฮเปอร์ฟิสิกส์—เสียงและการได้ยิน

[

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[

[

[ 24 ]