MPEG-1 เลเยอร์เสียง II

Q: อัตราการส่งข้อมูลแปรผัน

เสียง MPEG อาจมี อัตราบิตแปรผัน (VBR) แต่ไม่ได้รับการสนับสนุนอย่างแพร่หลาย เลเยอร์ II สามารถใช้วิธีที่เรียกว่าการสลับอัตราบิตได้ แต่ละเฟรมอาจถูกสร้างขึ้นด้วยอัตราบิตที่แตกต่างกัน [ 12 ] [ 13 ] ตามมาตรฐาน ISO/IEC 11172-3:1993 มาตรา 2.4.2.

MPEG-1 เลเยอร์เสียง II
MPEG-1 เลเยอร์เสียง II
นามสกุลไฟล์	.mp2, .mpa, .m2a, .mp2a
สื่อประเภทอินเทอร์เน็ต	เสียง/mpeg, เสียง/MPA
พัฒนาโดย	ฟิลิปส์และบริษัทอื่นๆ
การเผยแพร่ครั้งแรก	6 ธันวาคม พ.ศ. 2534
รุ่นล่าสุด	ISO/IEC 13818-3:1998 เมษายน 1998
ประเภทของรูปแบบ	ไฟล์เสียงแบบบีบอัด
บรรจุโดย	อีเอ็มเคอีเอส
มาตรฐาน	ISO/IEC 11172-3 , ISO/IEC 13818-3
รูปแบบเปิด ?	ใช่
รูปแบบฟรีใช่ไหม?	สิทธิบัตรที่หมดอายุ
เว็บไซต์	mpeg.chiariglione.org/standards/mpeg-1/audio.html

MP2 (อย่างเป็นทางการคือMPEG-1 Audio Layer IIหรือMPEG-2 Audio Layer IIบางครั้งเรียกอย่างไม่ถูกต้องว่าMusicam ) ^{[ 7 ]}เป็นรูปแบบการบีบอัดเสียง แบบสูญเสียข้อมูล ได้รับการกำหนดมาตรฐานให้เป็นหนึ่งในสามตัวแปลงสัญญาณเสียงของMPEG-1ควบคู่ไปกับMPEG-1 Audio Layer I (MP1) และMPEG-1 Audio Layer III (MP3) ตัวย่อ MP2 ยังใช้เป็นนามสกุลไฟล์ ทั่วไป สำหรับไฟล์ที่มีข้อมูลเสียงประเภทนี้ หรือรูปแบบที่ขยายเพิ่มเติมคือ MPEG-2 Audio Layer II

MPEG-1 Audio Layer II ได้รับการพัฒนาโดยPhilips , CCETTและIRTในรูปแบบอัลกอริธึม MUSICAM ซึ่งเป็นส่วนหนึ่งของ โครงการ Digital Audio Broadcasting (DAB) ที่ได้รับทุนสนับสนุนจากยุโรป ^{[ 8 ]}นอกเหนือจากการใช้งานในการออกอากาศ DAB แล้ว ตัวแปลงสัญญาณนี้ยังถูกนำมาใช้เป็นรูปแบบเสียงมาตรฐานสำหรับ สื่อ Video CDและSuper Video CDรวมถึงHDVด้วย^{[ 9 ]}ในทางกลับกัน MP3 (ซึ่งได้รับการพัฒนาโดยความร่วมมือของคู่แข่งที่นำโดยFraunhofer Societyที่เรียกว่า ASPEC) ได้รับการยอมรับอย่างกว้างขวางมากขึ้นสำหรับ แอปพลิเคชันบน พีซีและอินเทอร์เน็ต MP2 มีอัตราการบีบอัดข้อมูล ต่ำ กว่า MP3 แต่ก็ใช้ทรัพยากรการคำนวณน้อยกว่าเช่นกัน^{[ 10 ]}

ข้อกำหนดทางเทคนิค

MPEG-1 Audio Layer II ถูกกำหนดไว้ใน ISO/IEC 11172-3 (MPEG-1 Part 3)

อัตราการสุ่มตัวอย่าง : 32, 44.1 และ 48 kHz
อัตราการส่งข้อมูล : 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 และ 384 กิโลบิต/วินาที

ส่วนขยายได้รับการจัดเตรียมไว้ใน MPEG-2 Audio Layer II และกำหนดไว้ใน ISO/IEC 13818-3 (MPEG-2 Part 3) ^{[ 11 ]}^{[ 12 ]}

อัตราการสุ่มตัวอย่างเพิ่มเติม: 16, 22.05 และ 24 kHz
อัตราการส่งข้อมูลเพิ่มเติม: 8, 16, 24, 40 และ 144 กิโลบิต/วินาที
รองรับระบบเสียงหลายช่องสัญญาณ – สูงสุด 5 ช่องสัญญาณเสียงแบบเต็มช่วง และช่องสัญญาณ LFE (ช่องสัญญาณเพิ่มประสิทธิภาพความถี่ต่ำ)

รูปแบบนี้ใช้เฟรมดิจิทัลต่อเนื่องกัน โดยมีช่วงเวลาการสุ่มตัวอย่าง 1152 ช่วง และมีรูปแบบที่เป็นไปได้สี่แบบ:

รูปแบบโมโน
รูปแบบสเตอริโอ
รูปแบบสเตอริโอร่วมที่เข้ารหัสความเข้ม (ไม่เกี่ยวข้องกับสเตอริโอ)
รูปแบบสองช่องสัญญาณ (ไม่สัมพันธ์กัน)

อัตราการส่งข้อมูลแปรผัน

เสียง MPEG อาจมีอัตราบิตแปรผัน (VBR) แต่ไม่ได้รับการสนับสนุนอย่างแพร่หลาย เลเยอร์ II สามารถใช้วิธีที่เรียกว่าการสลับอัตราบิตได้ แต่ละเฟรมอาจถูกสร้างขึ้นด้วยอัตราบิตที่แตกต่างกัน^{[ 12 ]}^{[ 13 ]} ตามมาตรฐาน ISO/IEC 11172-3:1993 มาตรา 2.4.2.3: เพื่อให้เกิดความล่าช้าและความซับซ้อนน้อยที่สุด ตัวถอดรหัส (เสียง MPEG) ไม่จำเป็นต้องรองรับอัตราบิตแปรผันอย่างต่อเนื่องเมื่ออยู่ในเลเยอร์ I หรือ II ^{[ 14 ]}

MPEG-2 เลเยอร์เสียง II

แม้ว่าโดยทั่วไปแล้วคำว่า MP2 และนามสกุลไฟล์.mp2จะหมายถึงข้อมูล MPEG-1 Audio Layer II แต่ก็อาจหมายถึง MPEG-2 Audio Layer II ได้เช่นกัน ซึ่งเป็นส่วนขยายที่เข้ากันได้กับเวอร์ชันก่อนหน้าเป็นส่วนใหญ่ โดยเพิ่มการรองรับเสียงหลายช่องสัญญาณ การเข้ารหัส อัตราบิตแปรผันและอัตราการสุ่มตัวอย่างเพิ่มเติม ซึ่งกำหนดไว้ใน ISO/IEC 13818-3 ซึ่งเป็นส่วนหนึ่งของมาตรฐาน MPEG-2

เทคนิค

MP2 เป็นตัวเข้ารหัสเสียงแบบซับแบนด์ซึ่งหมายความว่าการบีบอัดเกิดขึ้นในโดเมนเวลาโดยใช้ฟิลเตอร์แบงค์ที่มีความล่าช้าต่ำ ทำให้เกิดส่วนประกอบในโดเมนความถี่ 32 ส่วน ในทางตรงกันข้ามMP3เป็นตัวเข้ารหัสเสียงแบบทรานส์ฟอร์มที่มีฟิลเตอร์แบงค์แบบไฮบริด ซึ่งหมายความว่าการบีบอัดเกิดขึ้นในโดเมนความถี่หลังจากการแปลงแบบไฮบริด (สองชั้น) จากโดเมนเวลา MPEG Audio Layer II เป็นอัลกอริทึมหลักของมาตรฐาน MP3 คุณลักษณะทางจิตวิทยาเสียงและโครงสร้างรูปแบบเฟรมทั้งหมดของรูปแบบ MP3 มาจากอัลกอริทึมและรูปแบบ MP2 พื้นฐาน

ตัวเข้ารหัส MP2 อาจใช้ประโยชน์จากความซ้ำซ้อนระหว่างช่องสัญญาณโดยใช้การเข้ารหัสความเข้ม "สเตอริโอร่วม" ที่เป็นตัวเลือก เช่นเดียวกับ MP3, MP2 เป็นรูปแบบการเข้ารหัสแบบรับรู้ ซึ่งหมายความว่ามันจะลบข้อมูลที่ระบบการได้ยินของมนุษย์ไม่สามารถรับรู้ได้ง่าย ในการเลือกข้อมูลที่จะลบ สัญญาณเสียงจะถูกวิเคราะห์ตามแบบจำลองทางจิตวิทยาการได้ยิน ซึ่งคำนึงถึงพารามิเตอร์ของระบบการได้ยินของมนุษย์ การวิจัยทางจิตวิทยาการได้ยินแสดงให้เห็นว่า หากมีสัญญาณที่แรงในความถี่หนึ่ง สัญญาณที่อ่อนกว่าในความถี่ใกล้เคียงกับความถี่ของสัญญาณที่แรงนั้น ระบบการได้ยินของมนุษย์จะไม่สามารถรับรู้ได้ สิ่งนี้เรียกว่าการบดบังความถี่ ตัวแปลงสัญญาณเสียงแบบรับรู้ใช้ประโยชน์จากการบดบังความถี่นี้โดยการละเลยข้อมูลที่ความถี่ที่ถือว่าไม่สามารถรับรู้ได้ ทำให้สามารถจัดสรรข้อมูลมากขึ้นสำหรับการสร้างความถี่ที่รับรู้ได้

MP2 แบ่งสัญญาณเสียงขาเข้าออกเป็น 32 ย่านความถี่ และหากเสียงในย่านความถี่ใดถือว่าไม่สามารถรับรู้ได้ ย่านความถี่นั้นจะไม่ถูกส่งไป ในทางกลับกัน MP3 แปลงสัญญาณเสียงขาเข้าให้อยู่ในโดเมนความถี่โดยมีส่วนประกอบความถี่ 576 ส่วน ดังนั้น MP3 จึงมีความละเอียดของความถี่สูงกว่า MP2 ซึ่งช่วยให้สามารถนำแบบจำลองทางจิตวิทยาการได้ยินมาใช้ได้อย่างเลือกสรรมากกว่า MP2 ดังนั้น MP3 จึงมีขอบเขตที่กว้างกว่าในการลดอัตราบิต

การใช้ เครื่องมือ เข้ารหัสเอนโทรปี เพิ่มเติม และความแม่นยำของความถี่ที่สูงขึ้น (เนื่องจากจำนวนแถบความถี่ย่อยที่ MP3 ใช้มีมากกว่า) อธิบายได้ว่าทำไม MP3 จึงไม่จำเป็นต้องมีอัตราบิตสูงเท่า MP2 เพื่อให้ได้คุณภาพเสียงที่ยอมรับได้ ในทางกลับกัน MP2 แสดงพฤติกรรมที่ดีกว่า MP3 ในโดเมนเวลา เนื่องจากความละเอียดของความถี่ที่ต่ำกว่า ซึ่งหมายถึงความล่าช้าของตัวแปลงสัญญาณน้อยลง—ซึ่งสามารถทำให้การแก้ไขเสียงง่ายขึ้น—รวมถึง "ความทนทาน" และความต้านทานต่อข้อผิดพลาดที่อาจเกิดขึ้นระหว่าง กระบวนการ บันทึกดิจิทัลหรือระหว่างข้อผิดพลาดในการส่งข้อมูล

ชุดฟิลเตอร์ย่อยของ MP2 ยังมีคุณสมบัติ " การปกปิดสัญญาณ รบกวนชั่วคราว " โดยธรรมชาติ เนื่องมาจากเอฟเฟกต์การปกปิดสัญญาณรบกวนชั่วคราวเฉพาะของฟิลเตอร์หลัก คุณลักษณะเฉพาะนี้ของตระกูลเสียง MPEG-1 บ่งบอกถึงคุณภาพเสียงที่ดีมากสำหรับสัญญาณเสียงที่มีการเปลี่ยนแปลงพลังงานอย่างรวดเร็ว เช่น เสียงกระทบ เนื่องจากทั้งรูปแบบ MP2 และ MP3 ใช้ชุดฟิลเตอร์ย่อยพื้นฐานเดียวกัน ทั้งสองรูปแบบจึงได้รับประโยชน์จากคุณลักษณะนี้

การประยุกต์ใช้ MP2

การถ่ายทอดสด

MPEG-1 Audio Layer II เป็นรูปแบบเสียงที่ใช้ในระบบกระจายเสียงดิจิทัล (DAB) ซึ่งเป็นมาตรฐานสำหรับการออกอากาศ บริการวิทยุเสียงดิจิทัลที่ได้รับการยอมรับในหลายภูมิภาคทั่วโลก แผนกวิจัยและพัฒนา ของ BBCระบุว่าอย่างน้อย 192 กิโลบิต/วินาที เป็นสิ่งจำเป็นสำหรับ การออกอากาศสเตอริโอ ที่มีความคมชัดสูง :

ค่า 256 กิโลบิต/วินาที ถือว่าให้คุณภาพสัญญาณกระจายเสียงสเตอริโอสูง อย่างไรก็ตาม การลดลงเล็กน้อยเหลือ 224 กิโลบิต/วินาที มักจะเพียงพอ และในบางกรณีอาจยอมรับการลดลงเพิ่มเติมเหลือ 192 กิโลบิต/วินาที โดยเฉพาะอย่างยิ่งหากมีการใช้ประโยชน์จากความซ้ำซ้อนในสัญญาณสเตอริโอโดยกระบวนการเข้ารหัสแบบ 'สเตอริโอร่วม' (เช่น เสียงบางเสียงที่ปรากฏอยู่ตรงกลางภาพสเตอริโอไม่จำเป็นต้องส่งซ้ำสองครั้ง) ที่ความเร็ว 192 กิโลบิต/วินาที จะสามารถได้ยินข้อบกพร่องในเนื้อหาเสียงที่สำคัญได้ค่อนข้างง่าย

— เอกสารวิจัยของ BBC R&D WHP 061 มิถุนายน 2546 ^{[ 15 ]}

ณ ปี 2025 MPEG-1 Audio Layer II ยังคงมีการใช้งานอย่างแพร่หลายในสหราชอาณาจักรสำหรับการออกอากาศ DAB มาตรฐาน DAB+ ที่ใหม่กว่าซึ่งปัจจุบันแพร่หลายในยุโรปและภูมิภาคอื่นๆ ไม่ได้ใช้ MP2 แต่ใช้HE-AACแทน MP2 ยังถูกนำมาใช้เป็นรูปแบบเสียงที่ใช้โดย การออกอากาศ Astra Digital Radio (ADR) และโดย มาตรฐาน Multimedia Home Platform (DVB-MHP) สำหรับกล่องรับสัญญาณ MP2 ยังถูกใช้ควบคู่กับDolby Digital (AC3)ในสตรีมเสียงสำหรับการออกอากาศDVB บางรายการ ^{[ 16 ]}

MPEG-1 Audio Layer II นิยมใช้ในอุตสาหกรรมการออกอากาศสำหรับการกระจายเสียงสดผ่านดาวเทียม ISDN และเครือข่าย IP รวมถึงการจัดเก็บเสียงในระบบเล่นเสียงดิจิทัล ตัวอย่างเช่น ระบบกระจายรายการ PRSS Content Depot ของNPR Content Depot กระจายเสียง MPEG-1 L2 ในรูปแบบไฟล์ Broadcast Wave File MPEG2 ที่มีส่วนหัว RIFF (ใช้ใน) ถูกกำหนดไว้ในมาตรฐาน RIFF/WAV ดังนั้น Windows Media Player จึงสามารถเล่นไฟล์ Content Depot ได้โดยตรง แต่โปรแกรมเล่นวิดีโอที่ไม่ฉลาดนักมักจะเล่นไม่ได้ เนื่องจากกระบวนการเข้ารหัสและถอดรหัสจะใช้ทรัพยากร CPU อย่างมากในระบบเล่นเสียงออกอากาศรุ่นแรกๆ ระบบเล่นเสียงออกอากาศระดับมืออาชีพจึงมักใช้โคเด็กในฮาร์ดแวร์ เช่น การมอบหมายงานเข้ารหัสและถอดรหัสให้กับการ์ดเสียงที่เข้ากันได้แทนที่จะเป็น CPU ของระบบ .wav.wav

สื่อกระจายและบันทึกได้

MPEG-1 Audio Layer II เป็นรูปแบบเสียงมาตรฐานที่ใช้ใน แผ่น Video CDและSuper Video CD (VCD และ SVCD ยังรองรับอัตราบิตแปรผันและMPEG Multichannelที่เพิ่มเข้ามาใน MPEG-2) เครื่องเล่น DVD-Videoใน ประเทศที่ใช้ระบบ PAL ทุก เครื่องมีตัวถอดรหัส MP2 แบบสเตอริโอ ทำให้ MP2 เป็นคู่แข่งที่เป็นไปได้ของDolby Digital (AC3)ในตลาดเหล่านี้ เครื่องเล่น DVD-Video ใน ประเทศที่ ใช้ระบบ NTSCไม่จำเป็นต้องถอดรหัสเสียง MP2 แม้ว่าส่วนใหญ่จะทำก็ตาม ในขณะที่เครื่องบันทึก DVD บางเครื่อง จัดเก็บเสียงในรูปแบบ MP2 และ DVD ที่ผู้บริโภคสร้างขึ้นเองจำนวนมากใช้รูปแบบนี้ แต่ DVD เชิงพาณิชย์ที่มีซาวด์แทร็ก MP2 นั้นหายาก

MPEG-1 Audio Layer II เป็นรูปแบบเสียงที่ใช้ในกล้องวิดีโอ HDV ด้วยเช่นกัน

ตัวเข้ารหัสและตัวถอดรหัส

ซอฟต์แวร์ เข้ารหัส MPEG-1 Audio Layer II (MP2) ได้แก่TooLAME , MP2ENC (Wav2mp), QDesign Imedia 2 และอื่นๆ^{[ 17 ]} CDexและExact Audio Copy เป็นซอฟต์แวร์ ริปซีดีบางส่วนที่สามารถเข้ารหัสเป็น MP2 ได้^{[ 17 ]} ซอฟต์แวร์ เล่นมีเดียสมัยใหม่หลายตัว^{สามารถ}เล่นไฟล์ MP2 ได้ รวมถึงWinamp , VLC , Windows Media Player , MusicBeeและiTunes ^[¹⁸ ]

ไฟล์ MP2 สามารถใช้งานร่วมกับ เครื่องเล่นเสียงดิจิทัล (เครื่องเล่น MP3) บางรุ่น แต่ไม่ใช่ทุกรุ่น

ประวัติการพัฒนา

มิวสิแคม

การเข้ารหัส MPEG-1 Audio Layer 2 พัฒนามาจาก ตัวแปลงสัญญาณเสียงMUSICAM ( Masking pattern adapted Universal Subband Integrated Coding And Multiplexing ) ซึ่งพัฒนาโดย Centre commun d'études de télévision et télécommunications (CCETT), PhilipsและInstitut für Rundfunktechnik (IRT) ในปี 1989 โดยเป็นส่วนหนึ่งของโครงการ วิจัยและพัฒนา EUREKA 147ระดับยุโรป ซึ่งเป็นโครงการความร่วมมือระหว่างรัฐบาลเพื่อพัฒนาระบบสำหรับการออกอากาศเสียงและข้อมูลไปยังเครื่องรับแบบติดตั้งอยู่กับที่ แบบพกพา หรือแบบเคลื่อนที่ (ก่อตั้งขึ้นในปี 1987)

เริ่มต้นจาก โครงการ Digital Audio Broadcast (DAB) ที่จัดการโดย Egon Meier-Engelen จาก Deutsche Forschungs- und Veruchsanstalt für Luft- und Raumfahrt (ต่อมาเรียกว่า Deutsches Zentrum für Luft- und Raumfahrt, ศูนย์การบินและอวกาศเยอรมัน) ในเยอรมนี ประชาคมยุโรปให้ทุนสนับสนุนโครงการนี้ ซึ่งรู้จักกันทั่วไปในชื่อ EU-147 ตั้งแต่ปี 1987 ถึง 1994 โดยเป็นส่วนหนึ่งของโครงการวิจัย ของ EUREKA

ระบบ Eureka 147 ประกอบด้วยองค์ประกอบหลัก 3 ส่วน ได้แก่ การเข้ารหัสเสียง MUSICAM ( การเข้ารหัสและการมัลติเพล็กซ์แบบบูรณาการซับแบนด์สากลในรูปแบบการบดบัง ) การเข้ารหัสและการมัลติเพล็กซ์การส่งสัญญาณ และการมอดูเลชั่น COFDM ^{[ 19 ]}

MUSICAM เป็นหนึ่งในตัวแปลงสัญญาณไม่กี่ตัวที่สามารถให้คุณภาพเสียงสูงที่อัตราบิตในช่วง 64 ถึง 192 กิโลบิต/วินาทีต่อช่องสัญญาณโมโนโฟนิก ได้รับการออกแบบมาเพื่อตอบสนองความต้องการทางเทคนิคของแอปพลิเคชันส่วนใหญ่ (ในด้านการออกอากาศ โทรคมนาคม และการบันทึกบนสื่อจัดเก็บข้อมูลดิจิทัล) — ความล่าช้าต่ำ ความซับซ้อนต่ำ ความทนทานต่อข้อผิดพลาด หน่วยการเข้าถึงสั้น ฯลฯ^{[ 20 ]}^{[ 21 ]}

MUSICAM ซึ่งเป็นรูปแบบและเทคโนโลยีต้นแบบของ MP3 นั้น ใช้การแปลงซับแบนด์ 32 แถบความถี่ด้วยเลขคณิตจำนวนเต็ม โดยอาศัยแบบจำลองทางจิตวิทยาการได้ยิน โดยได้รับการออกแบบมาเพื่อการออกอากาศเสียงดิจิทัลและโทรทัศน์ดิจิทัลเป็นหลัก และได้รับการเปิดเผยโดย CCETT (ฝรั่งเศส) และ IRT (เยอรมนี) ในเมืองแอตแลนตา ระหว่างการประชุม IEEE-ICASSP ^{[ 22 ]}ตัวแปลงสัญญาณนี้ซึ่งรวมอยู่ในระบบกระจายเสียงโดยใช้การมอดูเลชั่น COFDM ได้รับการสาธิตทางอากาศและภาคสนาม^{[ 23 ]}ร่วมกับRadio CanadaและCRC Canadaระหว่างงาน NAB (ลาสเวกัส) ในปี 1991 การใช้งานส่วนเสียงของระบบกระจายเสียงนี้ขึ้นอยู่กับตัวเข้ารหัสสองชิป (หนึ่งตัวสำหรับการแปลงซับแบนด์ หนึ่งตัวสำหรับแบบจำลองทางจิตวิทยาเสียงที่ออกแบบโดยทีมของG. Stoll (IRT เยอรมนี) ซึ่งต่อมาเป็นที่รู้จักในชื่อแบบจำลองทางจิตวิทยาเสียง I ในมาตรฐานเสียง ISO MPEG) และตัวถอดรหัสแบบเรียลไทม์โดยใช้ ชิป DSP Motorola 56001 หนึ่งตัว ที่ทำงานด้วยซอฟต์แวร์เลขคณิตจำนวนเต็มที่ออกแบบโดยทีมของYF Dehery ( CCETTฝรั่งเศส) ความเรียบง่ายของตัวถอดรหัสที่เกี่ยวข้อง ประกอบกับคุณภาพเสียงที่สูงของตัวแปลงสัญญาณนี้ ซึ่งใช้ความถี่สุ่มตัวอย่าง 48 kHz เป็นครั้งแรก และรูปแบบอินพุต 20 บิต/ตัวอย่าง (มาตรฐานการสุ่มตัวอย่างสูงสุดที่มีอยู่ในปี 1991 ซึ่งเข้ากันได้กับมาตรฐานสตูดิโออินพุตดิจิทัลระดับมืออาชีพ AES/EBU) เป็นเหตุผลหลักที่ทำให้ต่อมามีการนำคุณลักษณะของ MUSICAM มาใช้เป็นคุณสมบัติพื้นฐานสำหรับตัวแปลงสัญญาณการบีบอัดเพลงดิจิทัลขั้นสูง เช่น MP3

อัลกอริทึมการเข้ารหัสเสียงที่ใช้โดยระบบกระจายเสียงดิจิทัล Eureka 147 (DAB) ได้รับการกำหนดมาตรฐานภายในกลุ่มผู้เชี่ยวชาญด้านภาพยนตร์ ISO/Moving Pictures (MPEG) ในปี 1989–94 ^{[ 24 ]}^{[ 25 ]}การเข้ารหัสเสียง MUSICAM ถูกใช้เป็นพื้นฐานสำหรับรูปแบบการเข้ารหัสบางส่วนของ MPEG-1 และ MPEG-2 Audio ^{[ 26 ]}คุณสมบัติหลักส่วนใหญ่ของ MPEG-1 Audio ได้รับการสืบทอดโดยตรงจาก MUSICAM รวมถึงธนาคารตัวกรอง การประมวลผลโดเมนเวลา ขนาดเฟรมเสียง ฯลฯ อย่างไรก็ตาม มีการปรับปรุง และอัลกอริทึม MUSICAM จริงไม่ได้ถูกนำมาใช้ในมาตรฐาน MPEG-1 Audio Layer II ฉบับสุดท้าย

นับตั้งแต่การกำหนดมาตรฐานเสียง MPEG-1 และ MPEG-2 (ในปี 1992 และ 1994) อัลกอริทึม MUSICAM ดั้งเดิมจึงไม่ถูกนำมาใช้อีกต่อไป^{[ 7 ]}^{[ 27 ]}ชื่อ MUSICAM มักถูกใช้ผิดเมื่อหมายถึง MPEG-1 Audio Layer II ซึ่งอาจทำให้เกิดความสับสนได้ เนื่องจากชื่อ MUSICAM เป็นเครื่องหมายการค้าของบริษัทต่างๆ ในภูมิภาคต่างๆ ทั่วโลก^{[ 7 ]}^{[ 27 ]}^{[ 28 ]} (Musicam เป็นชื่อที่ใช้สำหรับ MP2 ในข้อกำหนดบางประการสำหรับ Astra Digital Radio รวมถึงในเอกสาร DAB ของ BBC ด้วย)

โครงการ Eureka Project 147 ส่งผลให้มีการเผยแพร่มาตรฐานยุโรป ETS 300 401 ในปี 1995 สำหรับ DAB ซึ่งปัจจุบันได้รับการยอมรับทั่วโลก มาตรฐาน DAB ใช้ MPEG-1 Audio Layer II (ISO/IEC 11172-3) สำหรับความถี่การสุ่มตัวอย่าง 48 kHz และ MPEG-2 Audio Layer II (ISO/IEC 13818-3) สำหรับความถี่การสุ่มตัวอย่าง 24 kHz ^{[ 29 ]}

เสียง MPEG

ในช่วงปลายทศวรรษ 1980 กลุ่มผู้เชี่ยวชาญด้านภาพเคลื่อนไหวของISO (MPEG) ได้เริ่มดำเนินการเพื่อสร้างมาตรฐานการเข้ารหัสเสียงและวิดีโอดิจิทัล ซึ่งคาดว่าจะมีการใช้งานที่หลากหลายในการออกอากาศวิทยุและโทรทัศน์ดิจิทัล (ต่อมาคือDAB , DMB , DVB ) และการใช้งานบน CD-ROM (ต่อมาคือVideo CD ) ^[³⁰^]การเข้ารหัสเสียง MUSICAM เป็นหนึ่งใน 14 ข้อเสนอสำหรับมาตรฐานเสียง MPEG-1 ที่ส่งไปยัง ISO ในปี 1989 ^[²¹^]^[²⁶^]

มาตรฐานเสียง MPEG-1 อิงตามรูปแบบเสียง MUSICAM และ ASPEC ที่มีอยู่^{[ 31 ]} มาตรฐาน เสียง MPEG-1ประกอบด้วย "เลเยอร์" เสียงสามชั้น (เทคนิคการเข้ารหัส) ซึ่งปัจจุบันรู้จักกันในชื่อ เลเยอร์ I (MP1), เลเยอร์ II (MP2) และเลเยอร์ III (MP3) อัลกอริทึมทั้งหมดสำหรับ MPEG-1 Audio Layer I, II และ III ได้รับการอนุมัติในปี 1991 ในฐานะร่างคณะกรรมการของ ISO-11172 ^{[ 32 ]}^{[ 33 ]}^{[ 34 ]}และสรุปขั้นสุดท้ายในปี 1992 ^{[ 35 ]}ซึ่งเป็นส่วนหนึ่งของMPEG-1ชุดมาตรฐานแรกของMPEGซึ่งส่งผลให้เกิดมาตรฐานสากลISO / IEC 11172-3 (หรือที่รู้จักกันในชื่อMPEG-1 AudioหรือMPEG-1 Part 3 ) ซึ่งเผยแพร่ในปี 1993 ^{[ 4 ]}งานเพิ่มเติมเกี่ยวกับ MPEG audio ^{[ 36 ]}ได้รับการสรุปขั้นสุดท้ายในปี 1994 ซึ่งเป็นส่วนหนึ่งของชุดมาตรฐาน MPEG ชุดที่สองMPEG-2หรือที่รู้จักอย่างเป็นทางการมากขึ้นในชื่อมาตรฐานสากลISO/IEC 13818-3 (หรือที่รู้จักกันในชื่อMPEG -2 Part 3 หรือ MPEG- 2 Audio ที่เข้ากันได้กับ เวอร์ชันก่อนหน้า หรือMPEG-2 Audio BC ^[³⁷^] ) ซึ่งเผยแพร่ครั้งแรกในปี 1995 ^[⁵^]^[³⁸^] MPEG-2 Part 3 (ISO/IEC 13818-3) กำหนดอัตราบิตและอัตราการสุ่มตัวอย่างเพิ่มเติมสำหรับ MPEG-1 Audio Layer I, II และ III อัตราการสุ่มตัวอย่างใหม่นี้มีค่าเป็นครึ่งหนึ่งของอัตราที่กำหนดไว้เดิมสำหรับ MPEG-1 Audio นอกจากนี้ MPEG-2 Part 3 ยังปรับปรุงเสียงของ MPEG-1 โดยอนุญาตให้เข้ารหัสโปรแกรมเสียงที่มีมากกว่าสองช่องสัญญาณ สูงสุดถึง 5.1 มัลติแชนเนล^[³⁶^]

ส่วนประกอบ Layer III ( MP3 ) ใช้ ขั้นตอนวิธี บีบอัดแบบสูญเสียข้อมูลซึ่งได้รับการออกแบบมาเพื่อลดปริมาณข้อมูลที่จำเป็นในการแสดงผลการบันทึกเสียงและให้เสียงที่ใกล้เคียงกับเสียงต้นฉบับที่ไม่ได้บีบอัดสำหรับผู้ฟังส่วนใหญ่

รางวัลเอ็มมี สาขาวิศวกรรมศาสตร์

CCETT (ฝรั่งเศส), IRT (เยอรมนี) และPhilips (เนเธอร์แลนด์) ได้รับรางวัล Emmy Awardสาขาวิศวกรรมศาสตร์ประจำปี 2000 จากการพัฒนาระบบบีบอัดเสียงดิจิทัลแบบสองช่องสัญญาณที่เรียกว่า Musicam หรือ MPEG Audio Layer II ^{[ 39 ]}^{[ 40 ]}

ดูเพิ่มเติม

สายประถมศึกษา
MP4 (รูปแบบคอนเทนเนอร์)
Musepackเดิมทีพัฒนามาจากไฟล์ MP2 โดยมีการปรับปรุงเพิ่มเติมมากมาย

อ่านเพิ่มเติม

กำเนิดมาตรฐานการเข้ารหัสเสียง MP3 โดย Hans Georg Musmannใน IEEE Transactions on Consumer Electronics, Vol. 52, Nr. 3, pp. 1043–1049, สิงหาคม 2549
บทความเรื่อง "การเข้ารหัสแหล่งที่มาของ MUSICAM" โดย Yves-François Dehery ในการประชุมนานาชาติ AES ครั้งที่ 10 ณ เคนซิงตัน ลอนดอน ประเทศอังกฤษ (7-9 กันยายน 1991) หน้า 71–79

ลิงก์ภายนอก

เว็บไซต์อย่างเป็นทางการ
RFC 3003 – เอกสารที่กำหนดประเภท MIME สำหรับเลเยอร์เสียง MPEG-1 ระดับ II
ประวัติความเป็นมาของไฟล์ MP3 จาก Fraunhofer IIS

[ 1 ]

[ 2 ]

[

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

สามารถ

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[

[

[ 39 ]

[ 40 ]