อ่าน 11 นาที
MPEG-1 เลเยอร์เสียง II
MP2 (อย่างเป็นทางการคือ MPEG-1 Audio Layer II หรือ MPEG-2 Audio Layer II บางครั้งเรียกอย่างไม่ถูกต้องว่า Musicam ) [ 7 ] เป็น รูปแบบการบีบอัดเสียง แบบสูญเสียข้อมูล...
MPEG-1 เลเยอร์เสียง II
| MPEG-1 เลเยอร์เสียง II | |
|---|---|
| นามสกุลไฟล์ | .mp2, .mpa, .m2a, .mp2a |
| สื่อประเภทอินเทอร์เน็ต | |
| พัฒนาโดย | ฟิลิปส์และบริษัทอื่นๆ |
| การเผยแพร่ครั้งแรก | 6 ธันวาคม พ.ศ. 2534 [ 3 ] |
| รุ่นล่าสุด | ISO/IEC 13818-3:1998 เมษายน 1998 |
| ประเภทของรูปแบบ | ไฟล์เสียงแบบบีบอัด |
| บรรจุโดย | อีเอ็มเคอีเอส |
| มาตรฐาน | ISO/IEC 11172-3 , [ 4 ] ISO/IEC 13818-3 [ 5 ] |
| รูปแบบเปิด ? | ใช่ |
| รูปแบบฟรีใช่ไหม? | สิทธิบัตรที่หมดอายุ[ 6 ] |
| เว็บไซต์ | mpeg.chiariglione.org/standards/mpeg-1/audio.html |
MP2 (อย่างเป็นทางการคือMPEG-1 Audio Layer IIหรือMPEG-2 Audio Layer IIบางครั้งเรียกอย่างไม่ถูกต้องว่าMusicam ) [ 7 ]เป็นรูปแบบการบีบอัดเสียงแบบสูญเสียข้อมูล ได้รับการกำหนดมาตรฐานให้เป็นหนึ่งในสามตัวแปลงสัญญาณเสียงของMPEG-1ควบคู่ไปกับMPEG-1 Audio Layer I (MP1) และMPEG-1 Audio Layer III (MP3) ตัวย่อ MP2 ยังใช้เป็นนามสกุลไฟล์ ทั่วไป สำหรับไฟล์ที่มีข้อมูลเสียงประเภทนี้ หรือรูปแบบที่ขยายเพิ่มเติมคือ MPEG-2 Audio Layer II
MPEG-1 Audio Layer II ได้รับการพัฒนาโดยPhilips , CCETTและIRTในรูปแบบอัลกอริธึม MUSICAM ซึ่งเป็นส่วนหนึ่งของ โครงการ Digital Audio Broadcasting (DAB) ที่ได้รับทุนสนับสนุนจากยุโรป [ 8 ]นอกเหนือจากการใช้งานในการออกอากาศ DAB แล้ว ตัวแปลงสัญญาณนี้ยังถูกนำมาใช้เป็นรูปแบบเสียงมาตรฐานสำหรับ สื่อ Video CDและSuper Video CDรวมถึงHDVด้วย[ 9 ]ในทางกลับกัน MP3 (ซึ่งได้รับการพัฒนาโดยความร่วมมือของคู่แข่งที่นำโดยFraunhofer Societyที่เรียกว่า ASPEC) ได้รับการยอมรับอย่างกว้างขวางมากขึ้นสำหรับ แอปพลิเคชันบน พีซีและอินเทอร์เน็ต MP2 มีอัตราการบีบอัดข้อมูล ต่ำ กว่า MP3 แต่ก็ใช้ทรัพยากรการคำนวณน้อยกว่าเช่นกัน[ 10 ]
ข้อกำหนดทางเทคนิค
MPEG-1 Audio Layer II ถูกกำหนดไว้ใน ISO/IEC 11172-3 (MPEG-1 Part 3)
- อัตราการสุ่มตัวอย่าง : 32, 44.1 และ 48 kHz
- อัตราการส่งข้อมูล : 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 และ 384 กิโลบิต/วินาที
ส่วนขยายได้รับการจัดเตรียมไว้ใน MPEG-2 Audio Layer II และกำหนดไว้ใน ISO/IEC 13818-3 (MPEG-2 Part 3) [ 11 ] [ 12 ]
- อัตราการสุ่มตัวอย่างเพิ่มเติม: 16, 22.05 และ 24 kHz
- อัตราการส่งข้อมูลเพิ่มเติม: 8, 16, 24, 40 และ 144 กิโลบิต/วินาที
- รองรับระบบเสียงหลายช่องสัญญาณ – สูงสุด 5 ช่องสัญญาณเสียงแบบเต็มช่วง และช่องสัญญาณ LFE (ช่องสัญญาณเพิ่มประสิทธิภาพความถี่ต่ำ)
รูปแบบนี้ใช้เฟรมดิจิทัลต่อเนื่องกัน โดยมีช่วงเวลาการสุ่มตัวอย่าง 1152 ช่วง และมีรูปแบบที่เป็นไปได้สี่แบบ:
- รูปแบบโมโน
- รูปแบบสเตอริโอ
- รูปแบบสเตอริโอร่วมที่เข้ารหัสความเข้ม (ไม่เกี่ยวข้องกับสเตอริโอ)
- รูปแบบสองช่องสัญญาณ (ไม่สัมพันธ์กัน)
อัตราการส่งข้อมูลแปรผัน
เสียง MPEG อาจมีอัตราบิตแปรผัน (VBR) แต่ไม่ได้รับการสนับสนุนอย่างแพร่หลาย เลเยอร์ II สามารถใช้วิธีที่เรียกว่าการสลับอัตราบิตได้ แต่ละเฟรมอาจถูกสร้างขึ้นด้วยอัตราบิตที่แตกต่างกัน[ 12 ] [ 13 ] ตามมาตรฐาน ISO/IEC 11172-3:1993 มาตรา 2.4.2.3: เพื่อให้เกิดความล่าช้าและความซับซ้อนน้อยที่สุด ตัวถอดรหัส (เสียง MPEG) ไม่จำเป็นต้องรองรับอัตราบิตแปรผันอย่างต่อเนื่องเมื่ออยู่ในเลเยอร์ I หรือ II [ 14 ]
MPEG-2 เลเยอร์เสียง II
แม้ว่าโดยทั่วไปแล้วคำว่า MP2 และนามสกุลไฟล์.mp2จะหมายถึงข้อมูล MPEG-1 Audio Layer II แต่ก็อาจหมายถึง MPEG-2 Audio Layer II ได้เช่นกัน ซึ่งเป็นส่วนขยายที่เข้ากันได้กับเวอร์ชันก่อนหน้าเป็นส่วนใหญ่ โดยเพิ่มการรองรับเสียงหลายช่องสัญญาณ การเข้ารหัส อัตราบิตแปรผันและอัตราการสุ่มตัวอย่างเพิ่มเติม ซึ่งกำหนดไว้ใน ISO/IEC 13818-3 ซึ่งเป็นส่วนหนึ่งของมาตรฐาน MPEG-2
เทคนิค
MP2 เป็นตัวเข้ารหัสเสียงแบบซับแบนด์ซึ่งหมายความว่าการบีบอัดเกิดขึ้นในโดเมนเวลาโดยใช้ฟิลเตอร์แบงค์ที่มีความล่าช้าต่ำ ทำให้เกิดส่วนประกอบในโดเมนความถี่ 32 ส่วน ในทางตรงกันข้ามMP3เป็นตัวเข้ารหัสเสียงแบบทรานส์ฟอร์มที่มีฟิลเตอร์แบงค์แบบไฮบริด ซึ่งหมายความว่าการบีบอัดเกิดขึ้นในโดเมนความถี่หลังจากการแปลงแบบไฮบริด (สองชั้น) จากโดเมนเวลา MPEG Audio Layer II เป็นอัลกอริทึมหลักของมาตรฐาน MP3 คุณลักษณะทางจิตวิทยาเสียงและโครงสร้างรูปแบบเฟรมทั้งหมดของรูปแบบ MP3 มาจากอัลกอริทึมและรูปแบบ MP2 พื้นฐาน
ตัวเข้ารหัส MP2 อาจใช้ประโยชน์จากความซ้ำซ้อนระหว่างช่องสัญญาณโดยใช้การเข้ารหัสความเข้ม "สเตอริโอร่วม" ที่เป็นตัวเลือก เช่นเดียวกับ MP3, MP2 เป็นรูปแบบการเข้ารหัสแบบรับรู้ ซึ่งหมายความว่ามันจะลบข้อมูลที่ระบบการได้ยินของมนุษย์ไม่สามารถรับรู้ได้ง่าย ในการเลือกข้อมูลที่จะลบ สัญญาณเสียงจะถูกวิเคราะห์ตามแบบจำลองทางจิตวิทยาการได้ยิน ซึ่งคำนึงถึงพารามิเตอร์ของระบบการได้ยินของมนุษย์ การวิจัยทางจิตวิทยาการได้ยินแสดงให้เห็นว่า หากมีสัญญาณที่แรงในความถี่หนึ่ง สัญญาณที่อ่อนกว่าในความถี่ใกล้เคียงกับความถี่ของสัญญาณที่แรงนั้น ระบบการได้ยินของมนุษย์จะไม่สามารถรับรู้ได้ สิ่งนี้เรียกว่าการบดบังความถี่ ตัวแปลงสัญญาณเสียงแบบรับรู้ใช้ประโยชน์จากการบดบังความถี่นี้โดยการละเลยข้อมูลที่ความถี่ที่ถือว่าไม่สามารถรับรู้ได้ ทำให้สามารถจัดสรรข้อมูลมากขึ้นสำหรับการสร้างความถี่ที่รับรู้ได้
MP2 แบ่งสัญญาณเสียงขาเข้าออกเป็น 32 ย่านความถี่ และหากเสียงในย่านความถี่ใดถือว่าไม่สามารถรับรู้ได้ ย่านความถี่นั้นจะไม่ถูกส่งไป ในทางกลับกัน MP3 แปลงสัญญาณเสียงขาเข้าให้อยู่ในโดเมนความถี่โดยมีส่วนประกอบความถี่ 576 ส่วน ดังนั้น MP3 จึงมีความละเอียดของความถี่สูงกว่า MP2 ซึ่งช่วยให้สามารถนำแบบจำลองทางจิตวิทยาการได้ยินมาใช้ได้อย่างเลือกสรรมากกว่า MP2 ดังนั้น MP3 จึงมีขอบเขตที่กว้างกว่าในการลดอัตราบิต
การใช้ เครื่องมือ เข้ารหัสเอนโทรปี เพิ่มเติม และความแม่นยำของความถี่ที่สูงขึ้น (เนื่องจากจำนวนแถบความถี่ย่อยที่ MP3 ใช้มีมากกว่า) อธิบายได้ว่าทำไม MP3 จึงไม่จำเป็นต้องมีอัตราบิตสูงเท่า MP2 เพื่อให้ได้คุณภาพเสียงที่ยอมรับได้ ในทางกลับกัน MP2 แสดงพฤติกรรมที่ดีกว่า MP3 ในโดเมนเวลา เนื่องจากความละเอียดของความถี่ที่ต่ำกว่า ซึ่งหมายถึงความล่าช้าของตัวแปลงสัญญาณน้อยลง—ซึ่งสามารถทำให้การแก้ไขเสียงง่ายขึ้น—รวมถึง "ความทนทาน" และความต้านทานต่อข้อผิดพลาดที่อาจเกิดขึ้นระหว่าง กระบวนการ บันทึกดิจิทัลหรือระหว่างข้อผิดพลาดในการส่งข้อมูล
ชุดฟิลเตอร์ย่อยของ MP2 ยังมีคุณสมบัติ " การปกปิดสัญญาณ รบกวนชั่วคราว " โดยธรรมชาติ เนื่องมาจากเอฟเฟกต์การปกปิดสัญญาณรบกวนชั่วคราวเฉพาะของฟิลเตอร์หลัก คุณลักษณะเฉพาะนี้ของตระกูลเสียง MPEG-1 บ่งบอกถึงคุณภาพเสียงที่ดีมากสำหรับสัญญาณเสียงที่มีการเปลี่ยนแปลงพลังงานอย่างรวดเร็ว เช่น เสียงกระทบ เนื่องจากทั้งรูปแบบ MP2 และ MP3 ใช้ชุดฟิลเตอร์ย่อยพื้นฐานเดียวกัน ทั้งสองรูปแบบจึงได้รับประโยชน์จากคุณลักษณะนี้
การประยุกต์ใช้ MP2
การถ่ายทอดสด
MPEG-1 Audio Layer II เป็นรูปแบบเสียงที่ใช้ในระบบกระจายเสียงดิจิทัล (DAB) ซึ่งเป็นมาตรฐานสำหรับการออกอากาศบริการวิทยุเสียงดิจิทัลที่ได้รับการยอมรับในหลายภูมิภาคทั่วโลก แผนกวิจัยและพัฒนา ของ BBCระบุว่าอย่างน้อย 192 กิโลบิต/วินาที เป็นสิ่งจำเป็นสำหรับ การออกอากาศสเตอริโอ ที่มีความคมชัดสูง :
ค่า 256 กิโลบิต/วินาที ถือว่าให้คุณภาพสัญญาณกระจายเสียงสเตอริโอสูง อย่างไรก็ตาม การลดลงเล็กน้อยเหลือ 224 กิโลบิต/วินาที มักจะเพียงพอ และในบางกรณีอาจยอมรับการลดลงเพิ่มเติมเหลือ 192 กิโลบิต/วินาที โดยเฉพาะอย่างยิ่งหากมีการใช้ประโยชน์จากความซ้ำซ้อนในสัญญาณสเตอริโอโดยกระบวนการเข้ารหัสแบบ 'สเตอริโอร่วม' (เช่น เสียงบางเสียงที่ปรากฏอยู่ตรงกลางภาพสเตอริโอไม่จำเป็นต้องส่งซ้ำสองครั้ง) ที่ความเร็ว 192 กิโลบิต/วินาที จะสามารถได้ยินข้อบกพร่องในเนื้อหาเสียงที่สำคัญได้ค่อนข้างง่าย
— เอกสารวิจัยของ BBC R&D WHP 061 มิถุนายน 2546 [ 15 ]
ณ ปี 2025 MPEG-1 Audio Layer II ยังคงมีการใช้งานอย่างแพร่หลายในสหราชอาณาจักรสำหรับการออกอากาศ DAB มาตรฐาน DAB+ ที่ใหม่กว่าซึ่งปัจจุบันแพร่หลายในยุโรปและภูมิภาคอื่นๆ ไม่ได้ใช้ MP2 แต่ใช้HE-AACแทน MP2 ยังถูกนำมาใช้เป็นรูปแบบเสียงที่ใช้โดย การออกอากาศ Astra Digital Radio (ADR) และโดย มาตรฐาน Multimedia Home Platform (DVB-MHP) สำหรับกล่องรับสัญญาณ MP2 ยังถูกใช้ควบคู่กับDolby Digital (AC3)ในสตรีมเสียงสำหรับการออกอากาศDVB บางรายการ [ 16 ]
MPEG-1 Audio Layer II นิยมใช้ในอุตสาหกรรมการออกอากาศสำหรับการกระจายเสียงสดผ่านดาวเทียม ISDN และเครือข่าย IP รวมถึงการจัดเก็บเสียงในระบบเล่นเสียงดิจิทัล ตัวอย่างเช่น ระบบกระจายรายการ PRSS Content Depot ของNPR Content Depot กระจายเสียง MPEG-1 L2 ในรูปแบบไฟล์ Broadcast Wave File MPEG2 ที่มีส่วนหัว RIFF (ใช้ใน) ถูกกำหนดไว้ในมาตรฐาน RIFF/WAV ดังนั้น Windows Media Player จึงสามารถเล่นไฟล์ Content Depot ได้โดยตรง แต่โปรแกรมเล่นวิดีโอที่ไม่ฉลาดนักมักจะเล่นไม่ได้ เนื่องจากกระบวนการเข้ารหัสและถอดรหัสจะใช้ทรัพยากร CPU อย่างมากในระบบเล่นเสียงออกอากาศรุ่นแรกๆ ระบบเล่นเสียงออกอากาศระดับมืออาชีพจึงมักใช้โคเด็กในฮาร์ดแวร์ เช่น การมอบหมายงานเข้ารหัสและถอดรหัสให้กับการ์ดเสียงที่เข้ากันได้แทนที่จะเป็น CPU ของระบบ .wav.wav
สื่อกระจายและบันทึกได้
MPEG-1 Audio Layer II เป็นรูปแบบเสียงมาตรฐานที่ใช้ใน แผ่น Video CDและSuper Video CD (VCD และ SVCD ยังรองรับอัตราบิตแปรผันและMPEG Multichannelที่เพิ่มเข้ามาใน MPEG-2) เครื่องเล่น DVD-Videoใน ประเทศที่ใช้ระบบ PAL ทุก เครื่องมีตัวถอดรหัส MP2 แบบสเตอริโอ ทำให้ MP2 เป็นคู่แข่งที่เป็นไปได้ของDolby Digital (AC3)ในตลาดเหล่านี้ เครื่องเล่น DVD-Video ใน ประเทศที่ ใช้ระบบ NTSCไม่จำเป็นต้องถอดรหัสเสียง MP2 แม้ว่าส่วนใหญ่จะทำก็ตาม ในขณะที่เครื่องบันทึก DVD บางเครื่อง จัดเก็บเสียงในรูปแบบ MP2 และ DVD ที่ผู้บริโภคสร้างขึ้นเองจำนวนมากใช้รูปแบบนี้ แต่ DVD เชิงพาณิชย์ที่มีซาวด์แทร็ก MP2 นั้นหายาก
MPEG-1 Audio Layer II เป็นรูปแบบเสียงที่ใช้ในกล้องวิดีโอ HDV ด้วยเช่นกัน
ตัวเข้ารหัสและตัวถอดรหัส
ซอฟต์แวร์ เข้ารหัส MPEG-1 Audio Layer II (MP2) ได้แก่TooLAME , MP2ENC (Wav2mp), QDesign Imedia 2 และอื่นๆ[ 17 ] CDexและExact Audio Copy เป็นซอฟต์แวร์ ริปซีดีบางส่วนที่สามารถเข้ารหัสเป็น MP2 ได้[ 17 ] ซอฟต์แวร์ เล่นมีเดียสมัยใหม่หลายตัวสามารถเล่นไฟล์ MP2 ได้ รวมถึงWinamp , VLC , Windows Media Player , MusicBeeและiTunes [ 18 ]
ไฟล์ MP2 สามารถใช้งานร่วมกับ เครื่องเล่นเสียงดิจิทัล (เครื่องเล่น MP3) บางรุ่น แต่ไม่ใช่ทุกรุ่น
ประวัติการพัฒนา
มิวสิแคม
การเข้ารหัส MPEG-1 Audio Layer 2 พัฒนามาจาก ตัวแปลงสัญญาณเสียงMUSICAM ( Masking pattern adapted Universal Subband Integrated Coding And Multiplexing ) ซึ่งพัฒนาโดย Centre commun d'études de télévision et télécommunications (CCETT), PhilipsและInstitut für Rundfunktechnik (IRT) ในปี 1989 โดยเป็นส่วนหนึ่งของโครงการ วิจัยและพัฒนา EUREKA 147ระดับยุโรป ซึ่งเป็นโครงการความร่วมมือระหว่างรัฐบาลเพื่อพัฒนาระบบสำหรับการออกอากาศเสียงและข้อมูลไปยังเครื่องรับแบบติดตั้งอยู่กับที่ แบบพกพา หรือแบบเคลื่อนที่ (ก่อตั้งขึ้นในปี 1987)
เริ่มต้นจาก โครงการ Digital Audio Broadcast (DAB) ที่จัดการโดย Egon Meier-Engelen จาก Deutsche Forschungs- und Veruchsanstalt für Luft- und Raumfahrt (ต่อมาเรียกว่า Deutsches Zentrum für Luft- und Raumfahrt, ศูนย์การบินและอวกาศเยอรมัน) ในเยอรมนี ประชาคมยุโรปให้ทุนสนับสนุนโครงการนี้ ซึ่งรู้จักกันทั่วไปในชื่อ EU-147 ตั้งแต่ปี 1987 ถึง 1994 โดยเป็นส่วนหนึ่งของโครงการวิจัย ของ EUREKA
ระบบ Eureka 147 ประกอบด้วยองค์ประกอบหลัก 3 ส่วน ได้แก่ การเข้ารหัสเสียง MUSICAM ( การเข้ารหัสและการมัลติเพล็กซ์แบบบูรณาการซับแบนด์สากลในรูปแบบการบดบัง ) การเข้ารหัสและการมัลติเพล็กซ์การส่งสัญญาณ และการมอดูเลชั่น COFDM [ 19 ]
MUSICAM เป็นหนึ่งในตัวแปลงสัญญาณไม่กี่ตัวที่สามารถให้คุณภาพเสียงสูงที่อัตราบิตในช่วง 64 ถึง 192 กิโลบิต/วินาทีต่อช่องสัญญาณโมโนโฟนิก ได้รับการออกแบบมาเพื่อตอบสนองความต้องการทางเทคนิคของแอปพลิเคชันส่วนใหญ่ (ในด้านการออกอากาศ โทรคมนาคม และการบันทึกบนสื่อจัดเก็บข้อมูลดิจิทัล) — ความล่าช้าต่ำ ความซับซ้อนต่ำ ความทนทานต่อข้อผิดพลาด หน่วยการเข้าถึงสั้น ฯลฯ[ 20 ] [ 21 ]
MUSICAM ซึ่งเป็นรูปแบบและเทคโนโลยีต้นแบบของ MP3 นั้น ใช้การแปลงซับแบนด์ 32 แถบความถี่ด้วยเลขคณิตจำนวนเต็ม โดยอาศัยแบบจำลองทางจิตวิทยาการได้ยิน โดยได้รับการออกแบบมาเพื่อการออกอากาศเสียงดิจิทัลและโทรทัศน์ดิจิทัลเป็นหลัก และได้รับการเปิดเผยโดย CCETT (ฝรั่งเศส) และ IRT (เยอรมนี) ในเมืองแอตแลนตา ระหว่างการประชุม IEEE-ICASSP [ 22 ]ตัวแปลงสัญญาณนี้ซึ่งรวมอยู่ในระบบกระจายเสียงโดยใช้การมอดูเลชั่น COFDM ได้รับการสาธิตทางอากาศและภาคสนาม[ 23 ]ร่วมกับRadio CanadaและCRC Canadaระหว่างงาน NAB (ลาสเวกัส) ในปี 1991 การใช้งานส่วนเสียงของระบบกระจายเสียงนี้ขึ้นอยู่กับตัวเข้ารหัสสองชิป (หนึ่งตัวสำหรับการแปลงซับแบนด์ หนึ่งตัวสำหรับแบบจำลองทางจิตวิทยาเสียงที่ออกแบบโดยทีมของG. Stoll (IRT เยอรมนี) ซึ่งต่อมาเป็นที่รู้จักในชื่อแบบจำลองทางจิตวิทยาเสียง I ในมาตรฐานเสียง ISO MPEG) และตัวถอดรหัสแบบเรียลไทม์โดยใช้ ชิป DSP Motorola 56001 หนึ่งตัว ที่ทำงานด้วยซอฟต์แวร์เลขคณิตจำนวนเต็มที่ออกแบบโดยทีมของYF Dehery ( CCETTฝรั่งเศส) ความเรียบง่ายของตัวถอดรหัสที่เกี่ยวข้อง ประกอบกับคุณภาพเสียงที่สูงของตัวแปลงสัญญาณนี้ ซึ่งใช้ความถี่สุ่มตัวอย่าง 48 kHz เป็นครั้งแรก และรูปแบบอินพุต 20 บิต/ตัวอย่าง (มาตรฐานการสุ่มตัวอย่างสูงสุดที่มีอยู่ในปี 1991 ซึ่งเข้ากันได้กับมาตรฐานสตูดิโออินพุตดิจิทัลระดับมืออาชีพ AES/EBU) เป็นเหตุผลหลักที่ทำให้ต่อมามีการนำคุณลักษณะของ MUSICAM มาใช้เป็นคุณสมบัติพื้นฐานสำหรับตัวแปลงสัญญาณการบีบอัดเพลงดิจิทัลขั้นสูง เช่น MP3
อัลกอริทึมการเข้ารหัสเสียงที่ใช้โดยระบบกระจายเสียงดิจิทัล Eureka 147 (DAB) ได้รับการกำหนดมาตรฐานภายในกลุ่มผู้เชี่ยวชาญด้านภาพยนตร์ ISO/Moving Pictures (MPEG) ในปี 1989–94 [ 24 ] [ 25 ]การเข้ารหัสเสียง MUSICAM ถูกใช้เป็นพื้นฐานสำหรับรูปแบบการเข้ารหัสบางส่วนของ MPEG-1 และ MPEG-2 Audio [ 26 ]คุณสมบัติหลักส่วนใหญ่ของ MPEG-1 Audio ได้รับการสืบทอดโดยตรงจาก MUSICAM รวมถึงธนาคารตัวกรอง การประมวลผลโดเมนเวลา ขนาดเฟรมเสียง ฯลฯ อย่างไรก็ตาม มีการปรับปรุง และอัลกอริทึม MUSICAM จริงไม่ได้ถูกนำมาใช้ในมาตรฐาน MPEG-1 Audio Layer II ฉบับสุดท้าย
นับตั้งแต่การกำหนดมาตรฐานเสียง MPEG-1 และ MPEG-2 (ในปี 1992 และ 1994) อัลกอริทึม MUSICAM ดั้งเดิมจึงไม่ถูกนำมาใช้อีกต่อไป[ 7 ] [ 27 ]ชื่อ MUSICAM มักถูกใช้ผิดเมื่อหมายถึง MPEG-1 Audio Layer II ซึ่งอาจทำให้เกิดความสับสนได้ เนื่องจากชื่อ MUSICAM เป็นเครื่องหมายการค้าของบริษัทต่างๆ ในภูมิภาคต่างๆ ทั่วโลก[ 7 ] [ 27 ] [ 28 ] (Musicam เป็นชื่อที่ใช้สำหรับ MP2 ในข้อกำหนดบางประการสำหรับ Astra Digital Radio รวมถึงในเอกสาร DAB ของ BBC ด้วย)
โครงการ Eureka Project 147 ส่งผลให้มีการเผยแพร่มาตรฐานยุโรป ETS 300 401 ในปี 1995 สำหรับ DAB ซึ่งปัจจุบันได้รับการยอมรับทั่วโลก มาตรฐาน DAB ใช้ MPEG-1 Audio Layer II (ISO/IEC 11172-3) สำหรับความถี่การสุ่มตัวอย่าง 48 kHz และ MPEG-2 Audio Layer II (ISO/IEC 13818-3) สำหรับความถี่การสุ่มตัวอย่าง 24 kHz [ 29 ]
เสียง MPEG
ในช่วงปลายทศวรรษ 1980 กลุ่มผู้เชี่ยวชาญด้านภาพเคลื่อนไหวของISO (MPEG) ได้เริ่มดำเนินการเพื่อสร้างมาตรฐานการเข้ารหัสเสียงและวิดีโอดิจิทัล ซึ่งคาดว่าจะมีการใช้งานที่หลากหลายในการออกอากาศวิทยุและโทรทัศน์ดิจิทัล (ต่อมาคือDAB , DMB , DVB ) และการใช้งานบน CD-ROM (ต่อมาคือVideo CD ) [ 30 ]การเข้ารหัสเสียง MUSICAM เป็นหนึ่งใน 14 ข้อเสนอสำหรับมาตรฐานเสียง MPEG-1 ที่ส่งไปยัง ISO ในปี 1989 [ 21 ] [ 26 ]
มาตรฐานเสียง MPEG-1 อิงตามรูปแบบเสียง MUSICAM และ ASPEC ที่มีอยู่[ 31 ] มาตรฐาน เสียง MPEG-1ประกอบด้วย "เลเยอร์" เสียงสามชั้น (เทคนิคการเข้ารหัส) ซึ่งปัจจุบันรู้จักกันในชื่อ เลเยอร์ I (MP1), เลเยอร์ II (MP2) และเลเยอร์ III (MP3) อัลกอริทึมทั้งหมดสำหรับ MPEG-1 Audio Layer I, II และ III ได้รับการอนุมัติในปี 1991 ในฐานะร่างคณะกรรมการของ ISO-11172 [ 32 ] [ 33 ] [ 34 ]และสรุปขั้นสุดท้ายในปี 1992 [ 35 ]ซึ่งเป็นส่วนหนึ่งของMPEG-1ชุดมาตรฐานแรกของMPEGซึ่งส่งผลให้เกิดมาตรฐานสากลISO / IEC 11172-3 (หรือที่รู้จักกันในชื่อMPEG-1 AudioหรือMPEG-1 Part 3 ) ซึ่งเผยแพร่ในปี 1993 [ 4 ]งานเพิ่มเติมเกี่ยวกับ MPEG audio [ 36 ]ได้รับการสรุปขั้นสุดท้ายในปี 1994 ซึ่งเป็นส่วนหนึ่งของชุดมาตรฐาน MPEG ชุดที่สองMPEG-2หรือที่รู้จักอย่างเป็นทางการมากขึ้นในชื่อมาตรฐานสากลISO/IEC 13818-3 (หรือที่รู้จักกันในชื่อMPEG -2 Part 3 หรือ MPEG- 2 Audio ที่เข้ากันได้กับ เวอร์ชันก่อนหน้า หรือMPEG-2 Audio BC [ 37 ] ) ซึ่งเผยแพร่ครั้งแรกในปี 1995 [ 5 ] [ 38 ] MPEG-2 Part 3 (ISO/IEC 13818-3) กำหนดอัตราบิตและอัตราการสุ่มตัวอย่างเพิ่มเติมสำหรับ MPEG-1 Audio Layer I, II และ III อัตราการสุ่มตัวอย่างใหม่นี้มีค่าเป็นครึ่งหนึ่งของอัตราที่กำหนดไว้เดิมสำหรับ MPEG-1 Audio นอกจากนี้ MPEG-2 Part 3 ยังปรับปรุงเสียงของ MPEG-1 โดยอนุญาตให้เข้ารหัสโปรแกรมเสียงที่มีมากกว่าสองช่องสัญญาณ สูงสุดถึง 5.1 มัลติแชนเนล[ 36 ]
ส่วนประกอบ Layer III ( MP3 ) ใช้ ขั้นตอนวิธี บีบอัดแบบสูญเสียข้อมูลซึ่งได้รับการออกแบบมาเพื่อลดปริมาณข้อมูลที่จำเป็นในการแสดงผลการบันทึกเสียงและให้เสียงที่ใกล้เคียงกับเสียงต้นฉบับที่ไม่ได้บีบอัดสำหรับผู้ฟังส่วนใหญ่
รางวัลเอ็มมี สาขาวิศวกรรมศาสตร์
CCETT (ฝรั่งเศส), IRT (เยอรมนี) และPhilips (เนเธอร์แลนด์) ได้รับรางวัล Emmy Awardสาขาวิศวกรรมศาสตร์ประจำปี 2000 จากการพัฒนาระบบบีบอัดเสียงดิจิทัลแบบสองช่องสัญญาณที่เรียกว่า Musicam หรือ MPEG Audio Layer II [ 39 ] [ 40 ]
ดูเพิ่มเติม
- สายประถมศึกษา
- MP4 (รูปแบบคอนเทนเนอร์)
- Musepackเดิมทีพัฒนามาจากไฟล์ MP2 โดยมีการปรับปรุงเพิ่มเติมมากมาย
อ่านเพิ่มเติม
- กำเนิดมาตรฐานการเข้ารหัสเสียง MP3 โดย Hans Georg Musmannใน IEEE Transactions on Consumer Electronics, Vol. 52, Nr. 3, pp. 1043–1049, สิงหาคม 2549
- บทความเรื่อง "การเข้ารหัสแหล่งที่มาของ MUSICAM" โดย Yves-François Dehery ในการประชุมนานาชาติ AES ครั้งที่ 10 ณ เคนซิงตัน ลอนดอน ประเทศอังกฤษ (7-9 กันยายน 1991) หน้า 71–79
ลิงก์ภายนอก
- เว็บไซต์อย่างเป็นทางการ

- RFC 3003 – เอกสารที่กำหนดประเภท MIME สำหรับเลเยอร์เสียง MPEG-1 ระดับ II
- ประวัติความเป็นมาของไฟล์ MP3 จาก Fraunhofer IIS
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ MPEG-1 เลเยอร์เสียง II
MP2 (อย่างเป็นทางการคือ MPEG-1 Audio Layer II หรือ MPEG-2 Audio Layer II บางครั้งเรียกอย่างไม่ถูกต้องว่า Musicam ) [ 7 ] เป็น รูปแบบการบีบอัดเสียง แบบสูญเสียข้อมูล...
ข้อกำหนดทางเทคนิค
MPEG-1 Audio Layer II ถูกกำหนดไว้ใน ISO/IEC 11172-3 (MPEG-1 Part 3)
อัตราการส่งข้อมูลแปรผัน
เสียง MPEG อาจมี อัตราบิตแปรผัน (VBR) แต่ไม่ได้รับการสนับสนุนอย่างแพร่หลาย เลเยอร์ II สามารถใช้วิธีที่เรียกว่าการสลับอัตราบิตได้ แต่ละเฟรมอาจถูกสร้างขึ้นด้วยอัตราบิตที่แตกต่างกัน [ 12 ] [ 13 ] ตามมาตรฐาน ISO/IEC 11172-3:1993 มาตรา 2.4.2.
MPEG-2 เลเยอร์เสียง II
แม้ว่าโดยทั่วไปแล้วคำว่า MP2 และ นามสกุลไฟล์ .mp2 จะหมายถึงข้อมูล MPEG-1 Audio Layer II แต่ก็อาจหมายถึง MPEG-2 Audio Layer II ได้เช่นกัน ซึ่งเป็นส่วนขยายที่เข้ากันได้กับเวอร์ชันก่อนหน้าเป็นส่วนใหญ่ โดยเพิ่มการรองรับ เสียงหลายช่อง สัญญาณ การเข้ารหัส...