อ่าน 6 นาที
H.262/MPEG-2 ตอนที่ 2
H.262 หรือMPEG-2 Part 2 (อย่างเป็นทางการเรียกว่า ITU-T Recommendation H.
H.262/MPEG-2 ตอนที่ 2
| H.262 / MPEG-2 ส่วนที่ 2 | |
|---|---|
| เทคโนโลยีสารสนเทศ – การเข้ารหัสทั่วไปของภาพเคลื่อนไหวและข้อมูลเสียงที่เกี่ยวข้อง: วิดีโอ | |
| สถานะ | มีผลบังคับใช้ |
| ปีเริ่มต้น | พ.ศ. 2538 |
| เผยแพร่ครั้งแรก | พฤษภาคม 2539 |
| เวอร์ชั่นล่าสุด | ISO/IEC 13818-2:2013 ตุลาคม 2013 |
| องค์กร | ITU-T , ISO/IEC JTC 1 |
| คณะกรรมการ | กลุ่มศึกษา ITU-T 16 VCEG , MPEG |
| มาตรฐานพื้นฐาน | H.261 , MPEG-2 |
| มาตรฐานที่เกี่ยวข้อง | H.222.0 , H.263 , H.264 , H.265 , H.266 , ISO/IEC 14496-2 |
| ผู้มาก่อน | เอช.261 |
| ผู้สืบทอด | เอช.263 |
| โดเมน | การบีอัดวิดีโอ |
| ใบอนุญาต | สิทธิบัตรที่หมดอายุ[ 1 ] |
| เว็บไซต์ | https://www.itu.int/rec/T-REC-H.262 |
H.262 [ 2 ]หรือMPEG-2 Part 2 (อย่างเป็นทางการเรียกว่า ITU-T Recommendation H.262 และISO/IEC 13818-2 [ 3 ]หรือที่รู้จักกันในชื่อMPEG -2 Video ) เป็นรูปแบบการเข้ารหัสวิดีโอที่ได้รับการกำหนดมาตรฐานและดูแลรักษาร่วมกันโดยITU-T Study Group 16 Video Coding Experts Group (VCEG) และISO / IEC Moving Picture Experts Group (MPEG) และได้รับการพัฒนาโดยมีส่วนร่วมของหลายบริษัท เป็นส่วนที่สองของมาตรฐาน ISO/IEC MPEG-2เอกสาร ITU-T Recommendation H.262 และ ISO/IEC 13818-2 นั้นเหมือนกัน
มาตรฐานนี้มีให้บริการโดยเสียค่าธรรมเนียมจาก ITU-T [ 2 ]และ ISO วิดีโอ MPEG-2 คล้ายกับMPEG-1 มาก แต่ยังรองรับวิดีโอแบบอินเตอร์เลซ (เทคนิคการเข้ารหัสที่ใช้ในระบบโทรทัศน์อนาล็อก NTSC, PAL และ SECAM) วิดีโอ MPEG-2 ไม่ได้ปรับให้เหมาะสมสำหรับอัตราบิตต่ำ (เช่น น้อยกว่า 1 Mbit/s) แต่มีประสิทธิภาพดีกว่า MPEG-1 เล็กน้อยที่อัตราบิตสูง (เช่น 3 Mbit/s ขึ้นไป) แม้ว่าจะไม่มากนักเว้นแต่ว่าวิดีโอจะเป็นแบบอินเตอร์เลซ ตัวถอดรหัสวิดีโอ MPEG-2 ที่สอดคล้องกับมาตรฐานทั้งหมดสามารถเล่นสตรีมวิดีโอ MPEG-1 ได้อย่างเต็มที่[ 4 ]
ประวัติศาสตร์
กระบวนการอนุมัติ ISO/IEC เสร็จสมบูรณ์ในเดือนพฤศจิกายน พ.ศ. 2537 [ 5 ]ฉบับแรกได้รับการอนุมัติในเดือนกรกฎาคม พ.ศ. 2538 [ 6 ]และเผยแพร่โดย ITU-T [ 2 ]และ ISO/IEC ในปี พ.ศ. 2539 [ 7 ] Didier LeGall จากBellcoreเป็นประธานในการพัฒนามาตรฐาน[ 8 ]และ Sakae Okubo จากNTTเป็นผู้ประสานงาน ITU-T และเป็นประธานข้อตกลงเกี่ยวกับข้อกำหนด[ 9 ]
เทคโนโลยีนี้ได้รับการพัฒนาโดยได้รับการสนับสนุนจากบริษัทหลายแห่งHyundai Electronics (ปัจจุบันคือSK Hynix ) ได้พัฒนาตัวถอดรหัส MPEG-2 SAVI (System/Audio/Video) ตัวแรกในปี 1995 [ 10 ]
สิทธิบัตรส่วนใหญ่ที่ถูกอ้างในภายหลังว่าเป็นสิ่งจำเป็นสำหรับการนำมาตรฐานไปใช้มาจากสามบริษัท ได้แก่Sony ( 311 สิทธิบัตร), Thomson (198 สิทธิบัตร) และMitsubishi Electric (119 สิทธิบัตร) [ 11 ]
ในปี พ.ศ. 2539 ได้มีการขยายขอบเขตโดยการแก้ไขเพิ่มเติมสองประการเพื่อรวมการลงทะเบียนตัวระบุลิขสิทธิ์และโปรไฟล์ 4:2:2 [ 2 ] [ 12 ] ITU-T ได้เผยแพร่การแก้ไขเพิ่มเติมเหล่านี้ในปี พ.ศ. 2539 และ ISO ในปี พ.ศ. 2540 [ 7 ]
นอกจากนี้ยังมีการแก้ไขเพิ่มเติมอื่นๆ ที่เผยแพร่ในภายหลังโดย ITU-T และ ISO/IEC [ 2 ] [ 13 ]มาตรฐานฉบับล่าสุดได้รับการเผยแพร่ในปี 2013 และรวมการแก้ไขเพิ่มเติมก่อนหน้านี้ทั้งหมด[ 3 ]
ฉบับพิมพ์
| ฉบับ | วันที่วางจำหน่าย | การแก้ไขล่าสุด | มาตรฐาน ISO/IEC | ข้อแนะนำของ ITU-T |
|---|---|---|---|---|
| ฉบับพิมพ์ครั้งแรก | พ.ศ. 2538 | 2000 | ISO/IEC 13818-2:1996 [ 7 ] | H.262 (07/95) |
| ฉบับพิมพ์ครั้งที่สอง | 2000 | 2010 [ 2 ] [ 14 ] | ISO/IEC 13818-2:2000 [ 15 ] | H.262 (02/00) |
| ฉบับที่สาม | 2013 | ISO/IEC 13818-2:2013 [ 3 ] | H.262 (02/12) รวมการแก้ไขเพิ่มเติม 1 (03/13) |
การเข้ารหัสวิดีโอ
การสุ่มตัวอย่างภาพ
กล้องHDTVที่มีการสุ่มตัวอย่าง 8 บิต จะสร้างสตรีมวิดีโอแบบดิบขนาด 25 × 1920 × 1080 × 3 = 155,520,000 ไบต์ต่อวินาที สำหรับวิดีโอ 25 เฟรมต่อวินาที (โดยใช้ รูปแบบ การสุ่มตัวอย่าง 4:4:4 ) สตรีมข้อมูลนี้จะต้องถูกบีบอัดหากต้องการให้ทีวีดิจิทัลพอดีกับแบนด์วิดท์ของช่องทีวีที่มีอยู่ และหากต้องการให้ภาพยนตร์พอดีกับดีวีดีการบีบอัดวิดีโอมีประโยชน์เนื่องจากข้อมูลในภาพมักซ้ำซ้อนทั้งในแง่ของพื้นที่และเวลา ตัวอย่างเช่น ท้องฟ้าอาจเป็นสีฟ้าตลอดช่วงบนของภาพ และสีฟ้าดังกล่าวอาจคงอยู่ต่อเนื่องกันในแต่ละเฟรม นอกจากนี้ ด้วยวิธีการทำงานของดวงตา จึงเป็นไปได้ที่จะลบหรือประมาณค่าข้อมูลบางส่วนจากภาพวิดีโอโดยที่คุณภาพของภาพไม่ลดลงอย่างเห็นได้ชัดหรือลดลงเพียงเล็กน้อย
เทคนิคทั่วไป (และเก่าแก่) ในการลดปริมาณข้อมูลคือ การแยก "เฟรม" วิดีโอแต่ละเฟรมออกเป็นสอง "ฟิลด์" ในระหว่างการออกอากาศ/การเข้ารหัส: "ฟิลด์บน" ซึ่งเป็นเส้นแนวนอนเลขคี่ และ "ฟิลด์ล่าง" ซึ่งเป็นเส้นแนวนอนเลขคู่ เมื่อรับ/ถอดรหัส ฟิลด์ทั้งสองจะแสดงสลับกัน โดยเส้นของฟิลด์หนึ่งจะแทรกอยู่ระหว่างเส้นของฟิลด์ก่อนหน้า รูปแบบนี้เรียกว่าวิดีโอแบบอินเตอร์เลซ (interlaced video ) อัตราฟิลด์โดยทั่วไปคือ50 (ยุโรป/PAL) หรือ59.94 (สหรัฐอเมริกา/NTSC) ฟิลด์ต่อวินาที ซึ่งสอดคล้องกับ 25 (ยุโรป/PAL) หรือ 29.97 (อเมริกาเหนือ/NTSC) เฟรมต่อวินาที หากวิดีโอไม่ได้เป็นแบบอินเตอร์เลซ จะเรียกว่า วิดีโอแบบ โปรเกรสซีฟสแกน (progressive scan video) และแต่ละภาพจะเป็นเฟรมที่สมบูรณ์ MPEG-2 รองรับทั้งสองตัวเลือก
โทรทัศน์ดิจิทัลจำเป็นต้องแปลงภาพเหล่านี้ให้เป็นดิจิทัลเพื่อให้ฮาร์ดแวร์คอมพิวเตอร์สามารถประมวลผลได้ แต่ละองค์ประกอบของภาพ ( พิกเซล ) จะถูกแทนด้วย ค่า ความสว่าง หนึ่ง ค่าและ ค่า ความอิ่มตัวของสี สอง ค่า ค่าเหล่านี้อธิบายถึงความสว่างและสีของพิกเซล (ดูYCbCr ) ดังนั้น ภาพดิจิทัลแต่ละภาพจึงถูกแทนด้วยอาร์เรย์ตัวเลขรูปสี่เหลี่ยมผืนผ้าสามชุดในเบื้องต้น
อีกวิธีหนึ่งที่นิยมใช้เพื่อลดปริมาณข้อมูลที่จะต้องประมวลผลคือ การสุ่มตัวอย่างย่อย ระนาบ สีทั้งสอง(หลังจากกรองความถี่ต่ำเพื่อหลีกเลี่ยงการเกิดเอเลียส ) วิธีนี้ได้ผลเพราะระบบการมองเห็นของมนุษย์สามารถแยกแยะรายละเอียดของความสว่างได้ดีกว่ารายละเอียดของเฉดสีและความอิ่มตัวของสี คำว่า4:2:2ใช้สำหรับวิดีโอที่มีการสุ่มตัวอย่างย่อยสีในอัตราส่วน 2:1 ในแนวนอน และ4:2:0ใช้สำหรับวิดีโอที่มีการสุ่มตัวอย่างย่อยสีในอัตราส่วน 2:1 ทั้งในแนวตั้งและแนวนอน วิดีโอที่มีความสว่างและความเข้มของสีที่ความละเอียดเท่ากันเรียกว่า4:4:4เอกสาร MPEG-2 Video พิจารณาประเภทการสุ่มตัวอย่างทั้งสามแบบ แม้ว่า 4:2:0 จะเป็นที่นิยมใช้มากที่สุดสำหรับวิดีโอสำหรับผู้บริโภค และไม่มี "โปรไฟล์" ที่กำหนดไว้ของ MPEG-2 สำหรับวิดีโอ 4:4:4 (ดูรายละเอียดเพิ่มเติมเกี่ยวกับโปรไฟล์ด้านล่าง)
แม้ว่าการอธิบายในส่วนนี้จะกล่าวถึงการบีบอัดวิดีโอ MPEG-2 โดยทั่วไป แต่ก็ยังมีรายละเอียดอีกมากมายที่ไม่ได้กล่าวถึง รวมถึงรายละเอียดเกี่ยวกับฟิลด์ รูปแบบสี การตอบสนองต่อการเปลี่ยนแปลงฉาก รหัสพิเศษที่ใช้ระบุส่วนต่างๆ ของบิตสตรีม และข้อมูลอื่นๆ อีกมากมาย นอกเหนือจากคุณสมบัติสำหรับการจัดการฟิลด์สำหรับการเข้ารหัสแบบอินเตอร์เลซแล้ว วิดีโอ MPEG-2 มีความคล้ายคลึงกับวิดีโอ MPEG-1 มาก (และค่อนข้างคล้ายกับ มาตรฐาน H.261 รุ่นก่อนหน้า ) ดังนั้นคำอธิบายทั้งหมดด้านล่างจึงใช้ได้กับ MPEG-1 เช่นกัน
โครงสร้างรูปตัว I, โครงสร้างรูปตัว P และโครงสร้างรูปตัว B
MPEG-2 ประกอบด้วยเฟรมเข้ารหัสพื้นฐานสามประเภท ได้แก่ เฟรมเข้ารหัสภายใน ( I-frames ), เฟรมเข้ารหัสแบบทำนาย ( P-frames ) และเฟรมเข้ารหัสแบบทำนายสองทิศทาง ( B-frames )
เฟรม I คือเวอร์ชันที่ถูกบีบอัดแยกต่างหากของเฟรมเดียวที่ไม่ถูกบีบอัด (ดิบ) การเข้ารหัสเฟรม I ใช้ประโยชน์จากความซ้ำซ้อนเชิงพื้นที่และความไม่สามารถของดวงตาในการตรวจจับการเปลี่ยนแปลงบางอย่างในภาพ แตกต่างจากเฟรม P และเฟรม B เฟรม I ไม่ขึ้นอยู่กับข้อมูลในเฟรมก่อนหน้าหรือเฟรมถัดไป ดังนั้นการเข้ารหัสจึงคล้ายกับการเข้ารหัสภาพนิ่ง (คล้ายกับ การเข้ารหัสภาพ JPEG ) กล่าวโดยสรุป เฟรมดิบจะถูกแบ่งออกเป็นบล็อกขนาด 8 พิกเซล x 8 พิกเซล ข้อมูลในแต่ละบล็อกจะถูกแปลงโดยการแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) ผลลัพธ์ที่ได้คือเมทริกซ์สัมประสิทธิ์ขนาด 8×8 ที่มี ค่า เป็นจำนวนจริงการแปลงจะแปลงความแปรผันเชิงพื้นที่เป็นความแปรผันเชิงความถี่ แต่จะไม่เปลี่ยนแปลงข้อมูลในบล็อก หากคำนวณการแปลงด้วยความแม่นยำสมบูรณ์ บล็อกดั้งเดิมสามารถสร้างขึ้นใหม่ได้อย่างแม่นยำโดยการใช้การแปลงโคไซน์ผกผัน (ด้วยความแม่นยำสมบูรณ์เช่นกัน) การแปลงจากจำนวนเต็ม 8 บิตเป็นสัมประสิทธิ์การแปลงค่าจริงนั้นทำให้ปริมาณข้อมูลที่ใช้ในขั้นตอนการประมวลผลนี้เพิ่มขึ้น แต่ข้อดีของการแปลงคือข้อมูลภาพสามารถประมาณค่าได้โดยการควอนไทซ์สัมประสิทธิ์ สัมประสิทธิ์การแปลงหลายตัว โดยเฉพาะส่วนประกอบความถี่สูง จะมีค่าเป็นศูนย์หลังจากควอนไทซ์ ซึ่งโดยพื้นฐานแล้วเป็นการปัดเศษ ข้อเสียของขั้นตอนนี้คือการสูญเสียความแตกต่างเล็กน้อยในความสว่างและสี การควอนไทซ์อาจเป็นแบบหยาบหรือละเอียดก็ได้ ขึ้นอยู่กับการเลือกของตัวเข้ารหัส หากการควอนไทซ์ไม่หยาบเกินไป และใช้การแปลงผกผันกับเมทริกซ์หลังจากที่ควอนไทซ์แล้ว จะได้ภาพที่ดูคล้ายกับภาพต้นฉบับมาก แต่ไม่เหมือนกันเสียทีเดียว ต่อไป เมทริกซ์สัมประสิทธิ์ที่ควอนไทซ์แล้วจะถูกบีบอัด โดยทั่วไป มุมหนึ่งของอาร์เรย์สัมประสิทธิ์ขนาด 8×8 จะมีแต่ค่าศูนย์หลังจากใช้การควอนไทซ์แล้ว โดยเริ่มจากมุมตรงข้ามของเมทริกซ์ จากนั้นลากเส้นซิกแซกผ่านเมทริกซ์เพื่อรวมสัมประสิทธิ์เข้าเป็นสตริง จากนั้นแทนที่รหัสความยาวต่อ เนื่องด้วย ศูนย์ที่ต่อเนื่องกันในสตริงนั้น และจากนั้นใช้การเข้ารหัสฮัฟฟ์แมนกับผลลัพธ์นั้น จะช่วยลดเมทริกซ์ให้เหลือปริมาณข้อมูลที่เล็กลง ข้อมูล ที่ เข้ารหัสด้วยเอนโทร ปีนี้ เองที่จะถูกออกอากาศหรือบันทึกไว้ในดีวีดี ในเครื่องรับหรือเครื่องเล่น กระบวนการทั้งหมดจะกลับกัน ทำให้เครื่องรับสามารถสร้างเฟรมดั้งเดิมขึ้นมาใหม่ได้ใกล้เคียงกับต้นฉบับ
การประมวลผลเฟรม B คล้ายกับการประมวลผลเฟรม P ยกเว้นว่าเฟรม B ใช้ภาพในเฟรมอ้างอิงถัดไปรวมถึงภาพในเฟรมอ้างอิงก่อนหน้าด้วย ดังนั้น เฟรม B จึงมักให้การบีบอัดที่ดีกว่าเฟรม P เฟรม B ไม่ใช่เฟรมอ้างอิงในวิดีโอ MPEG-2
โดยทั่วไป เฟรมทุกๆ 15 เฟรมหรือประมาณนั้น จะถูกสร้างเป็นเฟรม I เฟรม P และเฟรม B อาจตามหลังเฟรม I ในลักษณะนี้ IBBPBBBBPBB(I) เพื่อสร้างกลุ่มภาพ (GOP)อย่างไรก็ตาม มาตรฐานมีความยืดหยุ่นในเรื่องนี้ ตัวเข้ารหัสจะเป็นผู้เลือกภาพใดที่จะถูกเข้ารหัสเป็นเฟรม I, P และ B
มาโครบล็อก
เฟรม P ให้การบีบอัดมากกว่าเฟรม I เพราะใช้ประโยชน์จากข้อมูลในเฟรม I หรือเฟรม P ก่อนหน้า ซึ่งเป็นเฟรมอ้างอิงในการสร้างเฟรม P เฟรมอ้างอิงก่อนหน้าจะถูกสร้างขึ้นใหม่ เช่นเดียวกับที่เกิดขึ้นในเครื่องรับโทรทัศน์หรือเครื่องเล่นดีวีดี เฟรมที่กำลังถูกบีบอัดจะถูกแบ่งออกเป็นมาโครบล็อก ขนาด 16 พิกเซล x 16 พิกเซล จากนั้น สำหรับแต่ละมาโครบล็อกเหล่านั้น เฟรมอ้างอิงที่สร้างขึ้นใหม่จะถูกค้นหาเพื่อหาพื้นที่ขนาด 16 x 16 พิกเซล ที่ตรงกับเนื้อหาของมาโครบล็อกที่กำลังถูกบีบอัดมากที่สุด ค่าชดเชยจะถูกเข้ารหัสเป็น "เวกเตอร์การเคลื่อนไหว" บ่อยครั้งที่ค่าชดเชยเป็นศูนย์ แต่ถ้ามีบางสิ่งในภาพกำลังเคลื่อนไหว ค่าชดเชยอาจเป็นค่าเช่น 23 พิกเซลไปทางขวาและ 4 พิกเซลครึ่งขึ้นไป ใน MPEG-1 และ MPEG-2 ค่าเวกเตอร์การเคลื่อนไหวสามารถแสดงค่าชดเชยเป็นจำนวนเต็มหรือครึ่งจำนวนเต็มได้ การจับคู่ระหว่างสองพื้นที่มักจะไม่สมบูรณ์แบบ เพื่อแก้ไขปัญหานี้ ตัวเข้ารหัสจะหาผลต่างของพิกเซลที่ตรงกันทั้งหมดของสองบริเวณ และจากผลต่างของมาโครบล็อกนั้น จะคำนวณค่า DCT และสตริงของค่าสัมประสิทธิ์สำหรับพื้นที่ 8×8 ทั้งสี่ในมาโครบล็อก 16×16 ตามที่อธิบายไว้ข้างต้น ค่า "ส่วนเหลือ" นี้จะถูกเพิ่มเข้าไปในเวกเตอร์การเคลื่อนไหว และผลลัพธ์จะถูกส่งไปยังตัวรับหรือจัดเก็บไว้ใน DVD สำหรับแต่ละมาโครบล็อกที่กำลังบีบอัด บางครั้งอาจไม่พบการจับคู่ที่เหมาะสม ในกรณีนั้น มาโครบล็อกจะถูกจัดการเหมือนกับมาโครบล็อกแบบ I-frame
โปรไฟล์และระดับวิดีโอ
วิดีโอ MPEG-2 รองรับการใช้งานที่หลากหลาย ตั้งแต่โทรศัพท์มือถือไปจนถึงการตัดต่อวิดีโอ HD คุณภาพสูง สำหรับการใช้งานหลายอย่าง การรองรับมาตรฐานทั้งหมดนั้นไม่สมจริงและมีค่าใช้จ่ายสูงเกินไป เพื่อให้แอปพลิเคชันเหล่านั้นสามารถรองรับเฉพาะส่วนย่อยของมาตรฐานได้ มาตรฐานจึงกำหนดโปรไฟล์และระดับต่างๆ ขึ้นมา
โปรไฟล์จะกำหนดชุดคุณสมบัติต่างๆ เช่น ภาพ B, วิดีโอ 3 มิติ, รูปแบบโครมา เป็นต้น ระดับจะจำกัดหน่วยความจำและพลังการประมวลผลที่จำเป็น โดยกำหนดอัตราบิตสูงสุด ขนาดเฟรม และอัตรา เฟรม
แอปพลิเคชัน MPEG จะระบุความสามารถในแง่ของโปรไฟล์และระดับ ตัวอย่างเช่น เครื่องเล่น DVD อาจระบุว่ารองรับโปรไฟล์หลักและระดับหลัก (มักเขียนว่า MP@ML) ซึ่งหมายความว่าเครื่องเล่นสามารถเล่นสตรีม MPEG ใด ๆ ที่เข้ารหัสเป็น MP@ML หรือต่ำกว่าได้
ตารางด้านล่างสรุปข้อจำกัดของแต่ละโปรไฟล์และระดับ แม้ว่าจะมีข้อจำกัดอื่นๆ ที่ไม่ได้ระบุไว้ที่นี่ก็ตาม[ 2 ] : ภาคผนวก E โปรดทราบว่าการรวมกันของโปรไฟล์และระดับบางอย่างอาจไม่ได้รับอนุญาต และโหมดที่ปรับขนาดได้จะปรับเปลี่ยนข้อจำกัดของระดับ
| ตัวย่อ | ชื่อ | ประเภทการเข้ารหัสรูปภาพ | รูปแบบโครมา | โหมดที่ปรับขนาดได้ | อินทรา ดีซี พรีซิชั่น |
|---|---|---|---|---|---|
| เอสพี | โปรไฟล์เรียบง่าย | ไอ, พี | 4:2:0 | ไม่มี | 8, 9, 10 |
| ส.ส. | โปรไฟล์หลัก | ไอ, พี, บี | 4:2:0 | ไม่มี | 8, 9, 10 |
| อัตราส่วนสัญญาณต่อเสียงรบกวน (SNR) | โปรไฟล์ SNR ที่ปรับขนาดได้ | ไอ, พี, บี | 4:2:0 | SNR [ a ] | 8, 9, 10 |
| เชิงพื้นที่ | โปรไฟล์ที่ปรับขนาดได้ตามพื้นที่ | ไอ, พี, บี | 4:2:0 | SNR, [ a ] เชิงพื้นที่[ b ] | 8, 9, 10 |
| เอชพี | บุคคลสำคัญ | ไอ, พี, บี | 4:2:2 หรือ 4:2:0 | SNR, [ a ] เชิงพื้นที่[ b ] | 8, 9, 10, 11 |
| 422 | โปรไฟล์ 4:2:2 | ไอ, พี, บี | 4:2:2 หรือ 4:2:0 | ไม่มี | 8, 9, 10, 11 |
| เอ็มวีพี | โปรไฟล์หลายมุมมอง | ไอ, พี, บี | 4:2:0 | ชั่วคราว[ค] | 8, 9, 10 |
- ^ a b cการปรับขนาด SNR จะส่งความแตกต่างในโดเมนการแปลงไปยังระดับการควอนไทเซชันที่ต่ำกว่าของแต่ละบล็อก ซึ่งจะเพิ่มคุณภาพและอัตราบิตเมื่อรวมสตรีมทั้งสองเข้าด้วยกัน สตรีมหลักสามารถสร้างขึ้นใหม่ได้โดยไม่สูญเสียข้อมูล
- ^ a bการปรับขนาดเชิงพื้นที่เข้ารหัสความแตกต่างระหว่างสตรีม HD และสตรีม SD ที่ปรับขนาดขึ้น ซึ่งจะรวมเข้ากับ SD เพื่อสร้างสตรีม HD ขึ้นมาใหม่ สตรีมหลักไม่สามารถสร้างขึ้นใหม่ได้โดยไม่สูญเสียคุณภาพ
- ^การปรับขนาดตามเวลาจะแทรกเฟรมพิเศษระหว่างเฟรมหลักทุกเฟรม เพื่อเพิ่มอัตราเฟรมหรือเพิ่มมุมมอง 3 มิติ นี่เป็นโปรไฟล์ MPEG-2 เพียงโปรไฟล์เดียวที่อนุญาตให้ใช้การอ้างอิงเฟรมแบบปรับได้ ซึ่งเป็นคุณสมบัติเด่นของ H.264/AVCสตรีมหลักสามารถสร้างขึ้นใหม่ได้โดยไม่สูญเสียคุณภาพก็ต่อเมื่อไม่ได้ใช้การอ้างอิงเพิ่มเติมเท่านั้น
| ตัวย่อ | ชื่อ | อัตราเฟรม(เฮิร์ตซ์) | ความละเอียดสูงสุด | จำนวนตัวอย่างความสว่างสูงสุดต่อวินาที(โดยประมาณ ความสูง x ความกว้าง x อัตราเฟรม) | อัตราบิตสูงสุดMP@ (เมกะบิต/วินาที) | |
|---|---|---|---|---|---|---|
| แนวนอน | แนวตั้ง | |||||
| แอลแอล | ระดับต่ำ | 23.976, 24, 25, 29.97, 30 | 352 | 288 | 3,041,280 | 4 |
| เอ็มแอล | ชั้นหลัก | 23.976, 24, 25, 29.97, 30 | 720 | 576 | 10,368,000 ยกเว้นในกรณีที่โดดเด่นเป็นพิเศษ: ข้อจำกัดคือ 14,475,600 สำหรับ 4:2:0 และ 11,059,200 สำหรับ 4:2:2 | 15 |
| เอช-14 | สูงสุด 1440 | 23.976, 24, 25, 29.97, 30, 50, 59.94, 60 | 1440 | 1152 | 47,001,600 ยกเว้นในกรณีที่โดดเด่นเป็นพิเศษ: ข้อจำกัดคือ 62,668,800 สำหรับ 4:2:0 | 60 |
| เอชแอล | ระดับสูง | 23.976, 24, 25, 29.97, 30, 50, 59.94, 60 | 1920 | 1152 | 62,668,800 ยกเว้นในกรณีที่โดดเด่นเป็นพิเศษ: ข้อจำกัดคือ 83,558,400 สำหรับ 4:2:0 | 80 |
ตัวอย่างการใช้งานโปรไฟล์/ระดับ MPEG-2 ทั่วไปบางส่วนแสดงไว้ด้านล่าง พร้อมระบุขีดจำกัดสูงสุดที่เฉพาะเจาะจง:
| โปรไฟล์ @ ระดับ | ความละเอียด (พิกเซล) | อัตราเฟรมสูงสุด (เฮิร์ตซ์) | การสุ่มตัวอย่าง | อัตราบิต (เมกะบิต/วินาที) | ตัวอย่างการใช้งาน |
|---|---|---|---|---|---|
| SP@LL | 176 × 144 | 15 | 4:2:0 | 0.096 | โทรศัพท์ไร้สาย |
| SP@ML | 352 × 288 | 15 | 4:2:0 | 0.384 | พีดีเอ |
| 320 × 240 | 24 | ||||
| MP@LL | 352 × 288 | 30 | 4:2:0 | 4 | กล่องรับสัญญาณ (STB) |
| เอ็มพี@เอ็มแอล | 720 × 480 | 30 | 4:2:0 | 15 | ดีวีดี (9.8 เมกะบิต/วินาที), SD DVB (15 เมกะบิต/วินาที) |
| 720 × 576 | 25 | ||||
| เอ็มพี@เอช-14 | 1440 × 1080 | 30 | 4:2:0 | 60 | HDV (25 เมกะบิต/วินาที) |
| 1280 × 720 | 30 | ||||
| MP@HL | 1920 × 1080 | 30 | 4:2:0 | 80 | ATSC (18.3 เมกะบิต/วินาที), SD DVB (31 เมกะบิต/วินาที), HD DVB (50.3 เมกะบิต/วินาที) |
| 1280 × 720 | 60 | ||||
| 422P@ML | 720 × 480 | 30 | 4:2:2 | 50 | Sony IMX (เฉพาะ I), การสนับสนุนการออกอากาศ (เฉพาะ I&P) |
| 720 × 576 | 25 | ||||
| 422P@H-14 | 1440 × 1080 | 30 | 4:2:2 | 80 | |
| 422P@HL | 1920 × 1080 | 30 | 4:2:2 | 300 | Sony MPEG HD422 (50 Mbit/s), Canon XF Codec (50 Mbit/s), เครื่องบันทึก Convergent Design Nanoflash (สูงสุด 160 Mbit/s) |
| 1280 × 720 | 60 |
แอปพลิเคชัน
แอปพลิเคชันบางส่วนแสดงอยู่ด้านล่างนี้
- DVD-Video – รูปแบบวิดีโอสำหรับผู้บริโภคที่มีความละเอียดมาตรฐาน ใช้การสุ่มตัวอย่างสีแบบ 4:2:0 และอัตราการส่งข้อมูลวิดีโอแบบแปรผันได้สูงสุดถึง 9.8 เมกะบิตต่อวินาที
- MPEG IMX – รูปแบบการบันทึกวิดีโอระดับมืออาชีพความละเอียดมาตรฐาน ใช้การบีบอัดแบบอินทราเฟรม การสุ่มตัวอย่างสีแบบ 4:2:2 และอัตราการส่งข้อมูลวิดีโอคงที่ที่ผู้ใช้สามารถเลือกได้ 30, 40 หรือ 50 เมกะบิตต่อวินาที
- HDV – รูปแบบการบันทึกวิดีโอความละเอียดสูงแบบใช้เทป ใช้การสุ่มตัวอย่างสีแบบ 4:2:0 และอัตราการส่งข้อมูลรวม 19.4 หรือ 25 เมกะบิตต่อวินาที
- XDCAM – คือตระกูลของรูปแบบการบันทึกวิดีโอแบบไม่ใช้เทป ซึ่งโดยเฉพาะอย่างยิ่งประกอบด้วยรูปแบบที่ใช้ MPEG-2 Part 2 ได้แก่: MPEG IMX ความละเอียดมาตรฐาน (ดูด้านบน), MPEG HD ความละเอียดสูง และ MPEG HD422 ความละเอียดสูง MPEG IMX และ MPEG HD422 ใช้การสุ่มตัวอย่างสีแบบ 4:2:2 ในขณะที่ MPEG HD ใช้การสุ่มตัวอย่างสีแบบ 4:2:0 รูปแบบส่วนใหญ่ใช้ความเร็วในการรับส่งข้อมูลวิดีโอคงที่ที่เลือกได้ตั้งแต่ 25 ถึง 50 Mbit/s แม้ว่าจะมีโหมดความเร็วบิตแปรผันที่มีความเร็วสูงสุด 18 Mbit/s ก็ตาม
- XF Codec – รูปแบบการบันทึกวิดีโอแบบไร้เทปสำหรับมืออาชีพ คล้ายกับ MPEG HD และ MPEG HD422 แต่จัดเก็บในไฟล์คอนเทนเนอร์ที่แตกต่างกัน
- HD DVD – รูปแบบวิดีโอความละเอียดสูงสำหรับผู้บริโภคที่เลิกใช้แล้ว
- แผ่นบลูเรย์ – รูปแบบวิดีโอความละเอียดสูงสำหรับผู้บริโภค
- โทรทัศน์ออกอากาศ – ในบางประเทศใช้ MPEG-2 Part 2 สำหรับการออกอากาศดิจิทัลความละเอียดสูงตัวอย่างเช่นATSCกำหนดรูปแบบการสแกนหลายรูปแบบ (480i, 480p, 720p, 1080i, 1080p) และอัตราเฟรม/ฟิลด์ที่การสุ่มตัวอย่างสี 4:2:0 โดยมีอัตราข้อมูลสูงสุด 19.4 Mbit/s ต่อช่อง
- เคเบิลทีวีดิจิทัล
- ทีวีดาวเทียม
ผู้ถือสิทธิบัตร
องค์กรต่อไปนี้ถือครองสิทธิบัตรเทคโนโลยีวิดีโอ MPEG-2 ตามที่ระบุไว้ในMPEG LAสิทธิบัตรเหล่านี้ทั้งหมดหมดอายุแล้วในสหรัฐอเมริกาและดินแดนส่วนใหญ่[ 1 ]
| องค์กร | สิทธิบัตร[ 16 ] |
|---|---|
| โซนี่ | 311 |
| ทอมสันไลเซนส์ซิ่ง | 198 |
| มิตซูบิชิ อิเล็กทริค | 119 |
| ฟิลิปส์ | 99 |
| บริษัท จีอีเทคโนโลยี ดีเวลลอปเมนท์ จำกัด | 75 |
| บริษัทพานาโซนิค คอร์ปอเรชั่น | 55 |
| บริษัท ซีเอฟ ไลเซนซิ่ง จำกัด | 44 |
| เจวีซี เคนวูด | 39 |
| ซัมซุง อิเล็กโทรนิคส์ | 38 |
| อัลคาเทล ลูเซนต์ (รวมถึง มัลติมีเดีย แพทเทนต์ ทรัสต์) | 33 |
| บริษัทซิสโก้ เทคโนโลยี อิงค์ | 13 |
| บริษัทโตชิบา คอร์ปอเรชั่น | 9 |
| มหาวิทยาลัยโคลัมเบีย | 9 |
| แอลจี อิเล็กทรอนิกส์ | 8 |
| ฮิตาชิ | 7 |
| ออเรนจ์ เอสเอ | 7 |
| ฟูจิตสึ | 6 |
| บริษัท โรเบิร์ต บอช จำกัด | 5 |
| เครื่องมือทั่วไป | 4 |
| บริษัทโทรคมนาคมอังกฤษ | 3 |
| บริษัทแคนนอน อิงค์ | 2 |
| บริษัท เคดีดี คอร์ปอเรชั่น | 2 |
| บริษัท นิปปอน เทเลกราฟ แอนด์ เทเลโฟน (NTT) | 2 |
| บริษัท อาร์ริส เทคโนโลยี อิงค์ | 2 |
| ซานโย อิเล็กทริก | 1 |
| บริษัท ชาร์ป คอร์ปอเรชั่น | 1 |
| บริษัท ฮิวเลตต์-แพคการ์ด เอ็นเตอร์ไพรส์ | 1 |
ลิงก์ภายนอก
- เว็บไซต์อย่างเป็นทางการของ MPEG
- การเข้ารหัสวิดีโอ MPEG-2 (H.262) – หอสมุดแห่งชาติสหรัฐอเมริกา
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ H.262/MPEG-2 ตอนที่ 2
H.262 หรือMPEG-2 Part 2 (อย่างเป็นทางการเรียกว่า ITU-T Recommendation H.
ประวัติศาสตร์
กระบวนการอนุมัติ ISO/IEC เสร็จสมบูรณ์ในเดือนพฤศจิกายน พ.ศ. 2537 [ 5 ] ฉบับแรกได้รับการอนุมัติในเดือนกรกฎาคม พ.ศ. 2538 [ 6 ] และเผยแพร่โดย ITU-T [ 2 ] และ ISO/IEC ในปี พ.ศ.
ฉบับพิมพ์
H.262 / MPEG-2 วิดีโอฉบับ [ 13 ] ฉบับ วันที่วางจำหน่าย การแก้ไขล่าสุด มาตรฐาน ISO/IEC ข้อแนะนำของ ITU-T ฉบับพิมพ์ครั้งแรก พ.ศ. 2538 2000 ISO/IEC 13818-2:1996 [ 7 ] H.262 (07/95) ฉบับพิมพ์ครั้งที่สอง 2000 2010 [ 2 ] [ 14 ] ISO/IEC 13818-2:2000 [ 15 ] H.
การสุ่มตัวอย่างภาพ
กล้อง HDTV ที่มีการสุ่มตัวอย่าง 8 บิต จะสร้างสตรีมวิดีโอแบบดิบขนาด 25 × 1920 × 1080 × 3 = 155,520,000 ไบต์ต่อวินาที สำหรับวิดีโอ 25 เฟรมต่อวินาที (โดยใช้ รูปแบบ การสุ่มตัวอย่าง 4:4:4 )...