อ่าน 2 นาที
จี.718
G.718 เป็น ข้อแนะนำของ ITU-T สำหรับตัวแปลงสัญญาณเสียงพูดและ เสียงพูด แบบปรับขนาดได้ ฝังตัว ซึ่งให้คุณภาพเสียงพูดแบบแคบแบนด์ (250 Hz ถึง 3.
จี.718
| จี.718 | |
|---|---|
| การเข้ารหัสแบบฝังตัวอัตราบิตแปรผันสำหรับเสียงพูดและเสียงทั่วไปที่มีความทนทานต่อข้อผิดพลาดของเฟรม ทั้งแบบแถบความถี่แคบและแถบความถี่กว้าง ตั้งแต่ 8-32 กิโลบิต/วินาที | |
| สถานะ | มีผลบังคับใช้ |
| ปีเริ่มต้น | 2008 |
| เวอร์ชั่นล่าสุด | (03/11) มีนาคม 2554 |
| องค์กร | ไอทู-ที |
| มาตรฐานที่เกี่ยวข้อง | G.719 , G.722.1 |
| โดเมน | การบีบอัดเสียง |
| ใบอนุญาต | สามารถใช้งานได้ฟรี |
| เว็บไซต์ | https://www.itu.int/rec/T-REC-G.718 |
G.718เป็น ข้อแนะนำของ ITU-Tสำหรับตัวแปลงสัญญาณเสียงพูดและเสียงพูดแบบปรับขนาดได้ ฝังตัว ซึ่งให้คุณภาพเสียงพูดแบบแคบแบนด์ (250 Hz ถึง 3.5 kHz) คุณภาพสูงในช่วงอัตราบิตต่ำ และคุณภาพเสียงพูดแบบไวด์แบนด์ (50 Hz ถึง 7 kHz) คุณภาพสูงในช่วงอัตราบิตทั้งหมด[ 1 ]นอกจากนี้ G.718 ยังได้รับการออกแบบให้มีความทนทานต่อการลบเฟรมสูง จึงช่วยเพิ่มคุณภาพเสียงพูดเมื่อใช้ในแอปพลิเคชันการขนส่งโปรโตคอลอินเทอร์เน็ต (IP) บนเครือข่ายคงที่ ไร้สาย และเคลื่อนที่ แม้จะมีลักษณะฝังตัว แต่ตัวแปลงสัญญาณก็ยังทำงานได้ดีกับสัญญาณเสียงทั่วไปทั้งแบบแคบแบนด์และไวด์แบนด์ ตัวแปลงสัญญาณมี โครงสร้าง แบบปรับขนาด ได้ฝังตัว ทำให้มีความยืดหยุ่นสูงสุดในการขนส่งแพ็กเก็ตเสียงผ่านเครือข่าย IP ในปัจจุบันและในเครือข่ายที่รองรับสื่อในอนาคต นอกจากนี้ โครงสร้างแบบฝังตัวของ G.718 จะช่วยให้สามารถขยายโคเดกเพื่อรองรับย่านความถี่กว้างพิเศษ (50 Hz ถึง 14 kHz) และความสามารถในการสื่อสารแบบสเตอริโอได้ง่ายขึ้น ผ่านเลเยอร์เพิ่มเติมซึ่งกำลังอยู่ระหว่างการพัฒนาใน กลุ่มศึกษา ITU-T Study Group 16 สตรีมบิตอาจถูกตัดทอนที่ฝั่งตัวถอดรหัสหรือโดยส่วนประกอบใดๆ ของระบบสื่อสาร เพื่อปรับอัตราบิตให้เป็นค่าที่ต้องการได้ทันทีโดยไม่จำเป็นต้องใช้สัญญาณนอกย่านความถี่ ตัวเข้ารหัสจะสร้างสตรีมบิตแบบฝังตัวที่มีโครงสร้างเป็นห้าเลเยอร์ ซึ่งสอดคล้องกับอัตราบิตห้าค่าที่มีให้เลือก ได้แก่ 8, 12, 16, 24 และ 32 กิโลบิต/วินาที
ตัวเข้ารหัส G.718 สามารถรับสัญญาณแบบไวด์แบนด์ที่ความถี่ 16 kHz หรือสัญญาณแบบแนร์โรว์แบนด์ที่ความถี่ 16 หรือ 8 kHz ได้ ในทำนองเดียวกัน เอาต์พุตของตัวถอดรหัสสามารถเป็นแบบไวด์แบนด์ 16 kHz นอกเหนือจากแบบแนร์โรว์แบนด์ 16 หรือ 8 kHz สัญญาณอินพุตที่ความถี่ 16 kHz แต่มีแบนด์วิดท์จำกัดเฉพาะแบบแนร์โรว์แบนด์ จะถูกตรวจจับโดยตัวเข้ารหัส เอาต์พุตของตัวแปลงสัญญาณ G.718 สามารถทำงานได้ที่แบนด์วิดท์ 50 Hz ถึง 4 kHz ที่ความเร็ว 8 และ 12 kbit/s และ 50 Hz ถึง 7 kHz ที่ความเร็ว 8 ถึง 32 kbit/s
แกนหลักของตัวแปลงสัญญาณแสดงถึงความก้าวหน้าอย่างมากในด้านคุณภาพเมื่อเทียบกับตัวแปลงสัญญาณอื่นๆ ที่มีอยู่ โดยให้คุณภาพเสียงที่คมชัดระดับบรอดแบนด์ 8 กิโลบิต/วินาที เทียบเท่ากับG.722.2ที่ 12.65 กิโลบิต/วินาที ในขณะที่โหมดการทำงานของตัวแปลงสัญญาณแบบแคบแบนด์ 8 กิโลบิต/วินาที ให้คุณภาพเสียงที่คมชัดเทียบเท่ากับG.729ภาคผนวก E ที่ 11.8 กิโลบิต/วินาที
ตัวแปลงสัญญาณนี้ทำงานกับเฟรมขนาด 20 มิลลิวินาที และมีค่าความหน่วงเชิงอัลกอริทึมสูงสุด 42.875 มิลลิวินาที สำหรับสัญญาณอินพุตและเอาต์พุตแบบไวด์แบนด์ ส่วนค่าความหน่วงเชิงอัลกอริทึมสูงสุดสำหรับสัญญาณอินพุตและเอาต์พุตแบบแนร์โรว์แบนด์คือ 43.875 มิลลิวินาที นอกจากนี้ยังสามารถใช้ตัวแปลงสัญญาณในโหมดความหน่วงต่ำได้ เมื่อตั้งค่าอัตราบิตสูงสุดของตัวเข้ารหัสและตัวถอดรหัสไว้ที่ 12 กิโลบิต/วินาที ในกรณีนี้ ค่าความหน่วงเชิงอัลกอริทึมสูงสุดจะลดลง 10 มิลลิวินาที
ตัวแปลงสัญญาณนี้ยังรวมโหมดการเข้ารหัสทางเลือกไว้ด้วย โดยมีอัตราบิตขั้นต่ำ 12.65 กิโลบิต/วินาที ซึ่งสามารถทำงานร่วมกันได้กับ มาตรฐานการเข้ารหัสเสียงแบบบรอดแบนด์สำหรับอุปกรณ์เคลื่อนที่ ITU-T Recommendation G.722.2 , 3GPP AMR-WBและ3GPP2 VMR-WBตัวเลือกนี้จะแทนที่เลเยอร์ 1 และเลเยอร์ 2 และเลเยอร์ 3-5 จะคล้ายกับตัวเลือกเริ่มต้น ยกเว้นว่าในเลเยอร์ 3 จะใช้บิตเพียงเล็กน้อยเพื่อชดเชยบิตพิเศษของแกนหลัก 12.65 กิโลบิต/วินาที นอกจากนี้ ตัวถอดรหัสยังสามารถถอดรหัสโหมดการทำงานอื่นๆ ของG.722.2 ได้ทั้งหมด G.718 ยังรวมถึง โหมด การส่งสัญญาณแบบไม่ต่อเนื่อง (DTX) และ อัลกอริธึมการสร้าง เสียงรบกวนเพื่อความสบาย (CNG) ที่ช่วยประหยัดแบนด์วิดท์ในช่วงเวลาที่ไม่ได้ใช้งาน สามารถใช้อัลกอริธึมลดเสียงรบกวนแบบบูรณาการได้หากเซสชันการสื่อสารจำกัดอยู่ที่ 12 กิโลบิต/วินาที
อัลกอริทึมพื้นฐานใช้โครงสร้างการเข้ารหัสสองขั้นตอน: สองชั้นล่างใช้การเข้ารหัสแบบ Code-Excited Linear Prediction ( CELP ) สำหรับย่านความถี่ (50–6400 Hz) โดยชั้นหลักใช้ประโยชน์จากการจำแนกสัญญาณเพื่อใช้โหมดการเข้ารหัสที่เหมาะสมที่สุดสำหรับแต่ละเฟรม ชั้นที่สูงกว่าจะเข้ารหัสสัญญาณข้อผิดพลาดที่มีน้ำหนักจากชั้นล่างโดยใช้ การเข้ารหัสแบบ แปลงโคไซน์แบบไม่ต่อเนื่องที่ปรับปรุงแล้ว (MDCT) แบบซ้อนทับและบวก มีการใช้เทคโนโลยีหลายอย่างในการเข้ารหัสสัมประสิทธิ์ MDCT เพื่อเพิ่มประสิทธิภาพสูงสุดทั้งสำหรับเสียงพูดและดนตรี
G.718 ได้รับการพัฒนาในITU-T Study Group 16 ซึ่งเป็นส่วนหนึ่งของกลุ่มองค์กรเปิด 9 องค์กร ได้แก่Motorola , Nokia , Ericsson , Texas Instruments , VoiceAge Corporation [ 2 ] Panasonic , Huawei , France TelecomและQualcommได้รับการอนุมัติในปี 2551
G.718 มีคำอธิบายอย่างเป็นทางการว่า เป็นการเข้ารหัสแบบฝังตัวที่มีอัตราบิตแปรผันสำหรับเสียงพูดและเสียงทั่วไป ที่ทนทานต่อข้อผิดพลาดของเฟรม ทั้งแบบแถบความถี่แคบและแถบความถี่กว้าง ตั้งแต่ 8-32 กิโลบิต/วินาที
ดูเพิ่มเติม
ลิงก์ภายนอก
- ข้อแนะนำอย่างเป็นทางการของ ITU-T G.718
- รูปแบบเพย์โหลด RTP สำหรับเสียงพูด/เสียง G.718 draft-ietf-payload-rtp-g718 - ร่างเอกสารอินเทอร์เน็ต
- แผนงานของกลุ่มงาน ITU-T SG 16 (2005-2008) - G.718 (เดิมคือ G.VBR-EV)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ จี.718
G.718 เป็น ข้อแนะนำของ ITU-T สำหรับตัวแปลงสัญญาณเสียงพูดและ เสียงพูด แบบปรับขนาดได้ ฝังตัว ซึ่งให้คุณภาพเสียงพูดแบบแคบแบนด์ (250 Hz ถึง 3.
ลิงก์ภายนอก
ข้อแนะนำอย่างเป็นทางการของ ITU-T G.718 รูปแบบเพย์โหลด RTP สำหรับเสียงพูด/เสียง G.718 draft-ietf-payload-rtp-g718 - ร่างเอกสารอินเทอร์เน็ต แผนงานของกลุ่มงาน ITU-T SG 16 (2005-2008) - G.718 (เดิมคือ G.VBR-EV) ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.