อ่าน 5 นาที
ตัวแปลงสัญญาณเสียงแบบปรับอัตราได้หลายระดับ
ตัวแปลงสัญญาณเสียง Adaptive Multi-Rate ( AMR , AMR-NBหรือGSM-AMR ) เป็นรูปแบบการบีบอัดเสียงที่ได้รับการปรับให้เหมาะสมสำหรับการเข้ารหัสเสียง พูด AMR เป็น
ตัวแปลงสัญญาณเสียงแบบปรับอัตราได้หลายระดับ
| อัตราปรับได้หลายระดับ (AMR) | |
|---|---|
| นามสกุลไฟล์ | .amr, .3ga |
| สื่อประเภทอินเทอร์เน็ต | เสียง/AMR, เสียง/3GPP, เสียง/3GPP2 |
| การเผยแพร่ครั้งแรก | 23 มิถุนายน พ.ศ. 2542 [ 1 ] [ 2 ] |
| รุ่นล่าสุด | 14.0.0 17 มีนาคม 2017 |
| ประเภทของรูปแบบ | ไฟล์เสียงแบบบีบอัด |
| รูปแบบเปิด ? | ใช่ |
| รูปแบบฟรีใช่ไหม? | เลขที่ |
ตัวแปลงสัญญาณเสียง Adaptive Multi-Rate ( AMR , AMR-NBหรือGSM-AMR ) เป็นรูปแบบการบีบอัดเสียงที่ได้รับการปรับให้เหมาะสมสำหรับการเข้ารหัสเสียง พูด AMR เป็น ตัวแปลงสัญญาณเสียงพูดแบบแถบความถี่แคบหลายอัตราที่เข้ารหัสสัญญาณแถบความถี่แคบ (200–3400 Hz) ที่อัตราบิตแปรผันได้ตั้งแต่ 4.75 ถึง 12.2 กิโลบิต/วินาที โดยมีเสียงพูดคุณภาพสูง[ 3 ]เริ่มต้นที่ 7.4 กิโลบิต/วินาที[ 4 ]
AMR ได้รับการยอมรับให้เป็นตัวแปลง สัญญาณเสียงมาตรฐาน โดย3GPPในเดือนตุลาคม พ.ศ. 2542 และปัจจุบันมีการใช้งานอย่างแพร่หลายในGSM [ 5 ]และUMTSโดยใช้การปรับลิงก์เพื่อเลือกอัตราบิตที่แตกต่างกันแปดอัตราตามสภาพลิงก์
AMR ยังเป็นรูปแบบไฟล์สำหรับจัดเก็บเสียงพูดโดยใช้ตัวแปลงสัญญาณ AMR โทรศัพท์มือถือรุ่นใหม่หลายรุ่นสามารถจัดเก็บการบันทึกเสียงสั้นๆ ในรูปแบบ AMR ได้ และมีโปรแกรมทั้งแบบฟรีและแบบเสียเงิน (ดูการสนับสนุนซอฟต์แวร์ ) สำหรับแปลงระหว่างรูปแบบนี้กับรูปแบบอื่นๆ แม้ว่า AMR จะเป็นรูปแบบเสียงพูดและไม่น่าจะให้ผลลัพธ์ที่ดีที่สุดสำหรับเสียงประเภทอื่นๆ นามสกุลไฟล์ ทั่วไป คือ.amr.AMR นอกจากนี้ยังมีรูปแบบการจัดเก็บ AMR อีกรูปแบบหนึ่งที่เหมาะสมสำหรับแอปพลิเคชันที่มีความต้องการขั้นสูงกว่าในรูปแบบการจัดเก็บ เช่น การเข้าถึงแบบสุ่มหรือการซิงโครไนซ์กับวิดีโอ รูปแบบนี้คือรูปแบบคอนเทนเนอร์3GP ที่กำหนดโดย 3GPP ซึ่งอิงตามรูปแบบไฟล์มีเดียพื้นฐาน ISO [ 6 ]
การใช้งาน
เฟรมประกอบด้วยตัวอย่าง 160 ตัวอย่างและมีความยาว 20 มิลลิวินาที[ 1 ] AMR ใช้เทคนิคต่างๆ เช่นACELP , DTX , VADและCNGการใช้งาน AMR จำเป็นต้องมีการปรับการเชื่อมต่อให้เหมาะสมที่สุด ซึ่งจะเลือกโหมดตัวแปลงสัญญาณที่ดีที่สุดเพื่อให้ตรงกับช่องสัญญาณวิทยุในพื้นที่และข้อกำหนดด้านความจุ หากสภาพวิทยุไม่ดีการเข้ารหัสแหล่งที่มาจะลดลงและการเข้ารหัสช่องสัญญาณจะเพิ่มขึ้น ซึ่งจะช่วยปรับปรุงคุณภาพและความเสถียรของการเชื่อมต่อเครือข่ายในขณะที่ลดความชัดเจนของเสียงลงบ้าง ในกรณีเฉพาะของ AMR การปรับปรุงนี้จะอยู่ที่ประมาณ S/N = 4–6 dB สำหรับการสื่อสารที่ใช้งานได้ ระบบอัจฉริยะใหม่นี้ช่วยให้ผู้ให้บริการเครือข่ายสามารถจัดลำดับความสำคัญของความจุหรือคุณภาพต่อสถานีฐานได้
ตัวแปลงสัญญาณ AMR มีทั้งหมด 14 โหมด โดย 8 โหมดสามารถใช้งานได้ในช่องสัญญาณอัตราเต็ม (FR)และ 6 โหมดสามารถใช้งานได้ในช่องสัญญาณอัตราครึ่ง (HR )
| โหมด | อัตราบิต (กิโลบิต/วินาที) | ช่อง | เข้ากันได้กับ |
|---|---|---|---|
| เอเอ็มอาร์_12.20 | 12.20 | เอฟอาร์ | ETSI GSM อัตราเต็มประสิทธิภาพสูง |
| AMR_10.20 | 10.20 | เอฟอาร์ | |
| เอเอ็มอาร์_7.95 | 7.95 | FR/HR | |
| เอเอ็มอาร์_7.40 | 7.40 | FR/HR | TIA/EIA IS-641 TDMA อัตราเต็มที่ได้รับการปรับปรุง |
| เอเอ็มอาร์_6.70 | 6.70 | FR/HR | ARIB 6.7 กิโลบิต/วินาที อัตราเต็มที่ได้รับการปรับปรุง |
| เอเอ็มอาร์_5.90 | 5.90 | FR/HR | |
| เอเอ็มอาร์_5.15 | 5.15 | FR/HR | |
| เอเอ็มอาร์_4.75 | 4.75 | FR/HR | |
| เอเอ็มอาร์_เอสไอดี | 1.80 | FR/HR |
คุณสมบัติ
- ความถี่ในการสุ่มตัวอย่าง 8 kHz/13 บิต (160 ตัวอย่างสำหรับเฟรม 20 มิลลิวินาที) กรองที่ 200–3400 Hz
- ตัวแปลงสัญญาณ AMR ใช้ตัวแปลงสัญญาณต้นทางแปดตัวที่มีอัตราบิต 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 และ 4.75 กิโลบิต/วินาที
- สร้างเฟรมที่มีความยาว 95, 103, 118, 134, 148, 159, 204 หรือ 244 บิต สำหรับอัตราบิต AMR FR ที่ 4.75, 5.15, 5.90, 6.70, 7.40, 7.95, 10.2 หรือ 12.2 กิโลบิต/วินาที ตามลำดับ ความยาวเฟรม AMR HR จะแตกต่างกัน
- AMR ใช้การส่งสัญญาณแบบไม่ต่อเนื่อง (DTX) ร่วมกับการตรวจจับกิจกรรมเสียง (VAD) และการสร้างเสียงรบกวนเพื่อความสบาย (CNG) เพื่อลดการใช้แบนด์วิดท์ในช่วงเวลาเงียบ
- ความล่าช้าของอัลกอริทึมคือ 20 มิลลิวินาทีต่อเฟรม สำหรับอัตราบิต 12.2 จะไม่มีความล่าช้าในการมองล่วงหน้าของ "อัลกอริทึม" สำหรับอัตราอื่นๆ ความล่าช้าในการมองล่วงหน้าคือ 5 มิลลิวินาที โปรดทราบว่ามีความล่าช้าในการมองล่วงหน้า "จำลอง" 5 มิลลิวินาที เพื่อให้สามารถสลับโหมดเฟรมต่อเฟรมได้อย่างราบรื่นกับอัตราอื่นๆ
- AMR เป็นตัวเข้ารหัสเสียงแบบไฮบริด ดังนั้นจึงส่งทั้งพารามิเตอร์เสียงและสัญญาณรูปคลื่น
- การเข้ารหัสแบบทำนายเชิงเส้น ( Linear Predictive Coding : LPC) ใช้ในการสังเคราะห์เสียงพูดจากรูปคลื่นส่วนเหลือ พารามิเตอร์ของ LPC จะถูกเข้ารหัสเป็นคู่สเปกตรัมเส้น (Line Spectral Pairs: LSP)
- รูปคลื่นตกค้างจะถูกเข้ารหัสโดยใช้การทำนายเชิงเส้นที่กระตุ้นด้วยรหัสพีชคณิต (ACELP)
- ความซับซ้อนของอัลกอริทึมนี้ได้รับการประเมินที่ระดับ 5 โดยใช้มาตราส่วนสัมพัทธ์ที่G.711มีค่าเป็น 1 และG.729aมีค่าเป็น 15
- การทดสอบ PSQMภายใต้สภาวะที่เหมาะสม ให้คะแนนความเห็นเฉลี่ย 4.14 สำหรับ AMR (12.2 กิโลบิต/วินาที) เมื่อเทียบกับ 4.45 สำหรับG.711 (กฎไมโคร)
- การทดสอบ PSQM ภายใต้สภาวะความเครียดของเครือข่าย ให้คะแนนความเห็นเฉลี่ย 3.79 สำหรับ AMR (12.2 กิโลบิต/วินาที) เมื่อเทียบกับ 4.13 สำหรับG.711 (μ-law)
ประเด็นเกี่ยวกับการอนุญาตและการจดสิทธิบัตร
ตัวแปลงสัญญาณ AMR ประกอบด้วยสิทธิบัตร หลายรายการ ของNokia , Ericsson , NTTและ VoiceAge [ 7 ] [ 8 ]โดย VoiceAge เป็นผู้ดูแลลิขสิทธิ์สำหรับกลุ่มสิทธิบัตร AMR VoiceAge ยังรับการส่งสิทธิบัตรเพื่อพิจารณาความจำเป็นที่เป็นไปได้ของสิทธิบัตรเหล่านั้นต่อมาตรฐานเหล่านี้[ 9 ] [ 10 ]
ค่าธรรมเนียมเริ่มต้นสำหรับเครื่องมือสร้างเนื้อหาระดับมืออาชีพและผลิตภัณฑ์ "ช่องทางแบบเรียลไทม์" คือ 6,500 ดอลลาร์สหรัฐ ค่าลิขสิทธิ์ขั้นต่ำต่อปีคือ 10,000 ดอลลาร์สหรัฐ ซึ่งในปีแรกจะไม่รวมค่าธรรมเนียมเริ่มต้น ค่าธรรมเนียมใบอนุญาตต่อช่องจะลดลงจาก 0.99 ดอลลาร์สหรัฐเหลือ 0.50 ดอลลาร์สหรัฐตามปริมาณการใช้งาน สูงสุดไม่เกิน 2 ล้านดอลลาร์สหรัฐต่อปี[ 7 ] [ 8 ]
ในหมวดหมู่ผลิตภัณฑ์คอมพิวเตอร์ส่วนบุคคล เช่น เครื่องเล่นสื่อ ตัวถอดรหัส AMR ได้รับอนุญาตให้ใช้งานได้ฟรี ค่าธรรมเนียมใบอนุญาตสำหรับตัวเข้ารหัสที่ขายได้จะลดลงจาก 0.40 ดอลลาร์เหลือ 0.30 ดอลลาร์ตามปริมาณ สูงสุดไม่เกิน 300,000 ดอลลาร์ต่อปี ค่าลิขสิทธิ์ขั้นต่ำรายปีจะไม่ถูกนำมาใช้กับผลิตภัณฑ์ที่ได้รับอนุญาตซึ่งอยู่ในหมวดหมู่ผลิตภัณฑ์คอมพิวเตอร์ส่วนบุคคลและใช้เฉพาะตัวถอดรหัสฟรีเท่านั้น[ 7 ] [ 8 ]
ข้อมูลเพิ่มเติม:
- ข้อมูลเกี่ยวกับการอนุญาตใช้งาน VoiceAgeรวมถึงราคาสำหรับการอนุญาตใช้งานตัวแปลงสัญญาณ AMR
- ประเด็นทางกฎหมายของ 3GPP
- แพลตฟอร์มสิทธิบัตร 3G และนโยบายการอนุญาตใช้สิทธิ
- โค้ดเดค AMR ในรูปแบบไลบรารีที่ใช้ร่วมกันถูกเก็บถาวรเมื่อวันที่ 11 เมษายน 2021 ที่Wayback Machine — ข้อความทางกฎหมายสำหรับการใช้งานไลบรารี amrnb และ amrwb โดยอิงตามการใช้งานอ้างอิง
การสนับสนุนซอฟต์แวร์
- 3GPP TS 26.073 – ตัวแปลงสัญญาณเสียง AMR (ซอร์สโค้ด C) – การใช้งานอ้างอิง[ 11 ]
- Audacity (เบต้าเวอร์ชัน 1.3) ผ่านไลบรารีการรวม FFmpeg [ 12 ] (ทั้งรูปแบบอินพุตและเอาต์พุต)
- FFmpegพร้อมไลบรารี OpenCORE AMR [ 13 ]
- Android [ 14 ]ใช้สำหรับเครื่องบันทึกเสียง
- โค้ดเด็ค AMR ในรูปแบบไลบรารีที่ใช้ร่วมกันถูกเก็บถาวรเมื่อวันที่ 11 เมษายน 2021 ที่Wayback Machine – เว็บไซต์การพัฒนาไลบรารี amrnb และ amrwb ไลบรารีเหล่านี้มีพื้นฐานมาจากการใช้งานอ้างอิง และถูกสร้างขึ้นเพื่อป้องกันการฝังซอร์สโค้ดที่อาจมีสิทธิบัตรลงในโครงการโอเพนซอร์สจำนวนมาก
- ซอฟต์แวร์โอเพนซอร์สสำหรับแปลงไฟล์ .amr ได้แก่RetroCodeและAmr2Wavซึ่งทั้งสองยังอยู่ในช่วงเริ่มต้นของการพัฒนา
- AMR Playerเป็นซอฟต์แวร์ฟรีสำหรับเล่นไฟล์เสียง AMR และสามารถแปลงไฟล์เสียง AMR จาก/เป็นรูปแบบ MP3/WAV ได้
- Nokia Multimedia Converter 2.0สามารถแปลง (สร้าง) ไฟล์ตัวอย่างได้ โดยใช้เครื่องมือแปลงไฟล์ของ Nokia เพื่อสร้างไฟล์ .amr และ .awb ใช้งานได้บน Windows 7 เช่นกัน หากติดตั้งในโหมดความเข้ากันได้กับ XP
- MPlayer ( SMPlayer , KMPlayer [ 15 ] )
- โปรแกรมเล่นมีเดีย Parole เวอร์ชัน 0.8.1 (ใน Ubuntu 16.04)
- โปรแกรมเล่น QuickTimeและกรอบงานมัลติมีเดีย
- RealPlayerเวอร์ชัน 11 ขึ้นไป
- โปรแกรมเล่นมีเดีย VLCเวอร์ชัน 1.1.0 ขึ้นไป (เฉพาะรูปแบบอินพุต ไม่ใช่รูปแบบเอาต์พุต)
- ffdshow
- Apple iPhone (สามารถเล่นไฟล์ AMR ได้)
- iOSและmacOS (iMessage)
- สมาร์ทโฟน BlackBerry (ใช้สำหรับไฟล์บันทึกเสียง แต่BlackBerry 10ไม่สามารถเล่นไฟล์ AMR ได้)
- ชุดโคเดค K-Lite
- โปรแกรมเล่นมีเดียสำหรับโฮมเธียเตอร์รุ่นคลาสสิก เวอร์ชันประมาณ 1.7.1
- foobar2000พร้อมคอมโพเนนต์foo_input_amr
ดูเพิ่มเติม
- Adaptive Multi-Rate Wideband (AMR-WB)
- การปรับอัตราหลายระดับแบบขยาย – แถบความถี่กว้าง (AMR-WB+)
- อัตราครึ่ง
- อัตราเต็ม
- อัตราเต็มที่เพิ่มขึ้น (EFR)
- อัตราการสุ่มตัวอย่าง
- ไอเอส-641
- 3GP
- การเปรียบเทียบรูปแบบการเข้ารหัสเสียง
- โปรไฟล์เสียงและวิดีโอ RTP
ลิงก์ภายนอก
- 3GPP TS 26.090 – ฟังก์ชันการประมวลผลเสียงพูดของตัวแปลงสัญญาณเสียงพูดแบบบังคับ; ตัวแปลงสัญญาณเสียงพูดแบบปรับอัตราได้หลายระดับ (AMR); ฟังก์ชันการแปลงรหัสเสียง
- 3GPP TS 26.071 – ฟังก์ชันการประมวลผลเสียงของตัวแปลงสัญญาณเสียงบังคับ; ตัวแปลงสัญญาณเสียง AMR; คำอธิบายทั่วไป
- ข้อกำหนดโคเด็ก 3GPP; 3G และรุ่นต่อๆ ไป / GSM, ซีรี่ส์ 26
- RFC 4867 – รูปแบบเพย์โหลด RTP และรูปแบบการจัดเก็บไฟล์สำหรับตัวแปลงสัญญาณเสียงแบบ Adaptive Multi-Rate (AMR) และ Adaptive Multi-Rate Wideband (AMR-WB)
- RFC 4281 – พารามิเตอร์ Codecs สำหรับประเภทสื่อ "Bucket"
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ตัวแปลงสัญญาณเสียงแบบปรับอัตราได้หลายระดับ
ตัวแปลงสัญญาณเสียง Adaptive Multi-Rate ( AMR , AMR-NBหรือGSM-AMR ) เป็นรูปแบบการบีบอัดเสียงที่ได้รับการปรับให้เหมาะสมสำหรับการเข้ารหัสเสียง พูด AMR เป็น
การใช้งาน
เฟรมประกอบด้วยตัวอย่าง 160 ตัวอย่างและมีความยาว 20 มิลลิวินาที [ 1 ] AMR ใช้เทคนิคต่างๆ เช่น ACELP , DTX , VAD และ CNG การใช้งาน AMR จำเป็นต้องมีการปรับการเชื่อมต่อให้เหมาะสมที่สุด...
คุณสมบัติ
ความถี่ในการสุ่มตัวอย่าง 8 kHz/13 บิต (160 ตัวอย่างสำหรับเฟรม 20 มิลลิวินาที) กรองที่ 200–3400 Hz ตัวแปลงสัญญาณ AMR ใช้ตัวแปลงสัญญาณต้นทางแปดตัวที่มีอัตราบิต 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 และ 4.
ประเด็นเกี่ยวกับการอนุญาตและการจดสิทธิบัตร
ตัวแปลงสัญญาณ AMR ประกอบด้วย สิทธิบัตร หลายรายการ ของ Nokia , Ericsson , NTT และ VoiceAge [ 7 ] [ 8 ] โดย VoiceAge เป็น ผู้ดูแลลิขสิทธิ์ สำหรับ กลุ่มสิทธิบัตร AMR VoiceAge...