กลับไปหน้าบทความ

อ่าน 5 นาที

ตัวแปลงสัญญาณเสียงแบบปรับอัตราได้หลายระดับ

ตัวแปลงสัญญาณเสียง Adaptive Multi-Rate ( AMR , AMR-NBหรือGSM-AMR ) เป็นรูปแบบการบีบอัดเสียงที่ได้รับการปรับให้เหมาะสมสำหรับการเข้ารหัสเสียง พูด AMR เป็น

ตัวแปลงสัญญาณเสียงแบบปรับอัตราได้หลายระดับ

อัตราปรับได้หลายระดับ (AMR)
นามสกุลไฟล์
.amr, .3ga
สื่อประเภทอินเทอร์เน็ต
เสียง/AMR, เสียง/3GPP, เสียง/3GPP2
การเผยแพร่ครั้งแรก23 มิถุนายน พ.ศ. 2542 [ 1 ] [ 2 ] ( 23 มิถุนายน 1999 )
รุ่นล่าสุด
14.0.0 17 มีนาคม 2017 ( 17 มีนาคม 2017 )
ประเภทของรูปแบบไฟล์เสียงแบบบีบอัด
รูปแบบเปิด ?ใช่
รูปแบบฟรีใช่ไหม?เลขที่

ตัวแปลงสัญญาณเสียง Adaptive Multi-Rate ( AMR , AMR-NBหรือGSM-AMR ) เป็นรูปแบบการบีบอัดเสียงที่ได้รับการปรับให้เหมาะสมสำหรับการเข้ารหัสเสียง พูด AMR เป็น ตัวแปลงสัญญาณเสียงพูดแบบแถบความถี่แคบหลายอัตราที่เข้ารหัสสัญญาณแถบความถี่แคบ (200–3400 Hz) ที่อัตราบิตแปรผันได้ตั้งแต่ 4.75 ถึง 12.2 กิโลบิต/วินาที โดยมีเสียงพูดคุณภาพสูง[ 3 ]เริ่มต้นที่ 7.4 กิโลบิต/วินาที[ 4 ]

AMR ได้รับการยอมรับให้เป็นตัวแปลง สัญญาณเสียงมาตรฐาน โดย3GPPในเดือนตุลาคม พ.ศ. 2542 และปัจจุบันมีการใช้งานอย่างแพร่หลายในGSM [ 5 ]และUMTSโดยใช้การปรับลิงก์เพื่อเลือกอัตราบิตที่แตกต่างกันแปดอัตราตามสภาพลิงก์

AMR ยังเป็นรูปแบบไฟล์สำหรับจัดเก็บเสียงพูดโดยใช้ตัวแปลงสัญญาณ AMR โทรศัพท์มือถือรุ่นใหม่หลายรุ่นสามารถจัดเก็บการบันทึกเสียงสั้นๆ ในรูปแบบ AMR ได้ และมีโปรแกรมทั้งแบบฟรีและแบบเสียเงิน (ดูการสนับสนุนซอฟต์แวร์ ) สำหรับแปลงระหว่างรูปแบบนี้กับรูปแบบอื่นๆ แม้ว่า AMR จะเป็นรูปแบบเสียงพูดและไม่น่าจะให้ผลลัพธ์ที่ดีที่สุดสำหรับเสียงประเภทอื่นๆ นามสกุลไฟล์ ทั่วไป คือ.amr.AMR นอกจากนี้ยังมีรูปแบบการจัดเก็บ AMR อีกรูปแบบหนึ่งที่เหมาะสมสำหรับแอปพลิเคชันที่มีความต้องการขั้นสูงกว่าในรูปแบบการจัดเก็บ เช่น การเข้าถึงแบบสุ่มหรือการซิงโครไนซ์กับวิดีโอ รูปแบบนี้คือรูปแบบคอนเทนเนอร์3GP ที่กำหนดโดย 3GPP ซึ่งอิงตามรูปแบบไฟล์มีเดียพื้นฐาน ISO [ 6 ]

การใช้งาน

เฟรมประกอบด้วยตัวอย่าง 160 ตัวอย่างและมีความยาว 20 มิลลิวินาที[ 1 ] AMR ใช้เทคนิคต่างๆ เช่นACELP , DTX , VADและCNGการใช้งาน AMR จำเป็นต้องมีการปรับการเชื่อมต่อให้เหมาะสมที่สุด ซึ่งจะเลือกโหมดตัวแปลงสัญญาณที่ดีที่สุดเพื่อให้ตรงกับช่องสัญญาณวิทยุในพื้นที่และข้อกำหนดด้านความจุ หากสภาพวิทยุไม่ดีการเข้ารหัสแหล่งที่มาจะลดลงและการเข้ารหัสช่องสัญญาณจะเพิ่มขึ้น ซึ่งจะช่วยปรับปรุงคุณภาพและความเสถียรของการเชื่อมต่อเครือข่ายในขณะที่ลดความชัดเจนของเสียงลงบ้าง ในกรณีเฉพาะของ AMR การปรับปรุงนี้จะอยู่ที่ประมาณ S/N = 4–6 dB สำหรับการสื่อสารที่ใช้งานได้ ระบบอัจฉริยะใหม่นี้ช่วยให้ผู้ให้บริการเครือข่ายสามารถจัดลำดับความสำคัญของความจุหรือคุณภาพต่อสถานีฐานได้

ตัวแปลงสัญญาณ AMR มีทั้งหมด 14 โหมด โดย 8 โหมดสามารถใช้งานได้ในช่องสัญญาณอัตราเต็ม (FR)และ 6 โหมดสามารถใช้งานได้ในช่องสัญญาณอัตราครึ่ง (HR )

โหมดอัตราบิต (กิโลบิต/วินาที)ช่องเข้ากันได้กับ
เอเอ็มอาร์_12.2012.20เอฟอาร์ETSI GSM อัตราเต็มประสิทธิภาพสูง
AMR_10.2010.20เอฟอาร์
เอเอ็มอาร์_7.957.95FR/HR
เอเอ็มอาร์_7.407.40FR/HRTIA/EIA IS-641 TDMA อัตราเต็มที่ได้รับการปรับปรุง
เอเอ็มอาร์_6.706.70FR/HRARIB 6.7 กิโลบิต/วินาที อัตราเต็มที่ได้รับการปรับปรุง
เอเอ็มอาร์_5.905.90FR/HR
เอเอ็มอาร์_5.155.15FR/HR
เอเอ็มอาร์_4.754.75FR/HR
เอเอ็มอาร์_เอสไอดี1.80FR/HR

คุณสมบัติ

  • ความถี่ในการสุ่มตัวอย่าง 8 kHz/13 บิต (160 ตัวอย่างสำหรับเฟรม 20 มิลลิวินาที) กรองที่ 200–3400 Hz
  • ตัวแปลงสัญญาณ AMR ใช้ตัวแปลงสัญญาณต้นทางแปดตัวที่มีอัตราบิต 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 และ 4.75 กิโลบิต/วินาที
  • สร้างเฟรมที่มีความยาว 95, 103, 118, 134, 148, 159, 204 หรือ 244 บิต สำหรับอัตราบิต AMR FR ที่ 4.75, 5.15, 5.90, 6.70, 7.40, 7.95, 10.2 หรือ 12.2 กิโลบิต/วินาที ตามลำดับ ความยาวเฟรม AMR HR จะแตกต่างกัน
  • AMR ใช้การส่งสัญญาณแบบไม่ต่อเนื่อง (DTX) ร่วมกับการตรวจจับกิจกรรมเสียง (VAD) และการสร้างเสียงรบกวนเพื่อความสบาย (CNG) เพื่อลดการใช้แบนด์วิดท์ในช่วงเวลาเงียบ
  • ความล่าช้าของอัลกอริทึมคือ 20 มิลลิวินาทีต่อเฟรม สำหรับอัตราบิต 12.2 จะไม่มีความล่าช้าในการมองล่วงหน้าของ "อัลกอริทึม" สำหรับอัตราอื่นๆ ความล่าช้าในการมองล่วงหน้าคือ 5 มิลลิวินาที โปรดทราบว่ามีความล่าช้าในการมองล่วงหน้า "จำลอง" 5 มิลลิวินาที เพื่อให้สามารถสลับโหมดเฟรมต่อเฟรมได้อย่างราบรื่นกับอัตราอื่นๆ
  • AMR เป็นตัวเข้ารหัสเสียงแบบไฮบริด ดังนั้นจึงส่งทั้งพารามิเตอร์เสียงและสัญญาณรูปคลื่น
  • ความซับซ้อนของอัลกอริทึมนี้ได้รับการประเมินที่ระดับ 5 โดยใช้มาตราส่วนสัมพัทธ์ที่G.711มีค่าเป็น 1 และG.729aมีค่าเป็น 15
  • การทดสอบ PSQMภายใต้สภาวะที่เหมาะสม ให้คะแนนความเห็นเฉลี่ย 4.14 สำหรับ AMR (12.2 กิโลบิต/วินาที) เมื่อเทียบกับ 4.45 สำหรับG.711 (กฎไมโคร)
  • การทดสอบ PSQM ภายใต้สภาวะความเครียดของเครือข่าย ให้คะแนนความเห็นเฉลี่ย 3.79 สำหรับ AMR (12.2 กิโลบิต/วินาที) เมื่อเทียบกับ 4.13 สำหรับG.711 (μ-law)

ประเด็นเกี่ยวกับการอนุญาตและการจดสิทธิบัตร

ตัวแปลงสัญญาณ AMR ประกอบด้วยสิทธิบัตร หลายรายการ ของNokia , Ericsson , NTTและ VoiceAge [ 7 ] [ 8 ]โดย VoiceAge เป็นผู้ดูแลลิขสิทธิ์สำหรับกลุ่มสิทธิบัตร AMR ​​VoiceAge ยังรับการส่งสิทธิบัตรเพื่อพิจารณาความจำเป็นที่เป็นไปได้ของสิทธิบัตรเหล่านั้นต่อมาตรฐานเหล่านี้[ 9 ] [ 10 ]

ค่าธรรมเนียมเริ่มต้นสำหรับเครื่องมือสร้างเนื้อหาระดับมืออาชีพและผลิตภัณฑ์ "ช่องทางแบบเรียลไทม์" คือ 6,500 ดอลลาร์สหรัฐ ค่าลิขสิทธิ์ขั้นต่ำต่อปีคือ 10,000 ดอลลาร์สหรัฐ ซึ่งในปีแรกจะไม่รวมค่าธรรมเนียมเริ่มต้น ค่าธรรมเนียมใบอนุญาตต่อช่องจะลดลงจาก 0.99 ดอลลาร์สหรัฐเหลือ 0.50 ดอลลาร์สหรัฐตามปริมาณการใช้งาน สูงสุดไม่เกิน 2 ล้านดอลลาร์สหรัฐต่อปี[ 7 ] [ 8 ]

ในหมวดหมู่ผลิตภัณฑ์คอมพิวเตอร์ส่วนบุคคล เช่น เครื่องเล่นสื่อ ตัวถอดรหัส AMR ได้รับอนุญาตให้ใช้งานได้ฟรี ค่าธรรมเนียมใบอนุญาตสำหรับตัวเข้ารหัสที่ขายได้จะลดลงจาก 0.40 ดอลลาร์เหลือ 0.30 ดอลลาร์ตามปริมาณ สูงสุดไม่เกิน 300,000 ดอลลาร์ต่อปี ค่าลิขสิทธิ์ขั้นต่ำรายปีจะไม่ถูกนำมาใช้กับผลิตภัณฑ์ที่ได้รับอนุญาตซึ่งอยู่ในหมวดหมู่ผลิตภัณฑ์คอมพิวเตอร์ส่วนบุคคลและใช้เฉพาะตัวถอดรหัสฟรีเท่านั้น[ 7 ] [ 8 ]

ข้อมูลเพิ่มเติม:

  • ข้อมูลเกี่ยวกับการอนุญาตใช้งาน VoiceAgeรวมถึงราคาสำหรับการอนุญาตใช้งานตัวแปลงสัญญาณ AMR
  • ประเด็นทางกฎหมายของ 3GPP
  • แพลตฟอร์มสิทธิบัตร 3G และนโยบายการอนุญาตใช้สิทธิ
  • โค้ดเดค AMR ในรูปแบบไลบรารีที่ใช้ร่วมกันถูกเก็บถาวรเมื่อวันที่ 11 เมษายน 2021 ที่Wayback Machine — ข้อความทางกฎหมายสำหรับการใช้งานไลบรารี amrnb และ amrwb โดยอิงตามการใช้งานอ้างอิง

การสนับสนุนซอฟต์แวร์

  • 3GPP TS 26.073 – ตัวแปลงสัญญาณเสียง AMR (ซอร์สโค้ด C) – การใช้งานอ้างอิง[ 11 ]
  • Audacity (เบต้าเวอร์ชัน 1.3) ผ่านไลบรารีการรวม FFmpeg [ 12 ] (ทั้งรูปแบบอินพุตและเอาต์พุต)
  • FFmpegพร้อมไลบรารี OpenCORE AMR [ 13 ]
  • Android [ 14 ]ใช้สำหรับเครื่องบันทึกเสียง
  • โค้ดเด็ค AMR ในรูปแบบไลบรารีที่ใช้ร่วมกันถูกเก็บถาวรเมื่อวันที่ 11 เมษายน 2021 ที่Wayback Machine  – เว็บไซต์การพัฒนาไลบรารี amrnb และ amrwb ไลบรารีเหล่านี้มีพื้นฐานมาจากการใช้งานอ้างอิง และถูกสร้างขึ้นเพื่อป้องกันการฝังซอร์สโค้ดที่อาจมีสิทธิบัตรลงในโครงการโอเพนซอร์สจำนวนมาก
  • ซอฟต์แวร์โอเพนซอร์สสำหรับแปลงไฟล์ .amr ได้แก่RetroCodeและAmr2Wavซึ่งทั้งสองยังอยู่ในช่วงเริ่มต้นของการพัฒนา
  • AMR Playerเป็นซอฟต์แวร์ฟรีสำหรับเล่นไฟล์เสียง AMR และสามารถแปลงไฟล์เสียง AMR จาก/เป็นรูปแบบ MP3/WAV ได้
  • Nokia Multimedia Converter 2.0สามารถแปลง (สร้าง) ไฟล์ตัวอย่างได้ โดยใช้เครื่องมือแปลงไฟล์ของ Nokia เพื่อสร้างไฟล์ .amr และ .awb ใช้งานได้บน Windows 7 เช่นกัน หากติดตั้งในโหมดความเข้ากันได้กับ XP
  • MPlayer ( SMPlayer , KMPlayer [ 15 ] )
  • โปรแกรมเล่นมีเดีย Parole เวอร์ชัน 0.8.1 (ใน Ubuntu 16.04)
  • โปรแกรมเล่น QuickTimeและกรอบงานมัลติมีเดีย
  • RealPlayerเวอร์ชัน 11 ขึ้นไป
  • โปรแกรมเล่นมีเดีย VLCเวอร์ชัน 1.1.0 ขึ้นไป (เฉพาะรูปแบบอินพุต ไม่ใช่รูปแบบเอาต์พุต)
  • ffdshow
  • Apple iPhone (สามารถเล่นไฟล์ AMR ได้)
  • iOSและmacOS (iMessage)
  • สมาร์ทโฟน BlackBerry (ใช้สำหรับไฟล์บันทึกเสียง แต่BlackBerry 10ไม่สามารถเล่นไฟล์ AMR ได้)
  • ชุดโคเดค K-Lite
  • โปรแกรมเล่นมีเดียสำหรับโฮมเธียเตอร์รุ่นคลาสสิก เวอร์ชันประมาณ 1.7.1
  • foobar2000พร้อมคอมโพเนนต์foo_input_amr

ดูเพิ่มเติม

  • 3GPP TS 26.090 – ฟังก์ชันการประมวลผลเสียงพูดของตัวแปลงสัญญาณเสียงพูดแบบบังคับ; ตัวแปลงสัญญาณเสียงพูดแบบปรับอัตราได้หลายระดับ (AMR); ฟังก์ชันการแปลงรหัสเสียง
  • 3GPP TS 26.071 – ฟังก์ชันการประมวลผลเสียงของตัวแปลงสัญญาณเสียงบังคับ; ตัวแปลงสัญญาณเสียง AMR; คำอธิบายทั่วไป
  • ข้อกำหนดโคเด็ก 3GPP; 3G และรุ่นต่อๆ ไป / GSM, ซีรี่ส์ 26
  • RFC  4867  – รูปแบบเพย์โหลด RTP และรูปแบบการจัดเก็บไฟล์สำหรับตัวแปลงสัญญาณเสียงแบบ Adaptive Multi-Rate (AMR) และ Adaptive Multi-Rate Wideband (AMR-WB)
  • RFC  4281  – พารามิเตอร์ Codecs สำหรับประเภทสื่อ "Bucket"
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Adaptive_Multi-Rate_audio_codec&oldid=1306124989 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ตัวแปลงสัญญาณเสียงแบบปรับอัตราได้หลายระดับ

ตัวแปลงสัญญาณเสียง Adaptive Multi-Rate ( AMR , AMR-NBหรือGSM-AMR ) เป็นรูปแบบการบีบอัดเสียงที่ได้รับการปรับให้เหมาะสมสำหรับการเข้ารหัสเสียง พูด AMR เป็น

การใช้งาน

เฟรมประกอบด้วยตัวอย่าง 160 ตัวอย่างและมีความยาว 20 มิลลิวินาที [ 1 ] AMR ใช้เทคนิคต่างๆ เช่น ACELP , DTX , VAD และ CNG การใช้งาน AMR จำเป็นต้องมีการปรับการเชื่อมต่อให้เหมาะสมที่สุด...

คุณสมบัติ

ความถี่ในการสุ่มตัวอย่าง 8 kHz/13 บิต (160 ตัวอย่างสำหรับเฟรม 20 มิลลิวินาที) กรองที่ 200–3400 Hz ตัวแปลงสัญญาณ AMR ใช้ตัวแปลงสัญญาณต้นทางแปดตัวที่มีอัตราบิต 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 และ 4.

ประเด็นเกี่ยวกับการอนุญาตและการจดสิทธิบัตร

ตัวแปลงสัญญาณ AMR ประกอบด้วย สิทธิบัตร หลายรายการ ของ Nokia , Ericsson , NTT และ VoiceAge [ 7 ] [ 8 ] โดย VoiceAge เป็น ผู้ดูแลลิขสิทธิ์ สำหรับ กลุ่มสิทธิบัตร AMR ​​VoiceAge...