การมอดูเลชั่นรหัสพัลส์

Q: ประวัติศาสตร์

การสื่อสารทางไฟฟ้าในยุคแรกเริ่มใช้ การสุ่มตัวอย่าง สัญญาณเพื่อ รวม ตัวอย่างจาก แหล่งสัญญาณ โทรเลข หลายแหล่ง และส่งสัญญาณเหล่านั้นผ่านสายเคเบิลโทรเลขเพียงเส้นเดียว นักประดิษฐ์ชาวอเมริกัน โมเสส จี.

การมอดูเลชั่นรหัสพัลส์
การมอดูเลชั่นรหัสพัลส์
นามสกุลไฟล์	.L16, .WAV, .AIFF, .AU, .PCM
สื่อประเภทอินเทอร์เน็ต	เสียง/L16, เสียง/L8, เสียง/L20, เสียง/L24
รหัสประเภท	"AIFF" สำหรับ L16, ไม่มี
เลขมหัศจรรย์	แตกต่างกันไป
ประเภทของรูปแบบ	ไฟล์เสียงที่ไม่ได้บีบอัด
บรรจุโดย	รองรับไฟล์เสียงหลายรูปแบบ เช่น Audio CD , AES3 , WAV , AIFF , AU , M2TS , VOBและอื่นๆ
รูปแบบเปิด ?	ใช่
รูปแบบฟรีใช่ไหม?	ใช่

การมอดูเลชั่นแบบพัลส์โค้ด ( PCM ) เป็นวิธีการที่ใช้ในการแสดงสัญญาณอนาล็อก ในรูปแบบดิจิทัลเป็นรูปแบบมาตรฐานของเสียงดิจิทัลในคอมพิวเตอร์แผ่นซีดีโทรศัพท์ดิจิทัล และแอปพลิเคชันเสียงดิจิทัลอื่นๆ ใน สตรีม PCM แอมพลิจูดของสัญญาณอนาล็อกจะถูกสุ่มตัวอย่างในช่วงเวลาที่สม่ำเสมอ และแต่ละตัวอย่างจะถูกควอนไทซ์เป็นค่าที่ใกล้ที่สุดภายในช่วงของขั้นตอนดิจิทัลClaude Shannon , Bernard OliverและJohn Pierceได้รับการยกย่องให้เข้าสู่หอเกียรติยศนักประดิษฐ์แห่งชาติเนื่องจากสิทธิบัตร PCM ของพวกเขาที่ได้รับในปี 1952 ^[⁶^]^[⁷^]^[⁸^]^[⁹^]

การมอดูเลชั่นรหัสพัลส์เชิงเส้น ( LPCM ) เป็น PCM ประเภทหนึ่งโดยเฉพาะซึ่งระดับการควอนไทเซชันมีความสม่ำเสมอเชิงเส้น^{[ 5 ]}ซึ่งแตกต่างจากการเข้ารหัส PCM ที่ระดับการควอนไทเซชันแปรผันตามฟังก์ชันของแอมพลิจูด (เช่นเดียวกับอัลกอริทึม A-lawหรืออัลกอริทึม μ-law ) แม้ว่าPCMจะเป็นคำทั่วไปมากกว่า แต่ก็มักใช้เพื่ออธิบายข้อมูลที่เข้ารหัสเป็น LPCM

สัญญาณ PCM มีคุณสมบัติพื้นฐานสองประการที่กำหนดความเที่ยงตรงของสัญญาณต่อสัญญาณอนาล็อกดั้งเดิม ได้แก่อัตราการสุ่มตัวอย่างซึ่งเป็นจำนวนครั้งต่อวินาทีที่ทำการสุ่มตัวอย่าง และความลึกของบิตซึ่งกำหนดจำนวนค่าดิจิทัลที่เป็นไปได้ที่สามารถใช้แทนแต่ละตัวอย่างได้

ประวัติศาสตร์

การสื่อสารทางไฟฟ้าในยุคแรกเริ่มใช้การสุ่มตัวอย่างสัญญาณเพื่อรวมตัวอย่างจาก แหล่งสัญญาณ โทรเลข หลายแหล่ง และส่งสัญญาณเหล่านั้นผ่านสายเคเบิลโทรเลขเพียงเส้นเดียว นักประดิษฐ์ชาวอเมริกันโมเสส จี. ฟาร์มเมอร์คิดค้นระบบมัลติเพล็กซ์แบบแบ่งเวลา (TDM) สำหรับโทรเลขขึ้นตั้งแต่ปี 1853 วิศวกรไฟฟ้า ดับเบิลยู.เอ็ม. ไมเนอร์ ในปี 1903 ได้ใช้ตัวสลับสัญญาณ แบบอิเล็กโทรแมคคานิกส์ เพื่อรวมสัญญาณโทรเลขหลายสัญญาณด้วยระบบมัลติเพล็กซ์แบบแบ่งเวลา และเขายังประยุกต์ใช้เทคโนโลยีนี้กับโทรศัพท์ด้วยเขาได้เสียงพูดที่เข้าใจได้จากช่องสัญญาณที่สุ่มตัวอย่างในอัตราที่สูงกว่า 3500–4300 เฮิรตซ์ อัตราที่ต่ำกว่านั้นพิสูจน์แล้วว่าไม่เป็นที่น่าพอใจ

ในปี พ.ศ. 2463 ระบบส่งภาพผ่านสายเคเบิล Bartlaneใช้การส่งสัญญาณโทรเลขของตัวอักษรที่เจาะลงบนเทปกระดาษเพื่อส่งตัวอย่างภาพที่แบ่งเป็น 5 ระดับ^{[ 10 ]}ในปี พ.ศ. 2469 Paul M. Rainey จากWestern Electricได้จดสิทธิบัตรเครื่องแฟกซ์ที่ส่งสัญญาณโดยใช้ PCM 5 บิต ซึ่งเข้ารหัสโดยตัวแปลงอนาล็อกเป็นดิจิทัลแบบ ออปโตเมคานิก ส์^{[ 11 ]}เครื่องดังกล่าวไม่ได้ถูกนำไปผลิต^{[ 12 ]}

วิศวกรชาวอังกฤษอเล็ก รีฟส์ซึ่งไม่ทราบถึงงานวิจัยก่อนหน้านี้ ได้คิดค้นการใช้ PCM สำหรับการสื่อสารด้วยเสียงในปี 1937 ขณะทำงานให้กับInternational Telephone and Telegraphในฝรั่งเศส เขาได้อธิบายทฤษฎีและข้อดีของมัน แต่ไม่มีการนำไปใช้งานจริง รีฟส์ยื่นขอสิทธิบัตรฝรั่งเศสในปี 1938 และสิทธิบัตรของสหรัฐอเมริกาได้รับการอนุมัติในปี 1943 ^{[ 13 ]}ในเวลานั้น รีฟส์ได้เริ่มทำงานที่Telecommunications Research Establishmentแล้ว^{[ 12 ]}

การส่งสัญญาณ เสียงครั้งแรกด้วยเทคนิคดิจิทัล อุปกรณ์เข้ารหัส SIGSALYถ่ายทอดการสื่อสารระดับสูงของฝ่ายสัมพันธมิตรในช่วงสงครามโลกครั้งที่สอง ในปี พ.ศ. 2492 Ferranti Canada ได้สร้างระบบวิทยุ PCM ที่ใช้งานได้จริงสำหรับ ระบบDATARของกองทัพเรือแคนาดาซึ่งสามารถส่งข้อมูลเรดาร์แบบดิจิทัลได้ในระยะทางไกล^[¹⁴^]

ในช่วงปลายทศวรรษ 1940 และต้นทศวรรษ 1950 PCM ใช้หลอดเข้ารหัส รังสีแคโทด ที่มีแผ่นอิเล็กโทรดที่มีรูพรุนสำหรับการเข้ารหัส^[¹⁵^]เช่นเดียวกับในออสซิลโลสโคปลำแสงจะถูกกวาดในแนวนอนด้วยอัตราการสุ่มตัวอย่าง ในขณะที่การเบี่ยงเบนในแนวตั้งถูกควบคุมโดยสัญญาณอนาล็อกขาเข้า ทำให้ลำแสงผ่านส่วนที่สูงกว่าหรือต่ำกว่าของแผ่นที่มีรูพรุน แผ่นจะรวบรวมหรือส่งผ่านลำแสง ทำให้เกิดการเปลี่ยนแปลงของกระแสไฟฟ้าในรหัสไบนารี ทีละบิต แทนที่จะเป็นไบนารีตามธรรมชาติ ตารางของหลอดรุ่นหลังของ Goodall มีรูพรุนเพื่อสร้างรหัส Gray ที่ปราศจากความผิดพลาด และสร้างบิตทั้งหมดพร้อมกันโดยใช้ลำแสงพัดแทนที่จะเป็นลำแสงสแกน^[¹⁶^]

ในสหรัฐอเมริกาหอเกียรติยศนักประดิษฐ์แห่งชาติได้ยกย่องBernard M. Oliver ^{[ 17 ]} และClaude Shannon ^{[ 18 ]} ในฐานะผู้ประดิษฐ์ PCM ^{[ 19 ]} ตามที่อธิบายไว้ใน "ระบบการสื่อสารที่ใช้การปรับรหัสพัลส์" สิทธิบัตรสหรัฐอเมริกาหมายเลข 2,801,281ที่ยื่นในปี 1946 และ 1952 และได้รับอนุมัติในปี 1956 สิทธิบัตรอีกฉบับในชื่อเดียวกันนี้ถูกยื่นโดยJohn R. Pierceในปี 1945 และออกให้ในปี 1948: สิทธิบัตรสหรัฐอเมริกาหมายเลข 2,437,707ทั้งสามคนได้ตีพิมพ์ "ปรัชญาของ PCM" ในปี 1948 ^{[ 20 ]}

ระบบT-carrierซึ่งเปิดตัวในปี 1961 ใช้สายส่งสัญญาณแบบคู่บิดเกลียวสองเส้นเพื่อส่ง สัญญาณ โทรศัพท์ PCM จำนวน 24 สาย โดยมีการสุ่มตัวอย่างที่ความถี่ 8 kHz และความละเอียด 8 บิต การพัฒนาครั้งนี้ช่วยปรับปรุงความจุและคุณภาพการโทรเมื่อเทียบกับระบบ มัลติเพล็กซ์แบบแบ่งความถี่ แบบเดิม

ในปี พ.ศ. 2516 ได้มีการพัฒนา ระบบการปรับรหัสพัลส์แบบดิฟเฟอเรนเชียลแบบปรับได้ (ADPCM) โดย P. Cummiskey, Nikil JayantและJames L. Flanagan ^{[ 21 ]}

การบันทึกเสียงดิจิทัล

ในปี พ.ศ. 2510 เครื่องบันทึก PCM เครื่องแรกได้รับการพัฒนาโดยศูนย์วิจัยของNHK ในประเทศญี่ปุ่น ^{[ 22 ]}อุปกรณ์ 30 kHz 12 บิตนี้ใช้คอมแพนเดอร์ (คล้ายกับการลดเสียงรบกวน DBX ) เพื่อขยายช่วงไดนามิก และบันทึกสัญญาณลงในเครื่องบันทึกวิดีโอเทปในปี พ.ศ. 2512 NHK ได้ขยายขีดความสามารถของระบบเป็นสเตอริโอ 2 แชนเนลและความละเอียด 32 kHz 13 บิต ในเดือนมกราคม พ.ศ. 2514 วิศวกรของ Denonได้บันทึกการบันทึกดิจิทัลเชิงพาณิชย์ครั้งแรกโดยใช้ระบบบันทึก PCM ของ NHK ^{[หมายเหตุ 1 ]}^{[ 22 ]}

ในปี พ.ศ. 2515 เดนอนได้เปิดตัวเครื่องบันทึกเสียงดิจิทัล 8 แชนเนลเครื่องแรก คือ DN-023R ซึ่งใช้เครื่องบันทึกเทปวิดีโอแบบรีลเปิด 4 หัวในการบันทึกเสียง PCM ที่ความถี่ 47.25 kHz ความละเอียด 13 บิต^{[หมายเหตุ 2 ]}ในปี พ.ศ. 2520 เดนอนได้พัฒนาระบบบันทึกเสียง PCM แบบพกพา คือ DN-034R เช่นเดียวกับ DN-023R ระบบนี้บันทึก 8 แชนเนลที่ความถี่ 47.25 kHz แต่ใช้ความละเอียด 14 บิต "โดยเน้นย้ำทำให้เทียบเท่ากับ 15.5 บิต" ^{[ 22 ]}

ในปี พ.ศ. 2522 อัลบั้มเพลงป็อปดิจิทัลชุดแรกBop till You Dropได้รับการบันทึกเสียง โดยบันทึกเสียงที่ความถี่ 50 kHz, 16 บิต linear PCM โดยใช้เครื่องบันทึกเทปดิจิทัล 3M ^{[ 23 ]}

แผ่นซีดี (CD) นำเทคโนโลยี PCM มาสู่การใช้งานด้านเสียงสำหรับผู้บริโภค โดยเปิดตัวในปี 1982 แผ่นซีดีใช้ ความถี่สุ่มตัวอย่าง 44,100 เฮิรตซ์และความละเอียด 16 บิต และสามารถบันทึกเสียงสเตอริโอได้นานถึง 80 นาทีต่อแผ่น

ระบบโทรศัพท์ดิจิทัล

การพัฒนาอย่างรวดเร็วและการนำระบบโทรศัพท์ดิจิทัล PCM มาใช้อย่างแพร่หลาย นั้นเกิดขึ้นได้ด้วยเทคโนโลยีวงจรตัวเก็บประจุแบบสวิตช์โลหะออกไซด์เซมิคอนดักเตอร์ (MOS ) ซึ่งพัฒนาขึ้นในช่วงต้นทศวรรษ 1970 ^[²⁴^]ซึ่งนำไปสู่การพัฒนาชิปตัวแปลงสัญญาณและตัวกรอง PCM ในช่วงปลายทศวรรษ 1970 ^[²⁴^]^[²⁵^] ชิปตัวแปลงสัญญาณและตัวกรอง PCM CMOS (MOS เสริม) ที่ใช้เกตซิลิคอน ซึ่งพัฒนาโดยDavid A. Hodgesและ WC Black ในปี 1980 ^[²⁴^]ได้กลายเป็นมาตรฐานอุตสาหกรรมสำหรับระบบโทรศัพท์ดิจิทัลตั้งแต่นั้นเป็นต้นมา^[²⁴^]^[²⁵^]ในช่วงทศวรรษ 1990 เครือข่ายโทรคมนาคมเช่นเครือข่ายโทรศัพท์สาธารณะ (PSTN) ได้ถูกแปลงเป็นดิจิทัล เป็นส่วนใหญ่ ด้วยตัวแปลงสัญญาณ PCM CMOS แบบ VLSI ( Very-Large Scale Integration ) ซึ่งใช้กันอย่างแพร่หลายใน ระบบสวิตช์อิเล็กทรอนิกส์สำหรับชุมสายโทรศัพท์โมเด็มฝั่งผู้ใช้ และแอปพลิเคชัน การส่งสัญญาณดิจิทัลที่หลากหลายเช่นเครือข่ายบริการดิจิทัลแบบบูรณาการ (ISDN) โทรศัพท์ไร้สายและโทรศัพท์มือถือ^[²⁵^]

การนำไปใช้

PCM เป็นวิธีการเข้ารหัสที่ใช้โดยทั่วไปสำหรับเสียงดิจิทัลที่ไม่บีบอัด^{[หมายเหตุ 3 ]}

สวิตช์4ESSได้นำการสลับเวลามาใช้ในระบบโทรศัพท์ของสหรัฐอเมริกาในปี พ.ศ. 2519 โดยอาศัยเทคโนโลยีวงจรรวมขนาดกลาง^{[ 26 ]}
LPCM ถูกใช้สำหรับการเข้ารหัสข้อมูลเสียงแบบไม่สูญเสียในมาตรฐานแผ่นซีดี Red Book (หรือที่เรียกกันอย่างไม่เป็นทางการว่าAudio CD ) ซึ่งเปิดตัวในปี 1982
AES3 (กำหนดขึ้นในปี 1985 ซึ่ง เป็นพื้นฐานของ S/PDIF ) เป็นรูปแบบเฉพาะที่ใช้ LPCM
แผ่นเลเซอร์ดิสก์ที่มีระบบเสียงดิจิทัลจะมีแทร็ก LPCM อยู่ในช่องสัญญาณดิจิทัล
ในเครื่องพีซี PCM และ LPCM มักหมายถึงรูปแบบที่ใช้ใน รูปแบบไฟล์เสียง WAV (กำหนดในปี 1991) และAIFF (กำหนดในปี 1988) ข้อมูล LPCM อาจถูกจัดเก็บในรูปแบบอื่น ๆ เช่นAUซึ่งเป็นรูปแบบไฟล์เสียงดิบ (ไฟล์ที่ไม่มีส่วนหัว) และรูปแบบไฟล์ มัลติมีเดียต่าง ๆ
LPCM ได้รับการกำหนดให้เป็นส่วนหนึ่งของ มาตรฐาน DVD (ตั้งแต่ปี 1995) และBlu-ray (ตั้งแต่ปี 2006) ^{[ 27 ]}^{[ 28 ]}^{[ 29 ]}นอกจากนี้ยังได้รับการกำหนดให้เป็นส่วนหนึ่งของรูปแบบการจัดเก็บวิดีโอและเสียงดิจิทัลต่างๆ (เช่นDVตั้งแต่ปี 1995 ^{[ 30 ]} AVCHDตั้งแต่ปี 2006 ^{[ 31 ]} )
LPCM ถูกใช้โดยHDMI (กำหนดนิยามในปี 2002) ซึ่งเป็นอินเทอร์เฟซตัวเชื่อมต่อเสียง/วิดีโอดิจิทัลแบบใช้สายเคเบิลเส้นเดียวสำหรับการส่งข้อมูลดิจิทัลที่ไม่บีบอัด
รูปแบบคอนเทนเนอร์ RF64 (กำหนดในปี 2550) ใช้ LPCM และยังอนุญาตให้จัดเก็บบิตสตรีมที่ไม่ใช่ PCM ได้ด้วย: รูปแบบการบีบอัดต่างๆ ที่มีอยู่ในไฟล์ RF64 ในรูปแบบข้อมูลแบบระเบิด (Dolby E, Dolby AC3, DTS, MPEG-1/MPEG-2 Audio) สามารถ "ปลอมแปลง" เป็น PCM แบบเชิงเส้นได้^{[ 32 ]}

การปรับสัญญาณ

การสุ่มตัวอย่างและการหาปริมาณของสัญญาณ (สีแดง) สำหรับ LPCM 4 บิตในโดเมนเวลาที่ความถี่เฉพาะ

ในแผนภาพคลื่นไซน์ (เส้นโค้งสีแดง) ถูกสุ่มตัวอย่างและแปลงเป็นค่าเชิงปริมาณสำหรับ PCM คลื่นไซน์ถูกสุ่มตัวอย่างในช่วงเวลาปกติ ซึ่งแสดงเป็นเส้นแนวตั้ง สำหรับแต่ละตัวอย่าง จะเลือกค่าใดค่าหนึ่งจากค่าที่มีอยู่ (บนแกน y) กระบวนการ PCM มักถูกนำไปใช้ในวงจรรวม ตัวเดียว ที่เรียกว่าตัวแปลงอนาล็อกเป็นดิจิทัล (ADC) ซึ่งจะสร้างการแสดงผลแบบไม่ต่อเนื่องอย่างสมบูรณ์ของสัญญาณอินพุต (จุดสีน้ำเงิน) ที่สามารถเข้ารหัสเป็นข้อมูลดิจิทัลเพื่อจัดเก็บหรือประมวลผลได้อย่างง่ายดาย สตรีม PCM หลายสตรีมยังสามารถมัลติเพล็กซ์เข้าด้วยกันเป็นสตรีมข้อมูล รวมขนาดใหญ่ขึ้นได้ โดยทั่วไปสำหรับการส่งสตรีมหลายสตรีมผ่านลิงก์ทางกายภาพเดียว เทคนิคหนึ่งเรียกว่าการมัลติเพล็กซ์แบบแบ่งเวลา (TDM) และมีการใช้งานอย่างแพร่หลาย โดยเฉพาะอย่างยิ่งในระบบโทรศัพท์สาธารณะสมัยใหม่

การดีมอดูเลชั่น

วงจรอิเล็กทรอนิกส์ที่ใช้ในการสร้างสัญญาณอนาล็อกที่แม่นยำจากข้อมูลแบบไม่ต่อเนื่องนั้นคล้ายคลึงกับวงจรที่ใช้ในการสร้างสัญญาณดิจิทัล อุปกรณ์เหล่านี้คือตัวแปลงสัญญาณดิจิทัลเป็นอนาล็อก (DAC) โดยจะสร้างแรงดันหรือกระแส (ขึ้นอยู่กับชนิด) ที่แสดงถึงค่าที่ป้อนเข้ามาทางอินพุตดิจิทัล จากนั้นสัญญาณเอาต์พุตนี้จะถูกกรองและขยายสัญญาณเพื่อนำไปใช้งาน

เพื่อกู้คืนสัญญาณดั้งเดิมจากข้อมูลที่สุ่มตัวอย่างตัวถอดรหัสสามารถใช้กระบวนการมอดูเลชั่นแบบย้อนกลับได้ หลังจากแต่ละช่วงเวลาการสุ่มตัวอย่าง ตัวถอดรหัสจะอ่านค่าถัดไปและเปลี่ยนสัญญาณเอาต์พุตเป็นค่าใหม่ ผลจากการเปลี่ยนแปลงเหล่านี้ สัญญาณจะยังคงมีพลังงานความถี่สูงจำนวนมากเนื่องจากเอฟเฟกต์การสร้างภาพ เพื่อกำจัดความถี่ที่ไม่พึงประสงค์เหล่านี้ ตัวถอดรหัสจะส่งสัญญาณผ่านตัวกรองการสร้างใหม่ที่ระงับพลังงานนอกช่วงความถี่ที่คาดไว้ (มากกว่าความถี่ Nyquist ) ^[^{หมายเหตุ 4}^] $f_{s}/2$

ความแม่นยำและอัตราการสุ่มตัวอย่างมาตรฐาน

ความลึกของตัวอย่างทั่วไปสำหรับ LPCM คือ 8, 16, 20 หรือ 24 บิตต่อตัวอย่าง^{[ 1 ]}^{[ 2 ]}^{[ 3 ]}^{[ 33 ]}

LPCM เข้ารหัสช่องสัญญาณเสียงเดียว การรองรับเสียงหลายช่องสัญญาณขึ้นอยู่กับรูปแบบไฟล์และอาศัยการซิงโครไนซ์ของสตรีม LPCM หลายรายการ^{[ 5 ]}^{[ 34 ]}แม้ว่าสองช่องสัญญาณ (สเตอริโอ) จะเป็นรูปแบบที่พบได้บ่อยที่สุด แต่ระบบสามารถรองรับช่องสัญญาณเสียงได้มากถึง 8 ช่อง (7.1 เซอร์ราวด์) ^{[ 2 ]}^{[ 3 ]}หรือมากกว่านั้น

ความถี่การสุ่มตัวอย่างทั่วไปคือ 48 kHzซึ่งใช้กับ วิดีโอรูปแบบ DVDหรือ 44.1 kHz ซึ่งใช้ในซีดี ความถี่การสุ่มตัวอย่าง 96 kHz หรือ 192 kHz สามารถใช้ได้ในอุปกรณ์บางชนิด แต่ประโยชน์ของมันยังเป็นที่ถกเถียงกันอยู่^{[ 35 ]}

ข้อจำกัด

ทฤษฎีบทการสุ่มตัวอย่างของ Nyquist–Shannonแสดงให้เห็นว่าอุปกรณ์ PCM สามารถทำงานได้โดยไม่ก่อให้เกิดความผิดเพี้ยนภายในย่านความถี่ที่ออกแบบไว้ หากมีความถี่ในการสุ่มตัวอย่างอย่างน้อยสองเท่าของความถี่สูงสุดที่มีอยู่ในสัญญาณอินพุต ตัวอย่างเช่น ในระบบโทรศัพท์ ย่าน ความถี่เสียงที่ใช้งานได้จะอยู่ในช่วงประมาณ 300 ถึง 3400 Hz [ ^{36 ] เพื่อ}การสร้างสัญญาณเสียงขึ้นใหม่อย่างมีประสิทธิภาพ แอปพลิเคชันโทรศัพท์จึงมักใช้ความถี่ในการสุ่มตัวอย่าง 8000 Hz ซึ่งมากกว่าสองเท่าของความถี่เสียงที่ใช้งานได้สูงสุด

อย่างไรก็ตาม ระบบ PCM ทุกระบบล้วนมีแหล่งที่มาของความบกพร่องที่อาจเกิดขึ้นได้:

การเลือกค่าที่ไม่ต่อเนื่องซึ่งอยู่ใกล้เคียงแต่ไม่ตรงกับระดับสัญญาณอนาล็อกสำหรับแต่ละตัวอย่างจะนำไปสู่ข้อผิดพลาดในการกำหนดปริมาณเมื่อใช้การกระจายสัญญาณ เพื่อชดเชยข้อผิดพลาดนี้ จะทำให้เกิดสัญญาณรบกวนเพิ่มเติม ^{[หมายเหตุ 5 ]}
ระหว่างการเก็บตัวอย่างแต่ละครั้ง จะไม่มีการวัดสัญญาณใดๆ ทฤษฎีการสุ่มตัวอย่างรับประกันการแสดงและการกู้คืนสัญญาณที่ไม่กำกวมได้ก็ต่อเมื่อสัญญาณนั้นไม่มีพลังงานที่ความถี่f _s /2 หรือสูงกว่า (ครึ่งหนึ่งของความถี่การสุ่มตัวอย่าง ซึ่งเรียกว่าความถี่ Nyquist ) ความถี่ที่สูงกว่านั้นจะไม่ถูกแสดงหรือกู้คืนได้อย่างถูกต้อง และจะทำให้เกิดการบิดเบือนแบบเอเลียสซิ่งกับสัญญาณที่ต่ำกว่าความถี่ Nyquist
เนื่องจากตัวอย่างขึ้นอยู่กับเวลา จึงจำเป็นต้องใช้นาฬิกาที่แม่นยำเพื่อให้ได้ผลลัพธ์ที่ถูกต้อง หากนาฬิกาการเข้ารหัสหรือการถอดรหัสไม่เสถียร ข้อบกพร่องเหล่านี้จะส่งผลโดยตรงต่อคุณภาพเอาต์พุตของอุปกรณ์^{[หมายเหตุ 6 ]}

การประมวลผลและการเข้ารหัส

รูปแบบ PCM บางรูปแบบผสมผสานการประมวลผลสัญญาณเข้ากับการเข้ารหัส ระบบรุ่นเก่าใช้การประมวลผลในโดเมนอนาล็อกเป็นส่วนหนึ่งของกระบวนการแปลงอนาล็อกเป็นดิจิทัล ในขณะที่ระบบรุ่นใหม่กว่าใช้การประมวลผลในโดเมนดิจิทัล เทคนิคแบบง่ายเหล่านี้ส่วนใหญ่ล้าสมัยไปแล้วด้วย เทคนิค การบีบอัดเสียง แบบใช้การแปลงสมัยใหม่ เช่น การเข้ารหัส แบบแปลงโคไซน์แบบไม่ต่อเนื่องที่ปรับปรุงแล้ว (MDCT)

PCM เชิงเส้น (LPCM) คือ PCM ที่มีการควอนไทเซชันเชิงเส้น^{[ 5 ]}
การเข้ารหัส PCM แบบดิฟเฟอเรนเชียล (DPCM) เข้ารหัสค่า PCM โดยใช้ผลต่างระหว่างค่าปัจจุบันและค่าที่คาดการณ์ไว้ อัลกอริทึมจะคาดการณ์ค่าตัวอย่างถัดไปโดยอิงจากค่าตัวอย่างก่อนหน้า และตัวเข้ารหัสจะจัดเก็บเฉพาะผลต่างระหว่างการคาดการณ์นี้กับค่าจริงเท่านั้น หากการคาดการณ์มีความสมเหตุสมผล จะสามารถใช้บิตน้อยลงในการแสดงข้อมูลเดียวกัน สำหรับเสียง การเข้ารหัสประเภทนี้จะลดจำนวนบิตที่จำเป็นต่อตัวอย่างลงประมาณ 25% เมื่อเทียบกับ PCM
การมอดูเลชั่นแบบพัลส์โค้ดดิฟเฟอเรนเชียลแบบปรับได้ (ADPCM) เป็นรูปแบบหนึ่งของ DPCM ที่ปรับขนาดของขั้นตอนการควอนไทเซชัน เพื่อให้สามารถลดแบนด์วิดธ์ที่ต้องการลงได้อีกสำหรับอัตราส่วนสัญญาณต่อสัญญาณรบกวน ที่กำหนด
การมอดูเลชั่นแบบเดลต้าเป็นรูปแบบหนึ่งของ DPCM ที่ใช้หนึ่งบิตต่อตัวอย่างเพื่อระบุว่าสัญญาณเพิ่มขึ้นหรือลดลงเมื่อเทียบกับตัวอย่างก่อนหน้า

ในระบบโทรศัพท์ สัญญาณเสียงมาตรฐานสำหรับการโทรหนึ่งครั้งจะถูกเข้ารหัสเป็น 8,000 ตัวอย่างต่อวินาทีโดยแต่ละตัวอย่างมี 8 บิต ทำให้ได้สัญญาณดิจิทัล 64 กิโลบิตต่อวินาที ซึ่งเรียกว่าDS0 การเข้ารหัส การบีบอัดสัญญาณเริ่มต้นบน DS0 คือμ-law (mu-law) PCM (อเมริกาเหนือและญี่ปุ่น) หรือA-law PCM (ยุโรปและส่วนใหญ่ของโลก) ระบบเหล่านี้เป็นระบบการบีบอัดแบบลอการิทึม โดยที่หมายเลขตัวอย่าง PCM เชิงเส้น 12 หรือ 13 บิตจะถูก แปลง เป็นค่า 8 บิต ระบบนี้ได้รับการอธิบายไว้ในมาตรฐานสากลG.711

ในกรณีที่ต้นทุนวงจรสูงและยอมรับได้กับการสูญเสียคุณภาพเสียง การบีบอัดสัญญาณเสียงให้มากยิ่งขึ้นก็อาจเป็นเรื่องที่เหมาะสม โดยใช้อัลกอริธึม ADPCM ในการแปลงชุดตัวอย่าง PCM แบบ μ-law หรือ A-law 8 บิต ให้เป็นชุดตัวอย่าง ADPCM 4 บิต ด้วยวิธีนี้ ความจุของสายส่งจะเพิ่มขึ้นเป็นสองเท่า เทคนิคนี้มีรายละเอียดอยู่ในมาตรฐาน G.726

รูปแบบการเข้ารหัสเสียงและตัวแปลงสัญญาณเสียงได้รับการพัฒนาขึ้นเพื่อให้ได้การบีบอัดที่ดียิ่งขึ้น เทคนิคเหล่านี้บางส่วนได้รับการกำหนดมาตรฐานและจดสิทธิบัตรแล้ว เทคนิคการบีบอัดขั้นสูง เช่นการแปลงโคไซน์แบบไม่ต่อเนื่องที่ปรับปรุงแล้ว (MDCT) และการเข้ารหัสเชิงทำนายเชิงเส้น (LPC) กำลังถูกนำมาใช้อย่างแพร่หลายในโทรศัพท์มือถือเสียงผ่านอินเทอร์เน็ต (VoIP) และสื่อสตรีมมิ่ง

การเข้ารหัสสำหรับการส่งข้อมูลแบบอนุกรม

PCM สามารถเป็นได้ทั้งแบบreturn-to-zero (RZ) หรือnon-return-to-zero (NRZ) สำหรับระบบ NRZ ที่จะซิงโครไนซ์โดยใช้ข้อมูลในแบนด์ จะต้องไม่มีลำดับสัญลักษณ์ที่เหมือนกันยาวๆ เช่น เลขหนึ่งหรือเลขศูนย์ สำหรับระบบ PCM แบบไบนารี ความหนาแน่นของสัญลักษณ์เลขหนึ่งเรียกว่าความหนาแน่นของเลขหนึ่ง^{[ 37 ]}

โดยทั่วไปแล้ว ความหนาแน่นของเลขหนึ่งจะถูกควบคุมโดยใช้เทคนิคการเข้ารหัสล่วงหน้า เช่น การเข้ารหัส แบบจำกัดความยาว (run-length limited encoding) ซึ่งรหัส PCM จะถูกขยายเป็นรหัสที่ยาวขึ้นเล็กน้อยโดยมีการรับประกันขอบเขตของความหนาแน่นของเลขหนึ่งก่อนที่จะทำการมอดูเลตเข้าสู่ช่องสัญญาณ ในบางกรณี จะมีการเพิ่ม บิตเฟรม พิเศษ เข้าไปในสตรีม ซึ่งรับประกันการเปลี่ยนสัญลักษณ์อย่างน้อยเป็นครั้งคราว

อีกเทคนิคหนึ่งที่ใช้ในการควบคุมความหนาแน่นของเลขหนึ่งคือการใช้ตัวเข้ารหัสข้อมูล (scrambler) ซึ่งจะทำให้กระแสข้อมูลกลายเป็นกระแสข้อมูลที่ดูเหมือนสุ่มเทียมแต่ข้อมูลสามารถกู้คืนได้อย่างแม่นยำโดยใช้ตัวถอดรหัส (descrambler) ที่เสริมกัน ในกรณีนี้ การมีเลขศูนย์หรือเลขหนึ่งเรียงกันยาวๆ ยังคงเป็นไปได้ในผลลัพธ์ แต่ถือว่าไม่น่าจะเกิดขึ้นได้มากพอที่จะทำให้การซิงโครไนซ์มีความน่าเชื่อถือ

ในบางกรณี ค่ากระแสตรงระยะยาวของสัญญาณที่ถูกมอดูเลตมีความสำคัญ เนื่องจากค่าไบแอสกระแสตรงที่ สะสม จะทำให้วงจรการสื่อสารทำงานนอกช่วงการทำงานปกติ ในกรณีนี้ จะมีการใช้มาตรการพิเศษเพื่อนับค่าไบแอสกระแสตรงสะสม และปรับเปลี่ยนรหัสหากจำเป็น เพื่อให้ค่าไบแอสกระแสตรงมีแนวโน้มกลับเป็นศูนย์เสมอ

รหัสเหล่านี้จำนวนมากเป็นรหัสแบบไบโพลาร์ซึ่งพัลส์อาจเป็นบวก ลบ หรือไม่มีเลย ใน รหัส การกลับเครื่องหมายแบบสลับกัน ทั่วไป พัลส์ที่ไม่เป็นศูนย์จะสลับกันระหว่างค่าบวกและค่าลบ กฎเหล่านี้อาจถูกละเมิดเพื่อสร้างสัญลักษณ์พิเศษที่ใช้สำหรับการจัดเฟรมหรือวัตถุประสงค์พิเศษอื่นๆ

การตั้งชื่อ

คำว่า"พัลส์"ในคำว่า " การมอดูเลชั่นรหัสพัลส์"หมายถึงพัลส์ที่จะพบได้ในสายส่งสัญญาณ นี่อาจเป็นผลลัพธ์ตามธรรมชาติของเทคนิคนี้ที่พัฒนาควบคู่ไปกับวิธีการอนาล็อกสองวิธี คือการมอดูเลชั่นความกว้างพัลส์และการมอดูเลชั่นตำแหน่งพัลส์ซึ่งข้อมูลที่จะเข้ารหัสจะถูกแทนด้วยพัลส์สัญญาณแบบไม่ต่อเนื่องที่มีความกว้างหรือตำแหน่งที่แตกต่างกัน ในแง่นี้ PCM มีความคล้ายคลึงกับรูปแบบการเข้ารหัสสัญญาณอื่นๆ เหล่านี้น้อยมาก ยกเว้นว่าทั้งหมดสามารถใช้ในการมัลติเพล็กซ์แบบแบ่งเวลาได้ และตัวเลขของรหัส PCM จะถูกแทนด้วยพัลส์ไฟฟ้า

ดูเพิ่มเติม

ตัวเข้ารหัสเบต้า
สัญญาณรบกวนการเข้ารหัสพัลส์เทียบเท่า
อัตราส่วนสัญญาณต่อสัญญาณรบกวนจากการควอนไทเซชัน (SQNR) ซึ่งเป็นวิธีหนึ่งในการวัดข้อผิดพลาดจากการควอนไทเซชัน

หมายเหตุอธิบาย

^หนึ่งในผลงานบันทึกเสียงชุดแรกๆ คือ Uzu: The World Of Stomu Yamash'ta 2โดย Stomu Yamashta
^การบันทึกเสียงครั้งแรกด้วยระบบใหม่นี้เกิดขึ้นที่โตเกียวระหว่างวันที่ 24-26 เมษายน 1972
^ยังมีวิธีการอื่นๆ อีก เช่นการมอดูเลชั่นความหนาแน่นของพัลส์ซึ่งใช้ในแผ่นเสียง Super Audio CDด้วย
^บางระบบใช้การกรองแบบดิจิทัลเพื่อกำจัดสัญญาณรบกวนบางส่วน โดยแปลงสัญญาณจากดิจิทัลเป็นอนาล็อกที่อัตราการสุ่มตัวอย่างที่สูงขึ้น ทำให้ตัวกรองป้องกันสัญญาณรบกวน แบบอนาล็อก นั้นง่ายกว่ามาก ในบางระบบ ไม่มีการกรองอย่างชัดเจนเลย เนื่องจากเป็นไปไม่ได้ที่ระบบใดๆ จะสร้างสัญญาณที่มีแบนด์วิดท์อนันต์ได้ การสูญเสียโดยธรรมชาติในระบบจึงชดเชยสิ่งผิดปกติเหล่านั้น หรือระบบนั้นไม่ต้องการความแม่นยำมากนัก
^ข้อผิดพลาดในการควอนไทเซชันแกว่งไปมาระหว่าง -q / 2 และ q /2 ในกรณีที่เหมาะสมที่สุด (ด้วย ADC เชิงเส้นอย่างสมบูรณ์และระดับสัญญาณ >> q ) ข้อผิดพลาดจะกระจายอย่างสม่ำเสมอในช่วงนี้ โดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเท่ากับ q² /¹²
^โดยทั่วไปแล้ว ความแตกต่างเล็กน้อยระหว่างความถี่สัญญาณนาฬิกาการเข้ารหัสและการถอดรหัสไม่ใช่ปัญหาใหญ่ ข้อผิดพลาดคงที่เล็กน้อยนั้นแทบจะไม่สังเกตเห็นได้อย่างไรก็ตาม ข้อผิดพลาดของสัญญาณนาฬิกาจะกลายเป็นปัญหาใหญ่หากสัญญาณนาฬิกามี การกระเพื่อม อย่างมีนัยสำคัญ

อ่านเพิ่มเติม

Franklin S. Cooper ; Ignatius Mattingly (1969). "ระบบ PCM ที่ควบคุมด้วยคอมพิวเตอร์สำหรับการตรวจสอบการรับรู้เสียงพูดแบบไดโคติก"วารสารของสมาคมเสียงแห่งอเมริกา 46 ( 1A): 115. Bibcode : 1969ASAJ...46..115C . doi : 10.1121/1.1972688 .
เคน ซี. โพลมันน์ (1985). หลักการของเสียงดิจิทัล (ฉบับที่ 2). คาร์เมล รัฐอินเดียนา: สำนักพิมพ์คอมพิวเตอร์แซมส์/เพรนทิส-ฮอลล์. ISBN 978-0-672-22634-2.
DH Whalen , ER Wiley, Philip E. RubinและFranklin S. Cooper (1990). "ระบบการปรับรหัสพัลส์ (PCM) ของห้องปฏิบัติการ Haskins"วิธีการวิจัยพฤติกรรม เครื่องมือ และคอมพิวเตอร์ 22 ( 6): 550– 559. doi : 10.3758/ BF03204440{{cite journal}}: CS1 maint: multiple names: authors list ( link )
บิล วากเกนเนอร์ (1995) เทคนิคการปรับรหัสพัลส์ (ฉบับที่ 1) นิวยอร์ก รัฐนิวยอร์ก: แวน นอสแตรนด์ ไรน์โฮลด์ไอเอสบีเอ็น 978-0-442-01436-0.
บิล แวกเกเนอร์ (1999). การออกแบบระบบการเข้ารหัสพัลส์ (ฉบับพิมพ์ครั้งที่ 1). บอสตัน, แมสซาชูเซตส์: อาร์เทค เฮาส์. ISBN 978-0-89006-776-5.

ลิงก์ภายนอก

คำอธิบาย PCM บน MultimediaWiki
ราล์ฟ มิลเลอร์และบ็อบ แบดจ์ลีย์ คิดค้น PCM หลายระดับขึ้นโดยอิสระจากกัน ในระหว่างการทำงานที่เบลล์แล็บส์เกี่ยวกับSIGSALY : สิทธิบัตรสหรัฐอเมริกาหมายเลข 3,912,868ยื่นจดในปี 1943: การเข้ารหัสแบบพัลส์หลายระดับ (N-ary Pulse Code Modulation)
ข้อมูลเกี่ยวกับ PCM : คำอธิบายเกี่ยวกับ PCM พร้อมลิงก์ไปยังข้อมูลเกี่ยวกับชนิดย่อยของรูปแบบนี้ (เช่นการมอดูเลชั่นรหัสพัลส์เชิงเส้น ) และการอ้างอิงถึงข้อกำหนดเฉพาะของแต่ละชนิดย่อย
สรุปเกี่ยวกับ LPCM – ประกอบด้วยลิงก์ไปยังข้อมูลเกี่ยวกับการนำไปใช้งานและข้อกำหนดต่างๆ
วิธีการควบคุมฮาร์ดแวร์ภายใน/ภายนอกโดยใช้ Microsoft Media Control Interface – ประกอบด้วยข้อมูลและข้อกำหนดสำหรับการใช้งาน LPCM ในไฟล์ WAV
RFC 4856 – การลงทะเบียนประเภทสื่อของรูปแบบเพย์โหลดในโปรไฟล์ RTP สำหรับการประชุมทางเสียงและวิดีโอ – audio/L8 และ audio/L16 (มีนาคม 2550)
RFC 3190 – รูปแบบเพย์โหลด RTP สำหรับเสียง DAT 12 บิต และเสียงสุ่มตัวอย่างเชิงเส้น 20 และ 24 บิต (มกราคม 2545)
RFC 3551 – โปรไฟล์ RTP สำหรับการประชุมทางเสียงและวิดีโอที่มีการควบคุมขั้นต่ำ – L8 และ L16 (กรกฎาคม 2546)

[23] หนึ่งในผลงานบันทึกเสียงชุดแรกๆ คือ Uzu: The World Of Stomu Yamash'ta 2โดย Stomu Yamashta

[24] การบันทึกเสียงครั้งแรกด้วยระบบใหม่นี้เกิดขึ้นที่โตเกียวระหว่างวันที่ 24-26 เมษายน 1972

[28] ยังมีวิธีการอื่นๆ อีก เช่นการมอดูเลชั่นความหนาแน่นของพัลส์ซึ่งใช้ในแผ่นเสียง Super Audio CDด้วย

[36] บางระบบใช้การกรองแบบดิจิทัลเพื่อกำจัดสัญญาณรบกวนบางส่วน โดยแปลงสัญญาณจากดิจิทัลเป็นอนาล็อกที่อัตราการสุ่มตัวอย่างที่สูงขึ้น ทำให้ตัวกรองป้องกันสัญญาณรบกวน แบบอนาล็อก นั้นง่ายกว่ามาก ในบางระบบ ไม่มีการกรองอย่างชัดเจนเลย เนื่องจากเป็นไปไม่ได้ที่ระบบใดๆ จะสร้างสัญญาณที่มีแบนด์วิดท์อนันต์ได้ การสูญเสียโดยธรรมชาติในระบบจึงชดเชยสิ่งผิดปกติเหล่านั้น หรือระบบนั้นไม่ต้องการความแม่นยำมากนัก

[41] ข้อผิดพลาดในการควอนไทเซชันแกว่งไปมาระหว่าง -q / 2 และ q /2 ในกรณีที่เหมาะสมที่สุด (ด้วย ADC เชิงเส้นอย่างสมบูรณ์และระดับสัญญาณ >> q ) ข้อผิดพลาดจะกระจายอย่างสม่ำเสมอในช่วงนี้ โดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเท่ากับ q² /¹²

[42] โดยทั่วไปแล้ว ความแตกต่างเล็กน้อยระหว่างความถี่สัญญาณนาฬิกาการเข้ารหัสและการถอดรหัสไม่ใช่ปัญหาใหญ่ ข้อผิดพลาดคงที่เล็กน้อยนั้นแทบจะไม่สังเกตเห็นได้อย่างไรก็ตาม ข้อผิดพลาดของสัญญาณนาฬิกาจะกลายเป็นปัญหาใหญ่หากสัญญาณนาฬิกามี การกระเพื่อม อย่างมีนัยสำคัญ

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[

[

[

[

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[

[

[

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[หมายเหตุ 1 ]

[หมายเหตุ 2 ]

[ 23 ]

[

[

[หมายเหตุ 3 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[

[ 33 ]

[ 34 ]

[ 35 ]

36 ] เพื่อ

[หมายเหตุ 5 ]

[หมายเหตุ 6 ]

[ 37 ]

การมอดูเลชั่นรหัสพัลส์
นามสกุลไฟล์	.L16, .WAV, .AIFF, .AU, .PCM ^{[ 1 ]}
สื่อประเภทอินเทอร์เน็ต	เสียง/L16, เสียง/L8, ^{[ 2 ]}เสียง/L20, เสียง/L24 ^{[ 3 ]}^{[ 4 ]}
รหัสประเภท	"AIFF" สำหรับ L16, ^{[ 1 ]}ไม่มี^{[ 3 ]}
เลขมหัศจรรย์	แตกต่างกันไป
ประเภทของรูปแบบ	ไฟล์เสียงที่ไม่ได้บีบอัด
บรรจุโดย	รองรับไฟล์เสียงหลายรูปแบบ เช่น Audio CD , AES3 , WAV , AIFF , AU , M2TS , VOBและอื่นๆ
รูปแบบเปิด ?	ใช่
รูปแบบฟรีใช่ไหม?	ใช่^{[ 5 ]}