อ่าน 8 นาที
การสุ่มตัวอย่าง (การประมวลผลสัญญาณ)
ใน การประมวลผลสัญญาณ การ สุ่มตัวอย่าง คือการลด สัญญาณเวลาต่อเนื่อง ให้เป็น สัญญาณเวลาไม่ต่อเนื่อง ตัวอย่างที่พบได้ทั่วไปคือการแปลง คลื่นเสียง ให้เป็นลำดับของ "ตัวอย่าง" ตัวอย่าง...
การสุ่มตัวอย่าง (การประมวลผลสัญญาณ)

ในการประมวลผลสัญญาณการสุ่มตัวอย่างคือการลดสัญญาณเวลาต่อเนื่องให้เป็นสัญญาณเวลาไม่ต่อเนื่องตัวอย่างที่พบได้ทั่วไปคือการแปลงคลื่นเสียงให้เป็นลำดับของ "ตัวอย่าง" ตัวอย่างคือค่าของสัญญาณณ จุดเวลาและ/หรือพื้นที่หนึ่งๆ คำจำกัดความนี้แตกต่างจากการใช้คำในทางสถิติซึ่งหมายถึงชุดของค่าดังกล่าว[ A ]
ตัวสุ่มตัวอย่าง (Sampler)คือระบบย่อยหรือกระบวนการที่ดึงตัวอย่างจากสัญญาณต่อเนื่องโดยในทางทฤษฎีแล้วตัวสุ่มตัวอย่างในอุดมคติจะสร้างตัวอย่างที่มีค่าเท่ากับค่าทันทีของสัญญาณต่อเนื่อง ณ จุดที่ต้องการ
สามารถสร้างสัญญาณต้นฉบับขึ้นใหม่ได้จากลำดับของตัวอย่าง โดยไม่เกินขีดจำกัดของ Nyquistด้วยการนำลำดับของตัวอย่างเหล่านั้นผ่านตัวกรองการสร้างใหม่
ทฤษฎี
ฟังก์ชันของพื้นที่ เวลา หรือมิติอื่นใด สามารถสุ่มตัวอย่างได้ และในทำนองเดียวกันในสองมิติขึ้นไป
สำหรับฟังก์ชันที่เปลี่ยนแปลงตามเวลา ให้เป็นฟังก์ชันต่อเนื่อง (หรือ "สัญญาณ") ที่จะสุ่มตัวอย่าง และให้การสุ่มตัวอย่างดำเนินการโดยการวัดค่าของฟังก์ชันต่อเนื่องทุกๆวินาที ซึ่งเรียกว่าช่วงเวลาการสุ่มตัวอย่างหรือคาบการสุ่มตัวอย่าง [ 1 ] [ 2 ] จากนั้นฟังก์ชันที่สุ่มตัวอย่างจะกำหนดโดยลำดับ:
- สำหรับค่าจำนวนเต็มของ
ความถี่ในการสุ่มตัวอย่างหรืออัตราการสุ่มตัวอย่างคือจำนวนตัวอย่างเฉลี่ยที่ได้รับในหนึ่งวินาที ดังนั้นโดยมีหน่วยเป็นตัวอย่างต่อวินาทีบางครั้งเรียกว่าเฮิรตซ์ตัวอย่างเช่น 48 kHz คือ 48,000 ตัวอย่างต่อวินาที
การสร้างฟังก์ชันต่อเนื่องจากตัวอย่างทำได้โดยใช้อัลกอริธึมการ แทรกสอด สูตรการแทรกสอด Whittaker–Shannonเทียบเท่าทางคณิตศาสตร์กับตัวกรองความถี่ต่ำใน อุดมคติ ที่มีอินพุตเป็นลำดับของฟังก์ชันเดลต้า Diracที่ถูกปรับ (คูณ) ด้วยค่าตัวอย่าง เมื่อช่วงเวลาระหว่างตัวอย่างที่อยู่ติดกันเป็นค่าคงที่ ลำดับของฟังก์ชันเดลต้าจะเรียกว่าหวี Diracในทางคณิตศาสตร์ หวี Dirac ที่ถูกปรับนั้นเทียบเท่ากับผลคูณของฟังก์ชันหวีกับนามธรรมทางคณิตศาสตร์นั้นบางครั้งเรียกว่าการสุ่มตัวอย่างแบบอิมพัลส์[ 3 ]
สัญญาณที่สุ่มตัวอย่างส่วนใหญ่ไม่ได้ถูกจัดเก็บและสร้างใหม่โดยง่าย ความแม่นยำของการสร้างใหม่ตามทฤษฎีเป็นมาตรวัดทั่วไปของประสิทธิภาพของการสุ่มตัวอย่าง ความแม่นยำนั้นจะลดลงเมื่อมีส่วนประกอบความถี่ที่มีความยาวรอบ (คาบ) น้อยกว่า 2 ช่วงเวลาตัวอย่าง (ดูAliasing ) ขีดจำกัดความถี่ที่สอดคล้องกัน ในหน่วยรอบต่อวินาที ( เฮิรตซ์ ) คือรอบ/ตัวอย่าง × ตัวอย่าง/วินาที = ซึ่งเรียกว่าความถี่ Nyquistของตัวสุ่มตัวอย่าง ดังนั้นโดยปกติจะเป็นเอาต์พุตของตัวกรองความถี่ต่ำซึ่งในเชิงฟังก์ชันเรียกว่าตัวกรองป้องกันการเกิด Aliasingหากไม่มีตัวกรองป้องกันการเกิด Aliasing ความถี่ที่สูงกว่าความถี่ Nyquist จะส่งผลต่อตัวอย่างในลักษณะที่กระบวนการแทรกสอดตีความผิด[ 4 ]
ข้อควรพิจารณาในทางปฏิบัติ
ในทางปฏิบัติ สัญญาณต่อเนื่องจะถูกสุ่มตัวอย่างโดยใช้ตัวแปลงสัญญาณอนาล็อกเป็นดิจิทัล (ADC) ซึ่งเป็นอุปกรณ์ที่มีข้อจำกัดทางกายภาพหลายประการ ส่งผลให้เกิดความคลาดเคลื่อนจากการสร้างใหม่ที่สมบูรณ์แบบตามทฤษฎี ซึ่งโดยรวมเรียกว่าความ ผิดเพี้ยน
อาจเกิดการบิดเบือนได้หลายประเภท รวมถึง:
- ปรากฏการณ์เอเลียสซิ่ง (Aliasing ) เป็นสิ่งที่หลีกเลี่ยงไม่ได้ เพราะมีเพียงฟังก์ชันในทางทฤษฎีที่มีความยาวอนันต์เท่านั้นที่จะไม่มีเนื้อหาความถี่สูงกว่าความถี่ไนควิสต์ (Nyquist frequency) สามารถลดปรากฏการณ์เอเลียสซิ่งให้เหลือน้อยที่สุดได้โดยใช้ตัวกรองป้องกันเอเลียสซิ่งที่มีลำดับสูงเพียงพอ
- ข้อ ผิดพลาดของรูรับแสงเกิดจากข้อเท็จจริงที่ว่าตัวอย่างได้รับเป็นค่าเฉลี่ยตามเวลาภายในบริเวณการสุ่มตัวอย่าง แทนที่จะเท่ากับค่าสัญญาณ ณ ขณะสุ่มตัวอย่าง[ 5 ]ในวงจรตัวอย่างและคงค่าแบบใช้ตัวเก็บประจุข้อผิดพลาดของรูรับแสงเกิดขึ้นจากหลายกลไก ตัวอย่างเช่น ตัวเก็บประจุไม่สามารถติดตามสัญญาณอินพุตได้ทันที และตัวเก็บประจุไม่สามารถแยกออกจากสัญญาณอินพุตได้ทันที
- ความคลาดเคลื่อนหรือค่าเบี่ยงเบนจากช่วงเวลาการสุ่มตัวอย่างที่แม่นยำ
- สัญญาณรบกวนรวมถึงสัญญาณรบกวนจากเซ็นเซอร์ความร้อน สัญญาณรบกวน จากวงจรอนาล็อกเป็นต้น
- ข้อผิดพลาดเกี่ยว กับขีดจำกัดอัตราการเปลี่ยนแปลง เกิดจากค่าอินพุตของ ADC ไม่สามารถเปลี่ยนแปลงได้เร็วพอ
- การกำหนดปริมาณเป็นผลมาจากความแม่นยำที่จำกัดของคำที่ใช้แทนค่าที่แปลงแล้ว
- ข้อผิดพลาดที่เกิดจาก ผลกระทบ ที่ไม่เป็นเชิงเส้น อื่นๆ ของการแปลงแรงดันไฟฟ้าขาเข้าเป็นค่าเอาต์พุต (นอกเหนือจากผลกระทบของการควอนไทเซชัน)
แม้ว่าการใช้โอเวอร์แซมปลิงจะสามารถกำจัดข้อผิดพลาดของรูรับแสงและการเกิดเอเลียสได้อย่างสมบูรณ์โดยการย้ายพวกมันออกไปนอกย่านความถี่ผ่าน แต่เทคนิคนี้ไม่สามารถใช้งานได้จริงที่ความถี่สูงกว่าไม่กี่กิกะเฮิร์ตซ์ และอาจมีราคาแพงมากเกินไปที่ความถี่ต่ำกว่ามาก นอกจากนี้ แม้ว่าโอเวอร์แซมปลิงจะช่วยลดข้อผิดพลาดในการควอนไทเซชันและความไม่เป็นเชิงเส้นได้ แต่ก็ไม่สามารถกำจัดสิ่งเหล่านี้ได้อย่างสมบูรณ์ ดังนั้น ตัวแปลงอนาล็อกเป็นดิจิทัล (ADC) ที่ใช้งานได้จริงที่ความถี่เสียงโดยทั่วไปจึงไม่แสดงการเกิดเอเลียสหรือข้อผิดพลาดของรูรับแสง และไม่ถูกจำกัดด้วยข้อผิดพลาดในการควอนไทเซชัน แต่สัญญาณรบกวนแบบอนาล็อกจะมีบทบาทสำคัญมากกว่า ที่ความถี่วิทยุและไมโครเวฟ ซึ่งโอเวอร์แซมปลิงไม่สามารถใช้งานได้จริงและตัวกรองมีราคาแพง ข้อผิดพลาดของรูรับแสง ข้อผิดพลาดในการควอนไทเซชัน และการเกิดเอเลียสอาจเป็นข้อจำกัดที่สำคัญ
โดยทั่วไปแล้ว การวิเคราะห์การสั่นไหว เสียงรบกวน และการควอนไทเซชัน จะทำโดยการจำลองเป็นข้อผิดพลาดแบบสุ่มที่เพิ่มเข้าไปในค่าตัวอย่าง ผลกระทบของการอินทิเกรตและการคงค่าลำดับศูนย์สามารถวิเคราะห์ได้ในรูปแบบของการกรองความถี่ต่ำส่วนความไม่เป็นเชิงเส้นของ ADC หรือ DAC จะถูกวิเคราะห์โดยการแทนที่ การแมป ฟังก์ชันเชิงเส้นใน อุดมคติ ด้วยฟังก์ชันที่ไม่เป็นเชิงเส้น ที่เสนอขึ้น มา
แอปพลิเคชัน
การสุ่มตัวอย่างเสียง
ระบบเสียงดิจิทัล โดยทั่วไปใช้ การมอดูเลชั่นแบบพัลส์โค้ด (PCM) เพื่อเข้ารหัสเสียงเป็นชุดตัวอย่างที่ไม่ต่อเนื่องของระดับไฟฟ้าของสัญญาณเสียงอนาล็อก สัญญาณอนาล็อกจะถูกบันทึก (เข้ารหัส) เป็นตัวอย่าง PCM ในการแปลงอนาล็อกเป็นดิจิทัล (ADC) และสร้างขึ้นใหม่ (ถอดรหัส) โดยใช้การแปลงดิจิทัลเป็นอนาล็อก (DAC) การเข้ารหัสที่ใช้สำหรับการจัดเก็บและการส่งข้อมูลเสียงดิจิทัลภายในระบบอาจแตกต่างกันไป
เมื่อจำเป็นต้องบันทึกเสียงที่ครอบคลุมช่วงความถี่การได้ยินของมนุษย์ ทั้งหมด 20–20,000 Hz [ 6 ]เช่น เมื่อบันทึกเพลงหรือเหตุการณ์ทางเสียงหลายประเภท โดยทั่วไปแล้วรูปคลื่นเสียงจะถูกสุ่มตัวอย่างที่ 44.1 kHz ( CD ), 48 kHz, 88.2 kHz หรือ 96 kHz [ 7 ]ข้อกำหนดอัตราสองเท่าโดยประมาณเป็นผลมาจากทฤษฎีบทของ Nyquist อัตราการสุ่มตัวอย่างที่สูงกว่าประมาณ 50 kHz ถึง 60 kHz ไม่สามารถให้ข้อมูลที่เป็นประโยชน์มากขึ้นสำหรับผู้ฟังที่เป็นมนุษย์ ผู้ผลิตอุปกรณ์ เสียงระดับมืออาชีพในยุคแรกจึงเลือกอัตราการสุ่มตัวอย่างในช่วง 40 ถึง 50 kHz ด้วยเหตุผลนี้
มีแนวโน้มในอุตสาหกรรมที่มุ่งไปสู่อัตราการสุ่มตัวอย่างที่สูงกว่าข้อกำหนดพื้นฐาน เช่น 96 kHz และแม้กระทั่ง 192 kHz [ 8 ]แม้ว่า ความถี่ อัลตราโซนิกจะไม่สามารถได้ยินได้ด้วยหูมนุษย์ แต่การบันทึกและการผสมที่อัตราการสุ่มตัวอย่างที่สูงขึ้นจะมีประสิทธิภาพในการกำจัดความผิดเพี้ยนที่อาจเกิดจากการเกิดเอเลียสแบบพับกลับ ในทางกลับกัน เสียงอัลตราโซนิกอาจมีปฏิสัมพันธ์และปรับเปลี่ยนส่วนที่ได้ยินของสเปกตรัมความถี่ ( ความผิดเพี้ยนแบบอินเตอร์ โมดูเลชัน ) ทำให้ความเที่ยงตรง ลดลง [ 9 ] [ 10 ] [ 11 ] [ 12 ] ข้อดีอย่างหนึ่งของอัตราการสุ่มตัวอย่างที่สูงขึ้นคือสามารถลดข้อกำหนดการออกแบบตัวกรองความถี่ต่ำสำหรับADCและDAC ได้ แต่ด้วย ตัวแปลงเดลต้า-ซิกมาแบบโอเวอร์แซมปลิงที่ทันสมัยข้อดีนี้จึงมีความสำคัญน้อยลง
สมาคมวิศวกรรมเสียงแนะนำอัตราการสุ่มตัวอย่าง 48 kHz สำหรับการใช้งานส่วนใหญ่ แต่ยอมรับ 44.1 kHz สำหรับซีดีและการใช้งานสำหรับผู้บริโภคอื่นๆ 32 kHz สำหรับแอปพลิเคชันที่เกี่ยวข้องกับการส่งสัญญาณ และ 96 kHz สำหรับแบนด์วิดท์ที่สูงขึ้นหรือการกรองป้องกันการเกิดเอเลียสที่ผ่อนคลาย[ 13 ]ทั้งLavry Engineering และ J. Robert Stuart ระบุว่าอัตราการสุ่มตัวอย่างที่เหมาะสมควรอยู่ที่ประมาณ 60 kHz แต่เนื่องจากไม่ใช่ความถี่มาตรฐาน จึงแนะนำ 88.2 หรือ 96 kHz สำหรับวัตถุประสงค์ในการบันทึก[ 14 ] [ 15 ] [ 16 ] [ 17 ] รายการอัตราการสุ่มตัวอย่างเสียงทั่วไปที่สมบูรณ์ยิ่งขึ้นมีดังนี้:
| อัตราการสุ่มตัวอย่าง | ใช้ |
|---|---|
| 5,512.5 เฮิรตซ์ | รองรับใน Flash [ 18 ] |
| 8,000 เฮิรตซ์ | การส่งสัญญาณ ผ่านโทรศัพท์และ วิทยุ สื่อสาร แบบเข้ารหัส อินเตอร์คอมไร้สายและไมโครโฟนไร้สายเหมาะสำหรับเสียงพูดของมนุษย์ แต่ไม่มีเสียงเสียดแทรก ( เสียง essฟังดูเหมือนeff ( / s / , / f / )) |
| 11,025 เฮิรตซ์ | อัตราการสุ่มตัวอย่างหนึ่งในสี่ของแผ่นซีดีเพลง ใช้สำหรับไฟล์เสียง PCM คุณภาพต่ำ ไฟล์เสียง MPEG และสำหรับการวิเคราะห์เสียงย่านความถี่ของซับวูฟเฟอร์ |
| 16,000 เฮิรตซ์ | การขยายความถี่ แบบบรอดแบนด์ เหนือ ความถี่แคบมาตรฐานของโทรศัพท์ ที่ 8,000 เฮิรตซ์ ใช้ในผลิตภัณฑ์การสื่อสารVoIPและVVoIP สมัยใหม่ส่วนใหญ่ [ 19 ] |
| 22,050 เฮิรตซ์ | ครึ่งหนึ่งของอัตราการสุ่มตัวอย่างของซีดีเสียง ใช้สำหรับเสียง PCM และ MPEG คุณภาพต่ำ และสำหรับการวิเคราะห์เสียงของพลังงานความถี่ต่ำ เหมาะสำหรับการแปลงรูปแบบเสียงในช่วงต้นศตวรรษที่ 20 เช่น แผ่นเสียง78 รอบต่อนาทีและวิทยุ AMให้ เป็นดิจิทัล [ 20 ] |
| 32,000 เฮิรตซ์ | กล้องวิดีโอดิจิทัลminiDV , เทปวิดีโอที่มีช่องสัญญาณเสียงเพิ่มเติม (เช่นDVCAMที่มีช่องสัญญาณเสียงสี่ช่อง), DAT (โหมด LP), วิทยุดาวเทียมดิจิทัลของเยอรมนี, เสียงดิจิทัล NICAM ซึ่งใช้ควบคู่กับเสียงโทรทัศน์แบบอนาล็อกในบางประเทศ ไมโครโฟนไร้สายดิจิทัลคุณภาพสูง[ 21 ]เหมาะสำหรับการแปลงวิทยุ FM ให้เป็น ดิจิทัล |
| 37,800 เฮิรตซ์ | ซีดี-เอ็กซ์เอ ออดิโอ |
| 44,055.9 เฮิรตซ์ | ใช้สำหรับระบบเสียงดิจิทัลที่ล็อกกับสัญญาณวิดีโอสีNTSC (3 ตัวอย่างต่อบรรทัด, 245 บรรทัดต่อฟิลด์, 59.94 ฟิลด์ต่อวินาที = 29.97 เฟรมต่อวินาที ) |
| 44,100 เฮิรตซ์ | แผ่นซีดีเสียง (Audio CD ) หรือที่นิยมใช้กันมากที่สุดคือแผ่นเสียงMPEG-1 ( VCD , SVCD , MP3 ) เดิมทีโซนี่ เลือกใช้ เพราะสามารถบันทึกได้ด้วยอุปกรณ์วิดีโอที่ดัดแปลงแล้วซึ่งทำงานที่ 25 เฟรมต่อวินาที (PAL) หรือ 30 เฟรมต่อวินาที (โดยใช้ เครื่องบันทึกวิดีโอ ขาวดำ NTSC ) และครอบคลุมแบนด์วิดท์ 20 kHz ซึ่งถือว่าจำเป็นเพื่อให้ตรงกับอุปกรณ์บันทึกอนาล็อกระดับมืออาชีพในสมัยนั้นตัวแปลง PCMจะแปลงตัวอย่างเสียงดิจิทัลเป็นช่องสัญญาณวิดีโออนาล็อกของเทป วิดีโอ PALโดยใช้ 3 ตัวอย่างต่อบรรทัด 588 บรรทัดต่อเฟรม และ 25 เฟรมต่อวินาที |
| 47,250 เฮิรตซ์ | เครื่องบันทึกเสียงPCMเชิงพาณิชย์เครื่องแรกของโลก โดย Nippon Columbia (Denon) |
| 48,000 เฮิรตซ์ | อัตราการสุ่มตัวอย่างเสียงมาตรฐานที่ใช้โดยอุปกรณ์วิดีโอดิจิทัลระดับมืออาชีพ เช่น เครื่องบันทึกเทป เซิร์ฟเวอร์วิดีโอ เครื่องผสมภาพ และอื่นๆ อัตรานี้ถูกเลือกเนื่องจากสามารถสร้างความถี่ได้ถึง 22 kHz และใช้งานได้กับวิดีโอ NTSC 29.97 เฟรมต่อวินาที รวมถึงระบบ25 เฟรม/วินาที 30 เฟรม/วินาทีและ24 เฟรม/วินาที ในระบบ 29.97 เฟรม/วินาทีจำเป็นต้องจัดการตัวอย่างเสียง 1601.6 ตัวอย่างต่อเฟรม โดยส่งตัวอย่างเสียงจำนวนเต็มทุกๆ เฟรมวิดีโอที่ห้าเท่านั้น[ 13 ]นอกจากนี้ยังใช้สำหรับเสียงในรูปแบบวิดีโอสำหรับผู้บริโภค เช่น DV โทรทัศน์ดิจิทัลDVD ภาพยนตร์ และแพลตฟอร์มสตรีมมิ่งวิดีโอมากมาย เช่น YouTube และ Netflix [ 22 ]เสียงแบบไม่สูญเสียคุณภาพเช่น FLACสามารถเลือกได้ทั้ง44100 Hz 48000 Hz หรือสูงกว่า[ 23 ]อินเทอร์เฟซดิจิทัลแบบอนุกรมระดับมืออาชีพ(SDI) และอินเทอร์เฟซดิจิทัลแบบอนุกรมความละเอียดสูง (HD-SDI) ที่ใช้เชื่อมต่ออุปกรณ์โทรทัศน์ออกอากาศเข้าด้วยกันจะใช้ความถี่การสุ่มตัวอย่างเสียงนี้ อุปกรณ์เสียงระดับมืออาชีพส่วนใหญ่ใช้การสุ่มตัวอย่าง 48 kHz รวมถึงคอนโซลผสมเสียงและอุปกรณ์ บันทึกเสียงดิจิทัล |
| 50,000 เฮิรตซ์ | เครื่องบันทึกเสียงดิจิทัลเชิงพาณิชย์เครื่องแรกจากช่วงปลายทศวรรษ 1970 ผลิตโดย 3MและSoundstream |
| 50,400 เฮิรตซ์ | อัตราการสุ่มตัวอย่างที่ใช้โดยเครื่องบันทึกเสียงดิจิทัล Mitsubishi X-80 |
| 64,000 เฮิรตซ์ | ไม่ค่อยได้ใช้ แต่ได้รับการสนับสนุนจากฮาร์ดแวร์[ 24 ] [ 25 ]และซอฟต์แวร์[ 26 ] [ 27 ] |
| 88,200 เฮิรตซ์ | อัตราการสุ่มตัวอย่างที่อุปกรณ์บันทึกเสียงระดับมืออาชีพบางชนิดใช้เมื่อปลายทางคือซีดี (ตัวคูณของ 44,100 เฮิรตซ์) อุปกรณ์เสียงระดับมืออาชีพบางชนิดใช้ (หรือสามารถเลือกได้) อัตราการสุ่มตัวอย่าง 88.2 กิโลเฮิร์ตซ์ รวมถึงมิกเซอร์ อีควอไลเซอร์ คอมเพรสเซอร์ รีเวิร์บ ครอสโอเวอร์ และอุปกรณ์บันทึกเสียง |
| 96,000 เฮิรตซ์ | DVD-Audio , แทร็กเสียง LPCMบางแทร็กของ DVD, แทร็กเสียง BD-ROM (Blu-ray Disc), แทร็กเสียง HD DVD (High-Definition DVD) และHi-Res Audioอุปกรณ์บันทึกและผลิตเสียงระดับมืออาชีพบางชนิดสามารถเลือกความถี่สุ่มตัวอย่าง 96 kHz ได้ ความถี่สุ่มตัวอย่างนี้เป็นสองเท่าของมาตรฐาน 48 kHz ที่ใช้กันทั่วไปกับเสียงในอุปกรณ์ระดับมืออาชีพ |
| 176,400 เฮิรตซ์ | อัตราการสุ่มตัวอย่างที่ใช้โดย เครื่องบันทึก HDCDและแอปพลิเคชันระดับมืออาชีพอื่นๆ สำหรับการผลิตซีดี คือ สี่เท่าของความถี่ 44.1 kHz |
| 192,000 เฮิรตซ์ | DVD-Audio , แทร็กเสียง LPCMบางแทร็กใน DVD, แทร็กเสียง ใน BD-ROM (Blu-ray Disc), และ แทร็กเสียง ใน HD DVD (High-Definition DVD), อุปกรณ์บันทึกเสียงความละเอียดสูง, เสียงความละเอียดสูง (Hi-Res Audio ) และซอฟต์แวร์ตัดต่อเสียง ความถี่ในการสุ่มตัวอย่างนี้สูงกว่ามาตรฐาน 48 kHz ที่ใช้กันทั่วไปกับเสียงในอุปกรณ์วิดีโอระดับมืออาชีพถึงสี่เท่า |
| 352,800 เฮิรตซ์ | ระบบเสียง ดิจิทัลความละเอียดสูงพิเศษ (Digital eXtreme Definition ) ใช้สำหรับบันทึกและตัดต่อแผ่นเสียง Super Audio CDเนื่องจากระบบเสียงดิจิทัลแบบสตรีมโดยตรง 1 บิต (1-bit Direct Stream Digital หรือ DSD)ไม่เหมาะสำหรับการตัดต่อ มีความถี่สูงกว่า 44.1 kHz ถึง 8 เท่า |
| 384,000 เฮิรตซ์ | อัตราการสุ่มตัวอย่างสูงสุดที่มีในซอฟต์แวร์ทั่วไป |
| 2,822,400 เฮิรตซ์ | SACD คือ กระบวนการมอดูเลชั่นแบบเดลต้า-ซิกมา 1 บิต หรือ ที่รู้จักกันในชื่อ Direct Stream Digitalซึ่ง พัฒนาร่วมกันโดยSonyและPhilips |
| 5,644,800 เฮิรตซ์ | DSD แบบ Double-Rate คือการสตรีมข้อมูลดิจิทัลโดยตรง แบบ 1 บิต ที่อัตราเร็วเป็นสองเท่าของ SACD ใช้ในเครื่องบันทึก DSD ระดับมืออาชีพบางรุ่น |
| 11,289,600 เฮิรตซ์ | DSD แบบ Quad-Rate คือ การส่งสัญญาณดิจิทัลโดยตรงแบบ 1 บิตที่อัตราเร็วเป็น 4 เท่าของ SACD ใช้ในเครื่องบันทึก DSD ระดับมืออาชีพบางรุ่นที่ไม่ค่อยพบเห็นทั่วไป |
| 22,579,200 เฮิรตซ์ | DSD (Octuple-Rate DSD) คือ ระบบส่งสัญญาณดิจิทัลแบบ Direct Stream 1 บิตที่อัตราเร็วเป็น 8 เท่าของ SACD ใช้ในเครื่องบันทึก DSD รุ่นทดลองหายาก หรือที่รู้จักกันในชื่อ DSD512 |
| 45,158,400 เฮิรตซ์ | DSD อัตรา 6 เท่า, Direct Stream Digital 1 บิต ที่อัตรา 16 เท่าของ SACD ใช้ในเครื่องบันทึก DSD ทดลองหายาก เรียกอีกอย่างว่า DSD1024 [ B ] |
ความลึกของบิต
โดยทั่วไปเสียงจะถูกบันทึกที่ความละเอียด 8, 16 และ 24 บิต ซึ่งให้ค่าอัตราส่วนสัญญาณต่อสัญญาณรบกวนจากการควอนไทเซชัน (SQNR) สูงสุดตามทฤษฎีสำหรับคลื่นไซน์ บริสุทธิ์ ประมาณ 49.93 dB , 98.09 dB และ 122.17 dB ตามลำดับ[ 28 ]เสียงคุณภาพระดับซีดีใช้ตัวอย่าง 16 บิตสัญญาณรบกวนจากความร้อนจำกัดจำนวนบิตที่แท้จริงที่สามารถใช้ในการควอนไทเซชันได้ ระบบอนาล็อกส่วนน้อยเท่านั้นที่มีอัตราส่วนสัญญาณต่อสัญญาณรบกวน (SNR) เกิน 120 dB อย่างไรก็ตาม การ ประมวลผลสัญญาณดิจิทัล สามารถมีช่วงไดนามิกที่สูงมาก ดังนั้นจึงเป็นเรื่องปกติที่จะดำเนินการผสมและมาสเตอร์ริ่งที่ ความแม่นยำจุดลอยตัว 32 บิตจากนั้นแปลงเป็น 16 หรือ 24 บิตสำหรับการเผยแพร่
การสุ่มตัวอย่างเสียงพูด
สัญญาณเสียงพูด ซึ่งก็คือสัญญาณที่ออกแบบมาเพื่อส่งเฉพาะเสียงพูด ของมนุษย์ มักจะสามารถสุ่มตัวอย่างได้ในอัตราที่ต่ำกว่ามาก สำหรับหน่วยเสียง ส่วนใหญ่ พลังงานเกือบทั้งหมดจะอยู่ในช่วง 100 เฮิรตซ์ – 4 กิโลเฮิร์ตซ์ ทำให้สามารถใช้อัตราการสุ่มตัวอย่างที่ 8 กิโลเฮิร์ตซ์ได้ นี่คืออัตราการสุ่มตัวอย่างที่ใช้โดย ระบบ โทรศัพท์ เกือบทั้งหมด ซึ่งใช้ข้อกำหนดการสุ่มตัวอย่างและการกำหนดปริมาณ G.711
การสุ่มตัวอย่างวิดีโอ
โทรทัศน์ความละเอียดมาตรฐาน (SDTV) ใช้ความละเอียดภาพ 720 x 480 พิกเซล (US NTSC 525-line) หรือ 720 x 576 พิกเซล (UK PAL 625-line) สำหรับพื้นที่ภาพที่มองเห็นได้
โทรทัศน์ความละเอียดสูง (HDTV) ใช้ ความ ละเอียด 720p (โปรเกรสซีฟ), 1080i (อินเตอร์เลซ) และ1080p (โปรเกรสซีฟ หรือที่รู้จักกันในชื่อ Full-HD)
ในวิดีโอดิจิทัลอัตราการสุ่มตัวอย่างเชิงเวลาจะถูกกำหนดให้เป็นอัตราเฟรม หรืออัตราฟิลด์ มากกว่าจะเป็น นาฬิกาพิกเซล ตามแนวคิดความถี่การสุ่มตัวอย่างภาพคืออัตราการทำซ้ำของช่วงเวลาการรวมสัญญาณของเซ็นเซอร์ เนื่องจากช่วงเวลาการรวมสัญญาณอาจสั้นกว่าเวลาที่อยู่ระหว่างการทำซ้ำอย่างมาก ความถี่การสุ่มตัวอย่างจึงอาจแตกต่างจากค่าผกผันของเวลาการสุ่มตัวอย่างได้
ตัวแปลงสัญญาณ วิดีโอดิจิทัลเป็นอนาล็อกทำงานในช่วงความถี่เมกะเฮิร์ตซ์ (ตั้งแต่ประมาณ 3 เมกะเฮิร์ตซ์สำหรับตัวแปลงสัญญาณวิดีโอคอมโพสิตคุณภาพต่ำในเครื่องเล่นเกมรุ่นแรกๆ ไปจนถึง 250 เมกะเฮิร์ตซ์ขึ้นไปสำหรับเอาต์พุต VGA ที่มีความละเอียดสูงสุด)
เมื่อแปลงวิดีโออนาล็อกเป็นวิดีโอดิจิทัลกระบวนการสุ่มตัวอย่างจะแตกต่างออกไป โดยครั้งนี้จะเกิดขึ้นที่ความถี่พิกเซล ซึ่งสอดคล้องกับอัตราการสุ่มตัวอย่างเชิงพื้นที่ตามแนวเส้นสแกนอัตราการสุ่มตัวอย่างพิกเซลที่ใช้กันทั่วไปคือ:
การสุ่มตัวอย่างเชิงพื้นที่ในทิศทางตรงกันข้ามจะถูกกำหนดโดยระยะห่างของเส้นสแกนในแรสเตอร์อัตราการสุ่มตัวอย่างและความละเอียดในทั้งสองทิศทางเชิงพื้นที่สามารถวัดได้ในหน่วยของเส้นต่อความสูงของภาพ
ปรากฏการณ์เอเลียสซิ่งเชิงพื้นที่ ของส่วนประกอบ ความสว่างหรือความอิ่มตัวของสีที่มีความถี่สูงในวิดีโอ จะปรากฏเป็นลวดลายมัวเร่
การสุ่มตัวอย่างแบบ 3 มิติ
กระบวนการเรนเดอร์แบบปริมาตร (Volume Rendering)คือการสุ่มตัวอย่างตารางสามมิติของว็อกเซล (voxels ) เพื่อสร้างภาพสามมิติของข้อมูลที่ถูกตัดแบ่ง (ภาพตัดขวาง) โดยถือว่าตารางสามมิตินี้เป็นตัวแทนของบริเวณต่อเนื่องในพื้นที่สามมิติ การเรนเดอร์แบบปริมาตรเป็นเรื่องปกติในภาพทางการแพทย์ เช่น การถ่ายภาพเอกซเรย์คอมพิวเตอร์ (CT/CAT), การถ่ายภาพด้วยคลื่นแม่เหล็กไฟฟ้า (MRI), การถ่ายภาพด้วยโพซิตรอนอีมิสชันโทโมกราฟี (PET) เป็นต้น นอกจากนี้ยังใช้ในการสร้างภาพตัดขวางทางธรณีวิทยาและแอปพลิเคชันอื่นๆ อีก ด้วย

การสุ่มตัวอย่างที่ไม่เพียงพอ
เมื่อ สัญญาณ แบนด์พาสถูกสุ่มตัวอย่างช้ากว่าอัตรา Nyquistตัวอย่างจะไม่สามารถแยกแยะได้จากตัวอย่างของสัญญาณรบกวน ความถี่ต่ำ ของสัญญาณความถี่สูง ซึ่งมักจะทำโดยเจตนาเพื่อให้สัญญาณรบกวนความถี่ต่ำสุดเป็นไปตามเกณฑ์ Nyquistเนื่องจากสัญญาณแบนด์พาสยังคงแสดงและกู้คืนได้อย่างเป็นเอกลักษณ์ การสุ่มตัวอย่างที่ต่ำกว่าเกณฑ์ดังกล่าวเรียกอีกอย่างว่า การ สุ่มตัวอย่างแบนด์พาสการสุ่มตัวอย่างฮาร์มอนิกการสุ่มตัวอย่าง IFและการแปลง IF เป็นดิจิทัลโดยตรง[ 29 ]
การสุ่มตัวอย่างเกิน
การสุ่มตัวอย่างเกิน (Oversampling) ถูกนำมาใช้ในตัวแปลงอนาล็อกเป็นดิจิทัลสมัยใหม่ส่วนใหญ่เพื่อลดความผิดเพี้ยนที่เกิดจากตัวแปลงดิจิทัลเป็นอนาล็อก ในทางปฏิบัติ เช่น การคงค่าลำดับศูนย์ (zero-order hold)แทนที่จะใช้อุดมคติ เช่น สูตรการแทรกสอด ของWhittaker–Shannon [ 30 ]
การสุ่มตัวอย่างที่ซับซ้อน
การสุ่มตัวอย่างเชิงซ้อน (หรือการสุ่มตัวอย่าง I/Q ) คือการสุ่มตัวอย่างพร้อมกันของรูปคลื่นสองรูปที่แตกต่างกันแต่เกี่ยวข้องกัน ส่งผลให้ได้คู่ตัวอย่างที่จะถูกนำไปปฏิบัติเป็นจำนวนเชิงซ้อนใน ภายหลัง [ C ]เมื่อรูปคลื่นหนึ่งเป็นฮิลเบิร์ตทรานส์ฟอร์มของรูปคลื่นอีกรูปหนึ่งฟังก์ชันค่าเชิงซ้อนเรียกว่าสัญญาณเชิงวิเคราะห์ซึ่งฟูริเยร์ทรานส์ฟอร์มเป็นศูนย์สำหรับค่าความถี่ลบทั้งหมด ในกรณีนั้นอัตราไนควิสต์สำหรับรูปคลื่นที่ไม่มีความถี่ ≥ BสามารถลดลงเหลือเพียงB (ตัวอย่างเชิงซ้อน/วินาที) แทนที่จะเป็น(ตัวอย่างจริง/วินาที) [ D ]เห็นได้ชัดเจนยิ่งขึ้น รูปคลื่นเบสแบน ด์ที่เทียบเท่าก็มีอัตราไนควิสต์เท่ากับ เช่นกันเพราะเนื้อหาความถี่ที่ไม่เป็นศูนย์ทั้งหมดถูกเลื่อนไปอยู่ในช่วง
แม้ว่าตัวอย่างค่าเชิงซ้อนจะสามารถได้มาตามที่อธิบายไว้ข้างต้น แต่ก็ยังสร้างขึ้นโดยการจัดการตัวอย่างของรูปคลื่นค่าจริง ตัวอย่างเช่น รูปคลื่นเบสแบนด์ที่เทียบเท่ากันสามารถสร้างขึ้นได้โดยไม่ต้องคำนวณอย่างชัดเจนโดยการประมวลผลลำดับผลคูณ[ E ]ผ่านตัวกรองความถี่ต่ำแบบดิจิทัลที่มีความถี่ตัดเป็น[ F ] การ คำนวณเฉพาะตัวอย่างที่สองของลำดับเอาต์พุตจะลดอัตราการสุ่มตัวอย่างให้สอดคล้องกับอัตรา Nyquist ที่ ลดลง ผลลัพธ์คือจำนวนตัวอย่างค่าเชิงซ้อนเป็นครึ่งหนึ่งของจำนวนตัวอย่างค่าจริงดั้งเดิม ไม่มีข้อมูลสูญหาย และสามารถกู้คืนรูปคลื่นดั้งเดิมได้หากจำเป็น
ดูเพิ่มเติม
- ความถี่ออสซิเลเตอร์คริสตัล
- การลดขนาดตัวอย่าง
- การเพิ่มความละเอียดของภาพ
- ความอุดมสมบูรณ์ของตัวอย่าง
- การสุ่มตัวอย่างแบบหลายมิติ
- ส่วนประกอบเฟสตรงและเฟสตั้งฉากและข้อมูล I/Q
- การแปลงอัตราตัวอย่าง
- การแปลงเป็นดิจิทัล
- ตัวอย่างและการเก็บรักษา
- ตัวเข้ารหัสเบต้า
- ปัจจัยเคลล์
- อัตราบิต
- ความถี่ปกติ
หมายเหตุ
- ^ตัวอย่างเช่น "จำนวนตัวอย่าง" ในการประมวลผลสัญญาณนั้น มีความหมายโดยประมาณเทียบเท่ากับ "ขนาดตัวอย่าง " ในทางสถิติ
- ^อัตราการสุ่มตัวอย่าง DSD ที่สูงกว่านี้ยังมีอยู่ แต่ประโยชน์ที่ได้รับอาจแทบไม่รู้สึก และขนาดไฟล์ก็จะใหญ่มาก
- ^บางครั้งคู่ตัวอย่างก็ถูกมองว่าเป็นจุดบนแผนภาพกลุ่มดาว ด้วยเช่น กัน
- ^เมื่ออัตราการสุ่มตัวอย่างเชิงซ้อนคือ Bส่วนประกอบความถี่ที่ 0.6 Bตัวอย่างเช่น จะมีสัญญาณรบกวนที่ −0.4 Bซึ่งไม่มีความกำกวมเนื่องจากข้อจำกัดที่ว่าสัญญาณก่อนการสุ่มตัวอย่างเป็นสัญญาณเชิงวิเคราะห์ ดูเพิ่มเติมที่สัญญาณไซน์เชิงซ้อน
- ^เมื่อสุ่มตัวอย่าง s ( t ) ที่ความถี่ Nyquist (1/ T = 2B ) ลำดับผลคูณจะลดรูปเหลือ
- ^ลำดับของจำนวนเชิงซ้อนจะถูกคอนโวลูชันกับผลตอบสนองแบบอิมพัลส์ของตัวกรองที่มีสัมประสิทธิ์เป็นค่าจริง ซึ่งเทียบเท่ากับการกรองลำดับของส่วนจริงและส่วนจินตนาการแยกกัน แล้วสร้างคู่จำนวนเชิงซ้อนขึ้นใหม่ที่เอาต์พุต
อ่านเพิ่มเติม
- Matt Pharr, Wenzel Jakob และ Greg Humphreys, การเรนเดอร์ภาพโดยใช้หลักการทางฟิสิกส์: จากทฤษฎีสู่การนำไปใช้จริง, ฉบับที่ 3 , Morgan Kaufmann, พฤศจิกายน 2016. ISBN 978-0128006450บทที่ว่าด้วยการสุ่มตัวอย่าง ( มีให้ดูออนไลน์ ) เขียนได้ดีมาก มีแผนภาพประกอบ ทฤษฎีหลัก และตัวอย่างโค้ด
ลิงก์ภายนอก
- วารสารที่อุทิศให้กับทฤษฎีการสุ่มตัวอย่าง
- ข้อมูล I/Q สำหรับมือใหม่ – หน้าเว็บที่พยายามตอบคำถามว่า ทำไมต้องใช้ข้อมูล I/Q?
- การสุ่มตัวอย่างสัญญาณอนาล็อก – การนำเสนอแบบโต้ตอบผ่านเว็บสาธิต ณ สถาบันโทรคมนาคม มหาวิทยาลัยสตุทการ์ท
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การสุ่มตัวอย่าง (การประมวลผลสัญญาณ)
ใน การประมวลผลสัญญาณ การ สุ่มตัวอย่าง คือการลด สัญญาณเวลาต่อเนื่อง ให้เป็น สัญญาณเวลาไม่ต่อเนื่อง ตัวอย่างที่พบได้ทั่วไปคือการแปลง คลื่นเสียง ให้เป็นลำดับของ "ตัวอย่าง" ตัวอย่าง...
ทฤษฎี
ฟังก์ชันของพื้นที่ เวลา หรือมิติอื่นใด สามารถสุ่มตัวอย่างได้ และในทำนองเดียวกันในสองมิติขึ้นไป
ข้อควรพิจารณาในทางปฏิบัติ
ในทางปฏิบัติ สัญญาณต่อเนื่องจะถูกสุ่มตัวอย่างโดยใช้ ตัวแปลงสัญญาณอนาล็อกเป็นดิจิทัล (ADC) ซึ่งเป็นอุปกรณ์ที่มีข้อจำกัดทางกายภาพหลายประการ ส่งผลให้เกิดความคลาดเคลื่อนจากการสร้างใหม่ที่สมบูรณ์แบบตามทฤษฎี ซึ่งโดยรวมเรียกว่าความ ผิดเพี้ยน
การสุ่มตัวอย่างเสียง
ระบบ เสียงดิจิทัล โดยทั่วไปใช้ การมอดูเลชั่นแบบพัลส์โค้ด (PCM) เพื่อเข้ารหัสเสียงเป็นชุดตัวอย่างที่ไม่ต่อเนื่องของระดับไฟฟ้าของสัญญาณเสียงอนาล็อก สัญญาณอนาล็อกจะถูกบันทึก (เข้ารหัส) เป็นตัวอย่าง PCM ในการแปลงอนาล็อกเป็นดิจิทัล (ADC) และสร้างขึ้นใหม่ (ถอดรหัส)...