การสุ่มตัวอย่าง (การประมวลผลสัญญาณ)

Q: ข้อควรพิจารณาในทางปฏิบัติ

ในทางปฏิบัติ สัญญาณต่อเนื่องจะถูกสุ่มตัวอย่างโดยใช้ ตัวแปลงสัญญาณอนาล็อกเป็นดิจิทัล (ADC) ซึ่งเป็นอุปกรณ์ที่มีข้อจำกัดทางกายภาพหลายประการ ส่งผลให้เกิดความคลาดเคลื่อนจากการสร้างใหม่ที่สมบูรณ์แบบตามทฤษฎี ซึ่งโดยรวมเรียกว่าความ ผิดเพี้ยน

ในการประมวลผลสัญญาณการสุ่มตัวอย่างคือการลดสัญญาณเวลาต่อเนื่องให้เป็นสัญญาณเวลาไม่ต่อเนื่องตัวอย่างที่พบได้ทั่วไปคือการแปลงคลื่นเสียงให้เป็นลำดับของ "ตัวอย่าง" ตัวอย่างคือค่าของสัญญาณณ จุดเวลาและ/หรือพื้นที่หนึ่งๆ คำจำกัดความนี้แตกต่างจากการใช้คำในทางสถิติซึ่งหมายถึงชุดของค่าดังกล่าว^{[ A ]}

ตัวสุ่มตัวอย่าง (Sampler)คือระบบย่อยหรือกระบวนการที่ดึงตัวอย่างจากสัญญาณต่อเนื่องโดยในทางทฤษฎีแล้วตัวสุ่มตัวอย่างในอุดมคติจะสร้างตัวอย่างที่มีค่าเท่ากับค่าทันทีของสัญญาณต่อเนื่อง ณ จุดที่ต้องการ

สามารถสร้างสัญญาณต้นฉบับขึ้นใหม่ได้จากลำดับของตัวอย่าง โดยไม่เกินขีดจำกัดของ Nyquistด้วยการนำลำดับของตัวอย่างเหล่านั้นผ่านตัวกรองการสร้างใหม่

ทฤษฎี

ฟังก์ชันของพื้นที่ เวลา หรือมิติอื่นใด สามารถสุ่มตัวอย่างได้ และในทำนองเดียวกันในสองมิติขึ้นไป

สำหรับฟังก์ชันที่เปลี่ยนแปลงตามเวลา ให้เป็นฟังก์ชันต่อเนื่อง (หรือ "สัญญาณ") ที่จะสุ่มตัวอย่าง และให้การสุ่มตัวอย่างดำเนินการโดยการวัดค่าของฟังก์ชันต่อเนื่องทุกๆวินาที ซึ่งเรียกว่าช่วงเวลาการสุ่มตัวอย่างหรือคาบการสุ่มตัวอย่าง [ ¹^]^[²^]^จากนั้นฟังก์ชันที่สุ่มตัวอย่างจะกำหนดโดยลำดับ: $s(t)$ $T$

s(nT)

สำหรับค่าจำนวนเต็มของ

n

ความถี่ในการสุ่มตัวอย่างหรืออัตราการสุ่มตัวอย่างคือจำนวนตัวอย่างเฉลี่ยที่ได้รับในหนึ่งวินาที ดังนั้นโดยมีหน่วยเป็นตัวอย่างต่อวินาทีบางครั้งเรียกว่าเฮิรตซ์ตัวอย่างเช่น 48 kHz คือ 48,000 ตัวอย่างต่อวินาที $f_{s}$ $f_{s}=1/T$

การสร้างฟังก์ชันต่อเนื่องจากตัวอย่างทำได้โดยใช้อัลกอริธึมการ แทรกสอด สูตรการแทรกสอด Whittaker–Shannonเทียบเท่าทางคณิตศาสตร์กับตัวกรองความถี่ต่ำใน อุดมคติ ที่มีอินพุตเป็นลำดับของฟังก์ชันเดลต้า Diracที่ถูกปรับ (คูณ) ด้วยค่าตัวอย่าง เมื่อช่วงเวลาระหว่างตัวอย่างที่อยู่ติดกันเป็นค่าคงที่ ลำดับของฟังก์ชันเดลต้าจะเรียกว่าหวี Diracในทางคณิตศาสตร์ หวี Dirac ที่ถูกปรับนั้นเทียบเท่ากับผลคูณของฟังก์ชันหวีกับนามธรรมทางคณิตศาสตร์นั้นบางครั้งเรียกว่าการสุ่มตัวอย่างแบบอิมพัลส์^[³^] $(T)$ $s(t)$

สัญญาณที่สุ่มตัวอย่างส่วนใหญ่ไม่ได้ถูกจัดเก็บและสร้างใหม่โดยง่าย ความแม่นยำของการสร้างใหม่ตามทฤษฎีเป็นมาตรวัดทั่วไปของประสิทธิภาพของการสุ่มตัวอย่าง ความแม่นยำนั้นจะลดลงเมื่อมีส่วนประกอบความถี่ที่มีความยาวรอบ (คาบ) น้อยกว่า 2 ช่วงเวลาตัวอย่าง (ดูAliasing ) ขีดจำกัดความถี่ที่สอดคล้องกัน ในหน่วยรอบต่อวินาที ( เฮิรตซ์ ) คือรอบ/ตัวอย่าง × ตัวอย่าง/วินาที = ซึ่งเรียกว่าความถี่ Nyquistของตัวสุ่มตัวอย่าง ดังนั้นโดยปกติจะเป็นเอาต์พุตของตัวกรองความถี่ต่ำซึ่งในเชิงฟังก์ชันเรียกว่าตัวกรองป้องกันการเกิด Aliasingหากไม่มีตัวกรองป้องกันการเกิด Aliasing ความถี่ที่สูงกว่าความถี่ Nyquist จะส่งผลต่อตัวอย่างในลักษณะที่กระบวนการแทรกสอดตีความผิด^[⁴^] $s(t)$ $0.5$ $f_{s}$ $f_{s}/2$ $s(t)$

ข้อควรพิจารณาในทางปฏิบัติ

ในทางปฏิบัติ สัญญาณต่อเนื่องจะถูกสุ่มตัวอย่างโดยใช้ตัวแปลงสัญญาณอนาล็อกเป็นดิจิทัล (ADC) ซึ่งเป็นอุปกรณ์ที่มีข้อจำกัดทางกายภาพหลายประการ ส่งผลให้เกิดความคลาดเคลื่อนจากการสร้างใหม่ที่สมบูรณ์แบบตามทฤษฎี ซึ่งโดยรวมเรียกว่าความ ผิดเพี้ยน

อาจเกิดการบิดเบือนได้หลายประเภท รวมถึง:

ปรากฏการณ์เอเลียสซิ่ง (Aliasing ) เป็นสิ่งที่หลีกเลี่ยงไม่ได้ เพราะมีเพียงฟังก์ชันในทางทฤษฎีที่มีความยาวอนันต์เท่านั้นที่จะไม่มีเนื้อหาความถี่สูงกว่าความถี่ไนควิสต์ (Nyquist frequency) สามารถลดปรากฏการณ์เอเลียสซิ่งให้เหลือน้อยที่สุดได้โดยใช้ตัวกรองป้องกันเอเลียสซิ่งที่มีลำดับสูงเพียงพอ
ข้อ ผิดพลาดของรูรับแสงเกิดจากข้อเท็จจริงที่ว่าตัวอย่างได้รับเป็นค่าเฉลี่ยตามเวลาภายในบริเวณการสุ่มตัวอย่าง แทนที่จะเท่ากับค่าสัญญาณ ณ ขณะสุ่มตัวอย่าง^{[ 5 ]}ในวงจรตัวอย่างและคงค่าแบบใช้ตัวเก็บประจุข้อผิดพลาดของรูรับแสงเกิดขึ้นจากหลายกลไก ตัวอย่างเช่น ตัวเก็บประจุไม่สามารถติดตามสัญญาณอินพุตได้ทันที และตัวเก็บประจุไม่สามารถแยกออกจากสัญญาณอินพุตได้ทันที
ความคลาดเคลื่อนหรือค่าเบี่ยงเบนจากช่วงเวลาการสุ่มตัวอย่างที่แม่นยำ
สัญญาณรบกวนรวมถึงสัญญาณรบกวนจากเซ็นเซอร์ความร้อน สัญญาณรบกวน จากวงจรอนาล็อกเป็นต้น
ข้อผิดพลาดเกี่ยว กับขีดจำกัดอัตราการเปลี่ยนแปลง เกิดจากค่าอินพุตของ ADC ไม่สามารถเปลี่ยนแปลงได้เร็วพอ
การกำหนดปริมาณเป็นผลมาจากความแม่นยำที่จำกัดของคำที่ใช้แทนค่าที่แปลงแล้ว
ข้อผิดพลาดที่เกิดจาก ผลกระทบ ที่ไม่เป็นเชิงเส้น อื่นๆ ของการแปลงแรงดันไฟฟ้าขาเข้าเป็นค่าเอาต์พุต (นอกเหนือจากผลกระทบของการควอนไทเซชัน)

แม้ว่าการใช้โอเวอร์แซมปลิงจะสามารถกำจัดข้อผิดพลาดของรูรับแสงและการเกิดเอเลียสได้อย่างสมบูรณ์โดยการย้ายพวกมันออกไปนอกย่านความถี่ผ่าน แต่เทคนิคนี้ไม่สามารถใช้งานได้จริงที่ความถี่สูงกว่าไม่กี่กิกะเฮิร์ตซ์ และอาจมีราคาแพงมากเกินไปที่ความถี่ต่ำกว่ามาก นอกจากนี้ แม้ว่าโอเวอร์แซมปลิงจะช่วยลดข้อผิดพลาดในการควอนไทเซชันและความไม่เป็นเชิงเส้นได้ แต่ก็ไม่สามารถกำจัดสิ่งเหล่านี้ได้อย่างสมบูรณ์ ดังนั้น ตัวแปลงอนาล็อกเป็นดิจิทัล (ADC) ที่ใช้งานได้จริงที่ความถี่เสียงโดยทั่วไปจึงไม่แสดงการเกิดเอเลียสหรือข้อผิดพลาดของรูรับแสง และไม่ถูกจำกัดด้วยข้อผิดพลาดในการควอนไทเซชัน แต่สัญญาณรบกวนแบบอนาล็อกจะมีบทบาทสำคัญมากกว่า ที่ความถี่วิทยุและไมโครเวฟ ซึ่งโอเวอร์แซมปลิงไม่สามารถใช้งานได้จริงและตัวกรองมีราคาแพง ข้อผิดพลาดของรูรับแสง ข้อผิดพลาดในการควอนไทเซชัน และการเกิดเอเลียสอาจเป็นข้อจำกัดที่สำคัญ

โดยทั่วไปแล้ว การวิเคราะห์การสั่นไหว เสียงรบกวน และการควอนไทเซชัน จะทำโดยการจำลองเป็นข้อผิดพลาดแบบสุ่มที่เพิ่มเข้าไปในค่าตัวอย่าง ผลกระทบของการอินทิเกรตและการคงค่าลำดับศูนย์สามารถวิเคราะห์ได้ในรูปแบบของการกรองความถี่ต่ำส่วนความไม่เป็นเชิงเส้นของ ADC หรือ DAC จะถูกวิเคราะห์โดยการแทนที่ การแมป ฟังก์ชันเชิงเส้นใน อุดมคติ ด้วยฟังก์ชันที่ไม่เป็นเชิงเส้น ที่เสนอขึ้น มา

แอปพลิเคชัน

การสุ่มตัวอย่างเสียง

ระบบเสียงดิจิทัล โดยทั่วไปใช้ การมอดูเลชั่นแบบพัลส์โค้ด (PCM) เพื่อเข้ารหัสเสียงเป็นชุดตัวอย่างที่ไม่ต่อเนื่องของระดับไฟฟ้าของสัญญาณเสียงอนาล็อก สัญญาณอนาล็อกจะถูกบันทึก (เข้ารหัส) เป็นตัวอย่าง PCM ในการแปลงอนาล็อกเป็นดิจิทัล (ADC) และสร้างขึ้นใหม่ (ถอดรหัส) โดยใช้การแปลงดิจิทัลเป็นอนาล็อก (DAC) การเข้ารหัสที่ใช้สำหรับการจัดเก็บและการส่งข้อมูลเสียงดิจิทัลภายในระบบอาจแตกต่างกันไป

เมื่อจำเป็นต้องบันทึกเสียงที่ครอบคลุมช่วงความถี่การได้ยินของมนุษย์ ทั้งหมด 20–20,000 Hz ^{[ 6 ]}เช่น เมื่อบันทึกเพลงหรือเหตุการณ์ทางเสียงหลายประเภท โดยทั่วไปแล้วรูปคลื่นเสียงจะถูกสุ่มตัวอย่างที่ 44.1 kHz ( CD ), 48 kHz, 88.2 kHz หรือ 96 kHz ^{[ 7 ]}ข้อกำหนดอัตราสองเท่าโดยประมาณเป็นผลมาจากทฤษฎีบทของ Nyquist อัตราการสุ่มตัวอย่างที่สูงกว่าประมาณ 50 kHz ถึง 60 kHz ไม่สามารถให้ข้อมูลที่เป็นประโยชน์มากขึ้นสำหรับผู้ฟังที่เป็นมนุษย์ ผู้ผลิตอุปกรณ์ เสียงระดับมืออาชีพในยุคแรกจึงเลือกอัตราการสุ่มตัวอย่างในช่วง 40 ถึง 50 kHz ด้วยเหตุผลนี้

มีแนวโน้มในอุตสาหกรรมที่มุ่งไปสู่อัตราการสุ่มตัวอย่างที่สูงกว่าข้อกำหนดพื้นฐาน เช่น 96 kHz และแม้กระทั่ง 192 kHz ^{[ 8 ]}แม้ว่า ความถี่ อัลตราโซนิกจะไม่สามารถได้ยินได้ด้วยหูมนุษย์ แต่การบันทึกและการผสมที่อัตราการสุ่มตัวอย่างที่สูงขึ้นจะมีประสิทธิภาพในการกำจัดความผิดเพี้ยนที่อาจเกิดจากการเกิดเอเลียสแบบพับกลับ ในทางกลับกัน เสียงอัลตราโซนิกอาจมีปฏิสัมพันธ์และปรับเปลี่ยนส่วนที่ได้ยินของสเปกตรัมความถี่ ( ความผิดเพี้ยนแบบอินเตอร์ โมดูเลชัน ) ทำให้ความเที่ยงตรง ลดลง ^{[ 9 ]}^{[ 10 ]}^{[ 11 ]}^{[ 12 ]} ข้อดีอย่างหนึ่งของอัตราการสุ่มตัวอย่างที่สูงขึ้นคือสามารถลดข้อกำหนดการออกแบบตัวกรองความถี่ต่ำสำหรับADCและDAC ได้ แต่ด้วย ตัวแปลงเดลต้า-ซิกมาแบบโอเวอร์แซมปลิงที่ทันสมัยข้อดีนี้จึงมีความสำคัญน้อยลง

สมาคมวิศวกรรมเสียงแนะนำอัตราการสุ่มตัวอย่าง 48 kHz สำหรับการใช้งานส่วนใหญ่ แต่ยอมรับ 44.1 kHz สำหรับซีดีและการใช้งานสำหรับผู้บริโภคอื่นๆ 32 kHz สำหรับแอปพลิเคชันที่เกี่ยวข้องกับการส่งสัญญาณ และ 96 kHz สำหรับแบนด์วิดท์ที่สูงขึ้นหรือการกรองป้องกันการเกิดเอเลียสที่ผ่อนคลาย[ 13 ^{]ทั้งLavry} Engineering และ J. Robert Stuart ระบุว่าอัตราการสุ่มตัวอย่างที่เหมาะสมควรอยู่ที่ประมาณ 60 kHz แต่เนื่องจากไม่ใช่ความถี่มาตรฐาน จึงแนะนำ 88.2 หรือ 96 kHz สำหรับวัตถุประสงค์ในการบันทึก^{[ 14 ]}^{[ 15 ]}^{[ 16 ]}^{[ 17 ]} รายการอัตราการสุ่มตัวอย่างเสียงทั่วไปที่สมบูรณ์ยิ่งขึ้นมีดังนี้:

อัตราการสุ่มตัวอย่าง	ใช้
5,512.5 เฮิรตซ์	รองรับ^ใน Flash [ ^{18 ]}
8,000 เฮิรตซ์	การส่งสัญญาณ ผ่านโทรศัพท์และ วิทยุ สื่อสาร แบบเข้ารหัส อินเตอร์คอมไร้สายและไมโครโฟนไร้สายเหมาะสำหรับเสียงพูดของมนุษย์ แต่ไม่มีเสียงเสียดแทรก ( เสียง essฟังดูเหมือนeff ( / s / , / f / ))
11,025 เฮิรตซ์	อัตราการสุ่มตัวอย่างหนึ่งในสี่ของแผ่นซีดีเพลง ใช้สำหรับไฟล์เสียง PCM คุณภาพต่ำ ไฟล์เสียง MPEG และสำหรับการวิเคราะห์เสียงย่านความถี่ของซับวูฟเฟอร์
16,000 เฮิรตซ์	การขยายความถี่ แบบบรอดแบนด์ เหนือ ความถี่แคบมาตรฐานของโทรศัพท์ ที่ 8,000 เฮิรตซ์ ใช้ในผลิตภัณฑ์การสื่อสารVoIPและVVoIP สมัยใหม่ส่วนใหญ่ ^[¹⁹^]
22,050 เฮิรตซ์	ครึ่งหนึ่งของอัตราการสุ่มตัวอย่างของซีดีเสียง ใช้สำหรับเสียง PCM และ MPEG คุณภาพต่ำ และสำหรับการวิเคราะห์เสียงของพลังงานความถี่ต่ำ เหมาะสำหรับการแปลงรูปแบบเสียงในช่วงต้นศตวรรษที่ 20 เช่น แผ่นเสียง78 รอบต่อนาทีและวิทยุ AMให้ เป็นดิจิทัล ^{[ 20 ]}
32,000 เฮิรตซ์	กล้องวิดีโอดิจิทัลminiDV , เทปวิดีโอที่มีช่องสัญญาณเสียงเพิ่มเติม (เช่นDVCAMที่มีช่องสัญญาณเสียงสี่ช่อง), DAT (โหมด LP), วิทยุดาวเทียมดิจิทัลของเยอรมนี, เสียงดิจิทัล NICAM ซึ่งใช้ควบคู่กับเสียงโทรทัศน์แบบอนาล็อกในบางประเทศ ไมโครโฟนไร้สายดิจิทัลคุณภาพสูง^{[ 21 ]}เหมาะสำหรับการแปลงวิทยุ FM ให้เป็น ดิจิทัล
37,800 เฮิรตซ์	ซีดี-เอ็กซ์เอ ออดิโอ
44,055.9 เฮิรตซ์	ใช้สำหรับระบบเสียงดิจิทัลที่ล็อกกับสัญญาณวิดีโอสีNTSC (3 ตัวอย่างต่อบรรทัด, 245 บรรทัดต่อฟิลด์, 59.94 ฟิลด์ต่อวินาที = 29.97 เฟรมต่อวินาที )
44,100 เฮิรตซ์	แผ่นซีดีเสียง (Audio CD ) หรือที่นิยมใช้กันมากที่สุดคือแผ่นเสียงMPEG-1 ( VCD , SVCD , MP3 ) เดิมทีโซนี่ เลือกใช้ เพราะสามารถบันทึกได้ด้วยอุปกรณ์วิดีโอที่ดัดแปลงแล้วซึ่งทำงานที่ 25 เฟรมต่อวินาที (PAL) หรือ 30 เฟรมต่อวินาที (โดยใช้ เครื่องบันทึกวิดีโอ ขาวดำ NTSC ) และครอบคลุมแบนด์วิดท์ 20 kHz ซึ่งถือว่าจำเป็นเพื่อให้ตรงกับอุปกรณ์บันทึกอนาล็อกระดับมืออาชีพในสมัยนั้นตัวแปลง PCMจะแปลงตัวอย่างเสียงดิจิทัลเป็นช่องสัญญาณวิดีโออนาล็อกของเทป วิดีโอ PALโดยใช้ 3 ตัวอย่างต่อบรรทัด 588 บรรทัดต่อเฟรม และ 25 เฟรมต่อวินาที
47,250 เฮิรตซ์	เครื่องบันทึกเสียงPCMเชิงพาณิชย์เครื่องแรกของโลก โดย Nippon Columbia (Denon)
48,000 เฮิรตซ์	อัตราการสุ่มตัวอย่างเสียงมาตรฐานที่ใช้โดยอุปกรณ์วิดีโอดิจิทัลระดับมืออาชีพ เช่น เครื่องบันทึกเทป เซิร์ฟเวอร์วิดีโอ เครื่องผสมภาพ และอื่นๆ อัตรานี้ถูกเลือกเนื่องจากสามารถสร้างความถี่ได้ถึง 22 kHz และใช้งานได้กับวิดีโอ NTSC 29.97 เฟรมต่อวินาที รวมถึงระบบ25 เฟรม/วินาที 30 เฟรม/วินาทีและ24 เฟรม/วินาที ในระบบ 29.97 เฟรม/วินาทีจำเป็นต้องจัดการตัวอย่างเสียง 1601.6 ตัวอย่างต่อเฟรม โดยส่งตัวอย่างเสียงจำนวนเต็มทุกๆ เฟรมวิดีโอที่ห้าเท่านั้น^{[ 13 ]}นอกจากนี้ยังใช้สำหรับเสียงในรูปแบบวิดีโอสำหรับผู้บริโภค เช่น DV โทรทัศน์ดิจิทัล^{DVD ภาพยนตร์ และแพลตฟอร์มสตรีมมิ่งวิดีโอมากมาย เช่น YouTube และ Netflix [ 22 ]}เสียงแบบไม่สูญเสียคุณภาพ^{เช่น FLAC}สามารถเลือกได้ทั้ง44100 Hz 48000 Hz หรือสูงกว่า^{[ 23 ]}อินเทอร์เฟซดิจิทัลแบบอนุกรมระดับมืออาชีพ(SDI) และอินเทอร์เฟซดิจิทัลแบบอนุกรมความละเอียดสูง (HD-SDI) ที่ใช้เชื่อมต่ออุปกรณ์โทรทัศน์ออกอากาศเข้าด้วยกันจะใช้ความถี่การสุ่มตัวอย่างเสียงนี้ อุปกรณ์เสียงระดับมืออาชีพส่วนใหญ่ใช้การสุ่มตัวอย่าง 48 kHz รวมถึงคอนโซลผสมเสียงและอุปกรณ์ บันทึกเสียงดิจิทัล
50,000 เฮิรตซ์	เครื่องบันทึกเสียงดิจิทัลเชิงพาณิชย์เครื่องแรกจากช่วงปลายทศวรรษ 1970 ผลิตโดย 3MและSoundstream
50,400 เฮิรตซ์	อัตราการสุ่มตัวอย่างที่ใช้โดยเครื่องบันทึกเสียงดิจิทัล Mitsubishi X-80
64,000 เฮิรตซ์	ไม่ค่อยได้ใช้ แต่ได้รับการสนับสนุนจากฮาร์ดแวร์^{[ 24 ]}^{[ 25 ]}และซอฟต์แวร์^{[ 26 ]}^{[ 27 ]}
88,200 เฮิรตซ์	อัตราการสุ่มตัวอย่างที่อุปกรณ์บันทึกเสียงระดับมืออาชีพบางชนิดใช้เมื่อปลายทางคือซีดี (ตัวคูณของ 44,100 เฮิรตซ์) อุปกรณ์เสียงระดับมืออาชีพบางชนิดใช้ (หรือสามารถเลือกได้) อัตราการสุ่มตัวอย่าง 88.2 กิโลเฮิร์ตซ์ รวมถึงมิกเซอร์ อีควอไลเซอร์ คอมเพรสเซอร์ รีเวิร์บ ครอสโอเวอร์ และอุปกรณ์บันทึกเสียง
96,000 เฮิรตซ์	DVD-Audio , แทร็กเสียง LPCMบางแทร็กของ DVD, แทร็กเสียง BD-ROM (Blu-ray Disc), แทร็กเสียง HD DVD (High-Definition DVD) และHi-Res Audioอุปกรณ์บันทึกและผลิตเสียงระดับมืออาชีพบางชนิดสามารถเลือกความถี่สุ่มตัวอย่าง 96 kHz ได้ ความถี่สุ่มตัวอย่างนี้เป็นสองเท่าของมาตรฐาน 48 kHz ที่ใช้กันทั่วไปกับเสียงในอุปกรณ์ระดับมืออาชีพ
176,400 เฮิรตซ์	อัตราการสุ่มตัวอย่างที่ใช้โดย เครื่องบันทึก HDCDและแอปพลิเคชันระดับมืออาชีพอื่นๆ สำหรับการผลิตซีดี คือ สี่เท่าของความถี่ 44.1 kHz
192,000 เฮิรตซ์	DVD-Audio , แทร็กเสียง LPCMบางแทร็กใน DVD, แทร็กเสียง ใน BD-ROM (Blu-ray Disc), และ แทร็กเสียง ใน HD DVD (High-Definition DVD), อุปกรณ์บันทึกเสียงความละเอียดสูง, เสียงความละเอียดสูง (Hi-Res Audio ) และซอฟต์แวร์ตัดต่อเสียง ความถี่ในการสุ่มตัวอย่างนี้สูงกว่ามาตรฐาน 48 kHz ที่ใช้กันทั่วไปกับเสียงในอุปกรณ์วิดีโอระดับมืออาชีพถึงสี่เท่า
352,800 เฮิรตซ์	ระบบเสียง ดิจิทัลความละเอียดสูงพิเศษ (Digital eXtreme Definition ) ใช้สำหรับบันทึกและตัดต่อแผ่นเสียง Super Audio CDเนื่องจากระบบเสียงดิจิทัลแบบสตรีมโดยตรง 1 บิต (1-bit Direct Stream Digital หรือ DSD)ไม่เหมาะสำหรับการตัดต่อ มีความถี่สูงกว่า 44.1 kHz ถึง 8 เท่า
384,000 เฮิรตซ์	อัตราการสุ่มตัวอย่างสูงสุดที่มีในซอฟต์แวร์ทั่วไป
2,822,400 เฮิรตซ์	SACD คือ กระบวนการมอดูเลชั่นแบบเดลต้า-ซิกมา 1 บิต หรือ ที่รู้จักกันในชื่อ Direct Stream Digitalซึ่ง พัฒนาร่วมกันโดยSonyและPhilips
5,644,800 เฮิรตซ์	DSD แบบ Double-Rate คือการสตรีมข้อมูลดิจิทัลโดยตรง แบบ 1 บิต ที่อัตราเร็วเป็นสองเท่าของ SACD ใช้ในเครื่องบันทึก DSD ระดับมืออาชีพบางรุ่น
11,289,600 เฮิรตซ์	DSD แบบ Quad-Rate คือ การส่งสัญญาณดิจิทัลโดยตรงแบบ 1 บิตที่อัตราเร็วเป็น 4 เท่าของ SACD ใช้ในเครื่องบันทึก DSD ระดับมืออาชีพบางรุ่นที่ไม่ค่อยพบเห็นทั่วไป
22,579,200 เฮิรตซ์	DSD (Octuple-Rate DSD) คือ ระบบส่งสัญญาณดิจิทัลแบบ Direct Stream 1 บิตที่อัตราเร็วเป็น 8 เท่าของ SACD ใช้ในเครื่องบันทึก DSD รุ่นทดลองหายาก หรือที่รู้จักกันในชื่อ DSD512
45,158,400 เฮิรตซ์	DSD อัตรา 6 เท่า, Direct Stream Digital 1 บิต ที่อัตรา 16 เท่าของ SACD ใช้ในเครื่องบันทึก DSD ทดลองหายาก เรียกอีกอย่างว่า DSD1024 ^{[ B ]}

ความลึกของบิต

โดยทั่วไปเสียงจะถูกบันทึกที่ความละเอียด 8, 16 และ 24 บิต ซึ่งให้ค่าอัตราส่วนสัญญาณต่อสัญญาณรบกวนจากการควอนไทเซชัน (SQNR) สูงสุดตามทฤษฎีสำหรับคลื่นไซน์ บริสุทธิ์ ประมาณ 49.93 dB , 98.09 dB และ 122.17 dB ตามลำดับ^{[ 28 ]}เสียงคุณภาพระดับซีดีใช้ตัวอย่าง 16 บิตสัญญาณรบกวนจากความร้อนจำกัดจำนวนบิตที่แท้จริงที่สามารถใช้ในการควอนไทเซชันได้ ระบบอนาล็อกส่วนน้อยเท่านั้นที่มีอัตราส่วนสัญญาณต่อสัญญาณรบกวน (SNR) เกิน 120 dB อย่างไรก็ตาม การ ประมวลผลสัญญาณดิจิทัล สามารถมีช่วงไดนามิกที่สูงมาก ดังนั้นจึงเป็นเรื่องปกติที่จะดำเนินการผสมและมาสเตอร์ริ่งที่ ความแม่นยำจุดลอยตัว 32 บิตจากนั้นแปลงเป็น 16 หรือ 24 บิตสำหรับการเผยแพร่

การสุ่มตัวอย่างเสียงพูด

สัญญาณเสียงพูด ซึ่งก็คือสัญญาณที่ออกแบบมาเพื่อส่งเฉพาะเสียงพูด ของมนุษย์ มักจะสามารถสุ่มตัวอย่างได้ในอัตราที่ต่ำกว่ามาก สำหรับหน่วยเสียง ส่วนใหญ่ พลังงานเกือบทั้งหมดจะอยู่ในช่วง 100 เฮิรตซ์ – 4 กิโลเฮิร์ตซ์ ทำให้สามารถใช้อัตราการสุ่มตัวอย่างที่ 8 กิโลเฮิร์ตซ์ได้ นี่คืออัตราการสุ่มตัวอย่างที่ใช้โดย ระบบ โทรศัพท์ เกือบทั้งหมด ซึ่งใช้ข้อกำหนดการสุ่มตัวอย่างและการกำหนดปริมาณ G.711

การสุ่มตัวอย่างวิดีโอ

โทรทัศน์ความละเอียดมาตรฐาน (SDTV) ใช้ความละเอียดภาพ 720 x 480 พิกเซล (US NTSC 525-line) หรือ 720 x 576 พิกเซล (UK PAL 625-line) สำหรับพื้นที่ภาพที่มองเห็นได้

โทรทัศน์ความละเอียดสูง (HDTV) ใช้ ความ ละเอียด 720p (โปรเกรสซีฟ), 1080i (อินเตอร์เลซ) และ1080p (โปรเกรสซีฟ หรือที่รู้จักกันในชื่อ Full-HD)

ในวิดีโอดิจิทัลอัตราการสุ่มตัวอย่างเชิงเวลาจะถูกกำหนดให้เป็นอัตราเฟรม หรืออัตราฟิลด์ มากกว่าจะเป็น นาฬิกาพิกเซล ตามแนวคิดความถี่การสุ่มตัวอย่างภาพคืออัตราการทำซ้ำของช่วงเวลาการรวมสัญญาณของเซ็นเซอร์ เนื่องจากช่วงเวลาการรวมสัญญาณอาจสั้นกว่าเวลาที่อยู่ระหว่างการทำซ้ำอย่างมาก ความถี่การสุ่มตัวอย่างจึงอาจแตกต่างจากค่าผกผันของเวลาการสุ่มตัวอย่างได้

50 เฮิรตซ์ – วิดีโอPAL
60 / 1.001 Hz ≈ 59.94 Hz – วิดีโอNTSC

ตัวแปลงสัญญาณ วิดีโอดิจิทัลเป็นอนาล็อกทำงานในช่วงความถี่เมกะเฮิร์ตซ์ (ตั้งแต่ประมาณ 3 เมกะเฮิร์ตซ์สำหรับตัวแปลงสัญญาณวิดีโอคอมโพสิตคุณภาพต่ำในเครื่องเล่นเกมรุ่นแรกๆ ไปจนถึง 250 เมกะเฮิร์ตซ์ขึ้นไปสำหรับเอาต์พุต VGA ที่มีความละเอียดสูงสุด)

เมื่อแปลงวิดีโออนาล็อกเป็นวิดีโอดิจิทัลกระบวนการสุ่มตัวอย่างจะแตกต่างออกไป โดยครั้งนี้จะเกิดขึ้นที่ความถี่พิกเซล ซึ่งสอดคล้องกับอัตราการสุ่มตัวอย่างเชิงพื้นที่ตามแนวเส้นสแกนอัตราการสุ่มตัวอย่างพิกเซลที่ใช้กันทั่วไปคือ:

13.5 เมกะเฮิรตซ์ – วิดีโอ CCIR 601 , D1

การสุ่มตัวอย่างเชิงพื้นที่ในทิศทางตรงกันข้ามจะถูกกำหนดโดยระยะห่างของเส้นสแกนในแรสเตอร์อัตราการสุ่มตัวอย่างและความละเอียดในทั้งสองทิศทางเชิงพื้นที่สามารถวัดได้ในหน่วยของเส้นต่อความสูงของภาพ

ปรากฏการณ์เอเลียสซิ่งเชิงพื้นที่ ของส่วนประกอบ ความสว่างหรือความอิ่มตัวของสีที่มีความถี่สูงในวิดีโอ จะปรากฏเป็นลวดลายมัวเร่

การสุ่มตัวอย่างแบบ 3 มิติ

กระบวนการเรนเดอร์แบบปริมาตร (Volume Rendering)คือการสุ่มตัวอย่างตารางสามมิติของว็อกเซล (voxels ) เพื่อสร้างภาพสามมิติของข้อมูลที่ถูกตัดแบ่ง (ภาพตัดขวาง) โดยถือว่าตารางสามมิตินี้เป็นตัวแทนของบริเวณต่อเนื่องในพื้นที่สามมิติ การเรนเดอร์แบบปริมาตรเป็นเรื่องปกติในภาพทางการแพทย์ เช่น การถ่ายภาพเอกซเรย์คอมพิวเตอร์ (CT/CAT), การถ่ายภาพด้วยคลื่นแม่เหล็กไฟฟ้า (MRI), การถ่ายภาพด้วยโพซิตรอนอีมิสชันโทโมกราฟี (PET) เป็นต้น นอกจากนี้ยังใช้ในการสร้างภาพตัดขวางทางธรณีวิทยาและแอปพลิเคชันอื่นๆ อีก ด้วย

การสุ่มตัวอย่างที่ไม่เพียงพอ

เมื่อ สัญญาณ แบนด์พาสถูกสุ่มตัวอย่างช้ากว่าอัตรา Nyquistตัวอย่างจะไม่สามารถแยกแยะได้จากตัวอย่างของสัญญาณรบกวน ความถี่ต่ำ ของสัญญาณความถี่สูง ซึ่งมักจะทำโดยเจตนาเพื่อให้สัญญาณรบกวนความถี่ต่ำสุดเป็นไปตามเกณฑ์ Nyquistเนื่องจากสัญญาณแบนด์พาสยังคงแสดงและกู้คืนได้อย่างเป็นเอกลักษณ์ การสุ่มตัวอย่างที่ต่ำกว่าเกณฑ์ดังกล่าวเรียกอีกอย่างว่า การ สุ่มตัวอย่างแบนด์พาสการสุ่มตัวอย่างฮาร์มอนิกการสุ่มตัวอย่าง IFและการแปลง IF เป็นดิจิทัลโดยตรง^{[ 29 ]}

การสุ่มตัวอย่างเกิน

การสุ่มตัวอย่างเกิน (Oversampling) ถูกนำมาใช้ในตัวแปลงอนาล็อกเป็นดิจิทัลสมัยใหม่ส่วนใหญ่เพื่อลดความผิดเพี้ยนที่เกิดจากตัวแปลงดิจิทัลเป็นอนาล็อก ในทางปฏิบัติ เช่น การคงค่าลำดับศูนย์ (zero-order hold)แทนที่จะใช้อุดมคติ เช่น สูตรการแทรกสอด ของWhittaker–Shannon ^{[ 30 ]}

การสุ่มตัวอย่างที่ซับซ้อน

การสุ่มตัวอย่างเชิงซ้อน (หรือการสุ่มตัวอย่าง I/Q ) คือการสุ่มตัวอย่างพร้อมกันของรูปคลื่นสองรูปที่แตกต่างกันแต่เกี่ยวข้องกัน ส่งผลให้ได้คู่ตัวอย่างที่จะถูกนำไปปฏิบัติเป็นจำนวนเชิงซ้อนใน ภายหลัง ^{[ C ]}เมื่อรูปคลื่นหนึ่งเป็นฮิลเบิร์ตทรานส์ฟอร์มของรูปคลื่นอีกรูปหนึ่งฟังก์ชันค่าเชิงซ้อนเรียกว่าสัญญาณเชิงวิเคราะห์ซึ่งฟูริเยร์ทรานส์ฟอร์มเป็นศูนย์สำหรับค่าความถี่ลบทั้งหมด ในกรณีนั้นอัตราไนควิสต์สำหรับรูปคลื่นที่ไม่มีความถี่ ≥ BสามารถลดลงเหลือเพียงB (ตัวอย่างเชิงซ้อน/วินาที) แทนที่จะเป็น(ตัวอย่างจริง/วินาที) ^[^D^]เห็นได้ชัดเจนยิ่งขึ้น รูปคลื่นเบสแบน ด์ที่เทียบเท่าก็มีอัตราไนควิสต์เท่ากับ เช่นกันเพราะเนื้อหาความถี่ที่ไม่เป็นศูนย์ทั้งหมดถูกเลื่อนไปอยู่ในช่วง ${\hat {s}}(t)$ $s(t)$ $s_{a}(t)\triangleq s(t)+i\cdot {\hat {s}}(t)$ $2B$ $s_{a}(t)\cdot e^{-i2\pi {\frac {B}{2}}t}$ $B$ $[-B/2,B/2]$

แม้ว่าตัวอย่างค่าเชิงซ้อนจะสามารถได้มาตามที่อธิบายไว้ข้างต้น แต่ก็ยังสร้างขึ้นโดยการจัดการตัวอย่างของรูปคลื่นค่าจริง ตัวอย่างเช่น รูปคลื่นเบสแบนด์ที่เทียบเท่ากันสามารถสร้างขึ้นได้โดยไม่ต้องคำนวณอย่างชัดเจนโดยการประมวลผลลำดับผลคูณ[ ^E^]ผ่านตัวกรองความถี่ต่ำแบบดิจิทัลที่มีความถี่ตัดเป็น[ ^F^]^{การ คำนวณเฉพาะตัวอย่างที่สองของลำดับเอาต์พุตจะลดอัตราการสุ่มตัวอย่างให้สอดคล้องกับอัตรา Nyquist ที่}^ลดลง ผลลัพธ์คือจำนวนตัวอย่างค่าเชิงซ้อนเป็นครึ่งหนึ่งของจำนวนตัวอย่างค่าจริงดั้งเดิม ไม่มีข้อมูลสูญหาย และสามารถกู้คืนรูปคลื่นดั้งเดิมได้หากจำเป็น ${\hat {s}}(t)$ $\left[s(nT)\cdot e^{-i2\pi {\frac {B}{2}}Tn}\right]$ $B/2$ $s(t)$

ดูเพิ่มเติม

หมายเหตุ

^ตัวอย่างเช่น "จำนวนตัวอย่าง" ในการประมวลผลสัญญาณนั้น มีความหมายโดยประมาณเทียบเท่ากับ "ขนาดตัวอย่าง " ในทางสถิติ
^อัตราการสุ่มตัวอย่าง DSD ที่สูงกว่านี้ยังมีอยู่ แต่ประโยชน์ที่ได้รับอาจแทบไม่รู้สึก และขนาดไฟล์ก็จะใหญ่มาก
^บางครั้งคู่ตัวอย่างก็ถูกมองว่าเป็นจุดบนแผนภาพกลุ่มดาว ด้วยเช่น กัน
^เมื่ออัตราการสุ่มตัวอย่างเชิงซ้อนคือ Bส่วนประกอบความถี่ที่ 0.6 Bตัวอย่างเช่น จะมีสัญญาณรบกวนที่ −0.4 Bซึ่งไม่มีความกำกวมเนื่องจากข้อจำกัดที่ว่าสัญญาณก่อนการสุ่มตัวอย่างเป็นสัญญาณเชิงวิเคราะห์ ดูเพิ่มเติมที่สัญญาณไซน์เชิงซ้อน
^เมื่อสุ่มตัวอย่าง s ( t ) ที่ความถี่ Nyquist (1/ T = 2B ) ลำดับผลคูณจะลดรูปเหลือ $\left[s(nT)\cdot (-i)^{n}\right].$
^ลำดับของจำนวนเชิงซ้อนจะถูกคอนโวลูชันกับผลตอบสนองแบบอิมพัลส์ของตัวกรองที่มีสัมประสิทธิ์เป็นค่าจริง ซึ่งเทียบเท่ากับการกรองลำดับของส่วนจริงและส่วนจินตนาการแยกกัน แล้วสร้างคู่จำนวนเชิงซ้อนขึ้นใหม่ที่เอาต์พุต

อ่านเพิ่มเติม

Matt Pharr, Wenzel Jakob และ Greg Humphreys, การเรนเดอร์ภาพโดยใช้หลักการทางฟิสิกส์: จากทฤษฎีสู่การนำไปใช้จริง, ฉบับที่ 3 , Morgan Kaufmann, พฤศจิกายน 2016. ISBN 978-0128006450บทที่ว่าด้วยการสุ่มตัวอย่าง ( มีให้ดูออนไลน์ ) เขียนได้ดีมาก มีแผนภาพประกอบ ทฤษฎีหลัก และตัวอย่างโค้ด

ลิงก์ภายนอก

วารสารที่อุทิศให้กับทฤษฎีการสุ่มตัวอย่าง
ข้อมูล I/Q สำหรับมือใหม่ – หน้าเว็บที่พยายามตอบคำถามว่า ทำไมต้องใช้ข้อมูล I/Q?
การสุ่มตัวอย่างสัญญาณอนาล็อก – การนำเสนอแบบโต้ตอบผ่านเว็บสาธิต ณ สถาบันโทรคมนาคม มหาวิทยาลัยสตุทการ์ท

[1] ตัวอย่างเช่น "จำนวนตัวอย่าง" ในการประมวลผลสัญญาณนั้น มีความหมายโดยประมาณเทียบเท่ากับ "ขนาดตัวอย่าง " ในทางสถิติ

[29] อัตราการสุ่มตัวอย่าง DSD ที่สูงกว่านี้ยังมีอยู่ แต่ประโยชน์ที่ได้รับอาจแทบไม่รู้สึก และขนาดไฟล์ก็จะใหญ่มาก

[33] บางครั้งคู่ตัวอย่างก็ถูกมองว่าเป็นจุดบนแผนภาพกลุ่มดาว ด้วยเช่น กัน

[34] เมื่ออัตราการสุ่มตัวอย่างเชิงซ้อนคือ Bส่วนประกอบความถี่ที่ 0.6 Bตัวอย่างเช่น จะมีสัญญาณรบกวนที่ −0.4 Bซึ่งไม่มีความกำกวมเนื่องจากข้อจำกัดที่ว่าสัญญาณก่อนการสุ่มตัวอย่างเป็นสัญญาณเชิงวิเคราะห์ ดูเพิ่มเติมที่สัญญาณไซน์เชิงซ้อน

[35] เมื่อสุ่มตัวอย่าง s ( t ) ที่ความถี่ Nyquist (1/ T = 2B ) ลำดับผลคูณจะลดรูปเหลือ $\left[s(nT)\cdot (-i)^{n}\right].$

[36] ลำดับของจำนวนเชิงซ้อนจะถูกคอนโวลูชันกับผลตอบสนองแบบอิมพัลส์ของตัวกรองที่มีสัมประสิทธิ์เป็นค่าจริง ซึ่งเทียบเท่ากับการกรองลำดับของส่วนจริงและส่วนจินตนาการแยกกัน แล้วสร้างคู่จำนวนเชิงซ้อนขึ้นใหม่ที่เอาต์พุต

[ A ]

1

2

[

[

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

]ทั้งLavry

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

ใน

[

[ 20 ]

[ 21 ]

DVD ภาพยนตร์ และแพลตฟอร์มสตรีมมิ่งวิดีโอมากมาย เช่น YouTube และ Netflix [ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ B ]

[ 28 ]

[ 29 ]

[ 30 ]

[ C ]

[

E

]