กลับไปหน้าบทความ

อ่าน 8 นาที

สิ่งแปลกปลอมจากการบีบอัด

สิ่ง ผิดปกติจากการบีอัด (หรือ สิ่งผิดปกติ ) คือความผิดเพี้ยนที่สังเกตได้ของสื่อ (รวมถึง ภาพ เสียงและ วิดีโอ ) ที่เกิดจากการใช้การ บีอัดแบบสูญเสีย ข้อมูล การบีอัดข้อมูล แบบสูญเสีย...

สิ่งแปลกปลอมจากการบีบอัด

ภาพต้นฉบับ มีขอบตัวอักษรคมชัด และปรับสีได้ดี
การสูญเสียความคมชัดของขอบและโทนสี "ไม่คมชัด" ในการบีบอัดไฟล์ JPEG อย่างหนัก

สิ่งผิดปกติจากการบีอัด (หรือสิ่งผิดปกติ ) คือความผิดเพี้ยนที่สังเกตได้ของสื่อ (รวมถึงภาพเสียงและวิดีโอ ) ที่เกิดจากการใช้การบีอัดแบบสูญเสียข้อมูลการบีอัดข้อมูลแบบสูญเสีย ข้อมูล เกี่ยวข้องกับการทิ้งข้อมูลบางส่วนของสื่อเพื่อให้มีขนาดเล็กพอที่จะจัดเก็บในพื้นที่ดิสก์ ที่ต้องการ หรือส่ง ( สตรีม ) ภายในแบนด์วิดท์ ที่มีอยู่ (เรียกว่าอัตราข้อมูลหรืออัตราบิต ) หากตัวบีอัดไม่สามารถจัดเก็บข้อมูลได้เพียงพอในเวอร์ชันที่บีอัด ผลที่ได้คือคุณภาพลดลงหรือเกิดสิ่งผิดปกติขึ้นอัลกอริทึมการบีอัดอาจไม่ฉลาดพอที่จะแยกแยะความแตกต่างระหว่างความผิดเพี้ยนที่มีความสำคัญน้อยในเชิงอัตวิสัยและความผิดเพี้ยนที่ผู้ใช้ไม่พึงประสงค์

สิ่งผิดปกติจากการบีบอัดข้อมูลดิจิทัลที่พบได้บ่อยที่สุดคือบล็อก DCT ซึ่งเกิดจากอัลกอริธึมการบีบอัดแบบแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) ที่ใช้ใน มาตรฐาน สื่อดิจิทัล หลายอย่าง เช่นรูปแบบไฟล์วิดีโอJPEG , MP3และMPEG [ 1 ] [ 2 ] [ 3 ]สิ่งผิดปกติจากการบีบอัดเหล่านี้จะปรากฏขึ้นเมื่อมีการบีบอัดอย่างหนัก[ 1 ]และมักเกิดขึ้นในสื่อดิจิทัลทั่วไป เช่นDVDรูปแบบไฟล์คอมพิวเตอร์ทั่วไป เช่น ไฟล์ JPEG, MP3 และ MPEG และสื่อทางเลือกอื่นๆ นอกเหนือจากแผ่นซีดีเช่น รูปแบบ MiniDisc ของ Sony สื่อที่ไม่บีบอัด (เช่นLaserdisc , Audio CDและไฟล์WAV ) หรือสื่อ ที่บีบอัดแบบไม่สูญเสียข้อมูล (เช่นFLACหรือPNG ) จะไม่ได้รับผลกระทบจากสิ่งผิดปกติจากการบีบอัด

การลดสิ่งแปลกปลอมที่รับรู้ได้ให้น้อยที่สุดเป็นเป้าหมายสำคัญในการใช้งานอัลกอริธึมการบีบอัดแบบสูญเสีย อย่างไรก็ตาม บางครั้งสิ่งแปลกปลอมก็ถูก สร้างขึ้น โดยเจตนาเพื่อจุดประสงค์ทางศิลปะ ซึ่งเป็นรูปแบบที่เรียกว่าศิลปะกลิตช์[ 4 ]หรือดาต้าโมชชิ่ง[ 5 ]

ในทางเทคนิคแล้ว ข้อผิดพลาดจากการบีบอัดข้อมูล (compression artifact) คือข้อผิดพลาดของข้อมูลประเภทหนึ่ง ซึ่งมักเป็นผลมาจากการควอนไทเซชันในการบีบอัดข้อมูลแบบสูญเสียข้อมูล (lossy data compression) โดยในกรณีที่ใช้การเข้ารหัสแบบแปลง (transform coding) ข้อผิดพลาดดังกล่าวจะมีรูปแบบเป็นหนึ่งใน ฟังก์ชันพื้นฐาน (basis functions)ของปริภูมิการแปลง (transform space) ของตัวเข้ารหัส

รูปภาพ

ภาพประกอบแสดงผลกระทบของการบีบอัด JPEG ต่อภาพที่มีสัญญาณรบกวนเล็กน้อยซึ่งประกอบด้วยข้อความและพื้นที่ว่าง ข้อความคือภาพหน้าจอจากการสนทนาในวิกิพีเดียที่เพิ่มสัญญาณรบกวนเข้าไป (ความเข้ม 10 ใน Paint.NET) เฟรมหนึ่งของภาพเคลื่อนไหวถูกบันทึกเป็น JPEG (คุณภาพ 90) แล้วโหลดใหม่ จากนั้นทั้งสองเฟรมถูกซูมด้วยปัจจัย 4 (การประมาณค่าแบบเพื่อนบ้านที่ใกล้ที่สุด)

เมื่อทำการเข้ารหัส การแปลงโคไซน์แบบไม่ต่อเนื่องตามบล็อก(DCT) [ 1 ]สำหรับการควอนไทเซชันเช่นใน ภาพที่บีบอัด JPEGสิ่งประดิษฐ์หลายประเภทอาจปรากฏขึ้น

  • เสียงเรียกเข้า
  • การปรับรูปทรง
  • การทำโปสเตอร์
  • สัญญาณรบกวนแบบขั้นบันได ( เอเลียสซิ่ง ) ตามขอบโค้ง
  • ลักษณะเป็นบล็อกในบริเวณที่มี "ความหนาแน่น" สูง (ร่องรอยขอบเขตของบล็อก ซึ่งบางครั้งเรียกว่า การเป็นบล็อกขนาดใหญ่ การเย็บปะติดปะต่อ หรือลายตารางหมากรุก)

อัลกอริทึมการสูญเสียอื่นๆ ซึ่งใช้การจับคู่รูปแบบเพื่อลบสัญลักษณ์ที่คล้ายกันที่ซ้ำกัน มีแนวโน้มที่จะทำให้เกิดข้อผิดพลาดที่ตรวจจับได้ยากในข้อความที่พิมพ์ ตัวอย่างเช่น ตัวเลข "6" และ "8" อาจถูกแทนที่ ซึ่งพบว่าเกิดขึ้นกับJBIG2ในเครื่องถ่ายเอกสารบางเครื่อง[ 6 ] [ 7 ]

สิ่งแปลกปลอมบริเวณขอบเขตบล็อก

สิ่งผิดปกติจากการเข้ารหัสบล็อกในภาพ JPEG บล็อกแบนๆ เกิดจากการควอนไทเซชันที่หยาบเกินไป ความไม่ต่อเนื่องที่ขอบเขตของบล็อกการแปลงนั้นมองเห็นได้ชัดเจน

ที่อัตราบิตต่ำรูปแบบการเข้ารหัสแบบบล็อกที่สูญเสียข้อมูล ใดๆ จะทำให้เกิดสิ่งแปลกปลอมที่มองเห็นได้ในบล็อกพิกเซลและที่ขอบเขตของบล็อก ขอบเขตเหล่านี้อาจเป็นขอบเขตของบล็อกการแปลง ขอบเขตของบล็อกการทำนาย หรือทั้งสองอย่าง และอาจตรงกับขอบเขตของ มาโครบล็อกคำว่าmacroblockingมักใช้กันทั่วไปโดยไม่คำนึงถึงสาเหตุของสิ่งแปลกปลอม ชื่ออื่นๆ ได้แก่ blocking [ 8 ] tiling [ 9 ] mosaicing, pixelating, quilting และ checkerboarding

Block-artifacts are a result of the very principle of block transform coding. The transform (for example the discrete cosine transform) is applied to a block of pixels, and to achieve lossy compression, the transform coefficients of each block are quantized. The lower the bit rate, the more coarsely the coefficients are represented and the more coefficients are quantized to zero. Statistically, images have more low-frequency than high-frequency content, so it is the low-frequency content that remains after quantization, which results in blurry, low-resolution blocks. In the most extreme case only the DC-coefficient, that is the coefficient which represents the average color of a block, is retained, and the transform block is only a single color after reconstruction.

Because this quantization process is applied individually in each block, neighboring blocks quantize coefficients differently. This leads to discontinuities at the block boundaries. These are most visible in flat areas, where there is little detail to mask the effect.

Image artifact reduction

Various approaches have been proposed to reduce image compression effects, but to use standardized compression/decompression techniques and retain the benefits of compression (for instance, lower transmission and storage costs), many of these methods focus on "post-processing"—that is, processing images when received or viewed. No post-processing technique has been shown to improve image quality in all cases; consequently, none has garnered widespread acceptance, though some have been implemented and are in use in proprietary systems. Many photo editing programs, for instance, have proprietary JPEG artifact reduction algorithms built-in. Consumer equipment often calls this post-processing MPEG noise reduction.[10]

Boundary artifact in JPEG can be turned into more pleasing "grains" not unlike those in high ISO photographic films. Instead of just multiplying the quantized coefficients with the quantisation step Q pertaining to the 2D-frequency, intelligent noise in the form of a random number in the interval [-Q/2; Q/2] can be added to the dequantized coefficient. This method can be added as an integral part to JPEG decompressors working on the trillions of existing and future JPEG images. As such it is not a "post-processing" technique.[11]

The ringing issue can be reduced at encode time by overshooting the DCT values, clamping the rings away.[12]

Posterization generally only happens at low quality, when the DC values are given too little importance. Tuning the quantization table helps.[13]

Video

ตัวอย่างภาพที่มีสิ่งผิดปกติเนื่องจากข้อผิดพลาดในการส่งข้อมูล

เมื่อใช้การทำนายการเคลื่อนไหว เช่นในMPEG-1 , MPEG-2หรือMPEG-4สิ่งผิดปกติจากการบีบอัดมักจะยังคงหลงเหลืออยู่ในเฟรมที่คลายการบีบอัดหลายรุ่น และเคลื่อนที่ไปพร้อมกับการไหลของภาพ ทำให้เกิดเอฟเฟกต์ที่แปลกประหลาด ซึ่งอยู่กึ่งกลางระหว่างเอฟเฟกต์ภาพวาดและ "คราบสกปรก" ที่เคลื่อนที่ไปพร้อมกับวัตถุในฉาก

ข้อผิดพลาดของข้อมูลในบิตสตรีมที่ถูกบีบอัด ซึ่งอาจเกิดจากข้อผิดพลาดในการส่งข้อมูล สามารถนำไปสู่ข้อผิดพลาดที่คล้ายกับข้อผิดพลาดในการกำหนดปริมาณข้อมูลขนาดใหญ่ หรืออาจขัดขวางการประมวลผลบิตสตรีมทั้งหมดในช่วงเวลาสั้นๆ ส่งผลให้ภาพ "ขาดตอน" ในกรณีที่เกิดข้อผิดพลาดร้ายแรงในบิตสตรีม ตัวถอดรหัสจะยังคงทำการอัปเดตภาพที่เสียหายต่อไปในช่วงเวลาสั้นๆ ทำให้เกิดเอฟเฟกต์ "ภาพซ้อน" จนกว่าจะได้รับเฟรมที่ถูกบีบอัดอย่างอิสระเฟรมถัดไป ในการเข้ารหัสภาพ MPEG เฟรมเหล่านี้เรียกว่า " I-frames " โดยที่ 'I' ย่อมาจาก "intra" จนกว่า I-frame ถัดไปจะมาถึง ตัวถอดรหัสสามารถทำการปกปิดข้อผิดพลาดได้

สิ่งแปลกปลอมที่ขอบเขตของบล็อกการชดเชยการเคลื่อนไหว

ความไม่ต่อเนื่องของขอบเขตบล็อกอาจเกิดขึ้นที่ขอบของ บล็อก การทำนายการชดเชยการเคลื่อนไหวในการบีบอัดวิดีโอแบบชดเชยการเคลื่อนไหว ภาพปัจจุบันจะถูกทำนายโดยการเลื่อนบล็อก (มาโครบล็อก พาร์ติชัน หรือหน่วยการทำนาย) ของพิกเซลจากเฟรมที่ถอดรหัสไว้ก่อนหน้านี้ หากบล็อกที่อยู่ติดกันสองบล็อกใช้เวกเตอร์การเคลื่อนไหวที่แตกต่างกัน จะเกิดความไม่ต่อเนื่องที่ขอบระหว่างบล็อกเหล่านั้น

เสียงยุง

สิ่งผิดปกติจากการบีบอัดวิดีโอ ได้แก่ ผลลัพธ์สะสมของการบีบอัดภาพนิ่งที่ประกอบกัน เช่นการเกิดขอบหรือความยุ่งเหยิงที่ขอบในภาพนิ่งที่ต่อเนื่องกัน จะปรากฏตามลำดับเป็นภาพเบลอระยิบระยับของจุดรอบขอบ เรียกว่าสัญญาณรบกวนแบบยุงเนื่องจากมีลักษณะคล้ายยุงที่บินวนรอบวัตถุ[ 14 ] [ 15 ]สัญญาณรบกวนแบบยุงที่เรียกว่า "mosquito noise" เกิดจาก อัลกอริทึมการบีบอัดแบบ discrete cosine transform (DCT) ที่ใช้บล็อกเป็นฐาน ซึ่งใช้ในมาตรฐานการเข้ารหัสวิดีโอ ส่วนใหญ่ เช่นรูปแบบMPEG [ 3 ]

การลดสิ่งแปลกปลอมในวิดีโอ

สิ่งผิดปกติที่บริเวณขอบบล็อกสามารถลดลงได้โดยการใช้ตัวกรองลดบล็อก (deblocking filter ) เช่นเดียวกับการเข้ารหัสภาพนิ่ง สามารถใช้ตัวกรองลดบล็อกกับเอาต์พุตของตัวถอดรหัสได้ในขั้นตอนหลังการประมวลผล

ในการเข้ารหัสวิดีโอแบบทำนายการเคลื่อนไหวด้วยวงจรทำนายแบบปิด ตัวเข้ารหัสจะใช้เอาต์พุตของตัวถอดรหัสเป็นข้อมูลอ้างอิงในการทำนายเฟรมในอนาคต ดังนั้น ตัวเข้ารหัสจึงรวมเอาตัวถอดรหัสไว้ในเชิงแนวคิด หาก "ตัวถอดรหัส" นี้ทำการลดการเกิดบล็อก (deblocking) ภาพที่ลดการเกิดบล็อกแล้วจะถูกใช้เป็นภาพอ้างอิงสำหรับการชดเชยการเคลื่อนไหว ซึ่งจะช่วยเพิ่มประสิทธิภาพการเข้ารหัสโดยการป้องกันการแพร่กระจายของสิ่งผิดปกติที่เป็นบล็อกข้ามเฟรม สิ่งนี้เรียกว่าตัวกรองลดการเกิดบล็อกในวงจร (in-loop deblocking filter) มาตรฐานที่ระบุตัวกรองลดการเกิดบล็อกในวงจร ได้แก่VC-1 , H.263 Annex J, H.264/AVCและH.265/ HEVC

เสียง

การบีบอัดเสียง แบบสูญเสียข้อมูล (Lossy audio compression) โดยทั่วไปจะใช้แบบจำลองทางจิตวิทยาการได้ยิน (psychoacoustic model) ซึ่งเป็นแบบจำลองการรับรู้การได้ยินของมนุษย์ รูปแบบเสียงแบบสูญเสียข้อมูลมักเกี่ยวข้องกับการใช้การแปลงโดเมนเวลา/ความถี่ เช่น การแปลงโคไซน์แบบไม่ต่อเนื่อง ที่ดัดแปลง (modified discrete cosine transform ) ด้วยแบบจำลองทางจิตวิทยาการได้ยิน จะมีการใช้ประโยชน์จากผลกระทบของการบดบัง เช่น การบดบังความถี่และการบดบังเวลา เพื่อไม่ให้เสียงที่ควรจะฟังไม่รู้เรื่องถูกบันทึก ตัวอย่างเช่น โดยทั่วไปแล้ว มนุษย์ไม่สามารถรับรู้เสียงเบาที่เล่นพร้อมกับเสียงที่คล้ายกันแต่ดังกว่าได้ เทคนิคการบีบอัดแบบสูญเสียข้อมูลอาจระบุเสียงเบานี้และพยายามลบออก นอกจากนี้ เสียงรบกวนจากการควอนไทเซชัน (quantization noise) สามารถ "ซ่อน" ไว้ได้ในที่ที่ปกติแล้วจะถูกบดบังด้วยเสียงที่เด่นกว่า สำหรับการบีบอัดต่ำ จะใช้แบบจำลองทางจิตวิทยาการได้ยินแบบอนุรักษ์นิยม (conservative psy-model) กับขนาดบล็อกขนาดเล็ก

เมื่อแบบจำลองทางจิตวิทยาเสียงไม่แม่นยำ เมื่อขนาดบล็อกการแปลงถูกจำกัด หรือเมื่อใช้การบีบอัดที่รุนแรง อาจส่งผลให้เกิดสิ่งผิดปกติจากการบีบอัดได้ สิ่งผิดปกติในเสียงที่ถูกบีบอัดมักปรากฏในรูปแบบของเสียงก้อง เสียงสะท้อนล่วงหน้า เสียงคล้ายเสียงนก เสียงขาดหาย เสียงสั่น เสียงหึ่ง เสียงก้องเหมือนโลหะ ความรู้สึกเหมือนอยู่ใต้น้ำ เสียงฟู่ หรือเสียงหยาบกระด้าง

ตัวอย่างหนึ่งของสิ่งผิดปกติที่เกิดจากการบีอัดไฟล์เสียงคือเสียงปรบมือในไฟล์เสียงที่มีการบีอัดสูง (เช่น MP3 96 กิโลบิต/วินาที) โดยทั่วไปแล้ว เสียงดนตรีจะมีรูปคลื่นที่ซ้ำกันและมีการเปลี่ยนแปลงระดับเสียงที่คาดเดาได้มากกว่า ในขณะที่เสียงปรบมือเป็นแบบสุ่ม จึงยากต่อการบีอัด ไฟล์เสียงปรบมือที่ถูกบีอัดสูงอาจมี "เสียงก้องเหมือนโลหะ" และสิ่งผิดปกติอื่นๆ ที่เกิดจากการบีอัด

การใช้งานเชิงศิลปะ

สิ่งผิดปกติจากการบีบอัดอาจถูกนำมาใช้โดยเจตนาเพื่อสร้างรูปแบบภาพ ซึ่งบางครั้งเรียกว่า " ศิลปะกลิตช์ " ศิลปะกลิตช์ของRosa Menkman ใช้ประโยชน์จากสิ่งผิดปกติ จากการบีบอัด[ 16 ]โดยเฉพาะอย่างยิ่ง บล็อก การแปลงโคไซน์แบบไม่ต่อเนื่อง (บล็อก DCT) ที่พบใน รูปแบบ การบีบอัดข้อมูลสื่อดิจิทัล ส่วนใหญ่ เช่นภาพดิจิทัล JPEG และไฟล์เสียงดิจิทัลMP3 [ 2 ]ในภาพนิ่ง ตัวอย่างเช่นภาพ JPEGของช่างภาพชาวเยอรมันThomas Ruffซึ่งใช้สิ่งผิดปกติของ JPEG โดยเจตนา เป็นพื้นฐานของรูปแบบภาพ[ 17 ] [ 18 ]

ในศิลปะวิดีโอเทคนิคหนึ่งที่ใช้คือdatamoshingซึ่งวิดีโอสองรายการจะถูกสลับกันเพื่อให้เฟรมกลางถูกแทรกจากแหล่งที่มาสองแหล่งที่แยกจากกัน อีกเทคนิคหนึ่งคือการแปลงรหัสจากรูปแบบวิดีโอแบบสูญเสียข้อมูลรูปแบบหนึ่งไปยังอีกรูปแบบหนึ่ง ซึ่งใช้ประโยชน์จากความแตกต่างในวิธีการประมวลผลข้อมูลการเคลื่อนไหวและสีของตัวแปลงสัญญาณวิดีโอที่แยกจากกัน[ 19 ]เทคนิคนี้ริเริ่มโดยศิลปินBertrand Planesร่วมกับ Christian Jacquemin ในปี 2006 ด้วย DivXPrime [ 20 ] Sven König, Takeshi Murata , Jacques Perconteและ Paul B. Davis ร่วมกับPaperradและเมื่อไม่นานมานี้ถูกใช้โดยDavid OReillyและในมิวสิกวิดีโอสำหรับChairliftและโดยNabil Elderkinในมิวสิกวิดีโอ " Welcome to Heartbreak " สำหรับKanye West [ 21 ] [ 22 ]

นอกจากนี้ยังมีมีมอินเทอร์เน็ต ประเภทหนึ่ง ซึ่งมักจะเป็นภาพที่ไร้สาระซึ่งถูกบีบอัดอย่างหนักโดยเจตนา บางครั้งหลายครั้งเพื่อสร้างความตลกขบขัน ภาพที่สร้างขึ้นโดยใช้เทคนิคนี้มักเรียกว่า "deep fried" [ 23 ]

ดูเพิ่มเติม

  • DivXPrime — การทดลองครั้งแรกที่ทราบกันดีของซอฟต์แวร์การรวมข้อมูลวิดีโอโดย Bertrand Planes และ Christian Jacquemin (อิงตามอัลกอริทึม Xvid)
  • ตัวอย่างภาพยนตร์สั้นSonic Birth — ภาพยนตร์สั้นกำกับโดย Jérome Blanquet เอฟเฟ็กต์ดาต้าโมชชิ่งโดย David Olivari ผลิตโดย [Metronomic] ภาพยนตร์เต็ม: Sonic Birth
  • datamosher —ซอฟต์แวร์ประมวลผลข้อมูลวิดีโอแบบ datamoshing ที่ได้รับอนุญาตภายใต้ GPL
  • ตัวอย่างของสิ่งผิดปกติ ที่เกิดจากการบีบอัดวิดีโออย่างหนัก
  • JPEG Tutorคือแอปพลิเคชันแบบโต้ตอบที่ช่วยให้คุณสำรวจผลกระทบของการเปลี่ยนแปลงเมทริกซ์การควอนไทเซชัน
  • การลบสัญญาณรบกวนและบล็อกภาพ JPEG: ซอฟต์แวร์ Matlab และปลั๊กอิน Photoshop
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Compression_artifact&oldid=1360313086#Artistic_use "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สิ่งแปลกปลอมจากการบีบอัด

สิ่ง ผิดปกติจากการบีอัด (หรือ สิ่งผิดปกติ ) คือความผิดเพี้ยนที่สังเกตได้ของสื่อ (รวมถึง ภาพ เสียงและ วิดีโอ ) ที่เกิดจากการใช้การ บีอัดแบบสูญเสีย ข้อมูล การบีอัดข้อมูล แบบสูญเสีย...

รูปภาพ

เมื่อทำการเข้ารหัส การแปลงโคไซน์แบบไม่ต่อ เนื่องตามบล็อก(DCT) [ 1 ] สำหรับ การควอนไทเซชัน เช่นใน ภาพที่บีบอัด JPEG สิ่งประดิษฐ์หลายประเภทอาจปรากฏขึ้น

สิ่งแปลกปลอมบริเวณขอบเขตบล็อก

ที่อัตราบิตต่ำรูปแบบการเข้ารหัสแบบบล็อก ที่สูญเสียข้อมูล ใดๆ จะทำให้เกิดสิ่งแปลกปลอมที่มองเห็นได้ในบล็อกพิกเซลและที่ขอบเขตของบล็อก ขอบเขตเหล่านี้อาจเป็นขอบเขตของบล็อกการแปลง ขอบเขตของบล็อกการทำนาย หรือทั้งสองอย่าง และอาจตรงกับขอบเขตของ มาโครบล็อก คำว่า...

Image artifact reduction

Various approaches have been proposed to reduce image compression effects, but to use standardized compression/decompression techniques and retain the benefits of compression (for instance, lower transmission and storage costs), many of these methods focus on...