การบีบอัดแบบสูญเสียข้อมูล

ภาพประกอบแสดงการบีบอัดภาพ JPG และ PNG ด้านซ้ายของภาพมาจากภาพ JPEG คุณภาพต่ำ แสดงให้เห็นร่องรอยความเสียหาย ส่วนด้านขวามาจากภาพ PNG

ในเทคโนโลยีสารสนเทศการบีบอัดแบบสูญเสียข้อมูลหรือการบีบอัดที่ไม่สามารถย้อนกลับได้ คือวิธี การบีบอัดข้อมูลประเภทหนึ่งที่ใช้การประมาณค่าที่ไม่แม่นยำและการทิ้งข้อมูลบางส่วนเพื่อแสดงเนื้อหา เทคนิคเหล่านี้ใช้เพื่อลดขนาดข้อมูลสำหรับการจัดเก็บ การจัดการ และการส่งต่อเนื้อหา ระดับการประมาณค่าที่สูงขึ้นจะสร้างภาพที่หยาบขึ้นเนื่องจากรายละเอียดถูกลบออกไปมากขึ้น ซึ่งแตกต่างจากการบีบอัดข้อมูลแบบไม่สูญเสียข้อมูล (การบีบอัดข้อมูลที่สามารถย้อนกลับได้) ซึ่งไม่ทำให้ข้อมูลเสื่อมคุณภาพ ปริมาณการลดขนาดข้อมูลที่ทำได้โดยใช้การบีบอัดแบบสูญเสียข้อมูลนั้นสูงกว่าการใช้เทคนิคแบบไม่สูญเสียข้อมูลมาก

เทคโนโลยีการบีบอัดข้อมูลแบบสูญเสียที่ออกแบบมาอย่างดี มักจะช่วยลดขนาดไฟล์ลงได้อย่างมากก่อนที่ผู้ใช้ปลายทางจะสังเกตเห็นความเสื่อมคุณภาพ แม้ว่าผู้ใช้จะสังเกตเห็นแล้ว การลดขนาดข้อมูลเพิ่มเติมก็อาจเป็นสิ่งจำเป็น (เช่น สำหรับการสื่อสารแบบเรียลไทม์ หรือเพื่อลดเวลาในการส่งข้อมูล หรือลดความต้องการพื้นที่จัดเก็บข้อมูล) อัลกอริทึมการบีบอัดข้อมูลแบบสูญเสียที่ใช้กันอย่างแพร่หลายที่สุดคือการแปลงโคไซน์แบบไม่ต่อเนื่อง (Discrete Cosine Transformหรือ DCT) ซึ่งได้รับการตีพิมพ์ครั้งแรกโดยNasir Ahmed , T. Natarajan และKR Raoในปี 1974

การบีบอัดแบบสูญเสียข้อมูล (Lossy compression) มักใช้ในการบีบอัดข้อมูลมัลติมีเดีย ( เสียงวิดีโอและภาพ ) โดยเฉพาะในแอปพลิเคชันต่างๆ เช่นสตรีมมิ่งมีเดีย และโทรศัพท์ผ่านอินเทอร์เน็ตในทางตรงกันข้าม การบีบอัดแบบไม่สูญเสียข้อมูล (Lossless compression) มักจำเป็นสำหรับไฟล์ข้อความและข้อมูล เช่น บันทึกทางการเงินและบทความต่างๆ การสร้างไฟล์ต้นฉบับแบบไม่สูญเสียข้อมูลเพื่อใช้สร้างสำเนาเพิ่มเติมนั้นมีข้อดี เพราะจะช่วยหลีกเลี่ยงการสร้างสำเนาที่บีบอัดใหม่โดยอ้างอิงจากไฟล์ต้นฉบับแบบสูญเสียข้อมูล ซึ่งจะทำให้เกิดสิ่งผิดปกติและสูญเสียข้อมูล โดย ไม่ จำเป็น

ประเภท

เป็นไปได้ที่จะบีบอัดข้อมูลดิจิทัลหลายประเภทในลักษณะที่ช่วยลดขนาดไฟล์คอมพิวเตอร์ที่จำเป็นในการจัดเก็บ หรือลดแบนด์วิดท์ที่จำเป็นในการส่งข้อมูล โดยไม่สูญเสียข้อมูลทั้งหมดที่มีอยู่ในไฟล์ต้นฉบับ ตัวอย่างเช่น รูปภาพสามารถแปลงเป็นไฟล์ดิจิทัลได้โดยพิจารณาว่าเป็นอาร์เรย์ของจุด และระบุสีและความสว่างของแต่ละจุด หากรูปภาพมีพื้นที่ที่มีสีเดียวกัน ก็สามารถบีบอัดได้โดยไม่สูญเสียข้อมูลโดยระบุว่า "จุดสีแดง 200 จุด" แทนที่จะเป็น "จุดสีแดง จุดสีแดง ...(197 ครั้ง)..., จุดสีแดง"

ข้อมูลต้นฉบับมีปริมาณข้อมูลอยู่จำนวนหนึ่ง และมีขีดจำกัดล่างของขนาดไฟล์ที่ยังคงสามารถบรรจุข้อมูลทั้งหมดได้ทฤษฎีสารสนเทศ พื้นฐาน กล่าวว่ามีขีดจำกัดสัมบูรณ์ในการลดขนาดของข้อมูลนี้ เมื่อข้อมูลถูกบีบอัดเอนโทรปี ของข้อมูล จะเพิ่มขึ้น และมันไม่สามารถเพิ่มขึ้นได้อย่างไม่มีที่สิ้นสุด ตัวอย่างเช่น ไฟล์ ZIP ที่ถูกบีบอัด จะมีขนาดเล็กกว่าไฟล์ต้นฉบับ แต่การบีบอัดไฟล์เดิมซ้ำๆ จะไม่ลดขนาดลงจนเหลือศูนย์ อัลกอริทึมการบีบอัดส่วนใหญ่สามารถระบุได้ว่าเมื่อใดที่การบีบอัดเพิ่มเติมจะไม่มีประโยชน์และจะทำให้ขนาดของข้อมูลเพิ่มขึ้นเสียด้วยซ้ำ

ในหลายกรณี ไฟล์หรือสตรีมข้อมูลมีข้อมูลมากกว่าที่จำเป็น ตัวอย่างเช่น ภาพอาจมีรายละเอียดมากกว่าที่ตาจะมองเห็นได้เมื่อแสดงผลในขนาดใหญ่ที่สุดตามที่ตั้งใจไว้ ในทำนองเดียวกัน ไฟล์เสียงไม่จำเป็นต้องมีรายละเอียดปลีกย่อยมากนักในช่วงที่มีเสียงดังมาก การพัฒนาเทคนิคการบีบอัดแบบสูญเสียข้อมูลที่ใกล้เคียงกับการรับรู้ของมนุษย์มากที่สุดเท่าที่จะเป็นไปได้นั้นเป็นงานที่ซับซ้อน บางครั้งอุดมคติคือไฟล์ที่ให้การรับรู้เหมือนกับต้นฉบับทุกประการ โดยลบข้อมูลดิจิทัลออกให้มากที่สุดเท่าที่จะเป็นไปได้ ในขณะที่บางครั้ง การสูญเสียคุณภาพที่รับรู้ได้ก็ถือเป็นการแลกเปลี่ยนที่ยอมรับได้

คำว่า "ไม่สามารถย้อนกลับได้" และ "สามารถย้อนกลับได้" เป็นที่นิยมมากกว่าคำว่า "สูญเสีย" และ "ไม่สูญเสีย" ตามลำดับ สำหรับการใช้งานบางอย่าง เช่น การบีบอัดภาพทางการแพทย์ เพื่อหลีกเลี่ยงผลกระทบเชิงลบของคำว่า "สูญเสีย" ประเภทและปริมาณของการสูญเสียอาจส่งผลต่อประโยชน์ของภาพ สิ่งแปลกปลอมหรือผลกระทบที่ไม่พึงประสงค์ของการบีบอัดอาจมองเห็นได้ชัดเจน แต่ผลลัพธ์ยังคงมีประโยชน์สำหรับวัตถุประสงค์ที่ตั้งใจไว้ หรือภาพที่บีบอัดแบบสูญเสียอาจ ' ไม่สูญเสียทางสายตา ' หรือในกรณีของภาพทางการแพทย์อาจมีการใช้ การบีบอัดที่ไม่สามารถย้อนกลับได้ที่ยอมรับได้ทางการวินิจฉัย (DAIC) ^{[ 1 ]}

การแปลงรหัส

การบีบอัดแบบสูญเสียข้อมูลบางรูปแบบอาจมองได้ว่าเป็นการประยุกต์ใช้การเข้ารหัสแบบแปลง (transform coding ) ซึ่งเป็นการบีบอัดข้อมูลประเภทหนึ่งที่ใช้กับภาพดิจิทัล สัญญาณ เสียงดิจิทัล และวิดีโอดิจิทัลโดยทั่วไปแล้ว การแปลงจะใช้เพื่อช่วยให้ การกำหนดปริมาณข้อมูล (quantization ) มีประสิทธิภาพมากขึ้น (ตรงเป้าหมายมากขึ้น) ความรู้เกี่ยวกับแอปพลิเคชันจะถูกนำมาใช้ในการเลือกข้อมูลที่จะทิ้งไป ซึ่งจะช่วยลดแบนด์วิดท์ ลง จากนั้น ข้อมูลที่เหลือสามารถบีบอัดได้ด้วยวิธีการต่างๆ เมื่อถอดรหัสผลลัพธ์แล้ว ผลลัพธ์อาจไม่เหมือนกับข้อมูลป้อนเข้าดั้งเดิมทุกประการ แต่คาดว่าจะใกล้เคียงกันมากพอสำหรับวัตถุประสงค์ของแอปพลิเคชัน

รูปแบบการบีบอัดแบบสูญเสียข้อมูลที่พบได้บ่อยที่สุดคือวิธีการเข้ารหัสแบบแปลง ซึ่งก็คือการแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) ^{[ 2 ]}ซึ่งตีพิมพ์ครั้งแรกโดยNasir Ahmed , T. Natarajan และKR Raoในปี 1974 ^{[ 3 ]} DCT เป็นรูปแบบการบีบอัดแบบสูญเสียข้อมูลที่ใช้กันอย่างแพร่หลายที่สุด สำหรับ รูปแบบ การบีบอัดภาพ ที่เป็นที่นิยม (เช่นJPEG ) ^{[ 4 ]}มาตรฐานการเข้ารหัสวิดีโอ (เช่นMPEGและH.264/AVC ) และ รูปแบบ การบีบอัดเสียง (เช่นMP3และAAC )

ในกรณีของข้อมูลเสียง รูปแบบการเข้ารหัสแบบแปลงที่นิยมคือการเข้ารหัสแบบรับรู้ซึ่งแปลงข้อมูลดิบไปเป็นโดเมนที่สะท้อนเนื้อหาข้อมูลได้แม่นยำยิ่งขึ้น ตัวอย่างเช่น แทนที่จะแสดงไฟล์เสียงเป็นระดับแอมพลิจูดเมื่อเวลาผ่านไป อาจแสดงเป็นสเปกตรัมความถี่เมื่อเวลาผ่านไป ซึ่งสอดคล้องกับการรับรู้เสียงของมนุษย์ได้แม่นยำยิ่งขึ้น ในขณะที่การลดข้อมูล (การบีบอัด ไม่ว่าจะเป็นแบบสูญเสียหรือไม่สูญเสีย) เป็นเป้าหมายหลักของการเข้ารหัสแบบแปลง แต่ก็ยังช่วยให้บรรลุเป้าหมายอื่นๆ ได้อีกด้วย เช่น อาจแสดงข้อมูลได้แม่นยำยิ่งขึ้นสำหรับพื้นที่เดิม^{[ 5 ]} – ตัวอย่างเช่น โดยหลักการแล้ว หากเริ่มต้นด้วย มาสเตอร์แบบอนาล็อกหรือดิจิทัลความละเอียดสูงไฟล์MP3ที่มีขนาดที่กำหนดควรให้การแสดงผลที่ดีกว่าไฟล์เสียงดิบที่ไม่ได้บีบอัดใน ไฟล์ WAVหรือAIFFที่มีขนาดเท่ากัน เนื่องจากเสียงที่ไม่ได้บีบอัดสามารถลดขนาดไฟล์ได้โดยการลดอัตราบิตหรือความลึกเท่านั้น ในขณะที่การบีบอัดเสียงสามารถลดขนาดได้ในขณะที่ยังคงรักษาอัตราบิตและความลึกไว้ การบีบอัดนี้จึงเป็นการสูญเสียข้อมูลที่มีความสำคัญน้อยที่สุดอย่างเลือกสรร แทนที่จะสูญเสียข้อมูลทั้งหมด นอกจากนี้ การเข้ารหัสแบบแปลงอาจให้โดเมนที่ดีกว่าสำหรับการจัดการหรือแก้ไขข้อมูล เช่นการปรับสมดุลเสียงจะแสดงออกได้ดีที่สุดในโดเมนความถี่ (เช่น เพิ่มเสียงเบส) มากกว่าในโดเมนเวลาดิบ

จากมุมมองนี้ การเข้ารหัสเชิงรับรู้ไม่ได้หมายถึงการทิ้งข้อมูล แต่เป็น การนำเสนอ ข้อมูลที่ดีขึ้น ต่างหาก อีกประโยชน์หนึ่งคือเพื่อ ความเข้ากันได้กับรุ่นก่อนหน้าและการลดคุณภาพอย่างนุ่มนวล : ในโทรทัศน์สี การเข้ารหัสสีผ่าน โดเมนการแปลง ความสว่าง - ความอิ่มตัวของสี (เช่นYUV ) หมายความว่าโทรทัศน์ขาวดำจะแสดงความสว่างโดยไม่สนใจข้อมูลสี อีกตัวอย่างหนึ่งคือการลดความละเอียดของสี : การใช้พื้นที่สีเช่นYIQที่ใช้ในNTSCช่วยให้สามารถลดความละเอียดของส่วนประกอบต่างๆ ให้สอดคล้องกับการรับรู้ของมนุษย์ – มนุษย์มีความละเอียดสูงสุดสำหรับสีขาวดำ (ความสว่าง) ความละเอียดต่ำกว่าสำหรับสีช่วงกลาง เช่น สีเหลืองและสีเขียว และความละเอียดต่ำสุดสำหรับสีแดงและสีน้ำเงิน – ดังนั้น NTSC จึงแสดงความสว่างประมาณ 350 พิกเซลต่อเส้นสแกน 150 พิกเซลสำหรับสีเหลืองและสีเขียว และ 50 พิกเซลสำหรับสีน้ำเงินและสีแดง ซึ่งเป็นสัดส่วนกับความไวของมนุษย์ต่อแต่ละส่วนประกอบ

การสูญเสียข้อมูล

รูปแบบการบีบอัดแบบสูญเสียข้อมูล ( Lossy compression) ประสบปัญหา การสูญเสียคุณภาพ ในแต่ละรุ่นกล่าวคือ การบีบอัดและคลายการบีบอัดไฟล์ซ้ำๆ จะทำให้คุณภาพไฟล์ลดลงเรื่อยๆ ซึ่งแตกต่างจาก การบีบอัด ข้อมูลแบบไม่สูญเสียข้อมูล (Lossless data compression ) ที่ข้อมูลจะไม่สูญหายจากการใช้กระบวนการดังกล่าวทฤษฎีอัตราการบิดเบือน (Rate-distortion theory)เป็นพื้นฐานทาง ทฤษฎี สารสนเทศ เช่นเดียวกับการใช้ความน่าจะเป็นในทฤษฎีการเข้ารหัสที่เหมาะสม (Optimal coding theory) ทฤษฎีอัตราการบิดเบือนอาศัยการประมาณค่าแบบ เบย์เซียน (Bayesian estimation ) และทฤษฎีการตัดสินใจ (Decision theory)อย่างมากในการจำลองการบิดเบือนการรับรู้และแม้กระทั่งการตัดสิน ทางสุนทรียศาสตร์

มีวิธีการบีบอัดข้อมูลแบบสูญเสียข้อมูลพื้นฐานอยู่สองวิธี:

ใน ตัวแปลงสัญญาณแบบสูญเสียข้อมูล (lossy transform codecs)ตัวอย่างภาพหรือเสียงจะถูกนำมาหั่นเป็นส่วนเล็กๆ แปลงไปยังพื้นที่ฐาน ใหม่ และทำการค วอนไทซ์ จากนั้นค่าควอนไทซ์ที่ได้จะถูก เข้ารหัส แบบเอนโทรปี (entropy coded )
ในโคเดกแบบทำนายที่มีการสูญเสียข้อมูล ข้อมูลที่ถอดรหัสแล้วก่อนหน้าและ/หรือถัดไปจะถูกนำมาใช้เพื่อทำนายตัวอย่างเสียงหรือเฟรมภาพปัจจุบัน ข้อผิดพลาดระหว่างข้อมูลที่ทำนายได้กับข้อมูลจริง พร้อมด้วยข้อมูลเพิ่มเติมใดๆ ที่จำเป็นในการสร้างการทำนายขึ้นมาใหม่ จะถูกแปลงเป็นค่าควอนไทซ์และเข้ารหัส

ในบางระบบ เทคนิคทั้งสองจะถูกนำมาใช้ร่วมกัน โดยใช้ตัวแปลงสัญญาณแบบแปลง (transform codecs) เพื่อบีบอัดสัญญาณข้อผิดพลาดที่เกิดขึ้นจากขั้นตอนการคาดการณ์

การเปรียบเทียบ

ข้อดีของวิธีการบีบอัดแบบสูญ เสียข้อมูลเมื่อเทียบกับวิธีการบีบอัดแบบ ไม่สูญเสียข้อมูลคือ ในบางกรณี วิธีการบีบอัดแบบสูญเสียข้อมูลสามารถสร้างไฟล์ที่บีบอัดได้เล็กกว่าวิธีการบีบอัดแบบไม่สูญเสียข้อมูลมาก ในขณะที่ยังคงตรงตามข้อกำหนดของแอปพลิเคชัน วิธีการบีบอัดแบบสูญเสียข้อมูลมักใช้สำหรับการบีบอัดเสียง รูปภาพ หรือวิดีโอ เนื่องจากข้อมูลประเภทนี้มีจุดประสงค์เพื่อให้มนุษย์ตีความ ซึ่งสมองสามารถ "เติมเต็มส่วนที่ขาดหายไป" หรือมองข้ามข้อผิดพลาดหรือความไม่สอดคล้องกันเล็กน้อยได้ง่าย – ในอุดมคติแล้ว การบีบอัดแบบสูญเสียข้อมูลนั้นโปร่งใส (มองไม่เห็น) ซึ่งสามารถตรวจสอบได้ผ่านการทดสอบ ABX ไฟล์ข้อมูล ที่ ใช้การบีบอัดแบบสูญเสียข้อมูลมีขนาดเล็กกว่า ดังนั้นจึงมีค่าใช้จ่ายในการจัดเก็บและส่งผ่านทางอินเทอร์เน็ตน้อยกว่า ซึ่งเป็นข้อพิจารณาที่สำคัญสำหรับ บริการ สตรีมมิ่งวิดีโอเช่นNetflixและ บริการ สตรีมมิ่งเสียงเช่นSpotify

ความโปร่งใส

เมื่อผู้ใช้ดาวน์โหลดไฟล์ที่ถูกบีบอัดแบบสูญเสียข้อมูล (เช่น เพื่อลดเวลาในการดาวน์โหลด) ไฟล์ที่ได้อาจแตกต่างจากไฟล์ต้นฉบับใน ระดับ บิตอย่างมาก ในขณะที่หูหรือตาของมนุษย์แทบจะแยกไม่ออกในทางปฏิบัติ วิธีการบีบอัดหลายวิธีมุ่งเน้นไปที่ลักษณะเฉพาะของสรีรวิทยาของมนุษย์โดยคำนึงถึงตัวอย่างเช่นว่า ดวงตาของมนุษย์สามารถมองเห็นได้เฉพาะความยาวคลื่นแสงบางช่วงเท่านั้นแบบจำลองทางจิตวิทยาการได้ยินอธิบายว่าเสียงสามารถถูกบีบอัดได้อย่างมากโดยไม่ทำให้คุณภาพที่รับรู้ลดลง ข้อบกพร่องที่เกิดจากการบีบอัดแบบสูญเสียข้อมูลที่สังเกตเห็นได้ด้วยตาหรือหูของมนุษย์เรียกว่า สิ่งผิดปกติจากการบีบอัด (compression artifacts )

อัตราส่วนการบีบอัด

อัตราส่วนการบีบอัด (กล่าวคือ ขนาดของไฟล์ที่บีบอัดแล้วเมื่อเทียบกับขนาดของไฟล์ที่ยังไม่บีบอัด) ของตัวแปลงสัญญาณวิดีโอแบบสูญเสียข้อมูลนั้น มักจะดีกว่าอัตราส่วนการบีบอัดของไฟล์เสียงและภาพนิ่งอย่างมาก

วิดีโอสามารถบีบอัดได้อย่างมาก (เช่น 100:1) โดยแทบไม่มีการสูญเสียคุณภาพที่มองเห็นได้
ไฟล์เสียงสามารถบีบอัดได้ในอัตราส่วน 10:1 โดยแทบไม่มีการสูญเสียคุณภาพเลย
ภาพนิ่งมักถูกบีบอัดแบบสูญเสียคุณภาพในอัตราส่วน 10:1 เช่นเดียวกับไฟล์เสียง แต่การสูญเสียคุณภาพจะเห็นได้ชัดเจนกว่า โดยเฉพาะเมื่อตรวจสอบอย่างละเอียด

การแปลงรหัสและการแก้ไข

ข้อควรระวังที่สำคัญเกี่ยวกับการบีบอัดแบบสูญเสียข้อมูล (หรือที่เรียกว่าการแปลงรหัส) คือ การแก้ไขไฟล์ที่ถูกบีบอัดแบบสูญเสียข้อมูลจะทำให้เกิดการสูญเสียคุณภาพดิจิทัลจากการเข้ารหัสใหม่ ซึ่งสามารถหลีกเลี่ยงได้โดยการสร้างไฟล์แบบสูญเสียข้อมูลจากไฟล์ต้นฉบับ (แบบไม่สูญเสียข้อมูล) เท่านั้น และแก้ไขเฉพาะไฟล์ต้นฉบับ (สำเนา) เช่น ภาพในรูปแบบไฟล์ RAWแทนที่จะเป็นJPEGหากข้อมูลที่ถูกบีบอัดแบบสูญเสียข้อมูลถูกถอดรหัสและบีบอัดแบบไม่สูญเสียข้อมูล ขนาดของผลลัพธ์อาจเทียบได้กับขนาดของข้อมูลก่อนการบีบอัดแบบสูญเสียข้อมูล แต่ข้อมูลที่สูญหายไปแล้วจะไม่สามารถกู้คืนได้ เมื่อตัดสินใจใช้การแปลงแบบสูญเสียข้อมูลโดยไม่เก็บไฟล์ต้นฉบับไว้ อาจจำเป็นต้องมีการแปลงรูปแบบในอนาคตเพื่อให้เข้ากันได้กับซอฟต์แวร์หรืออุปกรณ์ (การเปลี่ยนรูปแบบ ) หรือเพื่อหลีกเลี่ยงการจ่ายค่าลิขสิทธิ์สิทธิบัตรสำหรับการถอดรหัสหรือการเผยแพร่ไฟล์ที่บีบอัด

การแก้ไขไฟล์ที่มีการสูญเสียข้อมูล

ด้วยการแก้ไขข้อมูลที่ถูกบีบอัดโดยตรงโดยไม่ต้องถอดรหัสและเข้ารหัสใหม่ ทำให้สามารถแก้ไขไฟล์ที่ถูกบีบอัดแบบสูญเสียคุณภาพได้โดยไม่ทำให้คุณภาพลดลง การแก้ไขที่ช่วยลดขนาดไฟล์ราวกับว่าไฟล์นั้นถูกบีบอัดในระดับที่สูงกว่า แต่ไม่สูญเสียคุณภาพไปมากกว่าเดิม ก็เป็นไปได้ในบางครั้งเช่นกัน

เจพีเอ

โปรแกรมหลักสำหรับการแก้ไขไฟล์ JPEG โดยไม่สูญเสียคุณภาพ ได้แก่jpegtranและไฟล์ที่ดัดแปลงมาจาก JPEG exiftran(ซึ่งยังคงรักษา ข้อมูล Exif ไว้ด้วย ) และJPEGcrop (ซึ่งมีอินเทอร์เฟซสำหรับ Windows)

ตัวเลือกเหล่านี้ช่วยให้สามารถ ตัดครอบตัด หมุน พลิกหรือแม้กระทั่งแปลงภาพ เป็น ภาพ ขาวดำ (โดยการตัด ช่อง สีออก ) ในขณะที่ข้อมูลที่ไม่ต้องการถูกทำลาย คุณภาพของส่วนที่เหลือยังคงไม่เปลี่ยนแปลง

การแปลงอื่นๆ บางอย่างก็สามารถทำได้ในระดับหนึ่ง เช่น การรวมภาพที่มีการเข้ารหัสเดียวกัน (การจัดวางเคียงข้างกัน เหมือนบนตาราง) หรือการวางภาพ เช่น โลโก้ ลงบนภาพที่มีอยู่แล้ว (ทั้งสองอย่างทำได้ผ่านJpegjoin ) หรือการปรับขนาด^{[ 6 ]}

สามารถทำการเปลี่ยนแปลงบางอย่างกับการบีบอัดได้โดยไม่ต้องเข้ารหัสใหม่:

ปรับปรุงการบีบอัดให้เหมาะสม (เพื่อลดขนาดโดยไม่เปลี่ยนแปลงภาพที่ถอดรหัสแล้ว)
การแปลงระหว่างการเข้ารหัสแบบโปรเกรสซีฟและแบบไม่โปรเกรสซีฟ

โปรแกรม IrfanViewซึ่งเป็นโปรแกรมฟรีแวร์สำหรับ Windows เท่านั้นมีฟังก์ชันการประมวลผล JPEG แบบไม่สูญเสียคุณภาพในJPG_TRANSFORMปลั๊กอิน ของ มัน

เมตาเดตา

โดยทั่วไปแล้ว เมตาเดตา เช่นแท็ก ID3 , ความคิดเห็น Vorbisหรือ ข้อมูล Exifสามารถแก้ไขหรือลบได้โดยไม่ต้องแก้ไขข้อมูลต้นฉบับ

ความสามารถในการปรับขนาดของการลดขนาด/การแสดงผลแบบบีบอัด

บางคนอาจต้องการลดความละเอียดของสัญญาณต้นฉบับและปริมาณข้อมูลที่ใช้สำหรับการบีบอัดโดยไม่ต้องเข้ารหัสใหม่ เช่นเดียวกับการลดบิตเรต(bitrate peeling ) แต่ฟังก์ชันนี้ไม่ได้รับการสนับสนุนในทุกรูปแบบ เนื่องจากไม่ใช่ทุกตัวแปลงสัญญาณที่จะเข้ารหัสข้อมูลในรูปแบบที่อนุญาตให้ตัดรายละเอียดที่ไม่สำคัญออกไปได้ รูปแบบที่รู้จักกันดีที่มีความสามารถนี้ ได้แก่JPEG 2000สำหรับภาพนิ่ง และH.264/MPEG-4 AVCสำหรับการเข้ารหัสวิดีโอแบบปรับขนาดได้ (Scalable Video Coding) รูปแบบดังกล่าวได้รับการกำหนดมาตรฐานสำหรับรูปแบบเก่าๆ ด้วยเช่นกัน เช่น ภาพ JPEGที่มีการเข้ารหัสแบบโปรเกรสซีฟ และ วิดีโอ MPEG-2และMPEG-4 Part 2แม้ว่ารูปแบบก่อนหน้านี้จะประสบความสำเร็จอย่างจำกัดในแง่ของการนำไปใช้ในโลกแห่งความเป็นจริง หากปราศจากความสามารถนี้ ซึ่งมักเกิดขึ้นในทางปฏิบัติ ในการสร้างภาพที่มีความละเอียดหรือความเที่ยงตรงต่ำกว่าภาพที่กำหนดไว้ จำเป็นต้องเริ่มต้นด้วยสัญญาณต้นฉบับและเข้ารหัส หรือเริ่มต้นด้วยภาพที่ถูกบีบอัดแล้วคลายการบีบอัดและเข้ารหัสใหม่ ( การแปลงรหัส ) แม้ว่าวิธีหลังมักจะทำให้เกิดการสูญเสียคุณภาพในการสร้างภาพดิจิทัลก็ตาม

อีกแนวทางหนึ่งคือการเข้ารหัสสัญญาณต้นฉบับด้วยอัตราบิตที่แตกต่างกันหลายระดับ จากนั้นจึงเลือกใช้อัตราบิตที่ต้องการ (เช่นเดียวกับการสตรีมผ่านอินเทอร์เน็ต – เช่นใน" SureStream " ของ RealNetworks – หรือการเสนอการดาวน์โหลดที่หลากหลาย เช่นในiTunes Store ของ Apple ) หรือออกอากาศหลายอัตราบิต แล้วใช้อัตราบิตที่ดีที่สุดที่ได้รับการรับอย่างสำเร็จ เช่นเดียวกับการใช้งานการปรับเปลี่ยนแบบลำดับชั้น ต่างๆ เทคนิคที่คล้ายกันนี้ใช้ในmipmaps , การแสดงผลแบบพีระมิดและ วิธีการ พื้นที่มาตราส่วน ที่ซับซ้อนกว่า บางรูปแบบเสียงมีส่วนผสมของรูปแบบที่สูญเสียข้อมูลและการแก้ไขแบบไม่สูญเสียข้อมูล ซึ่งเมื่อรวมกันแล้วจะสร้างสัญญาณต้นฉบับขึ้นมาใหม่ การแก้ไขสามารถตัดออกได้ ทำให้เหลือไฟล์ที่มีขนาดเล็กกว่าและบีบอัดแบบสูญเสียข้อมูล รูปแบบดังกล่าวได้แก่MPEG-4 SLS (Scalable to Lossless), WavPack , OptimFROG DualStreamและDTS-HD Master Audio ในโหมดไม่สูญเสียข้อมูล (XLL )

วิธีการ

กราฟิก

ภาพ

การแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT)
- JPEG ^{[ 7 ]}
- WebP (การบีบอัดภาพ RGB และ RGBA ความหนาแน่นสูง แบบไม่สูญเสียข้อมูล หรือแบบสูญเสียข้อมูลบางส่วน)
- รูปแบบภาพประสิทธิภาพสูง (HEIF)
- Better Portable Graphics (BPG) (การบีบอัดแบบไม่สูญเสียข้อมูลหรือแบบสูญเสียข้อมูล)
- JPEG XRคือรูปแบบไฟล์ภาพรุ่นต่อจาก JPEG ที่รองรับช่วงไดนามิกสูงและขอบเขตสี ที่กว้าง (การบีบอัดแบบไม่สูญเสียข้อมูลหรือแบบสูญเสียข้อมูล)
การบีบอัดเวฟเล็ต
- JPEG 2000เป็นรูปแบบไฟล์ที่พัฒนาต่อจาก JPEG โดยใช้เวฟเล็ต (การบีบอัดแบบไม่สูญเสียข้อมูลหรือแบบสูญเสียข้อมูล)
- ดีเจวู
- ICERซึ่งเป็นโปรแกรมที่ใช้โดยยานสำรวจดาวอังคาร มีความเกี่ยวข้องกับJPEG 2000ในแง่ของการใช้เวฟเล็ต
- PGF (Progressive Graphics File) คือไฟล์กราฟิกแบบโปรเกรสซีฟ (การบีบอัดแบบไม่สูญเสียข้อมูลหรือแบบสูญเสียข้อมูล)
การบีอัดการรับรู้แบบคาร์ทีเซียนหรือที่รู้จักกันในชื่อ CPC
การบีบอัดแบบแฟรกทัล
JBIG2 (การบีบอัดแบบไม่สูญเสียข้อมูลหรือแบบสูญเสียข้อมูล)
การบีบอัด พื้นผิว S3TCสำหรับฮาร์ดแวร์กราฟิกคอมพิวเตอร์ 3 มิติ

กราฟิกคอมพิวเตอร์ 3 มิติ

glTF

วิดีโอ

การแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT)
- H.261 ^{[ 7 ]}
- Motion JPEG ^{[ 7 ]}
- MPEG-1 ส่วนที่ 2 ^{[ 8 ]}
- MPEG-2 ส่วนที่ 2 (H.262) ^{[ 8 ]}
- MPEG-4 ส่วนที่ 2 ( H.263 ) ^{[ 7 ]}
- การเข้ารหัสวิดีโอขั้นสูง (AVC / H.264 / MPEG-4 AVC) ^{[ 7 ]} (อาจเป็นแบบไม่สูญเสียข้อมูล แม้ในบางส่วนของวิดีโอ)
- การเข้ารหัสวิดีโอประสิทธิภาพสูง (HEVC / H.265) ^{[ 7 ]}
- Ogg Theora (ซึ่งโดดเด่นในเรื่องที่ไม่มีข้อจำกัดด้านสิทธิบัตร)
- วีซี-1
การบีบอัดเวฟเล็ต
- Motion JPEG 2000
- ดิแรก
ตัวแปลงสัญญาณวิดีโอโซเรนสัน

เสียง

ทั่วไป

การแปลงโคไซน์แบบไม่ต่อเนื่องที่ปรับปรุงแล้ว (MDCT)
- ดอลบี้ ดิจิตอล (เอซี-3)
- การเข้ารหัสเสียงแบบปรับเปลี่ยนได้ (ATRAC)
- MPEG เลเยอร์ III (MP3) ^{[ 9 ]}
- การเข้ารหัสเสียงขั้นสูง (AAC / เสียงMP4 ) ^{[ 10 ]}
- วอร์บิส
- ไฟล์เสียง Windows Media Audio (WMA) (โปรไฟล์ Standard และ Pro เป็นแบบบีบอัดข้อมูล นอกจากนี้ยังมี WMA Lossless ให้เลือกใช้ด้วย)
- LDAC ^{[ 11 ]}^{[ 12 ]}
- Opus (โดดเด่นในเรื่องไม่มีข้อจำกัดด้านสิทธิบัตร ความหน่วงต่ำ และคุณภาพเสียงพูดและเสียงโดยรวมสูง)
การมอดูเลชั่นรหัสพัลส์เชิงอนุพันธ์แบบปรับได้ (ADPCM)
- การรับรองคุณภาพระดับมาสเตอร์ (MQA)
MPEG-1 Audio Layer II (MP2)
มิวสแพ็ค (พัฒนาจากมิวสิคัม)
aptX/ aptX-HD ^{[ 13 ]}

คำพูด

การเข้ารหัสทำนายเชิงเส้น (LPC)
- การเข้ารหัสทำนายแบบปรับตัว (APC)
- การทำนายเชิงเส้นแบบกระตุ้นด้วยรหัส (CELP)
- การทำนายเชิงเส้นที่กระตุ้นด้วยรหัสพีชคณิต (ACELP)
- การทำนายเชิงเส้นแบบผ่อนคลายที่กระตุ้นด้วยรหัส (RCELP)
- CELP ที่มีความล่าช้าต่ำ (LD-CELP)
- อัตราความเร็วหลายระดับแบบปรับได้ (ใช้ในระบบ GSMและ3GPP )
- Codec2 (โดดเด่นในเรื่องไม่มีข้อจำกัดด้านสิทธิบัตร)
- Speex (ซึ่งขึ้นชื่อเรื่องไม่มีข้อจำกัดด้านสิทธิบัตร)
การแปลงโคไซน์แบบไม่ต่อเนื่องที่ปรับปรุงแล้ว (MDCT)
- เอเอซี-แอลดี
- การแปลงพลังงานแบบซ้อนทับที่มีข้อจำกัด (CELT)
- Opus (ส่วนใหญ่ใช้สำหรับแอปพลิเคชันแบบเรียลไทม์)

ข้อมูลอื่นๆ

นักวิจัยได้ทำการบีบอัดข้อมูลแบบสูญเสียบนข้อความโดยใช้พจนานุกรมคำพ้องความหมายเพื่อแทนที่คำสั้นด้วยคำยาว หรือใช้เทคนิคข้อความแบบสร้าง^{[ 14 ]}แม้ว่าบางครั้งสิ่งเหล่านี้จะจัดอยู่ในหมวดหมู่ที่เกี่ยวข้องกับการแปลงข้อมูลแบบสูญเสียก็ตาม

ลดความละเอียด

การบีบอัดแบบสูญเสียข้อมูลโดยทั่วไปคือการลดความละเอียดของภาพ เช่นการปรับขนาดภาพโดยเฉพาะอย่างยิ่งการลดจำนวนพิกเซล นอกจากนี้ยังอาจลบส่วนที่มี "ข้อมูลน้อย" ออกไปได้ เช่นการตัดขอบภาพการแปลงสื่อหลายอย่าง เช่นการเบลอแบบเกาส์เซียนก็เหมือนกับการบีบอัดแบบสูญเสียข้อมูล คือไม่สามารถย้อนกลับได้ กล่าวคือ สัญญาณดั้งเดิมไม่สามารถสร้างขึ้นใหม่จากสัญญาณที่แปลงแล้วได้ อย่างไรก็ตาม โดยทั่วไปแล้วไฟล์ที่ได้จะมีขนาดเท่ากับไฟล์ต้นฉบับ และไม่ใช่รูปแบบของการบีบอัด การลดความละเอียดมีประโยชน์ในทางปฏิบัติ เช่น ยาน อวกาศนิวฮอไรซันส์ ของ นาซา ได้ส่งภาพย่อของการสำรวจพลูโต-ชารอนก่อนที่จะส่งภาพที่มีความละเอียดสูงกว่า อีกวิธีหนึ่งสำหรับการเชื่อมต่อที่ช้าคือการใช้การสลับภาพ (Image interlacing)ซึ่งจะค่อยๆ กำหนดภาพ ดังนั้นการส่งข้อมูลเพียงบางส่วนก็เพียงพอที่จะดูตัวอย่างภาพสุดท้ายในเวอร์ชันความละเอียดต่ำ โดยไม่ต้องสร้างทั้งเวอร์ชันที่ปรับขนาดและเวอร์ชันเต็ม

ดูเพิ่มเติม

หมายเหตุ

^สมาคมรังสีวิทยาแห่งยุโรป (2011). "ความสามารถในการใช้งานของการบีบอัดภาพที่ไม่สามารถย้อนกลับได้ในการถ่ายภาพรังสี เอกสารแสดงจุดยืนโดยสมาคมรังสีวิทยาแห่งยุโรป (ESR)" Insights Imaging . 2 (2): 103– 115. doi : 10.1007/s13244-011-0071-x . PMC 3259360 . PMID 22347940 .
^ "การบีบอัดข้อมูล"สารานุกรมบริแทนนิกาสืบค้นเมื่อ 13 สิงหาคม 2562
^ Ahmed, Nasir ; Natarajan, T.; Rao, KR (มกราคม 1974), "Discrete Cosine Transform", IEEE Transactions on Computers , C-23 (1): 90– 93, doi : 10.1109/TC.1974.223784 , S2CID 149806273
^ "T.81 – การบีบอัดและการเข้ารหัสภาพนิ่งแบบต่อเนื่องทางดิจิทัล – ข้อกำหนดและแนวทางปฏิบัติ" (PDF) . CCITT. กันยายน 1992 . สืบค้นเมื่อ12 กรกฎาคม 2019 .
“แม้ว่าเป้าหมายหลักอย่างหนึ่งของตัวเข้ารหัสการรับรู้เสียงดิจิทัลคือการลดข้อมูล แต่นี่ไม่ใช่คุณลักษณะที่จำเป็นเสมอไป ดังที่เราจะได้เห็นต่อไป การเข้ารหัสการรับรู้สามารถนำมาใช้เพื่อปรับปรุงการแสดงผลของเสียงดิจิทัลผ่านการจัดสรรบิตขั้นสูงได้” ( Masking and Perceptual Coding , Victor Lombardi, noisebetweenstations.com)
^ "คุณสมบัติใหม่ของ jpegtran" . sylvana.net . สืบค้นเมื่อ2019-09-20 .
^ ^a ^b ^c ^d ^e ^f Stanković, Radomir S.; Astola, Jaakko T. (2012). "ความทรงจำเกี่ยวกับงานยุคแรกใน DCT: บทสัมภาษณ์กับ KR Rao" (PDF) . บทความตีพิมพ์ซ้ำจากยุคแรกเริ่มของวิทยาศาสตร์สารสนเทศ . 60 . สืบค้นเมื่อ13 ตุลาคม 2019 .
^ ^a ^b K. R. Rao และ JJ Hwang, เทคนิคและมาตรฐานสำหรับการเข้ารหัสภาพ วิดีโอ และเสียง , Prentice Hall, 1996; JPEG: บทที่ 8; H.261: บทที่ 9; MPEG-1: บทที่ 10; MPEG-2: บทที่ 11
^ Guckert, John (ฤดูใบไม้ผลิ 2012). "การใช้ FFT และ MDCT ในการบีบอัดเสียง MP3" (PDF) . มหาวิทยาลัยยูทาห์ . สืบค้นเมื่อ 14 กรกฎาคม 2019 .
^แบรนเดนบูร์ก, คาร์ลไฮนซ์ (1999). "คำอธิบาย MP3 และ AAC" (PDF) . เก็บถาวร(PDF)จากต้นฉบับเมื่อ 13 กุมภาพันธ์ 2017
^ Darko, John H. (2017-03-29). "ความจริงที่น่าอึดอัดใจเกี่ยวกับเสียงบลูทูธ" . DAR__KO . เก็บถาวรจากต้นฉบับเมื่อ 2018-01-14 . เรียกดูเมื่อ2018-01-13 .
^ Ford, Jez (2015-08-24). "Sony LDAC คืออะไร และทำงานอย่างไร?" . AVHub . สืบค้นเมื่อ2018-01-13 .
^ Ford, Jez (2016-11-22). "aptX HD - lossless หรือ lossy?" . AVHub . สืบค้นเมื่อ2018-01-13 .
^ IH WITTEN และคณะ"แบบจำลองเชิงความหมายและเชิงกำเนิดสำหรับการบีบอัดข้อความแบบสูญเสียข้อมูล" (PDF)วารสารคอมพิวเตอร์สืบค้นเมื่อ13 ตุลาคม 2550

ลิงก์ภายนอก

รูปแบบไฟล์เสียงแบบสูญเสียข้อมูล : เปรียบเทียบความเร็วและประสิทธิภาพการบีบอัดของรูปแบบไฟล์เสียงแบบสูญเสียข้อมูล 5 รูปแบบ
พื้นฐานการบีบอัดข้อมูลรวมถึงบทต่างๆ เกี่ยวกับการบีบอัดแบบสูญเสียข้อมูลของภาพ เสียง และวิดีโอ
การบีบอัดภาพ PNG แบบสูญเสียข้อมูลที่Wayback Machine (เก็บถาวรเมื่อ 3 ตุลาคม 2548)
การใช้การบีบอัด GIF/PNG แบบสูญเสียข้อมูลสำหรับเว็บ (บทความ)
JPG สำหรับการจัดเก็บถาวร : เปรียบเทียบความเหมาะสมของ JPG และการบีบอัดแบบไม่สูญเสียข้อมูลสำหรับการจัดเก็บภาพ

[1] สมาคมรังสีวิทยาแห่งยุโรป (2011). "ความสามารถในการใช้งานของการบีบอัดภาพที่ไม่สามารถย้อนกลับได้ในการถ่ายภาพรังสี เอกสารแสดงจุดยืนโดยสมาคมรังสีวิทยาแห่งยุโรป (ESR)" Insights Imaging . 2 (2): 103– 115. doi : 10.1007/s13244-011-0071-x . PMC 3259360 . PMID 22347940 .

[2] "การบีบอัดข้อมูล"สารานุกรมบริแทนนิกาสืบค้นเมื่อ 13 สิงหาคม 2562

[pubDCT-3] Ahmed, Nasir ; Natarajan, T.; Rao, KR (มกราคม 1974), "Discrete Cosine Transform", IEEE Transactions on Computers , C-23 (1): 90– 93, doi : 10.1109/TC.1974.223784 , S2CID 149806273

[4] "T.81 – การบีบอัดและการเข้ารหัสภาพนิ่งแบบต่อเนื่องทางดิจิทัล – ข้อกำหนดและแนวทางปฏิบัติ" (PDF) . CCITT. กันยายน 1992 . สืบค้นเมื่อ12 กรกฎาคม 2019 .

[5] “แม้ว่าเป้าหมายหลักอย่างหนึ่งของตัวเข้ารหัสการรับรู้เสียงดิจิทัลคือการลดข้อมูล แต่นี่ไม่ใช่คุณลักษณะที่จำเป็นเสมอไป ดังที่เราจะได้เห็นต่อไป การเข้ารหัสการรับรู้สามารถนำมาใช้เพื่อปรับปรุงการแสดงผลของเสียงดิจิทัลผ่านการจัดสรรบิตขั้นสูงได้” ( Masking and Perceptual Coding , Victor Lombardi, noisebetweenstations.com)

[6] "คุณสมบัติใหม่ของ jpegtran" . sylvana.net . สืบค้นเมื่อ2019-09-20 .

[Stankovic-7] ^ ^a ^b ^c ^d ^e ^f Stanković, Radomir S.; Astola, Jaakko T. (2012). "ความทรงจำเกี่ยวกับงานยุคแรกใน DCT: บทสัมภาษณ์กับ KR Rao" (PDF) . บทความตีพิมพ์ซ้ำจากยุคแรกเริ่มของวิทยาศาสตร์สารสนเทศ . 60 . สืบค้นเมื่อ13 ตุลาคม 2019 .

[Rao-8] K. R. Rao และ JJ Hwang, เทคนิคและมาตรฐานสำหรับการเข้ารหัสภาพ วิดีโอ และเสียง , Prentice Hall, 1996; JPEG: บทที่ 8; H.261: บทที่ 9; MPEG-1: บทที่ 10; MPEG-2: บทที่ 11

[Guckert-9] Guckert, John (ฤดูใบไม้ผลิ 2012). "การใช้ FFT และ MDCT ในการบีบอัดเสียง MP3" (PDF) . มหาวิทยาลัยยูทาห์ . สืบค้นเมื่อ 14 กรกฎาคม 2019 .

[brandenburg-10] แบรนเดนบูร์ก, คาร์ลไฮนซ์ (1999). "คำอธิบาย MP3 และ AAC" (PDF) . เก็บถาวร(PDF)จากต้นฉบับเมื่อ 13 กุมภาพันธ์ 2017

[Darko_2017-11] Darko, John H. (2017-03-29). "ความจริงที่น่าอึดอัดใจเกี่ยวกับเสียงบลูทูธ" . DAR__KO . เก็บถาวรจากต้นฉบับเมื่อ 2018-01-14 . เรียกดูเมื่อ2018-01-13 .

[AVHub_2015-12] Ford, Jez (2015-08-24). "Sony LDAC คืออะไร และทำงานอย่างไร?" . AVHub . สืบค้นเมื่อ2018-01-13 .

[AVHub_2016-13] Ford, Jez (2016-11-22). "aptX HD - lossless หรือ lossy?" . AVHub . สืบค้นเมื่อ2018-01-13 .

[14] IH WITTEN และคณะ"แบบจำลองเชิงความหมายและเชิงกำเนิดสำหรับการบีบอัดข้อความแบบสูญเสียข้อมูล" (PDF)วารสารคอมพิวเตอร์สืบค้นเมื่อ13 ตุลาคม 2550

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]