อ่าน 6 นาที
การเสื่อมสภาพของข้อมูล
การเสื่อมสภาพของข้อมูล คือ การเสื่อมคุณภาพ ของ ข้อมูลคอมพิวเตอร์ อย่างค่อยเป็นค่อยไปอันเนื่อง มาจากการสะสมของความล้มเหลวที่ไม่ร้ายแรงใน อุปกรณ์จัดเก็บข้อมูล...
การเสื่อมสภาพของข้อมูล
การเสื่อมสภาพของข้อมูลคือการเสื่อมคุณภาพของข้อมูลคอมพิวเตอร์ อย่างค่อยเป็นค่อยไปอันเนื่อง มาจากการสะสมของความล้มเหลวที่ไม่ร้ายแรงในอุปกรณ์จัดเก็บข้อมูลนอกจากนี้ยังเรียกอีกอย่างว่าการเสื่อมสภาพของข้อมูลการเน่าเปื่อยของข้อมูลการเสื่อมสภาพทางดิจิทัลหรือ การ เน่าเปื่อยของบิต[ 1 ]ซึ่งส่งผลให้คุณภาพของข้อมูลลดลงเมื่อเวลาผ่านไป แม้ว่าข้อมูลจะไม่ได้ถูกใช้งานก็ตาม
การสำแดง
แหล่งเก็บข้อมูลหลัก
การเสื่อมสภาพของข้อมูลในหน่วยความจำเข้าถึงแบบสุ่มไดนามิก (DRAM) สามารถเกิดขึ้นได้เมื่อประจุไฟฟ้าของบิตใน DRAM กระจายตัว ซึ่งอาจทำให้รหัสโปรแกรมหรือข้อมูลที่จัดเก็บเปลี่ยนแปลงไป DRAM อาจถูกเปลี่ยนแปลงโดยรังสีคอสมิก[ 2 ]หรืออนุภาคพลังงานสูงอื่นๆ การเสื่อมสภาพของข้อมูลดังกล่าวเรียกว่า ข้อผิดพลาด แบบอ่อน[ 3 ]หน่วยความจำ ECCสามารถใช้เพื่อลดการเสื่อมสภาพของข้อมูลประเภทนี้ได้[ 4 ]
หน่วยเก็บข้อมูลสำรอง
การเสื่อมสภาพของข้อมูลเกิดจากการเสื่อมสภาพทีละน้อยของสื่อบันทึกข้อมูลในช่วงระยะเวลาหลายปีหรือนานกว่านั้น สาเหตุแตกต่างกันไปตามประเภทของสื่อ บันทึกข้อมูล
สื่อโซลิดสเตท
EPROM หน่วยความจำแฟลชและไดรฟ์โซลิดสเตท อื่นๆ จัดเก็บข้อมูลโดยใช้ประจุไฟฟ้า ซึ่งอาจรั่วไหลออกไปอย่างช้าๆ เนื่องจากการฉนวน ที่ไม่สมบูรณ์ ชิปควบคุมแฟลชสมัยใหม่จะจัดการกับการรั่วไหลนี้โดยการลองใช้แรงดันเกณฑ์ที่ต่ำกว่าหลายๆ ค่า (จนกว่าECCจะผ่าน) ซึ่งจะช่วยยืดอายุของข้อมูลเซลล์หลายระดับที่มีระยะห่างระหว่างระดับแรงดันไฟฟ้าน้อยกว่ามากนั้นไม่สามารถถือว่าเสถียรได้หากไม่มีฟังก์ชันนี้[ 5 ]
ตัวชิปเองไม่ได้รับผลกระทบจากสิ่งนี้ ดังนั้นการตั้งโปรแกรมใหม่ประมาณทุกๆ สิบปีจะช่วยป้องกันการเสื่อมสภาพ จำเป็นต้องมีสำเนาข้อมูลหลักที่สมบูรณ์สำหรับการตั้งโปรแกรมใหม่ สามารถใช้ ค่าตรวจสอบความถูกต้อง (checksum)เพื่อให้แน่ใจว่าข้อมูลบนชิปยังไม่เสียหายและพร้อมสำหรับการตั้งโปรแกรมใหม่
โดยทั่วไปแล้ว การ์ด SD, USB สติ๊ก และ M.2 NVMe ล้วนมีอายุการใช้งานที่จำกัด การเปิดเครื่องใหม่มักจะสามารถกู้คืนข้อมูลได้ แต่ข้อผิดพลาดที่เกิดขึ้นจะทำให้สื่อบันทึกข้อมูลเสื่อมสภาพจนอ่านไม่ออกในที่สุด การเขียนค่าศูนย์ลงในอุปกรณ์ NAND ที่เสื่อมสภาพแล้วสามารถฟื้นฟูการจัดเก็บข้อมูลให้กลับมาอยู่ในสภาพใกล้เคียงกับของใหม่เพื่อใช้งานต่อไปได้ รอบการอัปเดตไม่ควรนานเกิน 6 เดือนเพื่อให้แน่ใจว่าอุปกรณ์นั้นสามารถอ่านได้
สื่อแม่เหล็ก
สื่อแม่เหล็กเช่นฮาร์ดดิสก์ไดรฟ์ ฟลอปปี้ดิสก์และเทปแม่เหล็กอาจเกิดการเสื่อมสภาพของข้อมูลเนื่องจากบิตสูญเสียทิศทางแม่เหล็ก อุณหภูมิที่สูงขึ้นจะเร่งอัตราการสูญเสียแม่เหล็ก เช่นเดียวกับสื่อโซลิดสเตท การเขียนซ้ำจะมีประโยชน์ตราบใดที่ตัวสื่อเองไม่เสียหาย (ดูด้านล่าง) [ 6 ]ฮาร์ดไดรฟ์สมัยใหม่ใช้ความต้านทานแม่เหล็กขนาดใหญ่และมีอายุการใช้งานแม่เหล็กที่ยาวนานขึ้นในระดับหลายสิบปี นอกจากนี้ยังแก้ไขข้อผิดพลาดที่ตรวจพบโดย ECC โดยอัตโนมัติผ่านการเขียนซ้ำ อย่างไรก็ตาม การพึ่งพาเซอร์โวไรเตอร์อาจทำให้การกู้คืนข้อมูลซับซ้อนขึ้นหากไม่สามารถกู้คืนได้
ฟลอปปี้ดิสก์และเทปได้รับการปกป้องจากอากาศโดยรอบได้ไม่ดีนัก ในสภาพอากาศอบอุ่น/ชื้น สื่อบันทึกข้อมูลเหล่านี้มีแนวโน้มที่จะเสื่อมสภาพทางกายภาพ[ 7 ] [ 6 ]
สื่อออปติคอล
สื่อออปติคอลเช่นCD-R , DVD-RและBD-Rอาจเกิดการเสื่อมสภาพของข้อมูลเนื่องจากการแตกตัวของสื่อจัดเก็บข้อมูล สามารถลดปัญหานี้ได้โดยการเก็บแผ่นดิสก์ไว้ในที่มืด เย็น และมีความชื้นต่ำ แผ่นดิสก์ "คุณภาพสำหรับการเก็บรักษา" มีจำหน่ายพร้อมอายุการใช้งานที่ยาวนานขึ้น แต่ก็ยังไม่ถาวร อย่างไรก็ตามการสแกนความสมบูรณ์ของข้อมูลที่วัดอัตราของข้อผิดพลาดประเภทต่างๆ สามารถทำนายการเสื่อมสภาพของข้อมูลบนสื่อออปติคอลได้ก่อนที่จะเกิดการสูญเสียข้อมูลที่ไม่สามารถแก้ไขได้[ 8 ]
ทั้งสีย้อมแผ่นดิสก์และชั้นรองรับแผ่นดิสก์อาจเสี่ยงต่อการเสื่อมสภาพ สีย้อมไซยานีนรุ่นแรกๆ ที่ใช้ใน CD-R มีชื่อเสียงในด้านความไม่เสถียรต่อรังสียูวี ซีดีรุ่นแรกๆ ยังประสบปัญหา การเกิด สีบรอนซ์บนแผ่นซีดีซึ่งเกี่ยวข้องกับวัสดุเคลือบที่ไม่ดีและความล้มเหลวของชั้นสะท้อนแสงอะลูมิเนียม[ 9 ]แผ่นดิสก์รุ่นหลังๆ ใช้สีย้อมที่มีความเสถียรมากขึ้นหรือละเว้นการใช้สีย้อมและหันมาใช้ส่วนผสมอนินทรีย์แทน นอกจากนี้ชั้นอะลูมิเนียมยังมักถูกเปลี่ยนเป็นโลหะผสมทองหรือเงิน
สื่อกระดาษ
สื่อกระดาษเช่นบัตรเจาะรูและเทปเจาะรูอาจเน่าเปื่อยได้เทป เจาะ รูไมลาร์เป็นอีกแนวทางหนึ่งที่ไม่ต้องอาศัยความเสถียรทางแม่เหล็กไฟฟ้า การเสื่อมสภาพของหนังสือและกระดาษพิมพ์ส่วนใหญ่เกิดจากการไฮโดรไลซิสของพันธะไกลโคไซด์ใน โมเลกุล เซลลูโลสด้วยกรด รวมถึงการออกซิเดชัน[ 10 ]การเสื่อมสภาพของกระดาษจะเร่งขึ้นเมื่อมีความชื้นสัมพัทธ์ สูง อุณหภูมิสูง รวมถึงการสัมผัสกับกรด ออกซิเจน แสง และมลพิษต่างๆ รวมถึงสารประกอบอินทรีย์ระเหยง่าย ต่างๆ และไนโตรเจนไดออกไซด์[ 11 ]
สื่อสตรีมมิ่ง
การเสื่อมสภาพของข้อมูลเกิดขึ้นระหว่าง การส่ง ข้อมูลผ่านสื่อสตรีมมิ่งส่งผลให้เกิดปัญหาด้านคุณภาพของข้อมูล[ 12 ]
ตัวอย่าง
ลักษณะหนึ่งของการเสื่อมสภาพของข้อมูลคือเมื่อบิตหนึ่งหรือสองบิตถูกสลับแบบสุ่มเป็นเวลานาน[ 13 ]ดังแสดงในภาพดิจิทัลหลายภาพด้านล่าง ซึ่งทั้งหมดประกอบด้วย 326,272 บิต ภาพต้นฉบับแสดงเป็นภาพแรก ในภาพถัดไป บิตเดียวถูกเปลี่ยนจาก 0 เป็น 1 ในภาพสองภาพถัดไป บิตสองและสามบิตถูกสลับ ใน ระบบ Linuxความแตกต่างแบบไบนารีระหว่างไฟล์สามารถเปิดเผยได้โดยใช้cmpคำสั่ง (เช่นcmp -b bitrot-original.jpg bitrot-1bit-changed.jpg)
- ไม่มีการพลิกบิต
- พลิกบิต 1 บิต
- พลิกบิต 2 บิต
- พลิกบิต 3 บิต
รูปแบบไฟล์ JPEG ไม่ได้จัดเก็บภาพแบบบิตต่อบิต แต่จัดเก็บพารามิเตอร์สำหรับการถอดรหัส ดังนั้น การเปลี่ยนแปลงเพียงบิตเดียวจึงนำไปสู่การเปลี่ยนแปลงที่เห็นได้ชัด ตัวอย่างเช่น ค่าสัมประสิทธิ์ของฟังก์ชันการเข้ารหัสจะเปลี่ยนไปหลายเท่า หากบิตนั้นอยู่ในหลักที่มีค่าสูงกว่า
สาเหตุ
การเสื่อมสภาพนี้อาจเกิดจากปัจจัยหลายประการที่ส่งผลกระทบต่อความน่าเชื่อถือและความสมบูรณ์ของข้อมูลดิจิทัล รวมถึงปัจจัยทางกายภาพข้อผิดพลาดของซอฟต์แวร์การละเมิดความปลอดภัยข้อผิดพลาดของมนุษย์เทคโนโลยีที่ล้าสมัย และเหตุการณ์การเข้าถึงโดยไม่ได้รับอนุญาต[ 14 ] [ 15 ] [ 16 ] [ 17 ]
ดิสก์ตัวควบคุมดิสก์และระบบระดับสูงส่วนใหญ่มีโอกาสเล็กน้อยที่จะเกิดความล้มเหลวที่ไม่สามารถกู้คืนได้ ด้วยความจุของดิสก์ ขนาดไฟล์ และปริมาณข้อมูลที่จัดเก็บในดิสก์ที่เพิ่มขึ้นเรื่อยๆ ความน่าจะเป็นของการเกิดการเสื่อมสภาพของข้อมูลและรูปแบบอื่นๆ ของความเสียหายของข้อมูล ที่ไม่ได้รับการแก้ไขและตรวจไม่พบจึง เพิ่มขึ้น[ 18 ]
โดยทั่วไปตัวควบคุมดิสก์ระดับต่ำจะใช้รหัสแก้ไขข้อผิดพลาด (ECC) เพื่อแก้ไขข้อมูลที่ผิดพลาด[ 19 ]
อาจใช้ระบบซอฟต์แวร์ระดับสูงกว่าเพื่อลดความเสี่ยงจากความล้มเหลวพื้นฐานดังกล่าวโดยการเพิ่มความซ้ำซ้อนและนำการตรวจสอบความสมบูรณ์ รหัสแก้ไขข้อผิดพลาด และอัลกอริธึมการซ่อมแซมตัวเองมาใช้[ 20 ]ระบบไฟล์ZFS ได้รับการ ออกแบบมาเพื่อแก้ไขปัญหาความเสียหายของข้อมูลเหล่านี้หลายประการ[ 21 ]ระบบ ไฟล์ Btrfsยังรวมถึงกลไกการป้องกันและกู้คืนข้อมูล[ 22 ]เช่นเดียวกับReFS [ 23 ]
การบรรเทา
ไม่มีวิธีแก้ปัญหาใดที่สามารถขจัดภัยคุกคามจากการเสื่อมสภาพของข้อมูลได้อย่างสมบูรณ์[ 24 ]แต่มีมาตรการต่างๆ ที่สามารถป้องกันได้ หนึ่งในนั้นคือการทำสำเนาข้อมูลเป็น ข้อมูล สำรอง จากนั้นทั้งข้อมูลต้นฉบับและข้อมูลสำรองจะได้รับการตรวจสอบหาข้อผิดพลาดใดๆ ที่เกิดจากข้อผิดพลาดของสื่อจัดเก็บข้อมูลโดยการตรวจสอบผลรวมของข้อมูลหรือเปรียบเทียบกับสำเนาอื่นๆ นี่เป็นวิธีเดียวที่จะตรวจจับ ข้อผิดพลาด แฝงได้อย่างทันท่วงที[ 25 ]ซึ่งอาจไม่ถูกตรวจพบจนกว่าจะมีการเข้าถึงข้อมูลจริง[ 26 ]ระบบจัดเก็บข้อมูลในปัจจุบัน เช่น ระบบที่ใช้RAIDได้ใช้มาตรการดังกล่าวภายในอยู่แล้ว[ 27 ]ในอุดมคติ และโดยเฉพาะอย่างยิ่งสำหรับข้อมูลที่ต้องเก็บรักษาไว้ในรูปแบบดิจิทัลสำเนาควรจะกระจายอยู่ทั่วไซต์การบริหารหลายแห่งที่ทำงานอย่างอิสระและใช้งานฮาร์ดแวร์และซอฟต์แวร์ต่างๆ เพื่อเพิ่มความต้านทานต่อความล้มเหลว ตลอดจนข้อผิดพลาดของมนุษย์และการโจมตีทางไซเบอร์[ 28 ]
ดูเพิ่มเติม
แหล่งที่มา
- เบเกอร์, แมรี; คีตัน, คิมเบอร์ลี ; มาร์ติน, ฌอน (30 มิถุนายน 2548). เหตุใดระบบจัดเก็บข้อมูลแบบดั้งเดิมจึงไม่ช่วยให้เราเก็บรักษาข้อมูลไว้ได้ตลอดไป (PDF) . HotDep'05: รายงานการประชุมครั้งแรกเกี่ยวกับหัวข้อร้อนแรงในด้านความน่าเชื่อถือของระบบUSENIX . เก็บถาวรจากต้นฉบับ(PDF)เมื่อวันที่ 7 กันยายน 2549. สืบค้นเมื่อ15 กุมภาพันธ์ 2568 .
- Baker, Mary; Shah, Mehul; Rosenthal, David SH ; Roussopoulos, Mema; Maniatis, Petros; Giuli, TJ; Bungale, Prashanth (18 เมษายน 2549). มุมมองใหม่เกี่ยวกับความน่าเชื่อถือของการจัดเก็บข้อมูลดิจิทัลระยะยาว EuroSys '06: รายงานการประชุม ACM SIGOPS/EuroSys European Conference on Computer Systems ครั้งที่ 1 ประจำปี 2549 สมาคมเครื่องจักรคำนวณหน้า 221–234 . doi : 10.1145/1217935.1217957
- Rosenthal, David SH (พฤศจิกายน 2010). "การรักษาบิตให้ปลอดภัย: มันยากแค่ไหนกัน?" . Communications of the ACM . 53 (11): 47– 55. doi : 10.1145/1839676.1839692 .
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การเสื่อมสภาพของข้อมูล
การเสื่อมสภาพของข้อมูล คือ การเสื่อมคุณภาพ ของ ข้อมูลคอมพิวเตอร์ อย่างค่อยเป็นค่อยไปอันเนื่อง มาจากการสะสมของความล้มเหลวที่ไม่ร้ายแรงใน อุปกรณ์จัดเก็บข้อมูล...
แหล่งเก็บข้อมูลหลัก
การเสื่อมสภาพของข้อมูลใน หน่วยความจำเข้าถึงแบบสุ่มไดนามิก (DRAM) สามารถเกิดขึ้นได้เมื่อ ประจุไฟฟ้า ของ บิต ใน DRAM กระจายตัว ซึ่งอาจทำให้รหัสโปรแกรมหรือข้อมูลที่จัดเก็บเปลี่ยนแปลงไป DRAM อาจถูกเปลี่ยนแปลงโดย รังสีคอสมิก [ 2 ] หรืออนุภาคพลังงานสูงอื่นๆ...
หน่วยเก็บข้อมูลสำรอง
การเสื่อมสภาพของข้อมูลเกิดจากการเสื่อมสภาพทีละน้อยของ สื่อบันทึกข้อมูล ในช่วงระยะเวลาหลายปีหรือนานกว่านั้น สาเหตุแตกต่างกันไปตามประเภทของสื่อ บันทึกข้อมูล
ตัวอย่าง
ลักษณะหนึ่งของการเสื่อมสภาพของข้อมูลคือเมื่อบิตหนึ่งหรือสองบิตถูกสลับแบบสุ่มเป็นเวลานาน [ 13 ] ดังแสดงในภาพดิจิทัลหลายภาพด้านล่าง ซึ่งทั้งหมดประกอบด้วย 326,272 บิต ภาพต้นฉบับแสดงเป็นภาพแรก ในภาพถัดไป บิตเดียวถูกเปลี่ยนจาก 0 เป็น 1 ในภาพสองภาพถัดไป...