กลับไปหน้าบทความ

อ่าน 22 นาที

เครื่องย้อนเวลา

Wayback Machineเป็นคลังข้อมูลดิจิทัลของเวิลด์ไวด์เว็บที่ก่อตั้งโดยInternet Archiveซึ่งเป็นองค์กรไม่แสวงหาผลกำไรของอเมริกาที่ตั้งอยู่ในซานฟรานซิสโกรัฐแคลิฟอร์เนีย...

เครื่องย้อนเวลา

เครื่องย้อนเวลา
ประเภทของไซต์
บริการจัดเก็บเอกสาร
ก่อตั้ง
  •  25 ตุลาคม พ.ศ. 2544 [ 1 ] ( 25 ตุลาคม 2544 )
พื้นที่ ให้บริการทั่วโลก ( ยกเว้นจีนและเกาหลีเหนือ )
เจ้าของอินเทอร์เน็ตอาร์ไคฟ์
URL
  • เว็บอาร์ไคฟ์.org
ทางการค้าเลขที่
การลงทะเบียนไม่จำเป็น
 สถานะปัจจุบันคล่องแคล่ว
เขียน เป็นHTML , CSS , JavaScript , Java , Python

Wayback Machineเป็นคลังข้อมูลดิจิทัลของเวิลด์ไวด์เว็บที่ก่อตั้งโดยInternet Archiveซึ่งเป็นองค์กรไม่แสวงหาผลกำไรของอเมริกาที่ตั้งอยู่ในซานฟรานซิสโกรัฐแคลิฟอร์เนีย เปิดให้ประชาชนเข้าถึงได้ในปี 2001 บริการนี้ช่วยให้ผู้ใช้สามารถ "ย้อนเวลากลับไป" เพื่อดูว่าเว็บไซต์ต่างๆ มีลักษณะอย่างไรในอดีต ผู้ก่อตั้งBrewster KahleและBruce Gilliatพัฒนา Wayback Machine เพื่อให้ "การเข้าถึงความรู้ทั้งหมดอย่างทั่วถึง" โดยการเก็บรักษาสำเนาที่เก็บถาวรของเว็บเพจที่ใช้งานไม่ได้แล้ว[ 2 ]

ชื่อนี้เป็นการอ้างอิงถึงอุปกรณ์เดินทางข้ามเวลาในจินตนาการที่มีชื่อเดียวกันจากการ์ตูนแอนิเมชั่นเรื่องRocky and Bullwinkleจากยุค 1960 [ 3 ] [ 4 ] [ 5 ]ในตอนหนึ่งของการ์ตูนเรื่อง "Peabody's Improbable History" ตัวละครมิสเตอร์พีบอดี้และเชอร์แมนใช้ " Wayback Machine " เพื่อเดินทางย้อนเวลากลับไปเพื่อเป็นพยานและมีส่วนร่วมในเหตุการณ์ทางประวัติศาสตร์ที่มีชื่อเสียง[ 6 ]

คลังข้อมูลที่เก่าแก่ที่สุดของ Wayback Machine ย้อนกลับไปอย่างน้อยถึงปี 1995 และเมื่อสิ้นปี 2009 มีการบันทึกเว็บเพจไว้มากกว่า 38.2 พันล้านหน้า ( ณ เดือนตุลาคม2025) Wayback Machine ได้เก็บถาวรเว็บเพจมากกว่า 1 ล้านล้าน หน้าและ ข้อมูลมากกว่า 99 เพตาไบต์[ 7 ] [ 8 ]

ประวัติศาสตร์

Internet Archive ได้ทำการเก็บรักษา หน้าเว็บ ที่แคชไว้ตั้งแต่ปี 1995 เป็นอย่างน้อย หน้าเว็บที่เก่าแก่ที่สุดหน้าหนึ่งที่ทราบคือหน้าเว็บที่ถูกเก็บรักษาไว้เมื่อวันที่ 1 มีนาคม 1995 [ 9 ] [ 10 ]

Brewster KahleและBruce Gilliatผู้ก่อตั้ง Internet Archive ได้เปิดตัว Wayback Machine ในซานฟรานซิสโกรัฐแคลิฟอร์เนีย ในเดือนตุลาคม พ.ศ. 2544 [ 1 ] [ 11 ]โดยมีวัตถุประสงค์หลักเพื่อแก้ไขปัญหาเนื้อหาเว็บที่หายไปทุกครั้งที่มีการเปลี่ยนแปลงหรือเมื่อเว็บไซต์ถูกปิดตัวลง[ 12 ] [ 13 ]บริการนี้ช่วยให้ผู้ใช้สามารถดูเวอร์ชันที่เก็บถาวรของหน้าเว็บในช่วงเวลาต่างๆ ซึ่งทางคลังข้อมูลเรียกว่า "ดัชนีสามมิติ" [ 14 ] Kahle และ Gilliat สร้างเครื่องนี้ขึ้นมาโดยหวังว่าจะเก็บถาวรอินเทอร์เน็ตทั้งหมดและให้ "การเข้าถึงความรู้ทั้งหมดอย่างทั่วถึง" [ 15 ]

ตั้งแต่ปี 1996 ถึง 2001 ข้อมูลถูกเก็บไว้ในเทปดิจิทัล โดย Kahle อนุญาตให้นักวิจัยและนักวิทยาศาสตร์เข้าถึงฐานข้อมูล ที่ "เทอะทะ" ได้เป็นครั้ง คราว[ 16 ]เมื่อคลังข้อมูลมีอายุครบ 5 ปีในปี 2001 ก็ได้มีการเปิดเผยและเปิดให้สาธารณชนเข้าชมในพิธีที่มหาวิทยาลัยแคลิฟอร์เนีย เบิร์กลีย์ [ 17 ] เมื่อถึงเวลาที่ Wayback Machine เปิดตัว ก็มีหน้าเว็บที่เก็บถาวรไว้แล้วกว่า 10 พันล้านหน้า[ 18 ]ข้อมูลถูกจัดเก็บไว้ในคลัสเตอร์ขนาดใหญ่ของโหนดLinux ของ Internet Archive [ 15 ]มันจะตรวจสอบและเก็บถาวรเว็บไซต์เวอร์ชันใหม่เป็นครั้งคราว (ดูรายละเอียดทางเทคนิคด้านล่าง) [ 19 ] นอกจากนี้ยังสามารถบันทึกเว็บไซต์ได้ด้วยตนเองโดยการป้อน URLของเว็บไซต์ลงในช่องค้นหา หากเว็บไซต์นั้นอนุญาตให้ Wayback Machine " คลาน " และบันทึกข้อมูลได้[ 7 ]

Internet Archive ได้ย้ายสถาปัตยกรรมจัดเก็บข้อมูลที่กำหนดเองไปยังSun Open Storageในปี 2552 และเป็นที่ตั้งของศูนย์ข้อมูลแห่งใหม่ในSun Modular Datacenterในวิทยาเขตแคลิฟอร์เนียของSun Microsystems [ 20 ]

Wayback Machine เวอร์ชันใหม่ที่ได้รับการปรับปรุง พร้อมอินเทอร์เฟซที่อัปเดตและดัชนีเนื้อหาที่เก็บถาวรที่ทันสมัยยิ่งขึ้น เปิดให้ทดสอบสาธารณะในปี 2011 โดยการบันทึกจะปรากฏในรูปแบบปฏิทินที่มีวงกลมซึ่งความกว้างแสดงจำนวนการรวบรวมข้อมูลในแต่ละวัน แต่ไม่มีการทำเครื่องหมายซ้ำด้วยเครื่องหมายดอกจันหรือหน้าค้นหาขั้นสูง[ 21 ] [ 22 ] มีการเพิ่มแถบ เครื่องมือด้านบนเพื่ออำนวยความสะดวกในการนำทางระหว่างการบันทึก แผนภูมิแท่งแสดงความถี่ของการบันทึกต่อเดือนตลอดหลายปีที่ผ่านมา[ 23 ]คุณสมบัติเช่น "การเปลี่ยนแปลง" "สรุป" และแผนผังเว็บไซต์แบบกราฟิกถูกเพิ่มเข้ามาในภายหลัง

ในเดือนตุลาคม พ.ศ. 2556 Wayback Machine ได้แนะนำฟีเจอร์ "บันทึกหน้าเว็บทันที" ซึ่งช่วยให้ผู้ใช้อินเทอร์เน็ตทุกคนสามารถเก็บถาวรเนื้อหาของ URL และสร้างลิงก์ถาวร ได้อย่างรวดเร็ว ซึ่งแตกต่างจาก ฟีเจอร์livewebก่อนหน้านี้[ 24 ] [ 25 ]

เมื่อวันที่ 30 ตุลาคม พ.ศ. 2563 Wayback Machine เริ่มตรวจสอบข้อเท็จจริงของเนื้อหา[ 26 ]ณ เดือนมกราคม พ.ศ. 2565 โดเมนของเซิร์ฟเวอร์โฆษณาถูกปิดใช้งานไม่ให้บันทึก[ 27 ]

ในเดือนพฤษภาคม พ.ศ. 2564 เนื่องในโอกาสครบรอบ 25 ปีของ Internet Archive ทาง Wayback Machine ได้แนะนำ "Wayforward Machine" ซึ่งอนุญาตให้ผู้ใช้ "เดินทางไปยังอินเทอร์เน็ตในปี พ.ศ. 2589 ซึ่งความรู้กำลังถูกคุกคาม" [ 28 ] [ 29 ]

ปัญหาเกี่ยวกับโครงการจัดเก็บเอกสารส่งผลให้จำนวนการจับภาพหน้าเว็บในสื่อสิ่งพิมพ์ข่าวลดลง 87 เปอร์เซ็นต์ตั้งแต่เดือนพฤษภาคมถึงตุลาคม 2025 [ 30 ]ภายในเดือนกุมภาพันธ์ 2026 องค์กรข่าวหลายแห่ง เช่นThe GuardianและNew York Timesได้เริ่มบล็อก Wayback Machine เนื่องจากกังวลเกี่ยวกับการดึงข้อมูลการจับภาพด้วย AI [ 31 ] [ 32 ]

ข้อมูลทางเทคนิค

ซอฟต์แวร์ของ Wayback Machine ได้รับการพัฒนาขึ้นเพื่อ " รวบรวม " ข้อมูลบนเว็บและดาวน์โหลดข้อมูลและไฟล์ข้อมูลที่เข้าถึงได้โดยสาธารณะทั้งหมดบนเว็บเพจลำดับชั้นGopher ระบบกระดานข่าว Netnews (Usenet) และซอฟต์แวร์[ 33 ]ข้อมูลที่รวบรวมโดย "โปรแกรมรวบรวมข้อมูล" เหล่านี้ไม่ได้รวมเนื้อหาทั้งหมดที่มีอยู่บนอินเทอร์เน็ต เนื่องจากข้อมูลส่วนใหญ่ถูกจำกัดโดยผู้เผยแพร่หรือจัดเก็บไว้ในฐานข้อมูลที่ไม่สามารถเข้าถึงได้ เพื่อแก้ไขความไม่สอดคล้องกันในเว็บไซต์ที่แคชไว้บางส่วน Archive-It.org จึงได้รับการพัฒนาขึ้นในปี 2548 โดย Internet Archive เพื่อเป็นวิธีการอนุญาตให้สถาบันและผู้สร้างเนื้อหาสามารถรวบรวมและเก็บรักษาคอลเลกชันของเนื้อหาดิจิทัลและสร้างคลังข้อมูลดิจิทัลได้โดยสมัครใจ[ 34 ]

การรวบรวมข้อมูลมาจากแหล่งต่างๆ บางส่วนนำเข้าจากบุคคลที่สาม และบางส่วนสร้างขึ้นภายในโดย Archive เอง[ 19 ]ตัวอย่างเช่น เนื้อหามาจากการรวบรวมข้อมูลที่ได้รับจากSloan FoundationและAlexaการรวบรวมข้อมูลที่ดำเนินการโดย Internet Archive ในนามของNARAและInternet Memory Foundationเว็บเพจที่Archive Teamเก็บ ถาวรไว้ [ 35 ]และสำเนาของCommon Crawl [ 19 ] "การรวบรวมข้อมูลเว็บทั่วโลก" ได้ดำเนินการมาตั้งแต่ปี 2010 และรวบรวมข้อมูลเว็บทั่วโลก[ 19 ] [ 36 ]ในเดือนกันยายน 2020 Internet Archive ได้ประกาศความร่วมมือกับCloudflareซึ่งเป็น ผู้ให้บริการ เครือข่ายส่งเนื้อหา จากอเมริกา เพื่อจัดทำดัชนีเว็บไซต์ที่ให้บริการผ่านบริการ "Always Online" โดยอัตโนมัติ[ 37 ]

เอกสารและทรัพยากรจะถูกจัดเก็บด้วย URL ที่มีการประทับเวลา เช่น20260630003422ทรัพยากรแต่ละรายการของหน้า เช่น รูปภาพ สไตล์ชีต และสคริปต์ รวมถึงไฮเปอร์ลิงก์ ขาออก จะถูกเชื่อมโยงด้วยการประทับเวลาของหน้าที่กำลังดูอยู่ในปัจจุบัน ดังนั้นจึงจะถูกเปลี่ยนเส้นทางไปยังการบันทึกแต่ละรายการที่ใกล้เคียงที่สุดโดยอัตโนมัติ[ 38 ]

ความถี่ในการจับภาพหน้าจอจะแตกต่างกันไปในแต่ละเว็บไซต์[ 19 ]เว็บไซต์ใน "การรวบรวมข้อมูลทั่วโลก" จะถูกรวมอยู่ใน "รายการรวบรวมข้อมูล" โดยเว็บไซต์จะถูกเก็บถาวรหนึ่งครั้งต่อการรวบรวมข้อมูลแต่ละครั้ง[ 19 ]การรวบรวมข้อมูลอาจใช้เวลาหลายเดือนหรือหลายปีจึงจะเสร็จสมบูรณ์ ขึ้นอยู่กับขนาด[ 19 ]ตัวอย่างเช่น "การรวบรวมข้อมูลทั่วโลกหมายเลข 13" เริ่มต้นเมื่อวันที่ 9 มกราคม 2558 และเสร็จสิ้นเมื่อวันที่ 11 กรกฎาคม 2559 [ 39 ]อย่างไรก็ตาม อาจมีการรวบรวมข้อมูลหลายรายการที่กำลังดำเนินการอยู่ในเวลาเดียวกัน และเว็บไซต์อาจถูกรวมอยู่ในรายการรวบรวมข้อมูลมากกว่าหนึ่งรายการ ดังนั้นความถี่ในการรวบรวมข้อมูลของเว็บไซต์จึงแตกต่างกันอย่างมาก[ 19 ]

ตั้งแต่เดือนตุลาคม พ.ศ. 2562 ผู้ใช้ถูกจำกัดให้สามารถขอและเรียกค้นข้อมูลในคลังได้ไม่เกิน 15 ครั้งต่อนาที[ 40 ]

ความจุในการจัดเก็บและการเติบโต

การเติบโตของ Wayback Machine [ 41 ] [ 42 ]
Wayback Machine ตามปีหน้าเว็บที่เก็บถาวร
2004
30,000,000,000 (0–100 B: สีฟ้าอ่อน)
2548
40,000,000,000
2008
85,000,000,000
2012
150,000,000,000 (100B–450B: สีเหลือง)
2013
373,000,000,000
2014
400,000,000,000
2015
452,000,000,000 (450B–600B: สีส้ม)
2016
459,000,000,000
2017
279,000,000,000
2018
310,000,000,000
2019
345,000,000,000
2020
405,000,000,000
2021
514,000,000,000
2022
640,000,000,000 (600B–: สีแดง)
2024
866,000,000,000
2025
946,000,000,000
2026
1,000,000,000,000

เนื่องจากเทคโนโลยีมีการพัฒนาขึ้นเรื่อยๆ ตลอดหลายปีที่ผ่านมา ความจุในการจัดเก็บข้อมูลของ Wayback Machine จึงเพิ่มขึ้น ในปี 2546 หลังจากเปิดให้สาธารณะเข้าถึงได้เพียงสองปี Wayback Machine ก็เติบโตในอัตรา 12 เทราไบต์ต่อเดือน ข้อมูลถูกจัดเก็บไว้ใน ระบบแร็ค PetaBoxที่ออกแบบโดยเจ้าหน้าที่ของ Internet Archive  แร็คขนาด 100 TB ตัวแรกเริ่มใช้งานได้อย่างเต็มรูปแบบในเดือนมิถุนายน 2547 แม้ว่าจะเห็นได้ชัดในไม่ช้าว่าพวกเขาต้องการพื้นที่จัดเก็บข้อมูลมากกว่านั้นมาก[ 43 ] [ 44 ]

ข้อมูล ณ ปี 2009Wayback Machine มีข้อมูลประมาณสามเพตาไบต์และกำลังเติบโตในอัตรา 100 เทราไบต์ในแต่ละเดือน[ 45 ]

ในเดือนมีนาคมของปีนั้น มีการกล่าวในฟอรัม Wayback Machine ว่า "Wayback Machine เวอร์ชันเบต้าใหม่มีดัชนีที่สมบูรณ์และทันสมัยกว่าสำหรับวัสดุที่รวบรวมได้ทั้งหมดจนถึงปี 2010 และจะได้รับการอัปเดตอย่างสม่ำเสมอ ดัชนีที่ขับเคลื่อน Wayback Machine เวอร์ชันคลาสสิกมีวัสดุเพียงเล็กน้อยหลังจากปี 2008 และไม่มีการวางแผนการอัปเดตดัชนีเพิ่มเติม เนื่องจากจะถูกยกเลิกในปีนี้" [ 46 ]นอกจากนี้ ในปี 2011 Internet Archive ได้ติดตั้งแร็ค PetaBox คู่ที่หก ซึ่งเพิ่มความจุในการจัดเก็บข้อมูลของ Wayback Machine อีก 700 เทราไบต์[ 47 ]

ในเดือนมกราคม พ.ศ. 2556 Internet Archive ได้ประกาศความสำเร็จครั้งสำคัญด้วยจำนวน URL 240 พันล้านรายการ[ 48 ]

ในเดือนธันวาคม พ.ศ. 2557 Wayback Machine มีเว็บเพจ 435 พันล้านหน้า ซึ่งมีข้อมูลเกือบเก้าเพตาไบต์ และกำลังเพิ่มขึ้นประมาณ 20 เทราไบต์ต่อสัปดาห์[ 18 ] [ 49 ]

ในเดือนกรกฎาคม พ.ศ. 2559 มีรายงานว่า Wayback Machine มีข้อมูลประมาณ 15 เพตาไบต์[ 50 ]ในเดือนตุลาคม พ.ศ. 2559 มีการประกาศว่าวิธีการนับจำนวนหน้าเว็บจะถูกเปลี่ยนแปลง ส่งผลให้จำนวนหน้าเว็บที่เก็บถาวรลดลง วัตถุที่ฝังอยู่ เช่น รูปภาพ วิดีโอ สไตล์ชีต JavaScript จะไม่ถูกนับเป็น "หน้าเว็บ" อีกต่อไป ในขณะที่ HTML, PDF และเอกสารข้อความธรรมดายังคงถูกนับรวมอยู่[ 51 ]

ในเดือนกันยายน พ.ศ. 2561 Wayback Machine มีข้อมูลมากกว่า 25 เพตาไบต์[ 52 ] [ 53 ]ณ เดือนธันวาคม พ.ศ. 2563 Wayback Machine มีข้อมูลมากกว่า 70 เพตาไบต์[ 54 ]

ในปี 2025 Wayback Machine มีการเก็บถาวรเว็บเพจครบ 1 ล้านล้านหน้า โดยมีการจัดกิจกรรมต่างๆ ตลอดเดือนตุลาคมเพื่อเฉลิมฉลอง[ 55 ]

API ของ Wayback Machine

บริการ Wayback Machine มี API สาธารณะสามรายการ ได้แก่ SavePageNow, Availability และ CDX [ 56 ] SavePageNow สามารถใช้เพื่อเก็บถาวรหน้าเว็บได้ Availability API ใช้สำหรับตรวจสอบสถานะความพร้อมใช้งานของการเก็บถาวรสำหรับหน้าเว็บ[ 57 ]ตรวจสอบว่ามีการเก็บถาวรสำหรับหน้าเว็บหรือไม่ CDX API ใช้สำหรับการสืบค้น การกรอง และการวิเคราะห์ข้อมูลที่ถูกบันทึกไว้ที่ซับซ้อน[ 58 ] [ 59 ]

นโยบายการยกเว้นเว็บไซต์

ในอดีต Wayback Machine เคารพมาตรฐานการยกเว้นหุ่นยนต์ (robots.txt) ในการพิจารณาว่าเว็บไซต์จะถูกรวบรวมข้อมูลหรือไม่ หรือหากถูกรวบรวมข้อมูลแล้ว คลังข้อมูลของเว็บไซต์นั้นจะสามารถดูได้โดยสาธารณะหรือไม่ เจ้าของเว็บไซต์มีตัวเลือกที่จะยกเลิกการใช้งาน Wayback Machine โดยใช้ robots.txt กฎ robots.txt จะมีผลย้อนหลัง หากเว็บไซต์ใดบล็อก Internet Archive หน้าเว็บที่ถูกเก็บถาวรไว้ก่อนหน้านี้จากโดเมนนั้นก็จะไม่สามารถใช้งานได้ทันทีเช่นกัน นอกจากนี้ Internet Archive ยังระบุว่า "บางครั้งเจ้าของเว็บไซต์จะติดต่อเราโดยตรงและขอให้เราหยุดการรวบรวมข้อมูลหรือการเก็บถาวรเว็บไซต์ เราปฏิบัติตามคำขอเหล่านี้" [ 60 ]นอกจากนี้ เว็บไซต์ยังระบุว่า "Internet Archive ไม่สนใจที่จะเก็บรักษาหรือให้การเข้าถึงเว็บไซต์หรือเอกสารอินเทอร์เน็ตอื่น ๆ ของบุคคลที่ไม่ต้องการให้เอกสารของตนอยู่ในคอลเลกชัน" [ 61 ] [ 62 ]

อ้างถึงการเพิ่มขึ้นของเว็บไซต์ที่เลิกใช้งานและกลายเป็นโดเมนที่จอดไว้ซึ่งใช้ robots.txt เพื่อยกเว้นตัวเองจากเครื่องมือค้นหา ส่งผลให้เว็บไซต์เหล่านั้นถูกยกเว้นจาก Wayback Machine ทาง Internet Archive จึงได้เปลี่ยนนโยบายเมื่อวันที่ 17 เมษายน 2560 [ 63 ]เพื่อกำหนดให้ต้องมีคำขอการยกเว้นอย่างชัดเจนเพื่อลบเว็บไซต์ออกจาก Wayback Machine [ 38 ]

นโยบายการเก็บรักษาเอกสารของโอ๊คแลนด์

นโยบายการยกเว้นย้อนหลังของ Wayback มีพื้นฐานส่วนหนึ่งมาจากคำแนะนำสำหรับการจัดการคำขอการลบและการรักษาความสมบูรณ์ของเอกสารสำคัญซึ่งรู้จักกันในชื่อนโยบายคลังข้อมูลโอ๊คแลนด์ที่เผยแพร่โดย School of Information Management and Systems ที่มหาวิทยาลัยแคลิฟอร์เนีย เบิร์กลีย์ในปี 2545 ซึ่งให้สิทธิ์แก่เจ้าของเว็บไซต์ในการบล็อกการเข้าถึงคลังข้อมูลของเว็บไซต์[ 64 ] Wayback ได้ปฏิบัติตามนโยบายนี้เพื่อช่วยหลีกเลี่ยงการฟ้องร้องที่มีค่าใช้จ่ายสูง[ 65 ]

นโยบายการยกเว้นย้อนหลังของ Wayback เริ่มผ่อนคลายลงในปี 2017 เมื่อหยุดให้ความสำคัญกับ robots บนเว็บไซต์ของรัฐบาลสหรัฐฯ และกองทัพ ทั้งสำหรับการรวบรวมข้อมูลและการแสดงหน้าเว็บ ณ เดือนเมษายน 2017 Wayback ไม่สนใจ robots.txt ในวงกว้างมากขึ้น ไม่ใช่เฉพาะเว็บไซต์ของรัฐบาลสหรัฐฯ เท่านั้น[ 66 ] [ 67 ] [ 68 ] [ 69 ]

การใช้งาน

เว็บไซต์ Wayback Machine แสดงไฟล์เก็บถาวรที่มีอยู่สำหรับวิกิพีเดียภาษาสวาฮิลี

นับตั้งแต่เปิดตัวสู่สาธารณะในปี 2544 Wayback Machine ได้รับการศึกษาโดยนักวิชาการทั้งในแง่ของวิธีการจัดเก็บและรวบรวมข้อมูล และในแง่ของหน้าเว็บที่อยู่ในคลังข้อมูล ณ ปี 2556 นักวิชาการได้เขียนบทความเกี่ยวกับ Wayback Machine ประมาณ 350 บทความ ส่วนใหญ่มาจาก สาขา เทคโนโลยีสารสนเทศบรรณารักษศาสตร์และสังคมศาสตร์นักวิชาการด้านสังคมศาสตร์ได้ใช้ Wayback Machine เพื่อวิเคราะห์ว่าการพัฒนาเว็บไซต์ตั้งแต่กลางทศวรรษ 1990 จนถึงปัจจุบันส่งผลกระทบต่อการเติบโตของบริษัทอย่างไร[ 18 ]

เมื่อ Wayback Machine เก็บถาวรหน้าเว็บ ระบบมักจะรวมไฮเปอร์ลิงก์ส่วนใหญ่ไว้ด้วย ทำให้ลิงก์เหล่านั้นยังคงใช้งานได้ แม้ว่าลิงก์เหล่านั้นอาจเสียหายได้ง่ายเนื่องจากความไม่เสถียรของอินเทอร์เน็ต นักวิจัยในอินเดียศึกษาประสิทธิภาพของ Wayback Machine ในการบันทึกไฮเปอร์ลิงก์ในสิ่งพิมพ์ทางวิชาการออนไลน์ และพบว่าสามารถบันทึกได้มากกว่าครึ่งเล็กน้อย[ 70 ]

“นักข่าวใช้ Wayback Machine เพื่อดูเว็บไซต์ที่ปิดตัวไปแล้ว รายงานข่าวเก่า และการเปลี่ยนแปลงเนื้อหาเว็บไซต์ เนื้อหาดังกล่าวถูกนำมาใช้เพื่อตรวจสอบความรับผิดชอบของนักการเมืองและเปิดโปงการโกหกในสนามรบ” [ 71 ]ในปี 2014 หน้าโซเชียลมีเดียที่เก็บถาวรของIgor Girkinผู้นำกบฏแบ่งแยกดินแดนในยูเครน แสดงให้เห็นว่าเขากำลังโอ้อวดว่ากองกำลังของเขายิงเครื่องบินทหารยูเครนที่ต้องสงสัยตก ก่อนที่จะทราบว่าเครื่องบินลำนั้นเป็นเครื่องบินโดยสารของสายการบินมาเลเซียแอร์ไลน์ ( เที่ยวบินมาเลเซียแอร์ไลน์ 17 ) หลังจากนั้นเขาก็ลบโพสต์และกล่าวโทษกองทัพยูเครนว่าเป็นผู้ยิงเครื่องบินตก[ 71 ] [ 72 ]ในปี 2017 การเดินขบวนเพื่อวิทยาศาสตร์มีต้นกำเนิดมาจากการสนทนาบนRedditที่ระบุว่ามีคนไปเยี่ยมชม Archive.org และพบว่าการอ้างอิงถึงการเปลี่ยนแปลงสภาพภูมิอากาศ ทั้งหมด ถูกลบออกจากเว็บไซต์ของทำเนียบขาว ผู้ใช้รายหนึ่งแสดงความคิดเห็นว่า “จำเป็นต้องมีการเดินขบวนของนักวิทยาศาสตร์ในวอชิงตัน” [ 73 ] [ 74 ] [ 75 ]

เว็บไซต์นี้ถูกใช้อย่างมากในการตรวจสอบ โดยให้การเข้าถึงข้อมูลอ้างอิงและการสร้างเนื้อหาโดยบรรณาธิการวิกิพีเดีย [ 76 ] เมื่อมีการเพิ่ม URL ใหม่ลงในวิกิพีเดีย Internet Archive จะทำการเก็บถาวร URL เหล่านั้น[ 76 ]

ในเดือนกันยายน พ.ศ. 2563 มีการประกาศความร่วมมือกับCloudflareเพื่อจัดเก็บเว็บไซต์ที่ให้บริการผ่านบริการ "Always Online" โดยอัตโนมัติ ซึ่งจะช่วยให้สามารถนำผู้ใช้ไปยังสำเนาของเว็บไซต์ได้หากไม่สามารถเข้าถึงโฮสต์ต้นฉบับได้[ 37 ]

ข้อจำกัด

ในปี 2014 มีช่วงเวลาล่าช้าหกเดือนระหว่างที่เว็บไซต์ถูกรวบรวมข้อมูลและเมื่อเว็บไซต์นั้นพร้อมให้ดูใน Wayback Machine [ 77 ]ณ ปี 2024 ช่วงเวลาล่าช้าคือ 3 ถึง 10 ชั่วโมง[ 38 ] Wayback Machine มีสิ่งอำนวยความสะดวกในการค้นหาที่จำกัดเท่านั้น คุณสมบัติ "การค้นหาไซต์" ช่วยให้ผู้ใช้ค้นหาไซต์โดยใช้คำที่อธิบายไซต์ แทนที่จะใช้คำที่พบในหน้าเว็บเอง[ 78 ]

Wayback Machine ไม่ได้รวมทุกหน้าเว็บที่เคยสร้างขึ้นเนื่องจากข้อจำกัดต่างๆ ของการรวบรวมข้อมูลเว็บ Wayback Machine ไม่สามารถเก็บถาวรหน้าเว็บที่มีคุณสมบัติแบบโต้ตอบได้อย่างสมบูรณ์ เช่น แพลตฟอร์ม Flash และแบบฟอร์มที่เขียนด้วย JavaScript และแอปพลิเคชันเว็บแบบก้าวหน้าเนื่องจากฟังก์ชันเหล่านั้นต้องการการโต้ตอบกับเว็บไซต์โฮสต์ ซึ่งหมายความว่า ตั้งแต่วันที่ 9 กรกฎาคม 2556 เป็นต้นมา Wayback Machine ไม่สามารถแสดงความคิดเห็นของ YouTube เมื่อบันทึกหน้ารับชมวิดีโอได้ เนื่องจากตามที่ทีมเก็บข้อมูลระบุ ความคิดเห็นจะไม่ "โหลดภายในหน้าเว็บเอง" อีกต่อไป[ 79 ]โปรแกรมรวบรวมข้อมูลเว็บของ Wayback Machine มีปัญหาในการดึงข้อมูลใดๆ ที่ไม่ได้เขียนโค้ดด้วย HTML หรือรูปแบบต่างๆ ซึ่งมักส่งผลให้ไฮเปอร์ลิงก์เสียและรูปภาพหายไป ด้วยเหตุนี้ โปรแกรมรวบรวมข้อมูลเว็บจึงไม่สามารถเก็บถาวร "หน้าเว็บที่ไม่มีลิงก์" ที่ไม่มีหน้าเว็บอื่นเชื่อมโยงถึงได้[ 78 ] [ 80 ]โปรแกรมรวบรวมข้อมูลของ Wayback Machine ติดตามเฉพาะไฮเปอร์ลิงก์จำนวนที่กำหนดไว้ล่วงหน้าตามขีดจำกัดความลึกที่ตั้งไว้ ดังนั้นจึงไม่สามารถเก็บถาวรไฮเปอร์ลิงก์ทุกอันในทุกหน้าได้[ 36 ]

การดำเนินคดีแพ่ง

บริษัท Netbula LLC ฟ้องร้องบริษัท Chordiant Software Inc.

ในคดีปี 2009 Netbula, LLC v. Chordiant Software Inc.จำเลย Chordiant ได้ยื่นคำร้องขอให้ Netbula ปิดใช้งาน ไฟล์ robots.txtบนเว็บไซต์ของตน ซึ่งทำให้ Wayback Machine ลบการเข้าถึงเวอร์ชันก่อนหน้าของหน้าเว็บที่เก็บถาวรจากเว็บไซต์ของ Netbula ย้อนหลัง ซึ่ง Chordiant เชื่อว่าหน้าเว็บเหล่านั้นจะสนับสนุนคดีของตน[ 81 ]

Netbula คัดค้านคำร้องโดยอ้างว่าจำเลยกำลังขอแก้ไขเว็บไซต์ของ Netbula และควรออกหมายเรียกไปยัง Internet Archive เพื่อขอหน้าเว็บโดยตรง[ 82 ]อย่างไรก็ตาม พนักงานของ Internet Archive ได้ยื่นคำให้การเป็นลายลักษณ์อักษรสนับสนุนคำร้องของ Chordiant โดยระบุว่าไม่สามารถจัดหาหน้าเว็บด้วยวิธีการอื่นใดได้ "โดยปราศจากภาระ ค่าใช้จ่าย และการหยุดชะงักในการดำเนินงานอย่างมาก" [ 81 ]

ผู้พิพากษา Howard Lloyd ในเขตเหนือของแคลิฟอร์เนีย แผนกซานโฮเซ ปฏิเสธข้อโต้แย้งของ Netbula และสั่งให้พวกเขาปิดใช้งานการบล็อก robots.txt ชั่วคราวเพื่อให้ Chordiant สามารถเรียกหน้าเว็บที่เก็บถาวรที่พวกเขาต้องการได้[ 81 ]

Telewizja Polska USA, Inc. กับดาวเทียม Echostar

ในคดีเมื่อเดือนตุลาคม 2547 Telewizja Polska USA, Inc. v. Echostar Satellite , No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (ND Ill. October 15, 2547) ผู้ฟ้องคดีพยายามใช้ข้อมูลจาก Wayback Machine เป็นหลักฐานที่ยอมรับได้ ซึ่งอาจเป็นครั้งแรก Telewizja Polska เป็นผู้ให้บริการTVP PoloniaและEchoStarเป็นผู้ดำเนินการDish Networkก่อนการพิจารณาคดี EchoStar ระบุว่าตั้งใจจะนำเสนอภาพจาก Wayback Machine เป็นหลักฐานแสดงเนื้อหาในอดีตของเว็บไซต์ Telewizja Polska Telewizja Polska ยื่นคำร้องขอให้ระงับการใช้ภาพถ่ายโดยอ้างว่าเป็นคำบอกเล่าและแหล่งที่มาไม่ได้รับการรับรอง แต่ผู้พิพากษาศาลแขวง Arlander Keys ปฏิเสธข้ออ้างเรื่องคำบอกเล่าของ Telewizja Polska และปฏิเสธคำร้องขอของ TVP ที่จะยกเว้นหลักฐานดังกล่าว ในการพิจารณาคดี [ 83 ] [ 84 ]อย่างไรก็ตาม ในการพิจารณาคดี ผู้พิพากษาศาลแขวง Ronald Guzman ผู้พิพากษาในการพิจารณาคดี ได้กลับคำตัดสินของผู้พิพากษาศาลแขวง Keys และวินิจฉัยว่าทั้งคำให้การของพนักงาน Internet Archive และหน้าเว็บที่เกี่ยวข้อง (เช่น เว็บไซต์ของ Telewizja Polska) ไม่สามารถนำมาเป็นหลักฐานได้ ผู้พิพากษา Guzman ให้เหตุผลว่าคำให้การของพนักงานประกอบด้วยทั้งคำบอกเล่าและข้อความสนับสนุนที่ไม่ชัดเจน และหน้าเว็บที่อ้างว่าเป็นเอกสารพิมพ์ออกมานั้นไม่สามารถรับรองความถูกต้องได้ด้วยตนเอง[ 85 ] [ 86 ]

กฎหมายสิทธิบัตร

สำนักงานสิทธิบัตรและเครื่องหมายการค้าของสหรัฐอเมริกาและสำนักงานสิทธิบัตรยุโรปจะยอมรับการประทับวันที่จาก Internet Archive เป็นหลักฐานว่าหน้าเว็บที่กำหนดสามารถเข้าถึงได้โดยสาธารณะเมื่อใด วันที่เหล่านี้ใช้เพื่อพิจารณาว่าหน้าเว็บนั้นมีให้ใช้งานเป็นข้อมูลอ้างอิงก่อนหน้าหรือไม่ เช่น ในการตรวจสอบคำขอสิทธิบัตร[ 87 ]

ข้อจำกัดของประโยชน์ใช้สอย

มีข้อจำกัดทางเทคนิคในการเก็บรักษาเว็บไซต์ และด้วยเหตุนี้ คู่กรณีฝ่ายตรงข้ามในการดำเนินคดีจึงอาจใช้ผลลัพธ์ที่ได้จากการเก็บรักษาเว็บไซต์ในทางที่ผิด ปัญหานี้อาจรุนแรงขึ้นได้จากการส่งภาพหน้าจอของเว็บเพจในคำร้อง คำตอบ หรือรายงานของผู้เชี่ยวชาญ เมื่อลิงก์ที่อยู่เบื้องหลังไม่ได้ถูกเปิดเผย และด้วยเหตุนี้จึงอาจมีข้อผิดพลาด ตัวอย่างเช่น คลังข้อมูลเช่น Wayback Machine ไม่ได้กรอกแบบฟอร์ม ดังนั้นจึงไม่รวมเนื้อหาของฐานข้อมูลอีคอมเมิร์ซ ที่ไม่ใช่ RESTful ไว้ ในคลังข้อมูล [ 88 ]

ในยุโรป Wayback Machine อาจถูกตีความว่าเป็นการละเมิด กฎหมาย ลิขสิทธิ์มีเพียงผู้สร้างเนื้อหาเท่านั้นที่สามารถตัดสินใจได้ว่าจะเผยแพร่หรือทำสำเนาเนื้อหาของตนที่ใด ดังนั้นคลังข้อมูลจะต้องลบหน้าออกจากระบบตามคำขอของผู้สร้าง[ 89 ]นโยบายการยกเว้นสำหรับ Wayback Machine สามารถพบได้ในส่วนคำถามที่พบบ่อยของเว็บไซต์[ 90 ]

มีการฟ้องร้องดำเนินคดีกับ Internet Archive บางคดีโดยเฉพาะในเรื่องความพยายามในการจัดเก็บข้อมูลผ่าน Wayback Machine

ไซเอนโทโลจี

ในช่วงปลายปี 2545 Internet Archive ได้ลบเว็บไซต์ต่างๆ ที่วิพากษ์วิจารณ์ไซเอนโทโลจีออกจาก Wayback Machine [ 91 ]ข้อความแสดงข้อผิดพลาดระบุว่าเป็นการตอบสนองต่อ "คำขอจากเจ้าของเว็บไซต์" [ 92 ]ต่อมามีการชี้แจงว่าทนายความจากคริสตจักรไซเอนโทโลจีได้เรียกร้องให้ลบออก และเจ้าของเว็บไซต์ไม่ต้องการให้ลบเนื้อหาของตน[ 93 ]

บริษัท เฮลท์แคร์ แอดโวเคทส์ อิงค์

ในปี 2546 Harding Earley Follmer & Frailey ได้ว่าความให้ลูกความในข้อพิพาทเรื่องเครื่องหมายการค้าโดยใช้ Wayback Machine ของ Archive ทนายความสามารถแสดงให้เห็นว่าข้อเรียกร้องของโจทก์นั้นไม่ถูกต้อง โดยอ้างอิงจากเนื้อหาเว็บไซต์ของพวกเขาเมื่อหลายปีก่อน โจทก์ Healthcare Advocates จึงแก้ไขคำฟ้องโดยเพิ่ม Internet Archive เข้าไปด้วย โดยกล่าวหาองค์กรดังกล่าวว่าละเมิดลิขสิทธิ์ รวมถึงละเมิด DMCA และ Computer Fraud and Abuse Act Healthcare Advocates อ้างว่า เนื่องจากพวกเขาได้ติดตั้ง ไฟล์ robots.txtบนเว็บไซต์ของพวกเขาแล้ว แม้ว่าหลังจากมีการฟ้องร้องครั้งแรกแล้ว Archive ก็ควรจะลบสำเนาเว็บไซต์โจทก์ทั้งหมดออกจาก Wayback Machine แล้ว แต่เนื้อหาบางส่วนยังคงปรากฏให้เห็นต่อสาธารณะบน Wayback [ 94 ]คดีความดังกล่าวได้รับการไกล่เกลี่ยกันนอกศาลหลังจากที่ Wayback แก้ไขปัญหาแล้ว[ 95 ]

ซูซาน เชลล์

นักเคลื่อนไหวSuzanne Shellยื่นฟ้องในเดือนธันวาคม 2005 เรียกร้องให้ Internet Archive จ่ายเงินให้เธอ 100,000 ดอลลาร์สหรัฐ สำหรับการเก็บรักษาเว็บไซต์ profane-justice.org ของเธอระหว่างปี 1999 ถึง 2004 [ 96 ] [ 97 ] Internet Archive ยื่นฟ้องต่อศาลแขวงสหรัฐอเมริกาประจำเขตเหนือของรัฐแคลิฟอร์เนียเมื่อวันที่ 20 มกราคม 2006 เพื่อขอให้ศาลตัดสินว่า Internet Archive ไม่ได้ละเมิดลิขสิทธิ์ของ Shell Shellตอบโต้และยื่นฟ้องกลับ Internet Archive สำหรับการเก็บรักษาเว็บไซต์ของเธอ ซึ่งเธออ้างว่าเป็นการละเมิดข้อกำหนดในการให้บริการ ของเธอ [ 98 ]เมื่อวันที่ 13 กุมภาพันธ์ 2007 ผู้พิพากษาศาลแขวงสหรัฐอเมริกาประจำเขตโคโลราโดได้ยกฟ้องข้อกล่าวหาทั้งหมด ยกเว้นการละเมิดสัญญา [ 97 ] Internet Archive ไม่ได้ยื่นคำร้องขอให้ยกฟ้อง ข้อกล่าวหา การละเมิดลิขสิทธิ์ที่ Shell อ้างว่าเกิดขึ้นจากกิจกรรมการคัดลอกของตน ซึ่งจะดำเนินการต่อไป[ 99 ]

เมื่อวันที่ 25 เมษายน พ.ศ. 2550 Internet Archive และ Suzanne Shell ได้ประกาศร่วมกันถึงการยุติคดีความ[ 96 ] Internet Archive กล่าวว่า "...เราไม่มีความสนใจที่จะรวมเนื้อหาใน Wayback Machine ของบุคคลที่ไม่ต้องการให้เนื้อหาเว็บของตนถูกเก็บถาวร เรายอมรับว่าคุณ Shell มีลิขสิทธิ์ที่ถูกต้องและบังคับใช้ได้ในเว็บไซต์ของเธอ และเราเสียใจที่การรวมเว็บไซต์ของเธอใน Wayback Machine ส่งผลให้เกิดการฟ้องร้องนี้" Shell กล่าวว่า "ฉันเคารพคุณค่าทางประวัติศาสตร์ของเป้าหมายของ Internet Archive ฉันไม่เคยตั้งใจที่จะแทรกแซงเป้าหมายนั้นหรือก่อให้เกิดอันตรายใดๆ" [ 100 ]

แดเนียล ดาวิดิอุค

ระหว่างปี 2013 ถึง 2016 แดเนียล ดาวิดิอุคนักแสดงภาพยนตร์โป๊พยายามลบภาพที่เก็บถาวรของตัวเองออกจากคลังข้อมูลของ Wayback Machine โดยเริ่มจากการส่งคำขอ DMCA หลายครั้ง ไปยังคลังข้อมูล จากนั้นจึงยื่นอุทธรณ์ต่อศาลรัฐบาลกลางของแคนาดา [ 101 ] [ 102 ] [ 103 ] ภาพเหล่านั้นถูกลบออกจากเว็บไซต์ในปี 2017

เฟล็กซี่สปาย

ในปี 2018 คลังข้อมูล เว็บไซต์ของ แอปพลิเคชันสตอล์กเกอร์แวร์ FlexiSpy ถูกลบออกจาก Wayback Machine บริษัทอ้างว่าได้ติดต่อ Internet Archive เพื่อขอให้ลบคลังข้อมูลเว็บไซต์ของตน[ 62 ]

การเซ็นเซอร์และภัยคุกคามอื่นๆ

Archive.org ถูกบล็อกในประเทศจีน [ 104 ] [ 105 ] [ 106 ] Internet Archive ถูกบล็อกทั้งหมดในรัสเซียในปี 2015–16 โดยอ้างว่าเป็นการเผยแพร่วิดีโอสนับสนุนญิฮาด[ 71 ] [ 107 ] [ 108 ]ตั้งแต่ปี 2016 เว็บไซต์ได้กลับมาใช้งานได้อีกครั้ง โดยสามารถเข้าถึงได้ทั้งหมด แม้ว่าในปี 2016 กลุ่มล็อบบี้ทางการค้าของรัสเซียจะฟ้องร้อง Internet Archive เพื่อแบนเว็บไซต์นี้ด้วยเหตุผลด้านลิขสิทธิ์[ 109 ]

อลิสัน แมครินาผู้อำนวยการโครงการเสรีภาพห้องสมุดกล่าวว่า "ในขณะที่บรรณารักษ์ให้ความสำคัญกับความเป็นส่วนตัวของแต่ละบุคคลอย่างมาก เราก็ต่อต้านการเซ็นเซอร์อย่างรุนแรงเช่นกัน" [ 71 ]

มีอย่างน้อยหนึ่งกรณีที่บทความถูกลบออกจากคลังเก็บข้อมูลไม่นานหลังจากที่ถูกลบออกจากเว็บไซต์เดิม นักข่าวของDaily Beastได้เขียนบทความที่เปิดเผยตัวตนของนักกีฬาโอลิมปิกที่เป็นเกย์หลายคนในปี 2016 หลังจากที่นักข่าวได้สร้างโปรไฟล์ปลอมโดยปลอมตัวเป็นชายเกย์ในแอปหาคู่Daily Beastได้ลบบทความดังกล่าวออกหลังจากที่เกิดกระแสวิพากษ์วิจารณ์อย่างกว้างขวาง ไม่นานหลังจากนั้น Internet Archive ก็ได้ลบบทความดังกล่าวออกเช่นกัน และระบุว่าพวกเขาทำเช่นนั้นโดยไม่มีเหตุผลอื่นใดนอกจากเพื่อปกป้องความปลอดภัยของนักกีฬาที่ถูกเปิดเผยตัวตน[ 71 ]

ภัยคุกคามอื่นๆ ได้แก่ ภัยพิบัติทางธรรมชาติ[ 110 ]การทำลาย (ทั้งระยะไกลและทางกายภาพ) [ 111 ]การบิดเบือนเนื้อหาของคลังข้อมูล กฎหมายลิขสิทธิ์ที่มีปัญหา[ 112 ]และการสอดแนมผู้ใช้เว็บไซต์[ 113 ]

อเล็กซานเดอร์ โรส ผู้อำนวยการบริหารของมูลนิธิลองนาวคาดว่าในระยะยาวหลายชั่วอายุคน “แทบจะไม่มีอะไร” เหลือรอดในรูปแบบที่มีประโยชน์ โดยกล่าวว่า “หากเรามีความต่อเนื่องในอารยธรรมทางเทคโนโลยีของเรา ผมคิดว่าข้อมูลดิบจำนวนมากจะยังคงสามารถค้นหาได้ แต่ผมคิดว่ารูปแบบที่ส่งข้อมูลมานั้นแทบจะจำไม่ได้เลย” เพราะเว็บไซต์ “ที่มีระบบจัดการเนื้อหาแบบแบ็กเอนด์ที่ซับซ้อน เช่น Drupal, Ruby และ Django” นั้นยากต่อการจัดเก็บ[ 114 ]

ในปี 2016 ในบทความที่สะท้อนถึงการอนุรักษ์ความรู้ของมนุษย์The Atlanticได้แสดงความคิดเห็นว่า Internet Archive ซึ่งอธิบายว่าสร้างขึ้นเพื่อระยะยาว[ 115 ] "กำลังทำงานอย่างหนักเพื่อบันทึกข้อมูลก่อนที่มันจะหายไปโดยไม่มีโครงสร้างพื้นฐานระยะยาวใดๆ ให้พูดถึง" [ 116 ]

ในเดือนกันยายน พ.ศ. 2567 Internet Archive ประสบปัญหาการรั่วไหลของข้อมูล ทำให้ข้อมูลส่วนบุคคลจำนวน 31 ล้านรายการ ซึ่งรวมถึงที่อยู่อีเมลและรหัสผ่านที่เข้ารหัสไว้ ถูกเปิดเผย [ 117 ]ในวันที่ 9 ตุลาคม พ.ศ. 2567 เว็บไซต์ล่มเนื่องจากการโจมตีแบบปฏิเสธการให้บริการแบบกระจาย [ 118 ] [ 119 ] ในวันที่ 14 ตุลาคม เว็บไซต์กลับมาใช้งานได้อีกครั้ง แต่ยังคงอยู่ในโหมดอ่านอย่างเดียวจนถึงวันที่ 4 พฤศจิกายน ซึ่งในระหว่างนั้น ปุ่ม "บันทึกหน้าเว็บตอนนี้" ถูกปิดใช้งาน และถูกแทนที่ด้วยแบนเนอร์ "ไม่สามารถใช้งานได้ชั่วคราว" [ 120 ]

ในเดือนพฤศจิกายน พ.ศ. 2568 Internet Archive ได้แสดงข้อความ "ออฟไลน์ชั่วคราว" ซึ่งแนะนำให้ผู้คนติดตามข่าวสารอัปเดตผ่านโซเชียลมีเดีย หลังจากการหยุดชะงักครั้งใหญ่ทั่วอินเทอร์เน็ตที่เกี่ยวข้องกับCloudflareเมื่อวันที่ 18 พฤศจิกายน พ.ศ. 2568 [ 121 ]

ดูเพิ่มเติม

  • เว็บไซต์อย่างเป็นทางการแก้ไขข้อมูลนี้ได้ที่วิกิดาต้า
  • @PBSNewsHour (3 มกราคม 2017) ประวัติศาสตร์บนอินเทอร์เน็ตนั้นเปราะบาง คลังข้อมูลนี้กำลังทำให้แน่ใจว่ามันจะไม่หายไป PBS Newshourเก็บถาวรจากต้นฉบับเมื่อวันที่ 6 มกราคม 2022 เรียกดูเมื่อวันที่ 5 พฤศจิกายน 2024
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Wayback_Machine&oldid=1361564831 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เครื่องย้อนเวลา

Wayback Machineเป็นคลังข้อมูลดิจิทัลของเวิลด์ไวด์เว็บที่ก่อตั้งโดยInternet Archiveซึ่งเป็นองค์กรไม่แสวงหาผลกำไรของอเมริกาที่ตั้งอยู่ในซานฟรานซิสโกรัฐแคลิฟอร์เนีย...

ประวัติศาสตร์

Internet Archive ได้ทำการเก็บรักษา หน้าเว็บ ที่แคชไว้ ตั้งแต่ปี 1995 เป็นอย่างน้อย หน้าเว็บที่เก่าแก่ที่สุดหน้าหนึ่งที่ทราบคือหน้าเว็บที่ถูกเก็บรักษาไว้ เมื่อวันที่ 1 มีนาคม 1995 [ 9 ] [ 10 ]

ข้อมูลทางเทคนิค

ซอฟต์แวร์ของ Wayback Machine ได้รับการพัฒนาขึ้นเพื่อ " รวบรวม " ข้อมูลบนเว็บและดาวน์โหลดข้อมูลและไฟล์ข้อมูลที่เข้าถึงได้โดยสาธารณะทั้งหมดบนเว็บเพจลำดับชั้น Gopher ระบบกระดานข่าว Netnews (Usenet) และซอฟต์แวร์ [ 33 ] ข้อมูลที่รวบรวมโดย "โปรแกรมรวบรวมข้อมูล"...

ความจุในการจัดเก็บและการเติบโต

เนื่องจากเทคโนโลยีมีการพัฒนาขึ้นเรื่อยๆ ตลอดหลายปีที่ผ่านมา ความจุในการจัดเก็บข้อมูลของ Wayback Machine จึงเพิ่มขึ้น ในปี 2546 หลังจากเปิดให้สาธารณะเข้าถึงได้เพียงสองปี Wayback Machine ก็เติบโตในอัตรา 12 เทราไบต์ต่อเดือน ข้อมูลถูกจัดเก็บไว้ใน ระบบแร็ค PetaBox...