กลับไปหน้าบทความ

อ่าน 10 นาที

การจัดเก็บวัตถุ

การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ (หรือที่รู้จักกันในชื่อ การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ [ 1 ] หรือ การจัดเก็บข้อมูลแบบบล็อก ) เป็น แนวทาง การจัดเก็บข้อมูลคอมพิวเตอร์...

การจัดเก็บวัตถุ

การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ (หรือที่รู้จักกันในชื่อการจัดเก็บข้อมูลแบบอ็อบเจ็กต์[ 1 ]หรือการจัดเก็บข้อมูลแบบบล็อก ) เป็น แนวทาง การจัดเก็บข้อมูลคอมพิวเตอร์ที่จัดการข้อมูลเป็น "บล็อก" หรือ "อ็อบเจ็กต์" ซึ่งแตกต่างจากสถาปัตยกรรมการจัดเก็บข้อมูลอื่นๆ เช่นระบบไฟล์ซึ่งจัดการข้อมูลเป็นลำดับชั้นของไฟล์ และการจัดเก็บข้อมูลแบบบล็อกซึ่งจัดการข้อมูลเป็นบล็อกภายในเซกเตอร์และแทร็ก[ 2 ] โดยทั่วไปแล้ว อ็อบเจ็กต์แต่ละอันจะเกี่ยวข้องกับ เมตาเดตาจำนวนหนึ่งและตัวระบุที่ไม่ซ้ำกันทั่วโลกการจัดเก็บข้อมูลแบบอ็อบเจ็กต์สามารถนำไปใช้ได้หลายระดับ รวมถึงระดับอุปกรณ์ (อุปกรณ์จัดเก็บข้อมูลแบบอ็อบเจ็กต์) ระดับระบบ และระดับอินเทอร์เฟซ ในแต่ละกรณี การจัดเก็บข้อมูลแบบอ็อบเจ็กต์มุ่งที่จะเปิดใช้งานความสามารถที่สถาปัตยกรรมการจัดเก็บข้อมูลอื่นๆ ไม่ได้กล่าวถึง เช่น อินเทอร์เฟซที่แอปพลิเคชันสามารถตั้งโปรแกรมได้โดยตรง เนมสเปซที่สามารถครอบคลุมฮาร์ดแวร์ทางกายภาพหลายอินสแตนซ์ และฟังก์ชันการจัดการข้อมูล เช่นการจำลองข้อมูลและการกระจายข้อมูลในระดับความละเอียดของอ็อบเจ็กต์

ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์ช่วยให้สามารถเก็บรักษา ข้อมูลที่ไม่มีโครงสร้างจำนวนมหาศาลได้โดยที่ข้อมูลจะถูกเขียนเพียงครั้งเดียวและอ่านเพียงครั้งเดียว (หรือหลายครั้ง) [ 3 ]การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ใช้เพื่อวัตถุประสงค์ต่างๆ เช่น การจัดเก็บวัตถุ เช่น วิดีโอและรูปภาพบนFacebookเพลงบนSpotifyหรือไฟล์ในบริการการทำงานร่วมกันออนไลน์ เช่นDropbox [ 4 ]ข้อจำกัดอย่างหนึ่งของการจัดเก็บข้อมูลแบบอ็อบเจ็กต์คือ ไม่ได้มีไว้สำหรับข้อมูลธุรกรรมเนื่องจากระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์ไม่ได้ออกแบบมาเพื่อทดแทน การเข้าถึงและการ แชร์ ไฟล์ NASและไม่รองรับกลไกการล็อกและการแชร์ที่จำเป็นในการรักษาเวอร์ชันเดียวที่อัปเดตอย่างถูกต้องของไฟล์[ 3 ]

ประวัติศาสตร์

ต้นกำเนิด

จิม สตาร์คีย์เป็นผู้บัญญัติศัพท์คำว่า"blob"ขณะทำงานที่Digital Equipment Corporationเพื่อใช้เรียกเอนทิตีข้อมูลที่ไม่โปร่งใส คำศัพท์นี้ถูกนำมาใช้ในRdb/VMSคำ ว่า Blobมักถูกอธิบายอย่างขบขันว่าเป็นคำย่อของbinary large objectตามที่สตาร์คีย์กล่าวคำย่อ นี้ เกิดขึ้นเมื่อเทอร์รี แมคคีเวอร์ ซึ่งทำงานด้านการตลาดที่Apollo Computerรู้สึกว่าคำนี้จำเป็นต้องมีคำย่อ แมคคีเวอร์จึงเริ่มใช้คำว่าbasic large object ต่อมา คำนี้ก็ถูกแทนที่ด้วยคำอธิบายย้อนหลังว่า blob คือbinary large objectsตามที่สตาร์คีย์กล่าวว่า "Blob ไม่ได้หมายถึงอะไรเลย" เขาปฏิเสธคำย่อนี้และอธิบายแรงจูงใจเบื้องหลังการบัญญัติศัพท์นี้ว่า "Blob คือสิ่งที่กินซินซินแนตติ [ sic ] คลีฟแลนด์ หรืออะไรก็ตาม" โดยอ้างถึงภาพยนตร์ไซไฟเรื่องThe Blobใน ปี 1958 [ 5 ]

ในปี 1995 งานวิจัยที่นำโดยGarth Gibsonเกี่ยวกับNetwork-Attached Secure Disksได้ส่งเสริมแนวคิดเรื่องการแยกการทำงานที่ไม่ค่อยพบเห็น เช่น การจัดการเนมสเปซ ออกจากการทำงานทั่วไป เช่น การอ่านและการเขียน เพื่อเพิ่มประสิทธิภาพและขยายขนาดของการทำงานทั้งสองอย่าง[ 6 ] ในปีเดียวกันนั้น บริษัท FilePool ของเบลเยียมได้ก่อตั้งขึ้นเพื่อสร้างพื้นฐานสำหรับฟังก์ชันการเก็บถาวร การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ได้รับการเสนอในห้องปฏิบัติการของ Gibson ที่มหาวิทยาลัย Carnegie Mellonในฐานะโครงการวิจัยในปี 1996 [ 7 ] แนวคิดสำคัญอีกประการหนึ่งคือการแยกการเขียนและการอ่านข้อมูลออกเป็นคอนเทนเนอร์ข้อมูลที่มีความยืดหยุ่นมากขึ้น (อ็อบเจ็กต์) การควบคุมการเข้าถึงแบบละเอียดผ่านสถาปัตยกรรมจัดเก็บข้อมูลแบบอ็อบเจ็กต์[ 8 ] ได้รับการอธิบายเพิ่มเติมโดย Howard Gobioff หนึ่งในทีม NASD ซึ่งต่อมาเป็นหนึ่งในผู้คิดค้นGoogle File System [ 9 ]

งานที่เกี่ยวข้องอื่นๆ ได้แก่ โครงการระบบไฟล์ Codaที่Carnegie Mellonซึ่งเริ่มต้นในปี 1987 และก่อให้เกิด ระบบ ไฟล์Lustre [ 10 ]นอกจากนี้ยังมีโครงการ OceanStore ที่ UC Berkeley [ 11 ]ซึ่งเริ่มต้นในปี 1999 [ 12 ]และโครงการ Logistical Networking ที่มหาวิทยาลัยเทนเนสซี น็อกซ์วิลล์ ซึ่งเริ่มต้นในปี 1998 [ 13 ]ในปี 1999 Gibson ได้ก่อตั้งPanasasเพื่อนำแนวคิดที่พัฒนาโดยทีม NASD มาใช้ในเชิงพาณิชย์

การพัฒนา

Seagate Technologyมีบทบาทสำคัญในการพัฒนาการจัดเก็บข้อมูลแบบอ็อบเจ็กต์ ตามที่Storage Networking Industry Association (SNIA) ระบุว่า "การจัดเก็บข้อมูลแบบอ็อบเจ็กต์มีต้นกำเนิดในช่วงปลายทศวรรษ 1990: ข้อกำหนดของ Seagate จากปี 1999 ได้แนะนำคำสั่งแรกๆ และวิธีการที่ระบบปฏิบัติการกำจัดการใช้พื้นที่จัดเก็บข้อมูลอย่างมีประสิทธิภาพ" [ 14 ]

เอกสารฉบับร่างเบื้องต้นของ "ข้อเสนอชุดคำสั่งอุปกรณ์จัดเก็บข้อมูลแบบอิงวัตถุ" ลงวันที่ 25 ตุลาคม 1999 ถูกส่งโดย Seagate โดยมี Dave Anderson จาก Seagate เป็นผู้แก้ไข และเป็นผลงานของ National Storage Industry Consortium (NSIC) ซึ่งรวมถึงการมีส่วนร่วมจากCarnegie Mellon University , Seagate, IBM, QuantumและStorageTek [ 15 ]เอกสารฉบับนี้ถูกเสนอต่อ INCITS T-10 ( International Committee for Information Technology Standards ) โดยมีเป้าหมายเพื่อจัดตั้งคณะกรรมการและออกแบบข้อกำหนดตามโปรโตคอลอินเทอร์เฟซ SCSI ซึ่งกำหนดวัตถุเป็นข้อมูลนามธรรมที่มีตัวระบุเฉพาะและเมตาเดตา ความสัมพันธ์ระหว่างวัตถุกับระบบไฟล์ รวมถึงแนวคิดนวัตกรรมอื่นๆ อีกมากมาย แอนเดอร์สันนำเสนอแนวคิดเหล่านี้จำนวนมากในการประชุม SNIA ในเดือนตุลาคม พ.ศ. 2542 การนำเสนอเผยให้เห็นข้อตกลงทรัพย์สินทางปัญญาที่ลงนามในเดือนกุมภาพันธ์ พ.ศ. 2540 ระหว่างผู้ร่วมงานดั้งเดิม (โดยมี Seagate เป็นตัวแทนโดยแอนเดอร์สันและคริส มาลาคัปปัลลี) และครอบคลุมถึงประโยชน์ของการจัดเก็บข้อมูลแบบอ็อบเจ็กต์ การประมวลผลที่ปรับขนาดได้ ความเป็นอิสระของแพลตฟอร์ม และการจัดการการจัดเก็บข้อมูล[ 16 ]

สถาปัตยกรรม

การนามธรรมของการจัดเก็บข้อมูล

หนึ่งในหลักการออกแบบของระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์คือการแยกส่วนงานจัดเก็บข้อมูลระดับล่างๆ ออกจากผู้ดูแลระบบและแอปพลิเคชัน ดังนั้น ข้อมูลจึงถูกเปิดเผยและจัดการในรูปแบบของอ็อบเจ็กต์แทนที่จะเป็นบล็อกหรือไฟล์ (แต่เดิม) อ็อบเจ็กต์ประกอบด้วยคุณสมบัติเชิงพรรณนาเพิ่มเติมที่สามารถใช้สำหรับการจัดทำดัชนีหรือการจัดการที่ดีขึ้น ผู้ดูแลระบบไม่จำเป็นต้องดำเนินการฟังก์ชันการจัดเก็บข้อมูลระดับล่าง เช่น การสร้างและจัดการวอลุ่มเชิงตรรกะเพื่อใช้ประโยชน์จากความจุของดิสก์ หรือการตั้ง ค่าระดับ RAIDเพื่อรับมือกับความล้มเหลวของดิสก์

การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ยังช่วยให้สามารถระบุและระบุตัวตนของวัตถุแต่ละชิ้นได้มากกว่าแค่ชื่อไฟล์และเส้นทางไฟล์ การจัดเก็บข้อมูลแบบอ็อบเจ็กต์จะเพิ่มตัวระบุเฉพาะภายในบัคเก็ต หรือทั่วทั้งระบบ เพื่อรองรับเนมสเปซที่ใหญ่ขึ้นและขจัดปัญหาการชนกันของชื่อ

การรวมเมตาเดต้าแบบกำหนดเองที่ครบถ้วนไว้ในวัตถุ

ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์แยกเมตาเดตาของไฟล์ออกจากข้อมูลอย่างชัดเจน เพื่อรองรับความสามารถเพิ่มเติม แตกต่างจากเมตาเดตาคงที่ในระบบไฟล์ (ชื่อไฟล์ วันที่สร้าง ประเภท ฯลฯ) ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์มีเมตาเดตาแบบกำหนดเองระดับอ็อบเจ็กต์ที่ทำงานได้อย่างสมบูรณ์ เพื่อ:

  • บันทึกข้อมูลเฉพาะแอปพลิเคชันหรือเฉพาะผู้ใช้เพื่อการจัดทำดัชนีที่ดีขึ้น
  • สนับสนุนนโยบายการจัดการข้อมูล (เช่น นโยบายในการย้ายวัตถุจากระดับการจัดเก็บข้อมูลหนึ่งไปยังอีกระดับหนึ่ง)
  • รวมศูนย์การจัดการพื้นที่จัดเก็บข้อมูลที่กระจายอยู่ทั่วโหนดและคลัสเตอร์จำนวนมาก
  • เพิ่มประสิทธิภาพการจัดเก็บข้อมูลเมตา (เช่น การห่อหุ้ม การจัดเก็บในฐานข้อมูล หรือการจัดเก็บแบบคีย์-ค่า) และการแคช/การจัดทำดัชนี (เมื่อข้อมูลเมตาที่เชื่อถือได้ถูกห่อหุ้มไว้กับข้อมูลเมตาภายในวัตถุ) โดยไม่ขึ้นอยู่กับการจัดเก็บข้อมูล (เช่น การจัดเก็บข้อมูลไบนารีที่ไม่มีโครงสร้าง)

นอกจากนี้ ในการใช้งานระบบไฟล์แบบอิงวัตถุบางประเภท:

  • ไคลเอ็นต์ระบบไฟล์จะติดต่อเซิร์ฟเวอร์เมตาเดตาเพียงครั้งเดียวเมื่อเปิดไฟล์ จากนั้นจะดึงเนื้อหาโดยตรงผ่านเซิร์ฟเวอร์จัดเก็บข้อมูลแบบอ็อบเจ็กต์ (แตกต่างจากระบบไฟล์แบบบล็อกซึ่งต้องเข้าถึงเมตาเดตาอย่างต่อเนื่อง)
  • สามารถกำหนดค่าอ็อบเจ็กต์ข้อมูลได้แบบรายไฟล์ เพื่อให้สามารถปรับความกว้างของแถบข้อมูลได้ แม้กระทั่งในเซิร์ฟเวอร์จัดเก็บอ็อบเจ็กต์หลายเครื่อง ซึ่งช่วยเพิ่มประสิทธิภาพด้านแบนด์วิดท์และการรับส่งข้อมูล (I/O)

อุปกรณ์จัดเก็บข้อมูลแบบอิงวัตถุ ( OSD ) รวมถึงซอฟต์แวร์บางประเภท (เช่น DataCore Swarm) จัดการเมตาเดต้าและข้อมูลในระดับอุปกรณ์จัดเก็บข้อมูล:

  • แทนที่จะใช้ส่วนต่อประสานแบบบล็อกที่อ่านและเขียนข้อมูลเป็นบล็อกขนาดคงที่ ข้อมูลจะถูกจัดระเบียบเป็นคอนเทนเนอร์ข้อมูลที่มีขนาดยืดหยุ่นได้ เรียกว่า อ็อบเจ็กต์
  • แต่ละวัตถุประกอบด้วยทั้งข้อมูล (ลำดับไบต์ที่ยังไม่ได้ตีความ) และเมตาเดตา (ชุดคุณลักษณะที่ขยายได้ซึ่งอธิบายถึงวัตถุ) การห่อหุ้มทั้งสองอย่างเข้าด้วยกันในเชิงกายภาพจะช่วยเพิ่มความสามารถในการกู้คืนได้
  • ส่วนติดต่อคำสั่งประกอบด้วยคำสั่งสำหรับสร้างและลบวัตถุ เขียนไบต์และอ่านไบต์จากและไปยังวัตถุแต่ละชิ้น และตั้งค่าและเรียกดูแอตทริบิวต์ของวัตถุ
  • กลไกการรักษาความปลอดภัยช่วยให้สามารถควบคุมการเข้าถึงได้ทั้งแบบต่อวัตถุและต่อคำสั่ง

การจัดการข้อมูลเชิงโปรแกรม

ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์ (Object storage) มีอินเทอร์เฟซแบบโปรแกรมที่ช่วยให้แอปพลิเคชันสามารถจัดการข้อมูลได้ ในระดับพื้นฐานนั้น ประกอบด้วยฟังก์ชันการสร้าง อ่าน อัปเดต และลบ ( CRUD ) สำหรับการดำเนินการอ่าน เขียน และลบขั้นพื้นฐาน บางระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์อาจมีฟังก์ชันเพิ่มเติม เช่นการกำหนดเวอร์ชันของอ็อบเจ็กต์/ไฟล์การจำลองแบบอ็อบเจ็กต์ การจัดการวงจรชีวิต และการย้ายอ็อบเจ็กต์ระหว่างระดับและประเภทของพื้นที่จัดเก็บข้อมูลที่แตกต่างกัน การใช้งาน API ส่วนใหญ่เป็น แบบ RESTซึ่งช่วยให้สามารถใช้การเรียกใช้ HTTP มาตรฐานได้หลายอย่าง

การดำเนินการ

พื้นที่จัดเก็บข้อมูลบนคลาวด์

บริการจัดเก็บข้อมูลบนคลาวด์ส่วนใหญ่ในท้องตลาดใช้สถาปัตยกรรมจัดเก็บข้อมูลแบบอ็อบเจ็กต์ ตัวอย่างที่โดดเด่น ได้แก่Amazon S3ซึ่งเปิดตัวในเดือนมีนาคม 2549, Microsoft Azure Blob Storage, IBM Cloud Object Storage , Rackspace Cloud Files (ซึ่งได้บริจาครหัสให้กับโครงการ Openstack ในปี 2553 และเผยแพร่ในชื่อOpenStack Swift ) และGoogle Cloud Storageที่เปิดตัวในเดือนพฤษภาคม 2553

ระบบไฟล์แบบอิงวัตถุ

ระบบไฟล์แบบกระจายบางระบบใช้สถาปัตยกรรมแบบอิงวัตถุ โดยที่เมตาเดตาของไฟล์จะถูกจัดเก็บไว้ในเซิร์ฟเวอร์เมตาเดตา และข้อมูลไฟล์จะถูกจัดเก็บไว้ในเซิร์ฟเวอร์จัดเก็บวัตถุ ซอฟต์แวร์ไคลเอ็นต์ของระบบไฟล์จะโต้ตอบกับเซิร์ฟเวอร์ที่แตกต่างกันเหล่านี้ และทำการสร้างนามธรรมให้กับเซิร์ฟเวอร์เหล่านั้นเพื่อแสดงระบบไฟล์ที่สมบูรณ์แก่ผู้ใช้และแอปพลิเคชัน

ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์

ระบบ จัดเก็บข้อมูลแบบอ็อบเจ็กต์ในยุคแรกๆ บางระบบถูกนำมาใช้สำหรับการเก็บรักษาข้อมูลระยะยาว เนื่องจากระบบเหล่านั้นได้รับการออกแบบมาเพื่อให้บริการด้านข้อมูล เช่น ความไม่เปลี่ยนแปลง ไม่ใช่เพื่อประสิทธิภาพการทำงานEMC Centeraและ Hitachi HCP (เดิมชื่อ HCAP) เป็นสองผลิตภัณฑ์จัดเก็บข้อมูลแบบอ็อบเจ็กต์ที่ถูกกล่าวถึงบ่อยๆ สำหรับการเก็บรักษาข้อมูลระยะยาว อีกตัวอย่างหนึ่งคือQuantum ActiveScale Object Storage Platform

ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์ที่ใช้งานได้ทั่วไปเริ่มออกสู่ตลาดราวปี 2008 โดยได้รับแรงดึงดูดจากอัตราการเติบโตอย่างมหาศาลของระบบจัดเก็บข้อมูลแบบ "เฉพาะที่" ภายในแอปพลิเคชันบนเว็บ เช่น Yahoo Mail และความสำเร็จในช่วงแรกของการจัดเก็บข้อมูลบนคลาวด์ ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์จึงให้คำมั่นสัญญาว่าจะมอบขนาดและความสามารถเช่นเดียวกับการจัดเก็บข้อมูลบนคลาวด์ พร้อมความสามารถในการใช้งานระบบภายในองค์กร หรือในผู้ให้บริการจัดเก็บข้อมูลบนคลาวด์ที่กำลังเติบโต

ระบบจัดเก็บไฟล์และวัตถุแบบรวมศูนย์

ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์บางระบบรองรับการจัดเก็บไฟล์และอ็อบเจ็กต์แบบรวมศูนย์ ทำให้ลูกค้าสามารถจัดเก็บอ็อบเจ็กต์บนระบบจัดเก็บข้อมูลได้ ในขณะเดียวกันลูกค้ารายอื่นก็สามารถจัดเก็บไฟล์บนระบบจัดเก็บข้อมูลเดียวกันได้[ 17 ]ผู้จำหน่ายรายอื่นในด้านการจัดเก็บข้อมูลแบบไฮบริดคลาวด์กำลังใช้เกตเวย์การจัดเก็บข้อมูลบนคลาวด์เพื่อจัดเตรียมเลเยอร์การเข้าถึงไฟล์เหนือการจัดเก็บข้อมูลแบบอ็อบเจ็กต์ โดยใช้โปรโตคอลการเข้าถึงไฟล์ เช่น SMB และ NFS

การจัดเก็บวัตถุแบบ "กักขัง"

บริษัทอินเทอร์เน็ตขนาดใหญ่บางแห่งพัฒนาซอฟต์แวร์ของตนเองเมื่อผลิตภัณฑ์จัดเก็บข้อมูลแบบอ็อบเจ็กต์ยังไม่มีวางจำหน่ายในเชิงพาณิชย์หรือกรณีการใช้งานมีความเฉพาะเจาะจงมาก Facebook ได้สร้างซอฟต์แวร์จัดเก็บข้อมูลแบบอ็อบเจ็กต์ของตนเองขึ้นมา ซึ่งมีชื่อรหัสว่า Haystack เพื่อตอบสนองความต้องการในการจัดการรูปภาพขนาดใหญ่ได้อย่างมีประสิทธิภาพ[ 18 ]

อุปกรณ์จัดเก็บข้อมูลแบบอิงวัตถุ

การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ที่ระดับโปรโตคอลและอุปกรณ์ได้รับการเสนอเมื่อ 20 ปีที่แล้วและได้รับการอนุมัติสำหรับ ชุดคำสั่ง SCSIเมื่อเกือบ 10 ปีที่แล้วในชื่อ "คำสั่งอุปกรณ์จัดเก็บข้อมูลแบบอ็อบเจ็กต์" (OSD) [ 19 ]อย่างไรก็ตาม ยังไม่ได้นำไปใช้งานจริงจนกระทั่งมีการพัฒนาแพลตฟอร์ม Seagate Kinetic Open Storage [ 20 ] [ 21 ] ชุด คำสั่ง SCSIสำหรับอุปกรณ์จัดเก็บข้อมูลแบบอ็อบเจ็กต์ได้รับการพัฒนาโดยคณะทำงานของ SNIA สำหรับคณะกรรมการ T10 ของคณะกรรมการระหว่างประเทศว่าด้วยมาตรฐานเทคโนโลยีสารสนเทศ (INCITS) [ 22 ] T10 มีหน้าที่รับผิดชอบมาตรฐาน SCSI ทั้งหมด

การยอมรับของตลาด

Lustre ซึ่ง เป็นหนึ่งในผลิตภัณฑ์จัดเก็บข้อมูลแบบอ็อบเจ็กต์รุ่นแรกๆถูกใช้ในซูเปอร์คอมพิวเตอร์ 70% จาก 100 อันดับแรก และประมาณ 50% จาก500 อันดับแรก [ 23 ] วันที่ 16 มิถุนายน 2013 ซึ่งรวมถึง 7 ใน 10 อันดับแรก รวมถึงระบบที่เร็วที่สุดอันดับสี่ในปัจจุบัน คือ Tianhe-2 ของจีน และซูเปอร์คอมพิวเตอร์ Titanที่ห้องปฏิบัติการแห่งชาติ Oak Ridgeซึ่ง เร็วที่สุดอันดับเจ็ด [ 24 ]

ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์ได้รับการยอมรับอย่างดีในช่วงต้นทศวรรษ 2000 ในฐานะแพลตฟอร์มการเก็บถาวร โดยเฉพาะอย่างยิ่งภายหลังกฎหมายการปฏิบัติตามข้อกำหนด เช่นSarbanes-Oxleyหลังจากวางจำหน่ายในตลาดมาห้าปี ผลิตภัณฑ์ Centera ของ EMC มีลูกค้ากว่า 3,500 ราย และจัดส่งไปแล้ว 150 เพตาไบต์ภายในปี 2007 [ 25 ]ผลิตภัณฑ์ HCP ของ Hitachi ก็มีลูกค้าจำนวนมากในระดับเพตาไบต์ เช่นกัน [ 26 ]ระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์รุ่นใหม่ก็ได้รับความนิยมมากขึ้น โดยเฉพาะอย่างยิ่งในแอปพลิเคชันแบบกำหนดเองขนาดใหญ่ เช่น เว็บไซต์ประมูลของ eBay ซึ่ง EMC Atmos ถูกใช้ในการจัดการอ็อบเจ็กต์มากกว่า 500 ล้านรายการต่อวัน[ 27 ]ณ วันที่ 3 มีนาคม 2014 EMC อ้างว่าได้ขายพื้นที่จัดเก็บข้อมูล Atmos ไปแล้วกว่า 1.5 เอ็กซาไบต์[ 28 ]เมื่อวันที่ 1 กรกฎาคม 2557 ห้องปฏิบัติการแห่งชาติลอสอลาโมสได้เลือกScality RINGเป็นพื้นฐานสำหรับสภาพแวดล้อมการจัดเก็บข้อมูลขนาด 500 เพตาไบต์ ซึ่งถือเป็นหนึ่งในระบบจัดเก็บข้อมูลที่ใหญ่ที่สุดเท่าที่เคยมีมา[ 29 ]

ระบบจัดเก็บข้อมูลแบบ "จำกัด" เช่น Haystack ของ Facebook สามารถขยายขนาดได้อย่างน่าประทับใจ ในเดือนเมษายน 2552 Haystack จัดการรูปภาพได้ 60 พันล้านภาพและพื้นที่จัดเก็บ 1.5 เพตาไบต์ โดยเพิ่มรูปภาพ 220 ล้านภาพและพื้นที่จัดเก็บ 25 เทราไบต์ต่อสัปดาห์[ 18 ]เมื่อไม่นานมานี้ Facebook ระบุว่าพวกเขากำลังเพิ่มรูปภาพ 350 ล้านภาพต่อวันและจัดเก็บรูปภาพ 240 พันล้านภาพ[ 30 ]ซึ่งอาจเท่ากับ 357 เพตาไบต์[ 31 ]

การจัดเก็บข้อมูลบนคลาวด์แพร่หลายมากขึ้น เนื่องจากแอป พลิเคชันเว็บและมือถือใหม่ๆ จำนวนมากเลือกใช้เป็นวิธีทั่วไปในการจัดเก็บข้อมูลไบนารี[ 32 ] ในฐานะที่เป็นแบ็กเอนด์การจัดเก็บข้อมูลสำหรับแอปพลิเคชันยอดนิยมมากมาย เช่น Smugmug และDropboxนั้นAmazon S3ได้เติบโตขึ้นอย่างมหาศาล โดยระบุว่ามีการจัดเก็บวัตถุมากกว่า 2 ล้านล้านรายการในเดือนเมษายน 2556 [ 33 ]สองเดือนต่อมา Microsoft อ้างว่าพวกเขาจัดเก็บวัตถุใน Azure มากกว่านั้นถึง 8.5 ล้านล้านรายการ[ 34 ]ภายในเดือนเมษายน 2557 Azure อ้างว่ามีการจัดเก็บวัตถุมากกว่า 20 ล้านล้านรายการ[ 35 ] Windows Azure Storage จัดการ Blobs (ไฟล์ผู้ใช้), Tables (ที่เก็บข้อมูลแบบมีโครงสร้าง) และ Queues (การส่งข้อความ) และนับทั้งหมดเป็นวัตถุ[ 36 ]

การวิเคราะห์ตลาด

Coldago Research ซึ่งเผยแพร่รายงานการประเมินประจำปีเกี่ยวกับการจัดเก็บข้อมูลแบบอ็อบเจ็กต์ในรายงานปี 2024 ที่มีชื่อว่าColdago Research Map 2024 for Object Storageได้ให้ข้อมูลเชิงลึกเกี่ยวกับนวัตกรรม พลวัตของตลาด และทิศทางในอนาคตของการจัดเก็บข้อมูลแบบอ็อบเจ็กต์ ซึ่งมีลักษณะเด่นคือวิวัฒนาการที่รวดเร็ว การนำไปใช้ที่เพิ่มขึ้น และชุดกรณีการใช้งานขององค์กรที่ขยายตัว Coldago Research ได้นำการวิเคราะห์เชิงคุณภาพและเชิงปริมาณของตลาดการจัดเก็บข้อมูลแบบอ็อบเจ็กต์มาใช้เพื่อจัดอันดับผู้จำหน่ายที่โดดเด่น 13 รายตามความสามารถทางเทคโนโลยี โมเมนตัมของตลาด และเส้นทางนวัตกรรม[ 37 ]

การจัดอันดับผู้นำตลาดการ จัดเก็บข้อมูลแบบอ็อบเจ็กต์ Coldago ปี 2024 เรียงตามลำดับตัวอักษร ได้แก่Cloudian , DataCore , Dell EMC , Huawei , IBM , MinIO , Pure Storage , QuantumและVAST Data [ 38 ]

มาตรฐาน

มาตรฐานอุปกรณ์จัดเก็บข้อมูลแบบอิงวัตถุ

OSD เวอร์ชัน 1

ในเวอร์ชันแรกของมาตรฐาน OSD [ 39 ]วัตถุจะถูกระบุด้วยรหัสพาร์ติชัน 64 บิตและรหัสวัตถุ 64 บิต พาร์ติชันจะถูกสร้างและลบภายใน OSD และวัตถุจะถูกสร้างและลบภายในพาร์ติชัน ไม่มีขนาดคงที่ที่เกี่ยวข้องกับพาร์ติชันหรือวัตถุ พวกมันสามารถขยายได้โดยขึ้นอยู่กับข้อจำกัดขนาดทางกายภาพของอุปกรณ์หรือข้อจำกัดโควต้าเชิงตรรกะบนพาร์ติชัน

ชุดแอตทริบิวต์ที่ขยายได้นั้นใช้อธิบายวัตถุ แอตทริบิวต์บางอย่างถูกนำไปใช้โดยตรงโดย OSD เช่น จำนวนไบต์ในวัตถุและเวลาแก้ไขของวัตถุ นอกจากนี้ยังมีแอตทริบิวต์แท็กนโยบายพิเศษซึ่งเป็นส่วนหนึ่งของกลไกการรักษาความปลอดภัย แอตทริบิวต์อื่นๆ นั้น OSD ไม่ได้ตีความ แอตทริบิวต์เหล่านี้จะถูกกำหนดให้กับวัตถุโดยระบบจัดเก็บข้อมูลระดับสูงกว่าที่ใช้ OSD สำหรับการจัดเก็บข้อมูลถาวร ตัวอย่างเช่น แอตทริบิวต์อาจถูกใช้เพื่อจำแนกประเภทของวัตถุ หรือเพื่อบันทึกความสัมพันธ์ระหว่างวัตถุต่างๆ ที่จัดเก็บไว้ใน OSD ที่แตกต่างกัน

คำสั่ง list จะส่งคืนรายการตัวระบุสำหรับวัตถุภายในพาร์ติชัน โดยอาจกรองตามการจับคู่กับค่าแอตทริบิวต์ได้ นอกจากนี้ คำสั่ง list ยังสามารถส่งคืนแอตทริบิวต์ที่เลือกของวัตถุในรายการได้อีกด้วย

คำสั่งอ่านและเขียนสามารถรวมเข้าด้วยกัน หรือใช้ร่วมกับคำสั่งในการรับและตั้งค่าคุณสมบัติได้ ความสามารถนี้ช่วยลดจำนวนครั้งที่ระบบจัดเก็บข้อมูลระดับสูงต้องติดต่อกับ OSD ซึ่งจะช่วยเพิ่มประสิทธิภาพโดยรวมได้

OSD เวอร์ชัน 2

ชุดคำสั่ง SCSI รุ่นที่สอง "Object-Based Storage Devices - 2" (OSD-2) เพิ่มการสนับสนุนสำหรับสแนปช็อต คอลเลกชันของวัตถุ และการจัดการข้อผิดพลาดที่ดีขึ้น[ 40 ]

แนปช็อตคือสำเนาของวัตถุทั้งหมดในพาร์ติชัน ณ จุดเวลาหนึ่งไปยังพาร์ติชันใหม่ OSD สามารถใช้ เทคนิค copy-on-write เพื่อคัดลอกข้อมูลอย่างมีประสิทธิภาพโดยใช้พื้นที่ จัดเก็บข้อมูล เพื่อให้พาร์ติชันทั้งสองใช้ร่วมกันวัตถุที่ไม่เปลี่ยนแปลงระหว่างสแนปช็อต หรือ OSD อาจคัดลอกข้อมูลไปยังพาร์ติชันใหม่โดยตรง มาตรฐานกำหนดโคลน ซึ่งสามารถเขียนได้ และสแนปช็อต ซึ่งเป็นแบบอ่านอย่างเดียว

คอลเลกชันเป็นวัตถุชนิดพิเศษที่ประกอบด้วยตัวระบุของวัตถุอื่นๆ มีการดำเนินการเพื่อเพิ่มและลบออกจากคอลเลกชัน และมีการดำเนินการเพื่อรับหรือกำหนดคุณลักษณะสำหรับวัตถุทั้งหมดในคอลเลกชัน คอลเลกชันยังใช้สำหรับการรายงานข้อผิดพลาดด้วย หากวัตถุเสียหายเนื่องจากข้อบกพร่องของสื่อ (เช่น จุดเสียบนดิสก์) หรือข้อผิดพลาดของซอฟต์แวร์ภายในระบบ OSD ตัวระบุของวัตถุนั้นจะถูกใส่ไว้ในคอลเลกชันข้อผิดพลาดพิเศษ ระบบจัดเก็บข้อมูลระดับสูงที่ใช้ OSD สามารถสอบถามคอลเลกชันนี้และดำเนินการแก้ไขตามความจำเป็นได้

ความแตกต่างระหว่างที่เก็บข้อมูลแบบคีย์-ค่าและที่เก็บข้อมูลแบบอ็อบเจ็กต์

เส้นแบ่งระหว่างที่เก็บข้อมูลแบบอ็อบเจ็กต์และที่เก็บข้อมูลแบบคีย์-ค่าค่อนข้างคลุมเครือ โดยบางครั้งที่เก็บข้อมูลแบบคีย์-ค่าก็ถูกเรียกอย่างไม่เป็นทางการว่าที่เก็บข้อมูลแบบอ็อบเจ็กต์

อินเทอร์เฟซการจัดเก็บข้อมูลแบบบล็อกแบบดั้งเดิมใช้บล็อกขนาดคงที่หลายบล็อกซึ่งกำหนดหมายเลขเริ่มต้นที่ 0 ข้อมูลต้องมีขนาดคงที่นั้นและสามารถจัดเก็บในบล็อกเฉพาะซึ่งระบุโดยหมายเลขบล็อกเชิงตรรกะ (LBN) ต่อมาสามารถเรียกใช้บล็อกข้อมูลนั้นได้โดยการระบุ LBN ที่ไม่ซ้ำกัน

ในระบบจัดเก็บข้อมูลแบบคีย์-ค่า ข้อมูลจะถูกระบุด้วยคีย์แทนที่จะเป็น LBN (Level Number Network) คีย์อาจเป็น "cat" หรือ "olive" หรือ "42" ก็ได้ มันอาจเป็นลำดับของไบต์ที่มีความยาวไม่จำกัด ข้อมูล (เรียกว่าค่าในศัพท์เฉพาะนี้) ไม่จำเป็นต้องมีขนาดคงที่และอาจเป็นลำดับของไบต์ที่มีความยาวไม่จำกัดเช่นกัน เราจัดเก็บข้อมูลโดยการป้อนคีย์และข้อมูล (ค่า) ไปยังระบบจัดเก็บข้อมูล และสามารถดึงข้อมูลออกมาได้ในภายหลังโดยการป้อนคีย์ แนวคิดนี้พบได้ในภาษาโปรแกรมต่างๆ Python เรียกว่าพจนานุกรม (dictionary), Perl เรียกว่าแฮช (hashes), Java, Rust และ C++ เรียกว่าแผนที่ (maps) เป็นต้น ระบบจัดเก็บข้อมูลหลายระบบก็ใช้ระบบจัดเก็บข้อมูลแบบคีย์-ค่าเช่นกัน เช่น Memcached, Redis และ CouchDB

ที่เก็บวัตถุมีความคล้ายคลึงกับที่เก็บคีย์-ค่าในสองประเด็น ประการแรก ตัวระบุวัตถุหรือURL (เทียบเท่ากับคีย์) สามารถเป็นสตริงใดๆ ก็ได้[ 41 ]ประการที่สอง ข้อมูลอาจมีขนาดใดๆ ก็ได้

อย่างไรก็ตาม มีความแตกต่างที่สำคัญบางประการระหว่างที่เก็บข้อมูลแบบคีย์-ค่าและที่เก็บข้อมูลแบบอ็อบเจ็กต์ ประการแรก ที่เก็บข้อมูลแบบอ็อบเจ็กต์ยังอนุญาตให้เชื่อมโยงชุดคุณลักษณะ (เมตาเดตา) ที่จำกัดกับข้อมูลแต่ละชิ้นได้ การรวมกันของคีย์ ค่า และชุดคุณลักษณะเรียกว่าอ็อบเจ็กต์ ประการที่สอง ที่เก็บข้อมูลแบบอ็อบเจ็กต์ได้รับการปรับให้เหมาะสมสำหรับข้อมูลจำนวนมาก (หลายร้อยเมกะไบต์หรือแม้แต่กิกะไบต์) ในขณะที่ที่เก็บข้อมูลแบบคีย์-ค่าคาดว่าค่าจะมีขนาดค่อนข้างเล็ก (กิโลไบต์) สุดท้าย ที่เก็บข้อมูลแบบอ็อบเจ็กต์มักให้การรับประกันความสอดคล้องที่อ่อนกว่า เช่นความสอดคล้องในที่สุดในขณะที่ที่เก็บข้อมูลแบบคีย์-ค่าให้ความสอดคล้องที่แข็งแกร่ง

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Object_storage&oldid=1359302916 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การจัดเก็บวัตถุ

การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ (หรือที่รู้จักกันในชื่อ การจัดเก็บข้อมูลแบบอ็อบเจ็กต์ [ 1 ] หรือ การจัดเก็บข้อมูลแบบบล็อก ) เป็น แนวทาง การจัดเก็บข้อมูลคอมพิวเตอร์...

ต้นกำเนิด

จิม สตาร์คีย์ เป็นผู้บัญญัติศัพท์คำว่า "blob" ขณะทำงานที่ Digital Equipment Corporation เพื่อใช้เรียกเอนทิตีข้อมูลที่ไม่โปร่งใส คำศัพท์นี้ถูกนำมาใช้ใน Rdb/VMS คำ ว่า Blob มักถูกอธิบายอย่างขบขันว่าเป็นคำย่อของ binary large object ตามที่สตาร์คีย์กล่าว คำย่อ นี้...

การพัฒนา

Seagate Technology มีบทบาทสำคัญในการพัฒนาการจัดเก็บข้อมูลแบบอ็อบเจ็กต์ ตามที่ Storage Networking Industry Association (SNIA) ระบุว่า "การจัดเก็บข้อมูลแบบอ็อบเจ็กต์มีต้นกำเนิดในช่วงปลายทศวรรษ 1990: ข้อกำหนดของ Seagate จากปี 1999 ได้แนะนำคำสั่งแรกๆ...

การนามธรรมของการจัดเก็บข้อมูล

หนึ่งในหลักการออกแบบของระบบจัดเก็บข้อมูลแบบอ็อบเจ็กต์คือการแยกส่วนงานจัดเก็บข้อมูลระดับล่างๆ ออกจากผู้ดูแลระบบและแอปพลิเคชัน ดังนั้น ข้อมูลจึงถูกเปิดเผยและจัดการในรูปแบบของอ็อบเจ็กต์แทนที่จะเป็น บล็อก หรือไฟล์ (แต่เดิม)...