กลับไปหน้าบทความ

อ่าน 7 นาที

ข้อมูลที่เชื่อมโยง

ในด้านคอมพิวเตอร์ ข้อมูลที่เชื่อมโยง (Linked Data) คือข้อมูลที่มีโครงสร้างซึ่งเชื่อมโยงกับข้อมูลอื่น ๆ การเชื่อมโยงทำให้ข้อมูลมีประโยชน์มากขึ้นผ่านการค้นหาเชิงความหมาย ทิม...

ข้อมูลที่เชื่อมโยง

เครือข่ายที่ประกอบด้วยวงกลมกว่าพันวงรวมกลุ่มกันและเชื่อมโยงด้วยเส้นต่างๆ กลายเป็นเหมือนใยแมงมุม
ข้อมูลวิกิดาต้าใน Linked Open Data Cloud ณ เดือนสิงหาคม 2020 ฐานข้อมูลแสดงด้วยวงกลม (โดยวิกิดาต้าแสดงด้วยสัญลักษณ์ 'WD') และเส้นสีเทาเชื่อมโยงฐานข้อมูลในเครือข่ายหากข้อมูลสอดคล้องกัน สร้างจากhttps://lod-cloud.net/datasets
DBpedia เป็นชุดข้อมูล LOD ที่เชื่อมโยงกันมากที่สุดและเป็นจุดกำเนิดของ Linked Open Data Cloud มาตั้งแต่ปี 2008
DBpedia เป็นชุดข้อมูล LOD ที่เชื่อมโยงกันมากที่สุดและเป็นจุดกำเนิดของ Linked Open Data Cloud มาตั้งแต่ปี 2008 ภาพจากปี 2021 สร้างจาก https://lod-cloud.net

ในด้านคอมพิวเตอร์ข้อมูลที่เชื่อมโยง (Linked Data) คือข้อมูลที่มีโครงสร้างซึ่งเชื่อมโยงกับข้อมูลอื่น ๆ การเชื่อมโยงทำให้ข้อมูลมีประโยชน์มากขึ้นผ่านการค้นหาเชิงความหมาย ทิม เบอร์เนอร์ส-ลี ผู้อำนวยการของ World Wide Web Consortium (W3C) เป็นผู้บัญญัติศัพท์นี้ในบันทึกการออกแบบเกี่ยวกับโครงการ Semantic Web ในปี 2006 วิสัยทัศน์ส่วนหนึ่งของข้อมูลที่เชื่อมโยงคือการทำให้อินเทอร์เน็ตกลายเป็นฐานข้อมูลระดับโลก

ข้อมูลลิงก์ (Linked Data) สร้างขึ้นบนพื้นฐานของเทคโนโลยีเว็บมาตรฐาน เช่น HTTP, RDF และ URI แต่แทนที่จะใช้เทคโนโลยีเหล่านี้เพื่อแสดงเว็บเพจและไฮเปอร์ลิงก์สำหรับผู้อ่านที่เป็นมนุษย์เท่านั้น ข้อมูลลิงก์ขยายขอบเขตการใช้งานเพื่อแบ่งปันข้อมูลในลักษณะที่คอมพิวเตอร์สามารถอ่านได้โดยอัตโนมัติ (อ่านได้ด้วยเครื่องจักร) ข้อมูลลิงก์อาจเป็นข้อมูลเปิด (Open Data) ซึ่งในกรณีนี้มักจะเรียกว่าข้อมูลเปิดลิงก์ (Linked Open Data )

หลักการ

ในบันทึก "Linked Data" ปี 2006 ของเขาTim Berners-Leeได้สรุปหลักการสี่ประการของ Linked Data โดยสรุปได้ดังนี้: [ 1 ]

  1. ควรใช้ตัวระบุทรัพยากรสากล (URI) ในการตั้งชื่อและระบุสิ่งต่างๆ แต่ละอย่าง
  2. ควรใช้HTTP URI เพื่อให้สามารถค้นหา ตีความ และ "อ้างอิง" สิ่งเหล่านี้ได้ในภายหลัง
  3. ควรให้ข้อมูลที่เป็นประโยชน์เกี่ยวกับความหมายของชื่อผ่านมาตรฐานเปิด เช่นRDF , SPARQLเป็นต้น
  4. เมื่อเผยแพร่ข้อมูลบนเว็บ ควรระบุชื่ออื่นๆ โดยใช้ชื่อที่อิงตาม HTTP URI

ต่อมา Tim Berners-Lee ได้กล่าวซ้ำหลักการเหล่านี้ในการประชุม TED ปี 2009 โดยสรุปอีกครั้งตามแนวทางต่อไปนี้: [ 2 ]

  1. สิ่ง ที่เป็นนามธรรมทั้งหมดควรมีชื่อขึ้นต้นด้วยHTTP
  2. การค้นหาชื่อ HTTP ควรจะได้ข้อมูลที่เป็นประโยชน์เกี่ยวกับสิ่งนั้นๆ ในรูปแบบมาตรฐาน
  3. สิ่งอื่นใดที่มีความสัมพันธ์กับสิ่งนั้นผ่านทางข้อมูล ก็ควรได้รับการตั้งชื่อที่ขึ้นต้นด้วย HTTP เช่นกัน

ส่วนประกอบ

ดังนั้น เราจึงสามารถระบุส่วนประกอบต่อไปนี้ว่าเป็นสิ่งจำเป็นสำหรับระบบ Linked Data ระดับโลกตามที่ได้วางแผนไว้ และสำหรับชุดย่อย Linked Data ใดๆ ก็ตามภายในระบบนั้น:

ข้อมูลเปิดที่เชื่อมโยง

ข้อมูลเปิดที่เชื่อมโยงคือข้อมูลที่เชื่อมโยงซึ่งเป็นข้อมูลเปิด [ 4 ] [ 5 ] [ 6 ] Tim Berners-Lee ให้คำจำกัดความที่ชัดเจนที่สุดของข้อมูลเปิดที่เชื่อมโยงซึ่งแตกต่างจากข้อมูลที่เชื่อมโยง

Linked Open Data (LOD) คือ Linked Data ที่เผยแพร่ภายใต้ใบอนุญาตแบบเปิด ซึ่งไม่จำกัดการนำไปใช้ซ้ำโดยไม่เสียค่าใช้จ่าย

— ทิม เบอร์เนอร์ส-ลี, ลิงก์ดาต้า[ 1 ] [ 7 ]

ชุดข้อมูลเปิดขนาดใหญ่ที่เชื่อมโยงกัน ได้แก่DBpedia , Wikibase , WikidataและOpen ICEcat

ข้อมูลเปิดที่เชื่อมโยงระดับ 5 ดาว

แผนการปรับใช้สำหรับ Linked Open Data [ 8 ]

ในปี 2010 Tim Berners-Leeได้เสนอระบบ 5 ดาวสำหรับการจัดระดับคุณภาพของข้อมูลเปิดบนเว็บ โดยอันดับสูงสุดคือ Linked Open [ 9 ]

  • 1 ดาว: ข้อมูลมีให้ใช้งานได้อย่างเปิดเผยในรูปแบบใดรูปแบบหนึ่ง
  • 2 ดาว: ข้อมูลมีให้ในรูปแบบที่มีโครงสร้าง เช่นไฟล์ Microsoft Excel (.xls)
  • 3 ดาว: ข้อมูลมีให้ใช้งานในรูปแบบโครงสร้างที่ไม่เป็นกรรมสิทธิ์ เช่นค่าที่คั่นด้วยเครื่องหมายจุลภาค (.csv)
  • 4 ดาว: ข้อมูลเป็นไปตาม มาตรฐาน W3Cเช่น การใช้RDFและURI
  • 5 ดาว: สำหรับทุกอย่างที่เหลือ รวมถึงลิงก์ไปยังแหล่งข้อมูลเปิดที่เชื่อมโยงอื่นๆ ด้วย

ประวัติศาสตร์

คำว่า "linked open data" ถูกนำมาใช้ตั้งแต่เดือนกุมภาพันธ์ พ.ศ. 2550 เป็นอย่างน้อย เมื่อมีการสร้างรายชื่อผู้รับจดหมาย "Linking Open Data" [ 10 ]ขึ้น[ 11 ]รายชื่อผู้รับจดหมายนี้เริ่มต้นจากโครงการSIMILE [ 12 ]ที่สถาบันเทคโนโลยีแมสซาชู เซต ส์

โครงการเชื่อมโยงชุมชนข้อมูลเปิด

แผนภาพด้านบนแสดงให้เห็นว่าชุดข้อมูล Linking Open Data ใดบ้างที่เชื่อมต่อกัน ณ เดือนสิงหาคม 2557 ซึ่งจัดทำโดยโครงการ Linked Open Data Cloud ที่เริ่มต้นในปี 2550 ชุดข้อมูลบางชุดอาจมีข้อมูลที่มีลิขสิทธิ์ซึ่งสามารถเข้าถึงได้ฟรี[ 13 ]
แผนภาพเดียวกันกับด้านบน แต่เป็นข้อมูลของเดือนกุมภาพันธ์ 2560 แสดงให้เห็นถึงการเติบโตในช่วงเวลาเพียงสองปีครึ่ง
กลุ่มเมฆ LOD ในเดือนธันวาคม 2024

เป้าหมายของโครงการชุมชน Linking Open Data ของกลุ่มการศึกษาและการเผยแพร่ Semantic Web ของ W3C คือการขยายเว็บด้วยแหล่งข้อมูลสาธารณะโดยการเผยแพร่ชุดข้อมูลเปิด ต่างๆ ในรูปแบบ RDF บนเว็บ และโดยการสร้าง ลิงก์ RDF ระหว่างรายการข้อมูลจากแหล่งข้อมูลต่างๆ ในเดือนตุลาคม 2550 ชุดข้อมูลประกอบด้วย RDF triplesมากกว่า 2,000 ล้านรายการซึ่งเชื่อมโยงกันด้วยลิงก์ RDF มากกว่า 2 ล้านรายการ[ 14 ] [ 15 ] ภายในเดือนกันยายน 2554 จำนวนนี้ได้เพิ่มขึ้นเป็น 31,000 ล้าน RDF triples ซึ่งเชื่อมโยงกันด้วยลิงก์ RDF ประมาณ 504 ล้านรายการ มีการเผยแพร่รายละเอียดทางสถิติอย่างละเอียดในปี 2557 [ 16 ]

โครงการของสหภาพยุโรป

มีโครงการ ของสหภาพยุโรปหลายโครงการที่เกี่ยวข้องกับข้อมูลที่เชื่อมโยงกัน ได้แก่ โครงการ Linked Open Data Around the Clock (LATC) [ 17 ]โครงการ AKN4EU สำหรับข้อมูลกฎหมายที่เครื่องอ่านได้[ 18 ]โครงการ PlanetData [ 19 ]โครงการ DaPaaS (Data-and-Platform-as-a-Service) [ 20 ]และโครงการ Linked Open Data 2 (LOD2) [ 21 ] [ 22 ] [ 23 ]การเชื่อมโยงข้อมูลเป็นหนึ่งในเป้าหมายหลักของEU Open Data Portalซึ่งทำให้ชุดข้อมูลหลายพันชุดพร้อมใช้งานสำหรับทุกคนในการนำไปใช้ซ้ำและเชื่อมโยง

ออนโทโลยี

ออนโทโลยีคือคำอธิบายที่เป็นทางการของโครงสร้างข้อมูล ออนโทโลยีที่เป็นที่รู้จักกันดีบางส่วน ได้แก่:

  • FOAF – ออนโทโลยีที่อธิบายถึงบุคคล คุณสมบัติ และความสัมพันธ์ของบุคคล
  • UMBEL – โครงสร้างอ้างอิงน้ำหนักเบาที่ประกอบด้วยคลาสแนวคิดเรื่องต่างๆ กว่า 20,000 คลาสและความสัมพันธ์ระหว่างกัน ซึ่งได้มาจากOpenCycและสามารถใช้เป็นคลาสเชื่อมโยงข้อมูลภายนอกได้ นอกจากนี้ยังมีลิงก์ไปยังเอนทิตีที่มีชื่อกว่า 1.5 ล้านรายการจาก DBpedia และYAGO

ชุดข้อมูล

  • DBpediaคือชุดข้อมูลที่ดึงมาจากวิกิพีเดีย ประกอบด้วยแนวคิดประมาณ 3.4 ล้านแนวคิด ซึ่งอธิบายด้วยข้อมูลสามส่วน (triples) จำนวน 1 พันล้านชุด รวมถึงบทคัดย่อใน 11 ภาษาที่แตกต่างกัน
  • GeoNames – ให้บริการคำอธิบาย RDF ของลักษณะทางภูมิศาสตร์มากกว่า 7,500,000 แห่งทั่วโลก
  • วิกิดาต้า – ชุดข้อมูลเชื่อมโยงที่สร้างขึ้นโดยความร่วมมือ ซึ่งทำหน้าที่เป็นศูนย์กลางจัดเก็บข้อมูลที่มีโครงสร้างของโครงการต่างๆ ในเครือมูลนิธิวิกิมีเดีย
  • ฐานข้อมูลระบุตัวตนการวิจัยระดับโลก ( GRID ) – ฐานข้อมูลระหว่างประเทศของสถาบัน 89,506 แห่งที่เกี่ยวข้องกับการวิจัยทางวิชาการ โดยมีความสัมพันธ์ 14,401 รายการ GRID จำลองความสัมพันธ์สองประเภท ได้แก่ ความสัมพันธ์แบบพ่อแม่-ลูกที่กำหนดความสัมพันธ์ย่อย และความสัมพันธ์ที่เกี่ยวข้องซึ่งอธิบายความสัมพันธ์อื่นๆ[ 24 ] [ 25 ]
  • KnowWhereGraph [ 26 ] – กราฟความรู้แบบบูรณาการที่มีความแข็งแกร่ง 12 พันล้านทริปเปิล ประกอบด้วยเลเยอร์ข้อมูล 30 ชั้น ณ จุดตัดระหว่างมนุษย์และสิ่งแวดล้อม โดยใช้เทคโนโลยี Semantic Web และ Linked Data [ 27 ]
  • เปิด ICEcat - แคตตาล็อกแบบเปิด หลายภาษา ที่ประกอบด้วย เอกสารข้อมูลผลิตภัณฑ์ทรัพย์สินดิจิทัลที่เกี่ยวข้องและสถิติ การใช้ งาน

ความสัมพันธ์ระหว่างอินสแตนซ์และคลาสของชุดข้อมูล

ไดอะแกรมที่คลิกได้ซึ่งแสดงชุดข้อมูลแต่ละชุดและความสัมพันธ์ภายในคลาวด์ LOD ที่สร้างขึ้นโดย DBpedia (ตามรูปทางด้านขวา) มีให้บริการ[ 28 ] [ 29 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Ahmet Soylu, Felix Mödritscher และ Patrick De Causmaecker. 2012. "การนำทางเว็บแบบยูบิควิตัสผ่านการเก็บเกี่ยวข้อมูลความหมายที่ฝังตัว: สถานการณ์บนมือถือ" เก็บถาวรเมื่อ 2018-09-19 ที่Wayback Machineวิศวกรรมคอมพิวเตอร์ช่วยแบบบูรณาการ 19 (1): 93–109
  • Linked Evolving the Web into a Global Data Space (2011) โดย Tom Heath และ Christian Bizer, Synthesis Lectures on the Semantic Web: Theory and Technology, Morgan & Claypool
  • วิธีการเผยแพร่ Linked Data บนเว็บ(เก็บถาวรเมื่อ 19 เมษายน 2021 ที่Wayback Machine ) โดย Chris Bizer, Richard Cyganiak และ Tom Heath จากบทเรียน Linked Data ที่มหาวิทยาลัย Freie Universität Berlin ประเทศเยอรมนี เมื่อวันที่ 27 กรกฎาคม 2007
  • เว็บครบรอบ 20 ปี: ข้อมูลเชื่อมโยงมอบพลังให้แก่ผู้คนตอนที่ 1 จาก 4 โดย มาร์ค ฟิสเชตติ นิตยสารScientific American 23 ตุลาคม 2010
  • Linked Data ก็เป็นเพียงข้อมูลเพิ่มเติมเท่านั้น – Prateek Jain, Pascal Hitzler , Peter Z. Yeh, Kunal Verma และ Amit P. Sheth ใน: Dan Brickley, Vinay K. Chaudhri, Harry Halpin และ Deborah McGuinness: Linked Data Meets Artificial Intelligenceรายงานทางเทคนิค SS-10-07, AAAI Press, Menlo Park, California, 2010, หน้า 82–86
  • ก้าวข้ามการใช้ sameAs ด้วย PLATO: การตรวจจับ Partonomy สำหรับ Linked Data – Prateek Jain, Pascal Hitzler , Kunal Verma, Peter Z. Yeh, Amit Sheth ใน: รายงานการประชุม ACM Hypertext and Social Media ครั้งที่ 23 (HT 2012), มิลวอกี, วิสคอนซิน, สหรัฐอเมริกา, 25–28 มิถุนายน 2012
  • Freitas, André, Edward Curry, João Gabriel Oliveira และ Sean O'Riain 2555. "การสืบค้นชุดข้อมูลที่แตกต่างกันบนเว็บข้อมูลที่เชื่อมโยง: ความท้าทาย แนวทาง และแนวโน้ม"คอมพิวเตอร์อินเทอร์เน็ต IEEE 16 (1): 24–33
  • การเชื่อมโยงข้อมูลเปิดบนเว็บ – คริส ไบเซอร์, ทอม ฮีธ, แดนนี่ เอเยอร์ส, อีฟส์ ไรมองด์ ในเอกสารนำเสนอแบบโปสเตอร์, ESWC2007, อินส์บรุค, ออสเตรีย
  • การจัดเรียงออนโทโลยีสำหรับข้อมูลเปิดที่เชื่อมโยง – Prateek Jain, Pascal Hitzler , Amit Sheth, Kunal Verma, Peter Z. Yeh ในรายงานการประชุมนานาชาติว่าด้วยเว็บเชิงความหมายครั้งที่ 9, ISWC 2010, เซี่ยงไฮ้, ประเทศจีน
  • ข้อมูลยาแบบเปิดที่เชื่อมโยงสำหรับการวิจัยและพัฒนายา - J Cheminform. 2011; 3: 19. Samwald, Jentzsch, Bouton, Kallesøe, Willighagen, Hajagos, Marshall, Prud'hommeaux, Hassenzadeh, Pichler และ Stephens (พฤษภาคม 2011)
  • บทสัมภาษณ์ Sören Auer หัวหน้าโครงการ LOD2 เกี่ยวกับการดำเนินงานต่อของโครงการ LOD2 ในปี 2011เดือนมิถุนายน 2011
  • Linked Open The Essentials Archived 2016-06-04 at the Wayback Machine - Florian Bauer and Martin Kaltenböck (มกราคม 2012)
  • การกระพือปีกของผีเสื้อ - semanticweb.com ริชาร์ด วอลลิส (กุมภาพันธ์ 2012)
  • LinkedData เก็บถาวรเมื่อ 2021-05-09 ที่Wayback Machineใน W3C Wiki
  • ลิงก์ดาต้า.org
  • เอกสารไวท์เปเปอร์ของซอฟต์แวร์ OpenLink
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Linked_data&oldid=1360703065 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ข้อมูลที่เชื่อมโยง

ในด้านคอมพิวเตอร์ ข้อมูลที่เชื่อมโยง (Linked Data) คือข้อมูลที่มีโครงสร้างซึ่งเชื่อมโยงกับข้อมูลอื่น ๆ การเชื่อมโยงทำให้ข้อมูลมีประโยชน์มากขึ้นผ่านการค้นหาเชิงความหมาย ทิม...

หลักการ

ในบันทึก "Linked Data" ปี 2006 ของเขา Tim Berners-Lee ได้สรุปหลักการสี่ประการของ Linked Data โดยสรุปได้ดังนี้: [ 1 ]

ส่วนประกอบ

ดังนั้น เราจึงสามารถระบุส่วนประกอบต่อไปนี้ว่าเป็นสิ่งจำเป็นสำหรับระบบ Linked Data ระดับโลกตามที่ได้วางแผนไว้ และสำหรับชุดย่อย Linked Data ใดๆ ก็ตามภายในระบบนั้น:

ข้อมูลเปิดที่เชื่อมโยง

ข้อมูลเปิดที่เชื่อมโยง คือข้อมูลที่เชื่อมโยงซึ่งเป็น ข้อมูลเปิด [ 4 ] [ 5 ] [ 6 ] Tim Berners-Lee ให้คำจำกัดความที่ชัดเจนที่สุดของข้อมูลเปิดที่เชื่อมโยงซึ่งแตกต่างจากข้อมูลที่เชื่อมโยง