กลับไปหน้าบทความ

อ่าน 8 นาที

ดีบีพีเดีย

DBpedia (มาจาก "DB" ซึ่งย่อมาจาก " database ") เป็นโครงการที่มีจุดมุ่งหมายเพื่อดึงเนื้อหาที่มีโครงสร้างจากข้อมูลที่สร้างขึ้นใน โครงการ...

ดีบีพีเดีย

ดีบีพีเดีย
นักพัฒนา
ปล่อย10 มกราคม 2550 ( 10 มกราคม 2550 )
เวอร์ชันเสถียร
DBpedia 2016-10 / 4 กรกฎาคม 2017
เขียนเป็น
พิมพ์
ใบอนุญาตใบอนุญาตสาธารณะทั่วไปของ GNU
เว็บไซต์dbpedia.orgแก้ไขข้อมูลนี้ได้ที่วิกิดาต้า
ที่เก็บข้อมูล
  • github.com/dbpedia/

DBpedia (มาจาก "DB" ซึ่งย่อมาจาก " database ") เป็นโครงการที่มีจุดมุ่งหมายเพื่อดึงเนื้อหาที่มีโครงสร้างจากข้อมูลที่สร้างขึ้นใน โครงการ Wikipediaข้อมูลที่มีโครงสร้างนี้มีให้บริการบนWorld Wide Webโดยใช้OpenLink Virtuoso [ 1 ] [ 2 ] DBpediaอนุญาตให้ผู้ใช้สอบถามความสัมพันธ์และคุณสมบัติของทรัพยากร Wikipedia ในเชิงความหมาย รวมถึงลิงก์ไปยังชุดข้อมูลที่ เกี่ยวข้องอื่นๆ [ 3 ]

โครงการนี้ได้รับการยกย่องว่าเป็น "หนึ่งในผลงานที่มีชื่อเสียงที่สุด" ของ ความพยายาม ในการเชื่อมโยงข้อมูลแบบ กระจายศูนย์ โดยTim Berners-Leeผู้คิดค้นเวิลด์ไวด์เว็บ[ 4 ] ณ เดือนมิถุนายน 2021 DBpedia มีข้อมูลไตรเพิล เชิงความหมายมากกว่า 850 ล้านรายการ

พื้นหลัง

โครงการนี้เริ่มต้นโดยผู้คนจากมหาวิทยาลัยเสรีแห่งเบอร์ลินและมหาวิทยาลัยไลป์ซิก[ 5 ]ร่วมกับ OpenLink Software และปัจจุบันได้รับการดูแลโดยผู้คนจากมหาวิทยาลัยมันน์ไฮม์มหาวิทยาลัยไลป์ซิก และมหาวิทยาลัยเพนซิลเวเนีย [ 6 ] [ 7 ] ชุดข้อมูลสาธารณะชุดแรกได้รับการเผยแพร่ในปี 2550 [ 5 ]ข้อมูลนี้เผยแพร่ภายใต้ใบอนุญาตเสรี ( CC BY-SA ) ซึ่งอนุญาตให้ผู้อื่นนำชุดข้อมูลไปใช้ซ้ำ ได้ โดยไม่ได้ใช้ ใบอนุญาต ข้อมูลเปิดเพื่อยกเว้นสิทธิ์ฐานข้อมูลเฉพาะ

บทความในวิกิพีเดียส่วนใหญ่ประกอบด้วยข้อความอิสระ แต่ก็มีข้อมูลที่มีโครงสร้างฝังอยู่ในบทความด้วย เช่น ตาราง " อินโฟบ็อกซ์" (แผงที่ดึงออกมาซึ่งปรากฏที่มุมบนขวาของมุมมองเริ่มต้นของบทความวิกิพีเดียหลายบทความ หรือที่จุดเริ่มต้นของเวอร์ชันมือถือ ) ข้อมูลการจัดหมวดหมู่ รูปภาพพิกัดทางภูมิศาสตร์ และลิงก์ไปยัง เว็บเพจภายนอกข้อมูลที่มีโครงสร้างเหล่านี้จะถูกดึงออกมาและจัดเก็บไว้ในชุดข้อมูลที่เป็นมาตรฐานเดียวกัน ซึ่งสามารถสืบค้นได้

ชุดข้อมูล

ชุดข้อมูล DBpedia ที่เผยแพร่เมื่อเดือนเมษายน 2559 อธิบายเอนทิตี 6 ล้านรายการ โดย 5.2 ล้านรายการถูกจัดประเภทในออนโทโลยี ที่สอดคล้องกัน ซึ่งรวมถึงบุคคล 1.5 ล้านคน สถานที่ 810,000 แห่ง อัลบั้มเพลง 135,000 อัลบั้ม ภาพยนตร์ 106,000 เรื่อง วิดีโอเกม 20,000 เกม องค์กร 275,000 แห่ง สปีชีส์ 301,000 ชนิด และโรค 5,000 โรค[ 8 ] DBpedia ใช้Resource Description Framework (RDF) เพื่อแสดงข้อมูลที่สกัดออกมา และประกอบด้วยRDF triples 9.5 พันล้านรายการ โดย 1.3 พันล้านรายการสกัดมาจากวิกิพีเดียภาษาอังกฤษและ 5 พันล้านรายการสกัดมาจากฉบับภาษาอื่นๆ[ 8 ]

จากชุดข้อมูลนี้ เราสามารถดึงข้อมูลที่กระจายอยู่หลายหน้าออกมาได้ ตัวอย่างเช่น ข้อมูลเกี่ยวกับผู้แต่งหนังสือสามารถรวบรวมได้จากหน้าต่างๆ ที่เกี่ยวกับผลงาน หรือเกี่ยวกับผู้แต่ง

หนึ่งในความท้าทายในการดึงข้อมูลจากวิกิพีเดียคือแนวคิด เดียวกัน สามารถแสดงได้โดยใช้พารามิเตอร์ที่แตกต่างกันในกล่องข้อมูลและเทมเพลตอื่นๆ เช่น|birthplace=และ|placeofbirth=ด้วยเหตุนี้ การค้นหาสถานที่เกิดของบุคคลจึงต้องค้นหาคุณสมบัติทั้งสองนี้เพื่อให้ได้ผลลัพธ์ที่สมบูรณ์ยิ่งขึ้น ด้วยเหตุนี้ ภาษาการแมป DBpedia จึงได้รับการพัฒนาขึ้นเพื่อช่วยในการแมปคุณสมบัติเหล่านี้ไปยังออนโทโลยีในขณะที่ลดจำนวนคำพ้องความหมาย เนื่องจากความหลากหลายของกล่องข้อมูลและคุณสมบัติที่ใช้ในวิกิพีเดีย กระบวนการพัฒนาและปรับปรุงการแมปเหล่านี้จึงเปิดให้สาธารณะมีส่วนร่วม[ 9 ]

เวอร์ชัน 2014 เปิดตัวในเดือนกันยายน พ.ศ. 2557 [ 10 ] การเปลี่ยนแปลงหลักจากเวอร์ชันก่อนหน้าคือวิธีการดึงข้อความบทคัดย่อ โดยเฉพาะอย่างยิ่ง การใช้มิเรอร์ของวิกิพีเดียในพื้นที่และการดึงบทคัดย่อที่แสดงผลจากมิเรอร์นั้นทำให้ข้อความที่ดึงออกมามีความสะอาดมากขึ้น นอกจากนี้ ยัง มีการนำ ชุดข้อมูลใหม่ที่ดึงมาจากวิกิมีเดียคอมมอนส์ มาใช้ด้วย

ณ เดือนมิถุนายน พ.ศ. 2564 DBpedia มีทริปเปิลมากกว่า 850 ล้านรายการ[ 11 ]

ตัวอย่าง

DBpedia ดึงข้อมูลข้อเท็จจริงจากหน้า Wikipedia ทำให้ผู้ใช้สามารถค้นหาคำตอบสำหรับคำถามที่ข้อมูลกระจัดกระจายอยู่ในบทความ Wikipedia หลายบทความได้ การเข้าถึงข้อมูลทำได้โดยใช้ภาษา การสืบค้นข้อมูลแบบSQLสำหรับRDFที่เรียกว่าSPARQL

ตัวอย่างเช่น หากใครสนใจซีรี่ส์มังงะโช โจ ของญี่ปุ่นเรื่อง Tokyo Mew Mewและต้องการค้นหาประเภทของผลงานอื่นๆ ที่เขียนโดย Mia Ikumi ผู้เป็นผู้วาดภาพประกอบ DBpedia จะรวบรวมข้อมูลจากบทความใน Wikipedia เกี่ยวกับTokyo Mew Mew , Mia Ikumiและผลงานอื่นๆ ของผู้เขียนคนนี้ เช่นSuper Doll Licca-chanและKoi Cupidเนื่องจาก DBpedia จัดระเบียบข้อมูลให้อยู่ในฐานข้อมูลเดียว จึง สามารถค้นหาได้ด้วย คำค้นหา ต่อไปนี้ โดยไม่จำเป็นต้องรู้ว่าบทความใดมีข้อมูลแต่ละส่วน และจะแสดงรายการประเภทที่เกี่ยวข้อง:

PREFIX dbprop : <http://dbpedia.org/ontology/> PREFIX db : <http://dbpedia.org/resource/> SELECT ?who , ?WORK , ?genre WHERE { db : Tokyo_Mew_Mew dbprop : author ?who . ?WORK dbprop : author ?who . OPTIONAL { ?WORK dbprop : genre ?genre } . }

กรณีศึกษา

DBpedia มีขอบเขตของเอนทิตีที่ครอบคลุมหลากหลายสาขาความรู้ของมนุษย์ทำให้เป็นศูนย์กลางที่เหมาะสมสำหรับการเชื่อมต่อชุดข้อมูล โดยชุดข้อมูลภายนอกสามารถเชื่อมโยงกับแนวคิดต่างๆ ได้[ 12 ] ชุดข้อมูล DBpedia เชื่อมโยงกันในระดับ RDF กับชุดข้อมูล Open Dataอื่นๆบนเว็บ ซึ่งช่วยให้แอปพลิเคชันสามารถเสริมข้อมูล DBpedia ด้วยข้อมูลจากชุดข้อมูลเหล่านี้ ณ เดือนกันยายน 2013 มีการเชื่อมโยงระหว่าง DBpedia กับชุดข้อมูลภายนอกมากกว่า 45 ล้านรายการ ได้แก่Freebase , OpenCyc , UMBEL , GeoNames , MusicBrainz , CIA World Factbook , DBLP , Project Gutenberg , DBtune Jamendo , Eurostat , UniProt , Bio2RDFและข้อมูลสำมะโนประชากรของสหรัฐอเมริกา[ 13 ] [ 14 ]โครงการOpenCalaisของThomson Reuters , โครงการ Linked Open Data ของThe New York Times , API ของ Zemanta [ 15 ]และDBpedia Spotlightก็มีลิงก์ไปยัง DBpedia ด้วย[ 16 ] [ 17 ] [ 18 ] BBC ใช้ DBpediaเพื่อช่วยจัดระเบียบเนื้อหา[ 19 ] [ 20 ] Faviki ใช้ DBpedia สำหรับการติดแท็กเชิงความหมาย[ 21 ] Samsungยังรวม DBpedia ไว้ใน "แพลตฟอร์มการแบ่งปันความรู้" ของตนด้วย[ 22 ]

แหล่งความรู้ข้ามโดเมนที่มีโครงสร้างมากมายเช่นนี้ถือเป็นแหล่งที่อุดมสมบูรณ์สำหรับ ระบบ ปัญญาประดิษฐ์ DBpedia ถูกใช้เป็นหนึ่งในแหล่งความรู้ในระบบที่ชนะการแข่งขันJeopardy!ของIBM Watson [ 23 ]

Amazon มี ชุดข้อมูลสาธารณะ DBpedia ที่สามารถรวมเข้ากับแอปพลิเคชันAmazon Web Services ได้ [ 24 ]

ข้อมูลเกี่ยวกับผู้สร้างจาก DBpedia สามารถนำมาใช้เพื่อเสริมข้อมูลการสังเกตการขายผลงานศิลปะได้[ 25 ]

บริษัทซอฟต์แวร์crowdsourcing ชื่อ Ushahidiได้สร้างต้นแบบซอฟต์แวร์ที่ใช้ DBpedia เพื่อทำการใส่คำอธิบายความหมายในรายงานที่สร้างโดยประชาชน ต้นแบบนี้ได้รวมบริการ "YODIE" (Yet another Open Data Information Extraction system) [ 26 ]ที่พัฒนาโดยมหาวิทยาลัย Sheffieldซึ่งใช้ DBpedia ในการใส่คำอธิบายความหมาย เป้าหมายของ Ushahidi คือการปรับปรุงความเร็วและความสะดวกในการตรวจสอบความถูกต้องของรายงานที่เข้ามา[ 27 ]

DBpedia Spotlight

DBpedia Spotlightเป็นเครื่องมือสำหรับใส่คำอธิบายประกอบให้กับข้อความที่อ้างถึงแหล่งข้อมูล DBpedia ซึ่งช่วยให้สามารถเชื่อมโยงแหล่งข้อมูลที่ไม่เป็นระเบียบเข้ากับ ระบบคลาวด์ ข้อมูลเปิดที่เชื่อมโยงผ่าน DBpedia ได้ DBpedia Spotlight ทำการดึงข้อมูล ชื่อเฉพาะ (Named Entity Extraction ) รวมถึงการตรวจจับชื่อเฉพาะและการแก้ไขชื่อ (หรือกล่าวอีกนัยหนึ่งคือ การแยกความหมาย) นอกจากนี้ยังสามารถใช้สำหรับการจดจำชื่อเฉพาะ (Named Entity Recognition ) และ งาน ดึงข้อมูล อื่นๆ ได้อีกด้วย DBpedia Spotlight มีเป้าหมายที่จะปรับแต่งได้สำหรับกรณีการใช้งานที่หลากหลาย แทนที่จะเน้นเฉพาะชื่อเฉพาะบางประเภท โครงการนี้มุ่งมั่นที่จะสนับสนุนการใส่คำอธิบายประกอบให้กับชื่อ เฉพาะและแนวคิดทั้งหมด 3.5 ล้านรายการจากมากกว่า 320 คลาสใน DBpedia โครงการนี้เริ่มต้นในเดือนมิถุนายน 2010 ที่กลุ่มระบบบนเว็บ (Web Based Systems Group) มหาวิทยาลัยเสรีแห่งเบอร์ลิน (Free University of Berlin)

DBpedia Spotlight เปิดให้ใช้งานสาธารณะในรูปแบบเว็บเซอร์วิสสำหรับการทดสอบ และเป็นAPI Java / Scala ที่ได้รับอนุญาตภายใต้Apache Licenseการแจกจ่าย DBpedia Spotlight ประกอบด้วย ปลั๊กอิน jQueryที่ช่วยให้นักพัฒนาสามารถใส่คำอธิบายประกอบในหน้าเว็บได้ทุกที่บนเว็บโดยการเพิ่มบรรทัดเดียวลงในหน้าเว็บ[ 28 ]ไคลเอนต์ยังมีให้ใช้งานใน Java หรือPHP [ 29 ] เครื่องมือนี้รองรับภาษาต่างๆ ผ่านหน้าสาธิต[ 30 ]และเว็บเซอร์วิส รองรับการใช้งานหลายภาษาสำหรับภาษาใดๆ ก็ตามที่มี Wikipedia ฉบับ[ 31 ]

ฐานข้อมูลออนโทโลยี Archivo

ตั้งแต่ปี 2020 โครงการ DBpedia ได้จัดทำฐานข้อมูลออนโทโลยีที่เข้าถึงได้ทางเว็บซึ่งเขียนด้วยภาษา Web Ontology Language (OWL) ที่ได้รับการอัปเดตอย่างสม่ำเสมอ [ 32 ] Archivo ยังมีระบบการให้คะแนนสี่ดาวสำหรับออนโทโลยีที่ดึงข้อมูลมา โดยพิจารณาจากความสามารถในการเข้าถึง คุณภาพ และเกณฑ์ความเหมาะสมในการใช้งานที่เกี่ยวข้อง ตัวอย่างเช่น จะมีการประเมินการปฏิบัติตาม SHACLสำหรับข้อมูลแบบกราฟเมื่อเหมาะสม ออนโทโลยีควรมีเมตาเดตาเกี่ยวกับลักษณะเฉพาะและระบุใบอนุญาตสาธารณะที่อธิบายเงื่อนไขการใช้งาน[ 33 ] [ 34 ] ณ เดือนมิถุนายน 2021 ฐานข้อมูล Archivo มีรายการทั้งหมด 1368 รายการ

ประวัติศาสตร์

DBpedia ริเริ่มในปี 2550 โดย Sören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann , Richard Cyganiak และZachary Ives [ 5 ]

ดูเพิ่มเติม

  • เว็บไซต์อย่างเป็นทางการแก้ไขข้อมูลนี้ได้ที่วิกิดาต้า
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=DBpedia&oldid=1356813910 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ดีบีพีเดีย

DBpedia (มาจาก "DB" ซึ่งย่อมาจาก " database ") เป็นโครงการที่มีจุดมุ่งหมายเพื่อดึงเนื้อหาที่มีโครงสร้างจากข้อมูลที่สร้างขึ้นใน โครงการ...

พื้นหลัง

โครงการนี้เริ่มต้นโดยผู้คนจาก มหาวิทยาลัยเสรีแห่งเบอร์ลิน และ มหาวิทยาลัยไลป์ซิก [ 5 ] ร่วมกับ OpenLink Software และปัจจุบันได้รับการดูแลโดยผู้คนจาก มหาวิทยาลัยมันน์ไฮม์ มหาวิทยาลัยไลป์ซิก และ มหาวิทยาลัยเพนซิลเวเนีย [ 6 ] [ 7 ] ชุด...

ชุดข้อมูล

ชุดข้อมูล DBpedia ที่เผยแพร่เมื่อเดือนเมษายน 2559 อธิบายเอนทิตี 6 ล้านรายการ โดย 5.2 ล้านรายการถูกจัดประเภทใน ออนโทโลยี ที่สอดคล้องกัน ซึ่งรวมถึงบุคคล 1.

ตัวอย่าง

DBpedia ดึงข้อมูลข้อเท็จจริงจากหน้า Wikipedia ทำให้ผู้ใช้สามารถค้นหาคำตอบสำหรับคำถามที่ข้อมูลกระจัดกระจายอยู่ในบทความ Wikipedia หลายบทความได้ การเข้าถึงข้อมูลทำได้โดยใช้ภาษา การสืบค้นข้อมูล แบบ SQL สำหรับ RDF ที่เรียกว่า SPARQL