กลับไปหน้าบทความ

อ่าน 8 นาที

กราฟความรู้

ใน การแสดงความรู้และการให้เหตุผล กราฟ ความรู้ คือ ฐานความรู้ ที่ใช้ แบบจำลองข้อมูล หรือ โทโพโลยี ที่มีโครงสร้างเป็น กราฟ เพื่อแสดงและดำเนินการกับ ข้อมูล...

กราฟความรู้

ตัวอย่างแผนภาพแนวคิด

ในการแสดงความรู้และการให้เหตุผลกราฟความรู้คือฐานความรู้ที่ใช้แบบจำลองข้อมูลหรือโทโพโลยีที่มีโครงสร้างเป็นกราฟเพื่อแสดงและดำเนินการกับข้อมูลกราฟความรู้มักใช้เพื่อจัดเก็บคำอธิบายที่เชื่อมโยงกันของเอนทิตี  – วัตถุ เหตุการณ์ สถานการณ์ หรือแนวคิดเชิงนามธรรม – ในขณะเดียวกันก็เข้ารหัสความหมายหรือความสัมพันธ์แบบอิสระที่อยู่เบื้องหลังเอนทิตีเหล่านี้[ 1 ] [ 2 ]

นับตั้งแต่การพัฒนาSemantic Webกราฟความรู้มักเกี่ยวข้องกับ โครงการ ข้อมูลเปิดที่เชื่อมโยงกันโดยมุ่งเน้นที่การเชื่อมต่อระหว่างแนวคิดและเอนทิตี[ 3 ] [ 4 ]นอกจากนี้ ในอดีตกราฟความรู้ยังเกี่ยวข้องกับและถูกใช้โดยเครื่องมือค้นหาเช่นGoogle , BingและYahoo ; เครื่องมือความรู้และบริการตอบคำถาม เช่นWolframAlpha , Siriของ Apple และAmazon Alexa ; และเครือข่ายสังคมออนไลน์ เช่นLinkedInและFacebook

การพัฒนาล่าสุดในด้านวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่องโดยเฉพาะอย่างยิ่งในเครือข่ายประสาทกราฟการเรียนรู้การแสดงแทน และการเรียนรู้ของเครื่อง ได้ขยายขอบเขตของกราฟความรู้ให้กว้างขึ้นกว่าการใช้งานแบบดั้งเดิมในเครื่องมือค้นหาและระบบแนะนำ กราฟ ความรู้ ถูกนำมาใช้มากขึ้นในการวิจัยทางวิทยาศาสตร์ โดยมีการประยุกต์ใช้ที่โดดเด่นในสาขาต่างๆ เช่นจีโนมิกส์โปรตีโอมิกส์และชีววิทยาระบบ[ 5 ]

ประวัติศาสตร์

คำนี้ถูกบัญญัติขึ้นตั้งแต่ปี 1972 โดยนักภาษาศาสตร์ ชาวออสเตรีย Edgar W. Schneiderในการอภิปรายเกี่ยวกับวิธีการสร้างระบบการเรียนการสอนแบบโมดูลาร์สำหรับหลักสูตร[ 6 ]ในช่วงปลายทศวรรษ 1980 มหาวิทยาลัย Groningenและมหาวิทยาลัย Twenteได้ร่วมกันเริ่มต้นโครงการที่เรียกว่า Knowledge Graphs โดยมุ่งเน้นที่การออกแบบเครือข่ายความหมายที่มีขอบจำกัดเฉพาะชุดความสัมพันธ์ที่จำกัด เพื่ออำนวยความสะดวกในการคำนวณพีชคณิตบนกราฟ[ 7 ]ในทศวรรษต่อมา ความแตกต่างระหว่างเครือข่ายความหมายและกราฟความรู้เริ่มเลือนลางลง

กราฟความรู้ในยุคแรกๆ บางส่วนมีความเฉพาะเจาะจงตามหัวข้อ ในปี 1985 Wordnetก่อตั้งขึ้น โดยรวบรวมความสัมพันธ์เชิงความหมายระหว่างคำและความหมาย ซึ่งเป็นการประยุกต์ใช้แนวคิดนี้กับภาษาเอง ในปี 2005 Marc Wirk ก่อตั้งGeonamesเพื่อรวบรวมความสัมพันธ์ระหว่างชื่อทางภูมิศาสตร์และสถานที่ต่างๆ และหน่วยงานที่เกี่ยวข้อง ในปี 1998 Andrew Edmonds จาก Science in Finance Ltd ในสหราชอาณาจักรได้สร้างระบบที่เรียกว่า ThinkBase ซึ่งนำเสนอ การให้เหตุผลตาม ตรรกะคลุมเครือในบริบทกราฟิก[ 8 ]

ในปี พ.ศ. 2550 ทั้งDBpediaและFreebaseก่อตั้งขึ้นในฐานะคลัง ความรู้แบบกราฟ สำหรับความรู้ทั่วไป[ 9 ] DBpedia มุ่งเน้นเฉพาะข้อมูลที่สกัดจากWikipediaในขณะที่ Freebase ยังรวมถึงชุดข้อมูลสาธารณะต่างๆ ด้วย ทั้งสองไม่ได้เรียกตัวเองว่า 'กราฟความรู้' แต่ได้พัฒนาและอธิบายแนวคิดที่เกี่ยวข้อง

ในปี 2555 Google ได้เปิดตัวKnowledge Graph [ 10 ] โดยสร้างขึ้นจาก DBpedia และ Freebase รวมถึงแหล่งข้อมูลอื่นๆ ต่อมาพวกเขาได้รวมRDFa , Microdata , เนื้อหา JSON-LDที่ดึงมาจากเว็บเพจที่จัดทำดัชนีไว้ รวมถึงCIA World Factbook , Wikidataและ Wikipedia [ 10 ] [ 11 ]ประเภทเอนทิตีและความสัมพันธ์ที่เกี่ยวข้องกับ Knowledge Graph นี้ได้รับการจัดระเบียบเพิ่มเติมโดยใช้คำศัพท์จาก คำศัพท์ schema.org [ 12 ] Google Knowledge Graph กลายเป็นส่วนเสริมของการค้นหาตามสตริงภายใน Google และความนิยมทางออนไลน์ทำให้คำนี้ถูกนำมาใช้กันอย่างแพร่หลายมากขึ้น[ 12 ]

นับตั้งแต่นั้นมา บริษัทข้ามชาติขนาดใหญ่หลายแห่งได้โฆษณาการใช้กราฟความรู้ของตน ซึ่งทำให้คำนี้เป็นที่นิยมมากขึ้น บริษัทเหล่านี้ได้แก่ Facebook , LinkedIn , Airbnb , Microsoft , Amazon , UberและeBay [ 13 ]

ในปี 2019 IEEEได้รวมการประชุมนานาชาติประจำปีเรื่อง "ความรู้ขนาดใหญ่" และ "การขุดข้อมูลและการประมวลผลอัจฉริยะ" เข้าด้วยกันเป็นการประชุมนานาชาติว่าด้วยกราฟความรู้[ 14 ]

การพัฒนารูปแบบภาษาขนาดใหญ่ได้ขยายความสนใจในกราฟความรู้ในฐานะวิธีการจัดโครงสร้างข้อมูลจากข้อความที่ไม่มีโครงสร้าง โดยความก้าวหน้าในการประมวลผลภาษาทำให้สามารถสร้างและขยายกราฟความรู้ได้โดยอัตโนมัติหรือกึ่งอัตโนมัติ[ 15 ] [ 16 ] [ 17 ] นับตั้งแต่นั้นมา คำว่ากราฟความรู้ได้ขยายขอบเขตไปรวมถึงโครงสร้างกราฟที่สร้างขึ้นแบบไดนามิกและปรับเปลี่ยนได้ ซึ่งสนับสนุนการดึงข้อมูล การให้เหตุผล และการสรุปในระบบสร้างข้อมูล ตัวอย่างการพัฒนานี้ได้แก่ GraphRAG (2024) ของ Microsoft Research ซึ่งรวมกราฟที่สร้างโดย LLM เข้ากับการสร้างข้อมูลที่เสริมด้วยการดึงข้อมูล

คำจำกัดความ

ไม่มีคำจำกัดความที่เป็นที่ยอมรับโดยทั่วไปเพียงคำเดียวสำหรับกราฟความรู้ คำจำกัดความส่วนใหญ่จะพิจารณาหัวข้อนี้ผ่านมุมมองของเว็บเชิงความหมายและรวมถึงคุณลักษณะเหล่านี้: [ 18 ]

  • ความสัมพันธ์ที่ยืดหยุ่นระหว่างความรู้ในโดเมนเฉพาะเรื่อง : กราฟความรู้ (i) กำหนดคลาสและความสัมพันธ์เชิงนามธรรมของเอนทิตีในสคีมา (ii) ส่วนใหญ่จะอธิบายเอนทิตีในโลกแห่งความเป็นจริงและความสัมพันธ์ระหว่างกัน โดยจัดเรียงเป็นกราฟ (iii) อนุญาตให้เชื่อมโยงเอนทิตีใดๆ เข้าด้วยกันได้ และ (iv) ครอบคลุมโดเมนเฉพาะเรื่องต่างๆ[ 19 ]
  • โครงสร้างทั่วไป : เครือข่ายของเอนทิตี ประเภทความหมาย คุณสมบัติ และความสัมพันธ์[ 20 ] [ 21 ]มักใช้ค่าเชิงหมวดหมู่หรือเชิงตัวเลขเพื่อแสดงคุณสมบัติ
  • การสนับสนุนการให้เหตุผลเหนือออนโทโลยีที่อนุมานได้ : กราฟความรู้ได้รับและบูรณาการข้อมูลเข้าสู่ออนโทโลยีและใช้ตัวให้เหตุผลเพื่อดึงความรู้ใหม่[ 3 ]

อย่างไรก็ตาม มีรูปแบบกราฟความรู้หลายรูปแบบที่คุณลักษณะบางอย่างเหล่านี้ไม่เกี่ยวข้อง สำหรับกราฟความรู้เหล่านั้น คำจำกัดความที่เรียบง่ายกว่านี้อาจมีประโยชน์มากกว่า:

  • โครงสร้างดิจิทัลที่แสดงความรู้ในรูปแบบของแนวคิดและความสัมพันธ์ระหว่างแนวคิดเหล่านั้น (ข้อเท็จจริง) กราฟความรู้สามารถรวมถึงออนโทโลยีที่ช่วยให้ทั้งมนุษย์และเครื่องจักรสามารถเข้าใจและให้เหตุผลเกี่ยวกับเนื้อหาได้[ 22 ] [ 23 ]

การนำไปใช้

นอกจากตัวอย่างข้างต้นแล้ว คำนี้ยังถูกใช้เพื่ออธิบายโครงการความรู้แบบเปิด เช่นYAGOและ Wikidata; สหพันธ์ต่างๆ เช่น Linked Open Data cloud; [ 24 ]เครื่องมือค้นหาเชิงพาณิชย์ต่างๆ รวมถึง Spark ผู้ช่วยการค้นหาเชิงความหมายของ Yahoo, Knowledge Graph ของ Google และ Satori ของ Microsoft; และกราฟเอนทิตีของ LinkedIn และ Facebook [ 3 ]

คำนี้ยังใช้ในบริบทของ แอปพลิ เคชันซอฟต์แวร์จดบันทึกที่อนุญาตให้ผู้ใช้สร้าง กราฟความรู้ ส่วนบุคคล[ 25 ]

การแพร่หลายของกราฟความรู้และวิธีการที่เกี่ยวข้องได้นำไปสู่การพัฒนาฐานข้อมูลกราฟ เช่น Neo4j [ 26 ] GraphDB [ 27 ]และAgensGraph [ 28 ] ฐานข้อมูลกราฟเหล่านี้ช่วยให้ผู้ใช้สามารถจัดเก็บข้อมูลเป็นเอนทิตีและความสัมพันธ์ระหว่างกัน ได้อย่างง่ายดาย และอำนวยความสะดวกในการดำเนินการต่างๆ เช่น การให้เหตุผลข้อมูล การฝังโหนด และการพัฒนาออนโทโลยีบนฐานความรู้

ในทางตรงกันข้าม กราฟความรู้เสมือนไม่ได้จัดเก็บข้อมูลในฐานข้อมูลเฉพาะ[ 29 ]โดยอาศัยฐานข้อมูลเชิงสัมพันธ์หรือดาต้าเลคเป็นพื้นฐานในการตอบคำถามบนกราฟ ระบบกราฟความรู้เสมือนดังกล่าวจะต้องได้รับการกำหนดค่าอย่างเหมาะสมเพื่อให้สามารถตอบคำถามได้อย่างถูกต้อง การกำหนดค่าเฉพาะนี้ทำได้โดยผ่านชุดของการแมปที่กำหนดความสัมพันธ์ระหว่างองค์ประกอบของแหล่งข้อมูลและโครงสร้างและออนโทโลยีของกราฟความรู้เสมือน[ 30 ]

การใช้กราฟความรู้เพื่อการให้เหตุผลกับข้อมูล

กราฟความรู้แสดงความหมายอย่างเป็นทางการโดยการอธิบายเอนทิตีและความสัมพันธ์ของเอนทิตีเหล่านั้น[ 31 ]กราฟความรู้สามารถใช้ออนโทโลยีเป็นเลเยอร์สคีมาได้ การทำเช่นนี้จะช่วยให้สามารถอนุมานเชิงตรรกะเพื่อดึงความรู้โดย นัยแทนที่จะ อนุญาตเฉพาะการสอบถามที่ร้องขอความรู้ที่ชัดเจนเท่านั้น[ 32 ]

เพื่อให้สามารถใช้กราฟความรู้ในงานการเรียนรู้ของเครื่องต่างๆ ได้ จึงได้มีการคิดค้นวิธีการต่างๆ เพื่อสร้างการแสดงคุณลักษณะแฝงของเอนทิตีและความสัมพันธ์[ 33 ]การฝังกราฟความรู้เหล่านี้ทำให้สามารถเชื่อมต่อกับวิธีการเรียนรู้ของเครื่องที่ต้องการเวกเตอร์คุณลักษณะ เช่นการฝังคำซึ่งสามารถเสริมการประมาณค่าความคล้ายคลึงเชิงแนวคิดอื่นๆ ได้[ 34 ] [ 35 ]

แบบจำลองสำหรับการสร้างการฝังกราฟความรู้ที่มีประโยชน์มักเป็นขอบเขตของเครือข่ายประสาทกราฟ (GNNs) [ 36 ] GNNs เป็นสถาปัตยกรรมการเรียนรู้เชิงลึกที่ประกอบด้วยขอบและโหนด ซึ่งสอดคล้องกับเอนทิตีและความสัมพันธ์ของกราฟความรู้ โครงสร้างโทโพโลยีและโครงสร้างข้อมูลที่ GNNs มอบให้เป็นขอบเขตที่สะดวกสำหรับการเรียนรู้แบบกึ่งกำกับดูแล โดยที่เครือข่ายได้รับการฝึกฝนให้ทำนายค่าของการฝังโหนด (โดยมีกลุ่มของโหนดที่อยู่ติดกันและขอบของโหนดเหล่านั้น) หรือขอบ (โดยมีคู่ของโหนด) งานเหล่านี้ทำหน้าที่เป็นนามธรรมพื้นฐานสำหรับงานที่ซับซ้อนกว่า เช่น การให้เหตุผลและการจัดเรียงกราฟความรู้[ 37 ]

การจัดเรียงเอนทิตี

กราฟความรู้สมมติสองกราฟที่แสดงถึงหัวข้อที่แตกต่างกัน มีโหนดหนึ่งที่สอดคล้องกับเอนทิตีเดียวกันในโลกแห่งความเป็นจริง การจัดเรียงเอนทิตีคือกระบวนการระบุโหนดดังกล่าวในกราฟหลายๆ กราฟ

เมื่อมีการสร้างกราฟความรู้ใหม่ๆ ในหลากหลายสาขาและบริบท เอนทิตีเดียวกันก็จะถูกแสดงในกราฟหลายๆ กราฟอย่างหลีกเลี่ยงไม่ได้ อย่างไรก็ตาม เนื่องจากไม่มีมาตรฐานเดียวสำหรับการสร้างหรือการแสดงกราฟความรู้ การแก้ปัญหาว่าเอนทิตีใดจากกราฟที่แตกต่างกันสอดคล้องกับหัวข้อในโลกแห่งความเป็นจริงเดียวกันจึงเป็นงานที่ไม่ง่าย งานนี้เรียกว่าการจัดเรียงเอนทิตีในกราฟความรู้และเป็นหัวข้อการวิจัยที่กำลังดำเนินอยู่[ 38 ]

กลยุทธ์สำหรับการจัดเรียงเอนทิตีโดยทั่วไปมุ่งที่จะระบุโครงสร้างย่อยที่คล้ายคลึงกัน ความสัมพันธ์เชิงความหมาย คุณลักษณะที่ใช้ร่วมกัน หรือการรวมกันของทั้งสามอย่างระหว่างกราฟความรู้สองกราฟที่แตกต่างกัน[ 39 ]วิธีการจัดเรียงเอนทิตีใช้ความคล้ายคลึงกันเชิงโครงสร้างเหล่านี้ระหว่างกราฟที่ไม่เหมือนกันโดยทั่วไปเพื่อทำนายว่าโหนดใดสอดคล้องกับเอนทิตีเดียวกัน[ 40 ]

ในปี 2023 นักวิจัยพบว่าการใช้โมเดลภาษาขนาดใหญ่ (LLMs) ประสบความสำเร็จในงานการจัดตำแหน่งเอนทิตี[ 41 ]ซึ่งเป็นผลมาจากประสิทธิภาพในการสร้างการฝังที่มีความหมายทางไวยากรณ์[ 42 ]

เมื่อปริมาณข้อมูลที่จัดเก็บในกราฟความรู้เพิ่มมากขึ้น การพัฒนาวิธีการที่เชื่อถือได้สำหรับการจัดเรียงเอนทิตีในกราฟความรู้จึงกลายเป็นขั้นตอนที่สำคัญยิ่งขึ้นในการบูรณาการและความสอดคล้องกันของข้อมูลในกราฟความรู้

ดูเพิ่มเติม

  • วิล ดักลาส เฮเวน (4 กันยายน 2020). "AI ที่รู้ทุกอย่างนี้เรียนรู้โดยการอ่านเว็บทั้งหมดอย่างต่อเนื่อง" . MIT Technology Review . สืบค้นเมื่อ5 กันยายน 2020 . Diffbot กำลังสร้างกราฟความรู้ที่ใหญ่ที่สุดเท่าที่เคยมีมาโดยการประยุกต์ใช้การจดจำภาพและการประมวลผลภาษาธรรมชาติกับเว็บเพจหลายพันล้านหน้า
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Knowledge_graph&oldid=1361483025 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ กราฟความรู้

ใน การแสดงความรู้และการให้เหตุผล กราฟ ความรู้ คือ ฐานความรู้ ที่ใช้ แบบจำลองข้อมูล หรือ โทโพโลยี ที่มีโครงสร้างเป็น กราฟ เพื่อแสดงและดำเนินการกับ ข้อมูล...

ประวัติศาสตร์

คำนี้ถูกบัญญัติขึ้นตั้งแต่ปี 1972 โดย นักภาษาศาสตร์ ชาวออสเตรีย Edgar W.

คำจำกัดความ

ไม่มีคำจำกัดความที่เป็นที่ยอมรับโดยทั่วไปเพียงคำเดียวสำหรับกราฟความรู้ คำจำกัดความส่วนใหญ่จะพิจารณาหัวข้อนี้ผ่านมุมมองของเว็บเชิงความหมายและรวมถึงคุณลักษณะเหล่านี้: [ 18 ]

การนำไปใช้

นอกจากตัวอย่างข้างต้นแล้ว คำนี้ยังถูกใช้เพื่ออธิบายโครงการความรู้แบบเปิด เช่น YAGO และ Wikidata; สหพันธ์ต่างๆ เช่น Linked Open Data cloud; [ 24 ] เครื่องมือค้นหาเชิงพาณิชย์ต่างๆ รวมถึง Spark ผู้ช่วยการค้นหาเชิงความหมายของ Yahoo, Knowledge Graph ของ Google และ...