อ่าน 4 นาที
เปิดใจกว้าง ใช้สามัญสำนึก
Open Mind Common Sense ( OMCS ) เป็น โครงการ ปัญญาประดิษฐ์ที่ตั้งอยู่ที่ห้องปฏิบัติการสื่อ ของ สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) โดยมีเป้าหมายเพื่อสร้างและใช้ฐานความรู้สามัญสำนึก..
เปิดใจกว้าง ใช้สามัญสำนึก
Open Mind Common Sense ( OMCS ) เป็น โครงการ ปัญญาประดิษฐ์ที่ตั้งอยู่ที่ห้องปฏิบัติการสื่อ ของ สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) โดยมีเป้าหมายเพื่อสร้างและใช้ฐานความรู้สามัญสำนึก ขนาดใหญ่ จากผลงานของผู้คนหลายพันคนทั่วเว็บ โครงการนี้ดำเนินงานมาตั้งแต่ปี 1999 ถึง 2016
นับตั้งแต่ก่อตั้งขึ้น Open Mind Common Sense ได้รวบรวมข้อเท็จจริงภาษาอังกฤษมากกว่าหนึ่งล้านรายการจากผู้ร่วมให้ข้อมูลกว่า 15,000 ราย รวมถึงฐานความรู้ในภาษาอื่นๆ ซอฟต์แวร์ส่วนใหญ่ของ OMCS สร้างขึ้นจากการแสดงผลที่เชื่อมโยงกันสามแบบ ได้แก่ คลังข้อมูลภาษาธรรมชาติที่ผู้คนโต้ตอบโดยตรง เครือข่ายความหมายที่สร้างจากคลังข้อมูลนี้เรียกว่าConceptNet และการแสดงผล ConceptNet ในรูปแบบเมทริกซ์ที่เรียกว่า AnalogySpace ซึ่งสามารถอนุมานความรู้ใหม่โดยใช้การลดมิติ [ 1 ] ความรู้ที่รวบรวมโดยOpen Mind Common Sense ได้ช่วยให้โครงการวิจัยที่ MIT และที่อื่นๆ ประสบความสำเร็จ
ประวัติศาสตร์
โครงการนี้เป็นผลงานของMarvin Minsky , Push Singh, Catherine Havasiและคนอื่นๆ งานพัฒนาเริ่มขึ้นในเดือนกันยายน พ.ศ. 2542 และโครงการเปิดให้ใช้งานบนอินเทอร์เน็ตในอีกหนึ่งปีต่อมา Havasi อธิบายไว้ในวิทยานิพนธ์ของเธอว่า "เป็นการพยายามที่จะ... ใช้ประโยชน์จากพลังการประมวลผลของมนุษย์แบบกระจายบนอินเทอร์เน็ต ซึ่งเป็นแนวคิดที่ยังอยู่ในช่วงเริ่มต้นเท่านั้น" [ 2 ] OMCSดั้งเดิมได้รับอิทธิพลจากเว็บไซต์Everything2และรุ่นก่อนหน้า และนำเสนออินเทอร์เฟซแบบมินิมัลลิสต์ที่ได้รับแรงบันดาลใจจากGoogle
Push Singh น่าจะได้เป็นศาสตราจารย์ที่MIT Media Labและเป็นผู้นำกลุ่ม Common Sense Computing ในปี 2007 แต่เขาฆ่าตัวตายในวันที่ 28 กุมภาพันธ์ 2006 [ 3 ]
ปัจจุบันโครงการนี้ดำเนินการโดยกลุ่ม Digital Intuition Group ที่ MIT Media Lab ภายใต้การดูแลของ Catherine Havasi
ฐานข้อมูลและเว็บไซต์
OMCS มีความรู้หลายประเภท ข้อความบางส่วนสื่อถึงความสัมพันธ์ระหว่างวัตถุหรือเหตุการณ์ โดยแสดงออกมาในรูปแบบวลีง่ายๆ ของภาษาธรรมชาติ ตัวอย่างเช่น "เสื้อโค้ทใช้สำหรับให้ความอบอุ่น" "ดวงอาทิตย์ร้อนมาก" และ "สิ่งสุดท้ายที่คุณทำเมื่อทำอาหารเย็นคือล้างจาน" ฐานข้อมูลยังประกอบด้วยข้อมูลเกี่ยวกับเนื้อหาทางอารมณ์ของสถานการณ์ต่างๆ เช่น "การใช้เวลากับเพื่อนทำให้มีความสุข" และ "การประสบอุบัติเหตุทางรถยนต์ทำให้โกรธ" OMCS ยังมีข้อมูลเกี่ยวกับความปรารถนาและเป้าหมายของผู้คน ทั้งเล็กและใหญ่ เช่น "ผู้คนต้องการได้รับการเคารพ" และ "ผู้คนต้องการกาแฟที่ดี" [ 1 ]
เดิมที ข้อความเหล่านี้สามารถป้อนลงในเว็บไซต์ได้ในรูปแบบประโยคข้อความที่ไม่จำกัด ซึ่งจะต้องนำมาวิเคราะห์ในภายหลัง เวอร์ชันปัจจุบันของเว็บไซต์จะรวบรวมความรู้โดยใช้แม่แบบเติมคำในช่องว่างที่มีโครงสร้างมากขึ้นเท่านั้น OMCS ยังใช้ข้อมูลที่รวบรวมโดยเกมที่มีจุดประสงค์ " Verbosity " อีกด้วย [ 4 ]
ในรูปแบบดั้งเดิม ฐานข้อมูล OMCS เป็นเพียงชุดของประโยคสั้นๆ ที่สื่อถึงความรู้ทั่วไปบางอย่าง เพื่อที่จะนำความรู้นี้ไปใช้ในเชิงคำนวณ จำเป็นต้องแปลงให้เป็นรูปแบบที่มีโครงสร้างมากขึ้น
คอนเซ็ปต์เน็ต
ConceptNet เป็นเครือข่ายความหมายที่อิงตามข้อมูลในฐานข้อมูล OMCS ConceptNet แสดงเป็นกราฟแบบมีทิศทาง โดยที่โหนดคือแนวคิด และขอบคือข้อความยืนยันสามัญสำนึกเกี่ยวกับแนวคิดเหล่านี้ แนวคิดแสดงถึงชุดของวลีภาษาธรรมชาติที่เกี่ยวข้องอย่างใกล้ชิด ซึ่งอาจเป็นวลีคำนาม วลีคำกริยา วลีคุณศัพท์ หรืออนุประโยค[ 5 ]
ConceptNet ถูกสร้างขึ้นจากการยืนยันภาษาธรรมชาติใน OMCS โดยการจับคู่กับรูปแบบโดยใช้ตัวแยกวิเคราะห์แบบตื้น การยืนยันจะแสดงเป็นความสัมพันธ์ระหว่างสองแนวคิด ซึ่งเลือกจากชุดความสัมพันธ์ที่เป็นไปได้ที่จำกัด ความสัมพันธ์ต่างๆ แสดงถึงรูปแบบประโยคทั่วไปที่พบในคลังข้อมูล OMCS และโดยเฉพาะอย่างยิ่ง แม่แบบ "เติมคำในช่องว่าง" ทุกแบบที่ใช้ในเว็บไซต์รวบรวมความรู้จะเชื่อมโยงกับความสัมพันธ์เฉพาะ[ 5 ]
โครงสร้างข้อมูลที่ประกอบขึ้นเป็น ConceptNet ได้รับการจัดระเบียบใหม่อย่างมีนัยสำคัญในปี 2550 และเผยแพร่เป็น ConceptNet 3 [ 5 ]ปัจจุบันกลุ่ม Software Agents แจกจ่ายฐานข้อมูลและ API สำหรับเวอร์ชัน 4.0 ใหม่[ 6 ]
ในปี 2010 แคทเธอรีน ฮาวาซี ผู้ร่วมก่อตั้งและผู้อำนวยการของ OMCS ร่วมกับโรบิน สเปียร์ เดนนิส คลาร์ก และเจสัน อลอนโซ ได้สร้างLuminosoบริษัทซอฟต์แวร์วิเคราะห์ข้อความที่สร้างขึ้นบน ConceptNet [ 7 ] [ 8 ] [ 9 ] [ 10 ]โดยใช้ ConceptNet เป็นแหล่งข้อมูลคำศัพท์หลักเพื่อช่วยให้ธุรกิจเข้าใจและดึงข้อมูลเชิงลึกจากข้อมูลเชิงคุณภาพจำนวนมหาศาล รวมถึงแบบสำรวจ รีวิวผลิตภัณฑ์ และโซเชียลมีเดีย[ 7 ] [ 11 ] [ 12 ]
เครื่องมือการเรียนรู้ของเครื่อง
ข้อมูลใน ConceptNet สามารถใช้เป็นพื้นฐานสำหรับ อัลกอริธึม การเรียนรู้ของเครื่องได้การนำเสนอรูปแบบหนึ่งที่เรียกว่า AnalogySpace ใช้การแยกส่วนค่าเอกลักษณ์เพื่อสรุปและแสดงรูปแบบในความรู้ใน ConceptNet ในลักษณะที่สามารถนำไปใช้ในแอปพลิเคชัน AI ได้ ผู้สร้างได้เผยแพร่ชุดเครื่องมือการเรียนรู้ของเครื่อง Python ที่เรียกว่า Divisi [ 13 ]สำหรับดำเนินการเรียนรู้ของเครื่องโดยอิงจากคลังข้อความฐานความรู้ที่มีโครงสร้าง เช่น ConceptNet และการผสมผสานของทั้งสองอย่าง
เมื่อเปรียบเทียบกับโครงการอื่นๆ
โครงการอื่นๆ ที่คล้ายกัน ได้แก่Never-Ending Language Learning , Mindpixel (ยุติแล้ว), Cyc , Learner, SenticNet, Freebase , YAGO , DBpediaและ Open Mind 1001 Questions ซึ่งได้สำรวจแนวทางทางเลือกในการรวบรวมความรู้และให้แรงจูงใจในการมีส่วนร่วม
โครงการ Open Mind Common Sense แตกต่างจาก Cyc เนื่องจากมุ่งเน้นการนำเสนอความรู้สามัญสำนึกที่รวบรวมไว้ในรูปแบบประโยคภาษาอังกฤษ แทนที่จะใช้โครงสร้างเชิงตรรกะที่เป็นทางการ ConceptNet ได้รับการอธิบายโดย Hugo Liu หนึ่งในผู้สร้าง ว่ามีโครงสร้างคล้ายกับWordNetมากกว่า Cyc เนื่องจาก "เน้นการเชื่อมโยงแนวคิดที่ไม่เป็นทางการมากกว่าความเข้มงวดทางภาษาที่เป็นทางการ" [ 14 ]
ดูเพิ่มเติม
- Attempto Controlled English (ACE) ซึ่งเป็นภาษาธรรมชาติที่ถูกควบคุม
- การเรียนรู้ภาษาที่ไม่สิ้นสุด
- Mindpixel
- เว็บเชิงความหมาย
- ดีบีพีเดีย
- ฟรีเบส (ฐานข้อมูล)
- YAGO (ฐานข้อมูล)
ลิงก์ภายนอก
- คลังข้อมูลขนาดใหญ่ของ Open Mind Common Sense บน Github
- คอนเซ็ปต์เน็ต
- พื้นที่เปรียบเทียบ
- ชุดเครื่องมืออนุมาน Divisi
- เว็บไซต์ของ Commonsense Computing Initiative (เว็บไซต์นี้ไม่มีอยู่จริง)
- โครงการเปิดใจ (เว็บไซต์ไม่มีอยู่จริง)
- OMCSNetCPP - เครื่องมือประมวลผลอนุมานแบบโอเพนซอร์สที่เขียนด้วยภาษา C++ โดยใช้ข้อมูลจาก OMCSNet
- เปิดใจกว้างและใช้สามัญสำนึกในบราซิล (เว็บไซต์ใช้งานไม่ได้)
- ความเข้าใจอย่างลึกซึ้งด้วยหัวใจที่เปิดกว้าง - ความเข้าใจด้านอารมณ์ผ่านงานศิลปะ (หน้าเพจสืบทอด)
- ห้องปฏิบัติการปฏิสัมพันธ์ขั้นสูง
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เปิดใจกว้าง ใช้สามัญสำนึก
Open Mind Common Sense ( OMCS ) เป็น โครงการ ปัญญาประดิษฐ์ที่ตั้งอยู่ที่ห้องปฏิบัติการสื่อ ของ สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) โดยมีเป้าหมายเพื่อสร้างและใช้ฐานความรู้สามัญสำนึก..
ประวัติศาสตร์
โครงการนี้เป็นผลงานของ Marvin Minsky , Push Singh, Catherine Havasi และคนอื่นๆ งานพัฒนาเริ่มขึ้นในเดือนกันยายน พ.ศ. 2542 และโครงการเปิดให้ใช้งานบนอินเทอร์เน็ตในอีกหนึ่งปีต่อมา Havasi อธิบายไว้ในวิทยานิพนธ์ของเธอว่า "เป็นการพยายามที่จะ...
ฐานข้อมูลและเว็บไซต์
OMCS มีความรู้หลายประเภท ข้อความบางส่วนสื่อถึงความสัมพันธ์ระหว่างวัตถุหรือเหตุการณ์ โดยแสดงออกมาในรูปแบบวลีง่ายๆ ของภาษาธรรมชาติ ตัวอย่างเช่น "เสื้อโค้ทใช้สำหรับให้ความอบอุ่น" "ดวงอาทิตย์ร้อนมาก" และ "สิ่งสุดท้ายที่คุณทำเมื่อทำอาหารเย็นคือล้างจาน"...
คอนเซ็ปต์เน็ต
ConceptNet เป็น เครือข่ายความหมาย ที่อิงตามข้อมูลในฐานข้อมูล OMCS ConceptNet แสดงเป็นกราฟแบบมีทิศทาง โดยที่โหนดคือแนวคิด และขอบคือข้อความยืนยันสามัญสำนึกเกี่ยวกับแนวคิดเหล่านี้ แนวคิดแสดงถึงชุดของวลีภาษาธรรมชาติที่เกี่ยวข้องอย่างใกล้ชิด ซึ่งอาจเป็นวลีคำนาม...