อ่าน 8 นาที
ไวยากรณ์การเชื่อมโยง
ไวยากรณ์ลิงก์ (LG) เป็นทฤษฎี ไวยากรณ์ โดย Davy Temperley และ Daniel Sleator ซึ่งสร้างความสัมพันธ์ระหว่างคำคู่ต่างๆ แทนที่จะสร้างองค์ประกอบใน โครงสร้างลำดับชั้นของวลี ไวยากรณ์...
ไวยากรณ์การเชื่อมโยง
ไวยากรณ์ลิงก์ (LG) เป็นทฤษฎีไวยากรณ์โดย Davy Temperley และDaniel Sleatorซึ่งสร้างความสัมพันธ์ระหว่างคำคู่ต่างๆ แทนที่จะสร้างองค์ประกอบในโครงสร้างลำดับชั้นของวลี ไวยากรณ์ลิงก์คล้ายกับไวยากรณ์การพึ่งพาแต่ไวยากรณ์การพึ่งพาจะรวมความสัมพันธ์แบบหัว-ขึ้นอยู่กับ ในขณะที่ไวยากรณ์ลิงก์ทำให้ความสัมพันธ์แบบหัว-ขึ้นอยู่กับเป็นทางเลือก (ลิงก์ไม่จำเป็นต้องระบุทิศทาง) [ 1 ] ไวยากรณ์ลิงก์หลายระนาบสี (CMLG) เป็นส่วนขยายของ LG ที่อนุญาตให้มีความสัมพันธ์แบบไขว้ระหว่างคำคู่ต่างๆ[ 2 ]ความสัมพันธ์ระหว่างคำจะถูกระบุด้วยประเภทของลิงก์ทำให้ไวยากรณ์ลิงก์มีความเกี่ยวข้องอย่างใกล้ชิดกับ ไวยากรณ์ เชิง หมวดหมู่ บางประเภท
ตัวอย่างเช่น ใน ภาษา ที่มีโครงสร้างแบบประธาน-กริยา-กรรมเช่น ภาษาอังกฤษ กริยาจะหันไปทางซ้ายเพื่อสร้างส่วนต่อประสานกับประธาน และหันไปทางขวาเพื่อสร้างส่วนต่อประสานกับกรรม ส่วนคำนามจะหันไปทางขวาเพื่อสร้างส่วนต่อประสานกับประธาน หรือหันไปทางซ้ายเพื่อสร้างส่วนต่อประสานกับกรรม
ใน ภาษา ที่มีโครงสร้างแบบประธาน-กรรม-กริยาเช่นภาษาเปอร์เซียกริยาจะหันไปทางซ้ายเพื่อสร้างความสัมพันธ์กับกรรม และจะหันไปทางซ้ายที่ไกลออกไปเพื่อสร้างความสัมพันธ์กับประธาน ส่วนคำนามจะหันไปทางขวาสำหรับทั้งความสัมพันธ์กับประธานและกรรม
ภาพรวม
ไวยากรณ์การเชื่อมโยงจะเชื่อมโยงคำต่างๆ ในประโยคด้วยการเชื่อมโยง ซึ่งมีรูปแบบคล้ายกับcatenaแตกต่างจาก catena หรือไวยากรณ์การพึ่งพาแบบ ดั้งเดิม การระบุความสัมพันธ์ระหว่างประธานและกริยาเป็นทางเลือกสำหรับภาษาส่วนใหญ่ และจะกลายเป็นข้อบังคับเฉพาะในภาษาที่มีลำดับคำอิสระ (เช่นภาษาตุรกี [ 3 ]ภาษาฟินแลนด์ภาษาฮังการี ) กล่าวคือ ในภาษาอังกฤษ ความสัมพันธ์ระหว่างประธานและกริยานั้น "ชัดเจน" เนื่องจากประธานมักจะอยู่ทางซ้ายของกริยาเสมอ ดังนั้นจึงไม่จำเป็นต้องระบุการพึ่งพาอย่างเฉพาะเจาะจง ในกรณีของการสลับตำแหน่งประธานและกริยาจะใช้ประเภทการเชื่อมโยงที่แตกต่างกัน สำหรับภาษาที่มีลำดับคำอิสระ สิ่งนี้ไม่สามารถคงอยู่ได้อีกต่อไป และการเชื่อมโยงระหว่างประธานและกริยาจะต้องมีลูกศรบอกทิศทางอย่างชัดเจนเพื่อระบุว่าคำใดในสองคำนั้นเป็นคำใด
ไวยากรณ์แบบเชื่อมโยง (Link grammar) แตกต่างจากไวยากรณ์แบบพึ่งพา (Dependency grammar) แบบดั้งเดิมตรงที่อนุญาตให้มีความสัมพันธ์แบบวนรอบระหว่างคำได้ ตัวอย่างเช่น อาจมีการเชื่อมโยงที่บ่งบอกถึงทั้งกริยาหลักของประโยค ประธานหลักของประโยค และการเชื่อมโยงระหว่างประธานกับกริยา การเชื่อมโยงทั้งสามนี้จึงก่อให้เกิดวงจร (ในกรณีนี้คือรูปสามเหลี่ยม) วงจรเหล่านี้มีประโยชน์ในการจำกัดสิ่งที่อาจเป็นการตีความที่กำกวม วงจรช่วย "กระชับ" ชุดการตีความที่อนุญาตของประโยคให้แคบลง
ตัวอย่างเช่น ในการวิเคราะห์
+---->WV--->+ +--Wd--+-Ss-+--Pa--+ | | | | กำแพงด้านซ้าย เขาวิ่งเร็วมาก
ผนังด้านซ้ายแสดงจุดเริ่มต้นของประโยค หรือโหนดราก ลิงก์ WV ที่มีทิศทาง (พร้อมลูกศร) ชี้ไปที่กริยาหลักของประโยค ซึ่งก็คือลิงก์ Wall-Verb [ 4 ]ลิงก์ Wd (วาดไว้ที่นี่โดยไม่มีลูกศร) แสดงคำนามหลัก (ประธาน) ของประโยค ประเภทลิงก์Wdแสดงทั้งการเชื่อมต่อกับผนัง (W) และประโยคนั้นเป็นประโยคบอกเล่า (ประเภทย่อย "d" ตัวเล็ก) [ 5 ] ลิงก์Ssแสดงความสัมพันธ์ระหว่างประธานและกริยา โดย "s" ตัวเล็กแสดงว่าประธานเป็นเอกพจน์[ 6 ]โปรดทราบว่าลิงก์ WV, Wd และ Ss ใช้สำหรับวงจร ลิงก์ Pa เชื่อมต่อกริยากับส่วนเติมเต็ม โดย "a" ตัวเล็กแสดงว่าเป็นคำคุณศัพท์บอกลักษณะในกรณีนี้[ 7 ]
อัลกอริทึมการแยกวิเคราะห์
การวิเคราะห์โครงสร้างประโยคจะดำเนินการในลักษณะเดียวกับการประกอบจิ๊กซอว์ (ซึ่งแทนประโยคที่วิเคราะห์แล้ว) จากชิ้นส่วนจิ๊กซอว์ (ซึ่งแทนคำแต่ละคำ) [ 8 ] [ 9 ] ภาษาจะถูกแทนด้วยพจนานุกรมหรือเลกซิสซึ่งประกอบด้วยคำและชุดของ "รูปทรงจิ๊กซอว์" ที่อนุญาตให้แต่ละคำมีได้ รูปทรงจะถูกระบุด้วย "ตัวเชื่อม" ซึ่งเป็นประเภทของลิงก์ และตัวบ่งชี้ทิศทาง+หรือ-ที่ระบุขวาหรือซ้าย ตัวอย่างเช่นกริยาที่ต้องการกรรมอาจมีตัวเชื่อมS- และ O+ซึ่งบ่งชี้ว่ากริยาสามารถสร้างการเชื่อมต่อแบบประธาน (" S ") ทางด้านซ้าย (" - ") และการเชื่อมต่อแบบกรรม (" O ") ทางด้านขวา (" + ") ในทำนองเดียวกันคำนามทั่วไปอาจมีตัวเชื่อมD- และ S+ซึ่งบ่งชี้ว่าสามารถเชื่อมต่อกับคำนำหน้าทางด้านซ้าย (" D- ") และทำหน้าที่เป็นประธานเมื่อเชื่อมต่อกับกริยาทางด้านขวา (" S+ ") ขั้นตอนการแยกวิเคราะห์คือการระบุว่า ตัวเชื่อมต่อ S+สามารถเชื่อมต่อกับ ตัวเชื่อมต่อ S-เพื่อสร้างการเชื่อมโยง " S " ระหว่างสองคำ การแยกวิเคราะห์จะเสร็จสมบูรณ์เมื่อตัวเชื่อมต่อทั้งหมดเชื่อมต่อกันแล้ว
คำหนึ่งคำอาจมีรูปแบบปริศนาที่อนุญาตได้หลายสิบหรือหลายร้อยรูปแบบ (เรียกว่า "ส่วนแยก") ตัวอย่างเช่น คำกริยาหลายคำอาจเป็นคำกริยาที่ต้องการกรรมหรือไม่ก็ได้ ทำให้ ตัวเชื่อม O+เป็นตัวเลือก คำกริยาดังกล่าวอาจใช้คำขยายวิเศษณ์ ( ตัวเชื่อม E ) ซึ่งเป็นตัวเลือกโดยธรรมชาติ คำกริยาที่ซับซ้อนกว่าอาจมีตัวเชื่อมเพิ่มเติมสำหรับกรรมรอง หรือสำหรับอนุภาคหรือคำบุพบทดังนั้น ส่วนหนึ่งของการวิเคราะห์ไวยากรณ์จึงเกี่ยวข้องกับการเลือกส่วนแยกที่ไม่ซ้ำกันเพียงส่วนเดียวสำหรับคำหนึ่งคำ การวิเคราะห์ไวยากรณ์ขั้นสุดท้ายต้องตอบสนอง (เชื่อมต่อ) ตัวเชื่อม ทั้งหมดสำหรับส่วนแยกนั้น[ 10 ]
การพึ่งพา
นอกจากนี้ ตัวเชื่อมต่อยังอาจมีตัวบ่งชี้ที่ขึ้นอยู่กับหัวhและd ด้วย ในกรณีนี้ ตัวเชื่อมต่อที่มีตัวบ่งชี้หัวจะได้รับอนุญาตให้เชื่อมต่อกับตัวเชื่อมต่อที่มีตัวบ่งชี้ที่ขึ้นอยู่กับหัวเท่านั้น (หรือกับตัวเชื่อมต่อที่ไม่มีตัวบ่งชี้ hd ใดๆ) เมื่อใช้ตัวบ่งชี้เหล่านี้ ลิงก์จะถูกตกแต่งด้วยลูกศรเพื่อระบุทิศทางของลิงก์[ 9 ]
ส่วนเสริมล่าสุดช่วยลดความซับซ้อนในการกำหนดตัวเชื่อมต่อสำหรับภาษาที่มีข้อจำกัดน้อยหรือไม่มีเลยเกี่ยวกับลำดับคำ เช่นภาษาลิทัวเนียนอกจากนี้ยังมีส่วนเสริมเพื่อให้รองรับภาษาที่มีสัณฐานวิทยา แบบเชื่อมต่อ ได้ ง่ายขึ้น
ความราบเรียบ
อัลกอริทึมการแยกวิเคราะห์ยังต้องการให้กราฟสุดท้ายเป็นกราฟระนาบ กล่าวคือไม่มีลิงก์ตัดกัน[ 9 ]ข้อจำกัดนี้อิงตามหลักฐานทางจิตวิทยาภาษาศาสตร์เชิงประจักษ์ที่ว่า ในภาษาส่วนใหญ่ ในเกือบทุกสถานการณ์ ลิงก์การพึ่งพาจะไม่ตัดกันจริงๆ[ 11 ] [ 12 ]มีข้อยกเว้นที่หายาก เช่น ในภาษาฟินแลนด์ และแม้แต่ในภาษาอังกฤษ ซึ่งสามารถแยกวิเคราะห์ได้ด้วยไวยากรณ์ลิงก์โดยการแนะนำประเภทตัวเชื่อมต่อที่ซับซ้อนและเลือกได้มากขึ้นเพื่อจับสถานการณ์เหล่านี้
ต้นทุนและตัวเลือก
ตัวเชื่อมต่อสามารถมี การกำหนดราคา แบบจุดลอยตัว เพิ่มเติมได้ เพื่อให้บางตัว "ถูกกว่า" ในการใช้งานมากกว่าตัวอื่น ๆ ดังนั้นจึงให้ความสำคัญกับการแยกวิเคราะห์บางอย่างมากกว่าตัวอื่น ๆ[ 9 ] กล่าวคือ ต้นทุนรวมของการแยกวิเคราะห์คือผลรวมของต้นทุนของตัวเชื่อมต่อแต่ละตัวที่ใช้ การแยกวิเคราะห์ที่ถูกที่สุดบ่งชี้ถึงการแยกวิเคราะห์ที่มีความเป็นไปได้มากที่สุด วิธีนี้ใช้สำหรับการจัดอันดับการแยกวิเคราะห์ที่มีนัยยะกำกวมหลายรายการ ข้อเท็จจริงที่ว่าต้นทุนเป็นต้นทุนเฉพาะที่ตัวเชื่อมต่อ และไม่ใช่คุณสมบัติโดยรวมของอัลกอริทึม ทำให้ต้นทุนเหล่านี้มี ลักษณะเป็นแบบ มาร์โคเวียนโดย พื้นฐาน [ 13 ] [ 14 ] [ 15 ] [ 16 ] [ 17 ] [ 18 ]
การกำหนดค่าลอการิทึมความน่าจะเป็นให้กับการเชื่อมโยงทำให้ไวยากรณ์การเชื่อมโยงสามารถนำไปใช้ในการเลือกความหมายของความสัมพันธ์ระหว่างภาคแสดงและอาร์กิวเมนต์ได้ กล่าวคือ โครงสร้างบางอย่าง แม้ว่าจะถูกต้องตามหลักไวยากรณ์ แต่ก็มีโอกาสเกิดขึ้นน้อยมาก ด้วยวิธีนี้ ไวยากรณ์การเชื่อมโยงจึงรวบรวมแนวคิดบางอย่างที่มีอยู่ใน ไวยากรณ์ตัว ดำเนิน การ
เนื่องจากต้นทุนสามารถบวกกันได้ จึงมีพฤติกรรมคล้ายกับลอการิทึมของความน่าจะเป็น (เนื่องจากลอการิทึมของความน่าจะเป็นสามารถบวกกันได้) หรือในทำนองเดียวกัน ก็คล้ายกับเอนโทรปี (เนื่องจากเอนโทรปีสามารถบวกกันได้) สิ่งนี้ทำให้ไวยากรณ์การเชื่อมโยงเข้ากันได้กับเทคนิคการเรียนรู้ของเครื่อง เช่นแบบจำลองมาร์คอฟที่ซ่อนอยู่และอัลกอริทึมวิเทอร์บีเพราะต้นทุนการเชื่อมโยงสอดคล้องกับน้ำหนักการเชื่อมโยงในเครือข่ายมาร์คอฟหรือเครือข่ายเบย์เซียน
ทฤษฎีประเภท
ประเภทการเชื่อมโยงของไวยากรณ์ลิงก์สามารถเข้าใจได้ว่าเป็นประเภทในแง่ของทฤษฎีประเภท [ 9 ] [ 19 ] ใน ทางปฏิบัติ ไวยากรณ์ลิงก์สามารถใช้เพื่อจำลองภาษาภายใน ของ หมวดหมู่ปิดขนาดกะทัดรัดบางประเภท (ที่ไม่สมมาตร) เช่นไวยากรณ์พรีกรุ๊ปในแง่นี้ ไวยากรณ์ลิงก์ดูเหมือนจะเป็นไอโซมอร์ฟิกหรือโฮโมมอร์ฟิกกับไวยากรณ์เชิงหมวดหมู่บางประเภทดังนั้น ตัวอย่างเช่น ในไวยากรณ์เชิงหมวดหมู่ วลีคำนาม " เด็กเลว " อาจเขียนได้ดังนี้
ในขณะที่ตัวเชื่อม "หรือ" ที่สอดคล้องกันในไวยากรณ์การเชื่อมโยงจะเป็นดังนี้
เกรด: D+; แย่: A+; เด็กชาย: เกรด D และ A
กฎการย่อ (กฎการอนุมาน) ของแคลคูลัสแลมเบคสามารถแมปไปยังการเชื่อมต่อของตัวเชื่อมในไวยากรณ์ลิงก์ได้ ตัวบ่งชี้ทิศทาง +และ-สอดคล้องกับเครื่องหมายทับไปข้างหน้าและข้างหลังของไวยากรณ์เชิงหมวดหมู่ สุดท้าย ชื่อตัวอักษรเดี่ยวAและDสามารถเข้าใจได้ว่าเป็นป้ายกำกับหรือชื่อช่วยจำที่ "อ่านง่าย" สำหรับประเภทที่ค่อนข้างยาวกว่า เช่นNP/Nเป็นต้น
ความแตกต่างหลักในที่นี้คือ ไวยากรณ์เชิงหมวดหมู่มีตัวสร้างประเภท สองตัว คือ เครื่องหมายทับไปข้างหน้าและเครื่องหมายทับไปข้างหลัง ซึ่งสามารถใช้สร้างประเภทใหม่ (เช่นNP/N ) จากประเภทพื้นฐาน (เช่นNPและN ) ได้ ในขณะที่ไวยากรณ์เชิงลิงก์ละเว้นการใช้ตัวสร้างประเภท แต่เลือกที่จะกำหนดชุดประเภทพื้นฐานที่ใหญ่กว่ามาก ซึ่งมีตัวย่อที่กระชับและจำง่ายแทน
ตัวอย่าง
ตัวอย่างที่ 1
ไฟล์กฎพื้นฐานสำหรับภาษา SVO อาจมีลักษณะดังนี้:
<determiner> D+; <คำนาม-ประธาน> {D−} & S+; <คำนาม-วัตถุ> {D−} & O−; <กริยา> S− & {O+}; ดังนั้นประโยคภาษาอังกฤษ "The boy painted a picture" จะเขียนได้ดังนี้:
+-----O-----+ +-D-+--S--+ +--D--+ | | | | | เด็กชายวาดรูป
การวิเคราะห์ที่คล้ายกันนี้ใช้ได้กับภาษาจีน[ 20 ]
ตัวอย่างที่ 2
ในทางกลับกัน ไฟล์กฎสำหรับ ภาษา SOV ที่ไม่มีประธานอาจประกอบด้วยลิงก์ต่อไปนี้:
<คำนาม-ประธาน> S+; <คำนาม-วัตถุ> O+; <กริยา> {O−} & {S−}; และ ประโยคภาษาเปอร์เซียง่ายๆman nAn xordam (من نان کوردم) 'ฉันกินขนมปัง' จะมีลักษณะดังนี้: [ 21 ] [ 22 ] [ 23 ]
+-----S-----+ | +--O--+ | | | ชาย นัน ซอร์ดัม
คำสั่ง VSO สามารถรองรับได้เช่นกัน เช่น สำหรับภาษาอาหรับ[ 24 ]
ตัวอย่างที่ 3 (สัณฐานวิทยา)
ในหลายภาษาที่มีสัณฐานวิทยาแบบเรียงต่อกัน ลำต้นไม่มีบทบาททางไวยากรณ์ ไวยากรณ์ถูกกำหนดโดยส่วนต่อท้าย ดังนั้น ในภาษารัสเซียประโยค 'вверху плыли редкие облачка' อาจมีการวิเคราะห์ได้ดังนี้: [ 25 ] [ 26 ]
+------------Wd-----------+---------------SIp---------------+ | +-------EI-+ +--------เอพี--+ | | +--LLCZD-+ +-LLAQZ+ +--LLCAO-+ | | | | | | | | ผนังด้านซ้าย вверху.e плы.= =ли.vnndpp ре.= =дкие.api облачк.= =а.ndnpi
ตัวห้อย เช่น '.vnndpp' ใช้เพื่อระบุประเภททางไวยากรณ์ ตัวเชื่อมหลัก ได้แก่ Wd, EI, SIp และ Api เชื่อมคำต่อท้ายเข้าด้วยกัน โดยหลักการแล้ว คำหลักอื่นๆ สามารถปรากฏตรงนี้ได้โดยไม่เปลี่ยนแปลงโครงสร้างของประโยค ตัวเชื่อม Api ระบุคำคุณศัพท์ SIp ระบุการสลับตำแหน่งประธานและกริยา EI เป็นคำขยาย ตัวเชื่อม Wd ใช้เพื่อระบุคำนามหลัก ส่วนกริยาหลักไม่ได้ระบุไว้ในประโยคนี้ ตัวเชื่อม LLXXX ใช้เพื่อเชื่อมคำหลักกับคำต่อท้ายเท่านั้น
ตัวอย่างที่ 4 (สัทวิทยา)
ไวยากรณ์เชื่อมโยงยังสามารถบ่งชี้ความสอดคล้องทางเสียงระหว่างคำที่อยู่ใกล้เคียงกันได้อีกด้วย ตัวอย่างเช่น:
+---------เพลงประกอบ--------+ +------>WV------>+ +------Ds**x-----+ +----Wd---+-Ss*b-+ +--PHv-+----A----+ | | | | | | กำแพงด้านซ้าย นั่นคือแนวคิดเชิงนามธรรม
ในที่นี้ ตัวเชื่อม 'PH' ใช้เพื่อจำกัดคำนำหน้าคำนามที่สามารถปรากฏก่อนคำว่า 'abstract' มันจะปิดกั้น (ทำให้ใช้ยากขึ้น) การใช้คำนำหน้าคำนาม 'a' ในประโยคนี้ ในขณะที่การเชื่อมโยงกับ 'an' จะใช้ได้ง่ายขึ้น ส่วนการเชื่อมโยงอื่นๆ นั้นโดยคร่าวๆ จะคล้ายกับตัวอย่างก่อนหน้านี้ คือ S แทนประธาน O แทนกรรม และ D แทนคำนำหน้าคำนาม การเชื่อมโยง 'WV' แสดงถึงกริยาหลัก และการเชื่อมโยง 'W' แสดงถึงคำนามหลัก ตัวอักษรพิมพ์เล็กที่ตามหลังตัวอักษรพิมพ์ใหญ่จะใช้เพื่อจำแนกประเภทให้ละเอียดขึ้น เช่น D สามารถเชื่อมโยงกับคำนามเอกพจน์เท่านั้น S เชื่อมโยงกับประธานเอกพจน์เท่านั้น และ O เชื่อมโยงกับกรรมเอกพจน์เท่านั้น ตัวอักษร v พิมพ์เล็กใน PHv หมายถึง 'สระ' และตัวอักษร d พิมพ์เล็กใน Wd หมายถึงประโยคบอกเล่า
ตัวอย่างที่ 5 (ภาษาเวียดนาม)
ประโยคภาษาเวียดนาม "Bữa tiếc hôm qua là một thành công lớn" - "งานเลี้ยงเมื่อวานนี้ประสบความสำเร็จอย่างมาก" อาจแยกวิเคราะห์ได้ดังนี้: [ 27 ]
การนำไปใช้
| ตัวแยกวิเคราะห์ไวยากรณ์ลิงก์ | |
|---|---|
| นักพัฒนา | โอเพ่นค็อก |
| ปล่อย | ตุลาคม พ.ศ. 2534 [ 1 ] |
| เวอร์ชันเสถียร | |
| เขียนเป็น | C++ ; เดิมทีเป็นC |
| ระบบปฏิบัติการ | ข้ามแพลตฟอร์ม |
| แพลตฟอร์ม | จีเอ็นยู |
| พิมพ์ | เอ็นแอลแอล |
| ใบอนุญาต | LGPLv2 |
| เว็บไซต์ | opencog.github.io/link-grammar-website/ |
| ที่เก็บข้อมูล |
|
ตัวแยกวิเคราะห์ไวยากรณ์ลิงก์เป็นไลบรารีสำหรับการประมวลผลภาษาธรรมชาติที่เขียนด้วยภาษาCมีให้ใช้งานภายใต้ใบอนุญาต LGPLตัวแยกวิเคราะห์[ 30 ]เป็นโครงการที่กำลังดำเนินการอยู่ เวอร์ชันล่าสุดประกอบด้วยการครอบคลุมประโยคที่ดีขึ้น การสนับสนุนภาษารัสเซีย เปอร์เซีย และอาหรับ ต้นแบบสำหรับภาษาเยอรมัน ฮิบรู ลิทัวเนีย เวียดนาม และตุรกี และ API การเขียนโปรแกรมสำหรับPython , Java , Common LISP , AutoItและOCaml พร้อมด้วยการเชื่อม ต่อของบุคคลที่สามสำหรับPerl [ 31 ] Ruby [ 32 ]และJavaScript node.js [ 33 ]
โครงการสำคัญในปัจจุบันคือโครงการเรียนรู้ไวยากรณ์และสัณฐานวิทยาของภาษาใหม่โดยใช้อัลกอริธึมการเรียนรู้แบบไม่กำกับดูแล[ 34 ] [ 35 ]
โปรแกรม ตัวแยกวิเคราะห์ลิงก์พร้อมกฎและรายการคำศัพท์สำหรับภาษาอังกฤษสามารถพบได้ในระบบปฏิบัติการลินุกซ์ มาตรฐาน เช่น ในรูป แบบแพ็คเกจ Debianแม้ว่าหลายรายการเหล่านี้จะล้าสมัยไปหลายปีแล้วก็ตาม[ 36 ]
แอปพลิเคชัน

AbiWord [ 30 ]ซึ่งเป็น โปรแกรมประมวล ผลคำฟรี ใช้ไวยากรณ์การเชื่อมโยงสำหรับการตรวจสอบไวยากรณ์แบบเรียลไทม์ คำที่ไม่สามารถเชื่อมโยงที่ใดได้จะถูกขีดเส้นใต้ด้วยสีเขียว
ตัวแยกความสัมพันธ์เชิงความหมาย RelEx [ 37 ]ซึ่งวางซ้อนอยู่บนไลบรารีไวยากรณ์ลิงก์ จะสร้าง เอาต์พุต ไวยากรณ์การพึ่งพาโดยทำให้ความสัมพันธ์เชิงความหมายระหว่างคำในประโยคชัดเจน เอาต์พุตของมันสามารถจัดอยู่ในระดับระหว่าง SSyntR และ DSyntR ของทฤษฎีความหมาย-ข้อความนอกจากนี้ยังให้การจัดกรอบ/การวางรากฐานการแก้ปัญหาการอ้างอิง การระบุคำหลัก การ แบ่งกลุ่มคำศัพท์การระบุส่วนของคำพูด และการติดแท็ก รวมถึงการติดแท็กเอนทิตี วันที่ เงิน เพศ ฯลฯ มีโหมดความเข้ากันได้เพื่อสร้างเอาต์พุตการพึ่งพาที่เข้ากันได้กับตัวแยกวิเคราะห์ Stanford [ 38 ] และการติดแท็ ก POSที่เข้ากันได้ กับ Penn Treebank [ 39 ]
ไวยากรณ์การเชื่อมโยงยังถูกนำมาใช้สำหรับการสกัดข้อมูลจากข้อความทางการแพทย์[ 40 ] [ 41 ]และเหตุการณ์ที่อธิบายไว้ในบทความข่าว[ 42 ]รวมถึง ระบบ การแปลด้วยเครื่องจักร แบบทดลอง จากภาษาอังกฤษเป็นภาษาเยอรมัน ตุรกี อินโดนีเซีย[ 43 ]และภาษาเปอร์เซีย[ 44 ] [ 45 ]
พจนานุกรมลิงก์ไวยากรณ์ใช้ในการสร้างและตรวจสอบความถูกต้องทางไวยากรณ์ของ ระบบ สร้างภาษาธรรมชาติ ที่แตกต่างกันสาม ระบบ ได้แก่ NLGen [ 46 ] NLGen2 [ 47 ]และ microplanner/surreal [ 48 ]นอกจากนี้ยังใช้เป็นส่วนหนึ่งของไปป์ไลน์ NLP ใน โครงการ OpenCog AI ด้วย
หมายเหตุ
- ^ a b Daniel Sleator (8 กันยายน 2004). "บรรณานุกรมไวยากรณ์การเชื่อมโยง" . cmu.edu . สืบค้นเมื่อ28 สิงหาคม 2023 .
- ^ Anssi Yli-Jyrä & Matti Nykänen (2004). "ลำดับชั้นของไวยากรณ์การพึ่งพาที่ไวต่อบริบทเล็กน้อย" (PDF)ใน GP Gerhard Jäger, Paola Monachesi และ S. Wintner (บรรณาธิการ). รายงานการประชุมครั้งที่ 9 เรื่อง ไวยากรณ์เชิงรูปธรรม 2004 "FGNancy" รายงานฉบับร่างหน้า 151–165
- ^ Özlem İstek (2006). ไวยากรณ์การเชื่อมโยงสำหรับภาษาตุรกี (PDF) (วิทยานิพนธ์ปริญญาโท). อังการา ประเทศตุรกี: มหาวิทยาลัย Bilkent . สืบค้นเมื่อ2023-08-23 .
- ^ประเภทลิงก์ WV
- ^ประเภทลิงก์ W
- ^ประเภทลิงก์ S
- ^ประเภทลิงก์ P
- ^ Daniel DK Sleator; Davy Temperley (1991). "การวิเคราะห์ไวยากรณ์ภาษาอังกฤษด้วยไวยากรณ์เชื่อมโยง". arXiv : cmp-lg/9508004 .
- ^ a b c d eบทนำเกี่ยวกับตัวแยกวิเคราะห์ไวยากรณ์ลิงก์
- ^ Dennis Grinberg; John Lafferty; Daniel Sleator (1995). อัลกอริทึมการแยกวิเคราะห์ที่แข็งแกร่งสำหรับไวยากรณ์การเชื่อมโยง (PDF) . รายงานการประชุมเชิงปฏิบัติการนานาชาติครั้งที่สี่ว่าด้วยเทคโนโลยีการแยกวิเคราะห์ กรุงปราก. สืบค้นเมื่อ2023-08-28 .
- ^ J. Havelka (2007). นอกเหนือจากความเป็นเชิงฉายภาพ: การประเมินข้อจำกัดและมาตรการในโครงสร้างที่ไม่ใช่เชิงฉายภาพในหลายภาษา รายงานการประชุมประจำปีครั้งที่ 45 ของสมาคมภาษาศาสตร์เชิงคำนวณ กรุงปราก สาธารณรัฐเช็ ก: สมาคมภาษาศาสตร์เชิงคำนวณ หน้า 608–615
- ^ R. Ferrer i Cancho (2006). "ทำไมการเชื่อมโยงทางไวยากรณ์จึงไม่ข้ามกัน?" EPL . 76 (6): 1228– 1234. Bibcode : 2006EL.....76.1228C . doi : 10.1209/epl/i2006-10406-0 . hdl : 2117/180367 .
- ^ John Lafferty; Daniel Sleator; Davey Temperley (1992). Grammatical Trigrams: a Probabilistic Model of Link Grammar (PDF) . Proceedings of the AAAI Conference on Probabilistic Approaches to Natural Language.
- ^ Ramon Ferrer-i-Cancho (2013). "Hubiness, length, crossings and their relationships in dependency trees". arXiv : 1304.4086 [ cs.CL ].
- ^ D. Temperley (2008). "การลดความยาวของการพึ่งพาในภาษาธรรมชาติและภาษาประดิษฐ์" วารสารภาษาศาสตร์เชิงปริมาณ 15 ( 3): 256– 282. doi : 10.1080/09296170802159512 .
- ^ E. Gibson (2000). "ทฤษฎีความเกี่ยวข้องเชิงตำแหน่ง: ทฤษฎีเชิงระยะทางของความซับซ้อนทางภาษา" ใน Marantz, A.; Miyashita, Y.; O'Neil, W. (บรรณาธิการ). ภาพ ภาษา สมอง: บทความจากงานสัมมนาโครงการ Mind Articulation ครั้งแรกเคมบริดจ์ แมสซาชูเซตส์: สำนักพิมพ์ MIT
- ^ Haitao Liu (2009). "ระยะห่างของการพึ่งพาเป็นตัวชี้วัดความยากในการเข้าใจภาษา"วารสารวิทยาศาสตร์การรู้คิด 6 ( 6): 159– 187. doi : 10.17791/jcs.2008.9.2.159 .
- ^ Richard Futrell; Kyle Mahowald; Edward Gibson (2015). "หลักฐานขนาดใหญ่ของการลดความยาวของการพึ่งพาใน 37 ภาษา" Proceedings of the National Academy of Sciences . 112 (33): 10336– 10341. Bibcode : 2015PNAS..11210336F . doi : 10.1073/pnas.1502134112 . PMC 4547262 . PMID 26240370 .
- ^ Daniel Sleator; Davey Temperley (1993). การวิเคราะห์ไวยากรณ์ภาษาอังกฤษด้วยไวยากรณ์เชื่อมโยง (PDF)การประชุมเชิงปฏิบัติการนานาชาติครั้งที่ 3 ว่าด้วยเทคโนโลยีการวิเคราะห์ไวยากรณ์(ดูหัวข้อที่ 6 เกี่ยวกับไวยากรณ์เชิงหมวดหมู่)
- ^แคโรล หลิว (2001). "สู่ไวยากรณ์เชื่อมโยงสำหรับภาษาจีน"การประมวลผลภาษาจีนและภาษาตะวันออกด้วยคอมพิวเตอร์สมาคมคอมพิวเตอร์ภาษาจีน
- ^ John Dehdari; Deryle Lonsdale (2005). "ไวยากรณ์การเชื่อมโยงสำหรับภาษาเปอร์เซีย" (PDF) . Ohio-state.edu . เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2008-12-03
- ^ Armin Sajadi; A. Abdollahzadeh (2006). "การวิเคราะห์ไวยากรณ์ภาษาเปอร์เซียโดยใช้ไวยากรณ์เชื่อมโยง" (PDF)จดหมายของศูนย์วิจัยการประมวลผลสัญญาณอัจฉริยะ (เป็นภาษาเปอร์เซีย) 1 (9): 25– 37. เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2014-04-01
- ^ A. Sajadi; M. Homayounpour (2006). "การนำเสนอความรู้ทางสัณฐานวิทยาภาษาเปอร์เซียโดยใช้ไวยากรณ์เชื่อมโยง" จดหมายของศูนย์วิจัยการประมวลผลสัญญาณอัจฉริยะ (ภาษาเปอร์เซีย) 1 (9): 41– 55
- ^ Warren Casbeer; Jon Dehdari; Deryle Lonsdale (มีนาคม 2006). โปรแกรมวิเคราะห์ไวยากรณ์ลิงก์สำหรับภาษาอาหรับ (PDF) . มุมมองเกี่ยวกับภาษาศาสตร์อาหรับ: บทความจากการประชุมสัมมนาประจำปีด้านภาษาศาสตร์อาหรับ เล่มที่ XX. คาลามะซู รัฐมิชิแกน. เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 12 พฤษภาคม 2014
- ↑ Документация по связям и по классам слов доступна.
- ↑ Грамматика связей (ไวยากรณ์ลิงก์)
- ↑ Nguyễn Thị Thu Hịng, Nguyễn Thúc Hải, Nguyễn Thanh Thủy " Parsing complex - ประโยคประสมพร้อมส่วนขยายของตัวแยกวิเคราะห์ลิงก์ภาษาเวียดนาม รวมกับตัวแบ่งส่วนวาทกรรม " Journal of Computer Science and Cybernetics , Vol 28 , No 4 (2012)
- ^ "ดัชนีของ /Link-grammar/Downloads "
- ^ "แท็ก · opencog/Link-grammar" . GitHub .
- ^ a b AbiWord — ตัวแยกวิเคราะห์ไวยากรณ์ลิงก์
- ^ Lingua-LinkParser (อินเทอร์เฟซ Perl)
- ^ "อินเทอร์เฟซของ Ruby Link Parser" . เก็บถาวรจากต้นฉบับเมื่อ 2016-03-04 . เรียกดูเมื่อ2019-02-01 .
- ^ไลบรารี JavaScript node.js
- ^การเรียนรู้ภาษา OpenCog
- ^ Vepstas, Linas; Goertzel, Ben (2014). "การเรียนรู้ภาษาจากคลังข้อมูลขนาดใหญ่ (ที่ไม่มีคำอธิบายประกอบ)". arXiv : 1401.3372 [ cs.CL ].
- ^ Debian - ผลการค้นหาแพ็กเกจ - ไวยากรณ์ลิงก์
- ^ "RelEx Dependency Relationship Extractor" . เก็บถาวรจากต้นฉบับเมื่อ 2009-07-28 . เรียกดูเมื่อ2013-11-21 .
- ^ Stanford Parser: ตัวแยกวิเคราะห์เชิงสถิติ
- ^โครงการ Penn Treebank ถูกเก็บถาวรเมื่อวันที่ 9 พฤศจิกายน 2013 ที่ Wayback Machine
- ^ Jing Ding; Daniel Berleant; Jun Xu; Andy W. Fulmer (พฤศจิกายน 2546). "การสกัดปฏิสัมพันธ์ทางชีวเคมีจาก MEDLINE โดยใช้ตัวแยกวิเคราะห์ไวยากรณ์ลิงก์" (PDF) . รายงานการประชุม IEEE ครั้งที่ 15 ว่าด้วยเครื่องมือปัญญาประดิษฐ์ (ICTAI), 2546.หน้า 467–471 . ISBN 0-7695-2038-3เก็บถาวรจากไฟล์ต้นฉบับ(PDF)เมื่อวันที่ 31 มีนาคม 2011 เรียกดูเมื่อวันที่ 27 สิงหาคม 2023
- ^ Sampo Pyysalo, Tapio Salakoski, Sophie Aubin และ Adeline Nazarenko, "การปรับคำศัพท์ของ Link Grammar ให้เข้ากับภาษาย่อยทางการแพทย์: การประเมินเปรียบเทียบสามแนวทาง ", BMC Bioinformatics 7 (Suppl 3):S2 (2006)
- ^ Harsha V. Madhyastha; N. Balakrishnan; KR Ramakrishnan (2003). "การสกัดข้อมูลเหตุการณ์โดยใช้ไวยากรณ์การเชื่อมโยง" การประชุมเชิงปฏิบัติการนานาชาติครั้งที่ 13 ว่าด้วยประเด็นการวิจัยในวิศวกรรมข้อมูล: การจัดการข้อมูลหลายภาษา (RIDE'03)หน้า 16. doi : 10.1109/RIDE.2003.1249841 .
- ^ Teguh Bharata Adji; Baharum Baharudin; Norshuhani Zamin (2008). "การประยุกต์ใช้รูปแบบไวยากรณ์การเชื่อมโยงในการพัฒนาระบบการแปลด้วยเครื่องจักรภาษาอังกฤษ-อินโดนีเซีย" การประชุมคณิตศาสตร์คอมพิวเตอร์อัจฉริยะนานาชาติครั้งที่ 9, AISC 2008, การประชุมสัมมนาครั้งที่ 15, Calculemus 2008, การประชุมนานาชาติครั้งที่ 7, เบอร์มิงแฮม สหราชอาณาจักร, เอกสารประกอบการประชุมหน้า 17–23 . doi : 10.1007/978-3-540-85110-3_3 .
- ^ A.Sajadi และ MR Borujerdi, "การแปลด้วยเครื่องจักรโดยใช้ไวยากรณ์การเชื่อมโยง", ส่งไปยังวารสาร Journal of Computational Linguistics , MIT Press (กุมภาพันธ์ 2009)
- ^ Sajadi, Armin; Borujerdi, Mohammad Reza M. (2013). "การแปลด้วยเครื่องจักรโดยใช้ไวยากรณ์การเชื่อมโยงแบบรวม" Artificial Intelligence Review . 39 (2): 109– 132. doi : 10.1007/s10462-011-9261-7 .
- ^ Ruiting Lianและคณะ "การสร้างประโยคสำหรับสมองเทียม: แนวทางการจับคู่ความคล้ายคลึงแบบโลกาภิวัตน์" Neurocomputing (Elsevier) (2009 ส่งเพื่อตีพิมพ์)
- ^ Blake Lemoine, NLGen2: ระบบสร้างภาษาธรรมชาติอเนกประสงค์ที่สมเหตุสมผลทางภาษาศาสตร์ (2009)
- ^ไมโครแพลนเนอร์และการสร้างพื้นผิว (SuReal)
ลิงก์ภายนอก
- หน้าแรกของ Link Grammar เดิม (ซึ่งถูกแทนที่ด้วยโปรเจกต์ปัจจุบันแล้ว เก็บถาวรจากต้นฉบับ )
- ตัวอย่างการใช้งานภาษาอังกฤษออนไลน์ (สำหรับเวอร์ชันเก่าที่ไม่ทันสมัยแล้ว มีการแก้ไขข้อผิดพลาดหลายอย่างในเวอร์ชันนี้แล้ว)
- BioLGคือการดัดแปลง Link Grammar Parser ที่ปรับให้เหมาะสมกับโดเมนชีวการแพทย์ (การปรับปรุง BioLG หลายอย่าง แต่ไม่ใช่ทั้งหมด ได้ถูกนำกลับไปรวมไว้ในชุดการแจกจ่าย Link Grammar หลักแล้ว)
- การวิเคราะห์ประโยคด้วย Link Grammar และ PythonโดยJeff Elmoreในงาน PyCon 2012
ส่วนขยายภาษา
- ส่วนขยายไวยากรณ์การเชื่อมโยงภาษาอาหรับ ( แพ็กเกจซอร์สโค้ด )
- ส่วนขยายไวยากรณ์ลิงก์ภาษาเปอร์เซีย
- การสาธิตภาษาเปอร์เซียออนไลน์
- การสาธิตไวยากรณ์ภาษารัสเซีย
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ไวยากรณ์การเชื่อมโยง
ไวยากรณ์ลิงก์ (LG) เป็นทฤษฎี ไวยากรณ์ โดย Davy Temperley และ Daniel Sleator ซึ่งสร้างความสัมพันธ์ระหว่างคำคู่ต่างๆ แทนที่จะสร้างองค์ประกอบใน โครงสร้างลำดับชั้นของวลี ไวยากรณ์...
ภาพรวม
ไวยากรณ์การเชื่อมโยงจะเชื่อมโยงคำต่างๆ ในประโยคด้วยการเชื่อมโยง ซึ่งมีรูปแบบคล้ายกับ catena แตกต่างจาก catena หรือ ไวยากรณ์การพึ่งพาแบบ ดั้งเดิม การระบุความสัมพันธ์ระหว่างประธานและกริยาเป็นทางเลือกสำหรับภาษาส่วนใหญ่ และจะกลายเป็นข้อบังคับเฉพาะใน ภาษา...
อัลกอริทึมการแยกวิเคราะห์
การวิเคราะห์โครงสร้างประโยคจะดำเนินการในลักษณะเดียวกับการประกอบ จิ๊กซอว์ (ซึ่งแทนประโยคที่วิเคราะห์แล้ว) จากชิ้นส่วนจิ๊กซอว์ (ซึ่งแทนคำแต่ละคำ) [ 8 ] [ 9 ] ภาษาจะถูกแทนด้วยพจนานุกรมหรือ เลกซิส ซึ่งประกอบด้วยคำและชุดของ "รูปทรงจิ๊กซอว์"...
การพึ่งพา
นอกจากนี้ ตัวเชื่อมต่อยังอาจมีตัวบ่งชี้ที่ขึ้นอยู่กับหัว h และ d ด้วย ในกรณีนี้ ตัวเชื่อมต่อที่มีตัวบ่งชี้หัวจะได้รับอนุญาตให้เชื่อมต่อกับตัวเชื่อมต่อที่มีตัวบ่งชี้ที่ขึ้นอยู่กับหัวเท่านั้น (หรือกับตัวเชื่อมต่อที่ไม่มีตัวบ่งชี้ hd ใดๆ)...
