กลับไปหน้าบทความ

อ่าน 7 นาที

ความหมายเชิงเส้น

ใน ด้านภาษาศาสตร์ และ การศึกษา คำอธิบายระหว่างบรรทัด ( interlinear gloss) คือคำ อธิบาย (ชุดคำอธิบายสั้นๆ เช่น คำจำกัดความหรือการออกเสียง) ที่วางไว้ระหว่างบรรทัด เช่น...

ความหมายเชิงเส้น

ในด้านภาษาศาสตร์และการศึกษา คำอธิบายระหว่างบรรทัด ( interlinear gloss)คือคำอธิบาย (ชุดคำอธิบายสั้นๆ เช่น คำจำกัดความหรือการออกเสียง) ที่วางไว้ระหว่างบรรทัด เช่น ระหว่างบรรทัดของข้อความต้นฉบับและการแปลเป็นภาษา อื่น เมื่อมีการใส่คำอธิบายแล้ว แต่ละบรรทัดของข้อความต้นฉบับจะได้รับบรรทัดการถอดความที่สอดคล้องกันหนึ่งบรรทัดหรือมากกว่านั้น ซึ่งเรียกว่าข้อความระหว่างบรรทัดหรือข้อความที่มีคำอธิบายระหว่างบรรทัด ( IGT ) – เรียกสั้นๆ ว่า interlinearคำอธิบายเหล่านี้ช่วยให้ผู้อ่านติดตามความสัมพันธ์ระหว่างข้อความต้นฉบับ และการแปล รวมถึงโครงสร้างของภาษาต้นฉบับ ในรูปแบบที่ง่ายที่สุด คำอธิบายระหว่างบรรทัดคือการแปล ข้อความ ต้นฉบับแบบคำต่อคำอย่างตรงตัว

ประวัติศาสตร์

ข้อความแทรกในToussaint–Langenscheidt Spanischหนังสือ เรียน ภาษาสเปนสำหรับ ผู้พูดภาษา เยอรมันพ.ศ. 2453

การใส่คำอธิบายความหมายแบบบรรทัดต่อบรรทัดถูกนำมาใช้เพื่อวัตถุประสงค์ที่หลากหลายมาเป็นเวลานานแล้ว การใช้งานที่พบได้ทั่วไปอย่างหนึ่งคือการใส่คำอธิบายประกอบในตำราเรียนสองภาษาสำหรับการศึกษาภาษา การใส่คำอธิบายความหมายแบบบรรทัดต่อบรรทัดในลักษณะนี้ช่วยให้ความหมายของข้อความต้นฉบับชัดเจนขึ้นโดยไม่ต้องพยายามจำลองลักษณะโครงสร้างของภาษาต้นฉบับอย่างเป็นทางการ

บางครั้งคำอธิบายดังกล่าวไม่ได้แสดงออกมาในรูปแบบการจัดวางแบบบรรทัดต่อบรรทัด แต่แสดงออกมาในรูปแบบการแจงนับคำในภาษาวัตถุและภาษาเมตา ตัวอย่างหนึ่งคือคำอธิบายของWilhelm von Humboldt เกี่ยวกับ ภาษา Nahuatl คลาสสิก : [ 1 ]

1

นิ-

1

อิช

2

ซี-

3

มาเช่

3

ชิหุย

2

เอส

4

-เลีย

4

ขน

5

ใน

5

เดอร์

6

เลขที่-

6

ฉัน

7

พิลต์ซิน

7

ซอน

8

ซี

8

หนึ่ง

9

คอลลี

9

บ้าน

1 2 3 4 5 6 7 8 9

ni- c- chihui -lia ใน no- piltzin ce calli

1 3 2 4 5 6 7 8 9

ฉันมาเช่เอสเฟือร์เดอร์ไมน์ โซห์น ไอน์ เฮาส์

รูปแบบ "แทรกในข้อความ" นี้ช่วยให้สามารถแทรกตัวอย่างไว้ในเนื้อหาได้ และช่วยให้ลำดับคำในภาษาเป้าหมายเขียนในลำดับที่ใกล้เคียงกับไวยากรณ์ของภาษาเป้าหมาย (ในคำอธิบายนี้ คำว่าmache esถูกเรียงลำดับใหม่จากลำดับคำในภาษาต้นฉบับเพื่อให้ใกล้เคียงกับไวยากรณ์ภาษาเยอรมันอย่างเป็นธรรมชาติมากขึ้น) ถึงกระนั้น วิธีการนี้ก็ยังต้องการให้ผู้อ่าน "ปรับแนว" ความสอดคล้องกันระหว่างรูปแบบในภาษาต้นฉบับและภาษาเป้าหมายอีกครั้ง

แนวทางที่ทันสมัยกว่าในศตวรรษที่ 19 และ 20 หันมาใช้การอธิบายความหมายในแนวตั้ง โดยจัดเรียงเนื้อหาแบบคำต่อคำในลักษณะที่คำศัพท์เฉพาะทางภาษาจะอยู่ด้านล่างคำศัพท์ในภาษาต้นฉบับในแนวตั้ง ในรูปแบบนี้ ตัวอย่างที่ให้มาอาจแปลได้ดังนี้ (นี่คือคำอธิบายความหมายภาษาอังกฤษ):

นิ-

ฉัน

ซี-

มัน

ชิหุย

ทำ

-เลีย

สำหรับ

ใน

ถึง-

เลขที่-

ของฉัน

พิลต์ซิน

ลูกชาย

ซี

เอ

คอลลี

บ้าน

ni- c- chihui -lia ใน no- piltzin ce calli

ฉันสร้างบ้านให้ลูกชายของฉัน

"ฉันสร้างบ้านให้ลูกชายของฉัน"

ในกรณีนี้ ลำดับของคำจะถูกกำหนดโดยไวยากรณ์ของภาษาเป้าหมาย

ในที่สุด นักภาษาศาสตร์สมัยใหม่ก็ได้นำแนวปฏิบัติในการใช้ ป้ายกำกับ หมวดหมู่ทางไวยากรณ์ แบบย่อ มาใช้ สิ่งพิมพ์ในปี 2008 ซึ่งทำซ้ำตัวอย่างนี้ได้ติดป้ายกำกับไว้ดังนี้: [ 2 ]

พรรณี-ชิฮุย-เลีย

1SG . SUBJ - 3SG . OBJ -mach- APPL

ใน

ดีที

โน-พิลต์ซิน

1SG . POSS -Sohn

ซี

หนึ่ง

คอลลี

บ้าน

ni-c-chihui-lia ใน no-piltzin ce calli

1SG.SUBJ-3SG.OBJ-mach-APPL DET 1SG.POSS-Sohn ein Haus

วิธีการนี้มีความหนาแน่นกว่าและต้องใช้ความพยายามในการอ่านมากกว่า แต่พึ่งพาโครงสร้างทางไวยากรณ์ของภาษาเมตาในการแสดงความหมายของรูปแบบเป้าหมายน้อยกว่า

ในด้านคอมพิวเตอร์ มีเครื่องหมายข้อความพิเศษอยู่ในบล็อก Unicode พิเศษเพื่อระบุจุดเริ่มต้นและจุดสิ้นสุดของคำอธิบายความหมายแบบบรรทัดต่อบรรทัด

โครงสร้าง

แม้ว่าจะไม่มีข้อกำหนดอย่างเป็นทางการสำหรับรูปแบบ IGT แต่กฎ Leipzig Glossing [ 3 ]เป็นชุดแนวทางที่มุ่งทำให้รูปแบบเป็นมาตรฐานมากที่สุดเท่าที่จะเป็นไปได้

โดยทั่วไปแล้ว ข้อความแปลแบบบรรทัดต่อบรรทัดสำหรับวิชาภาษาศาสตร์จะประกอบด้วยส่วนต่างๆ ต่อไปนี้ทั้งหมดหรือบางส่วน โดยปกติจะเรียงลำดับจากบนลงล่างดังนี้:

  • การสะกดคำดั้งเดิม(โดยทั่วไปจะเป็นตัวเอียงหรือตัวเอียงหนา )
  • การถอดเสียงตามแบบแผนดั้งเดิมเป็นอักษรละติน
  • การถอดเสียงตามหลักสัทศาสตร์
  • การถอดเสียงตามหลักสัทศาสตร์และสัณฐานวิทยา
  • การแปลความหมาย แบบคำต่อคำหรือหน่วยคำต่อหน่วยคำ โดยที่หน่วยคำภายในคำจะถูกคั่นด้วยเครื่องหมายขีดกลางหรือเครื่องหมายวรรคตอนอื่นๆ

และสุดท้าย

  • เป็นการแปลแบบอิสระ ซึ่งอาจจัดไว้ในย่อหน้าแยกต่างหาก หรือในหน้าตรงข้าม หากโครงสร้างของภาษาแตกต่างกันมากเกินไปจนไม่สามารถแปลตามบรรทัดของข้อความได้

ตัวอย่างเช่น ประโยคภาษา หมิ่นหนานของไต้หวัน ต่อไปนี้ ได้รับการถอดความด้วยข้อความห้าบรรทัด:

1. การทับศัพท์มาตรฐานเพฺโฮ-โอเอ-จี
2. การเคลือบเงาโดยใช้หมายเลขโทนสีสำหรับโทนสีพื้นผิว
3. คำอธิบายที่แสดงวรรณยุกต์พื้นฐานในรูปแบบอ้างอิง (ก่อนที่จะเกิดการเปลี่ยนแปลงวรรณยุกต์ )
4. คำอธิบายความหมายแบบคำต่อคำในภาษาอังกฤษและ
5. คำแปลภาษาอังกฤษ: [ 4 ]

(1.)

(2.)

(3.)

(4.)

โกอา

กัว1

กัว2

ฉัน

iáu-boē

iau 1 -boe 3

iau 2 -boe 7

ยังไม่ใช่

โคอาต-เต็ง

koat 2 -teng 3

koat 4 -teng 7

ตัดสินใจ

ถังซี

ถัง7 -si 5

ถัง1 -si 5

เมื่อไร

โบห์

โบห์2

โบห์4

ต้องการ

tńg-khì

tng 1 -khi 3 .

tng 2 -khi 3 .

กลับ.

(1.) goá iáu-boē koat-tēng tang-sî boeh tńg-khì

(2.) goa1 iau1-boe3 koat2-teng3 tang7-si5 boeh2 tng1-khi3

(3.) goa2 iau2-boe7 koat4-teng7 tang1-si5 boeh4 tng2-khi3.

(4.) ฉันยังไม่ได้ตัดสินใจว่าจะกลับเมื่อไหร่

(5.) "ฉันยังไม่ได้ตัดสินใจว่าจะกลับเมื่อไหร่"

การจัดเรียงคำต่อคำตามกฎการจัดเรียงคำศัพท์ของไลป์ซิก การจัดแนวคำในภาษาเป้าหมายให้ชิดซ้ายกับคำที่สอดคล้องกันในภาษาเมตาถือเป็นมาตรฐาน การจัดเรียงนี้สามารถเห็นได้ระหว่างบรรทัด (1-3) และบรรทัด (4)

การจับคู่แบบมอร์ฟีมต่อมอร์ฟีมในระดับย่อยของคำ มอร์ฟีมที่แบ่งส่วนได้จะถูกคั่นด้วยเครื่องหมายยัติภังค์ ทั้งในตัวอย่างและในคำอธิบาย ควรมีจำนวนเครื่องหมายยัติภังค์เท่ากันทั้งในตัวอย่างและในคำอธิบาย ดังแสดงในตัวอย่างต่อไปนี้จากภาษาเลซเกียน :

กิลา

ตอนนี้

อาบูร์-อุน

พวกเขา - โอ.บี. - พลเอก

เฟอร์มา

ฟาร์ม

hamišaluǧ

ตลอดไป

กุ้ยจือน่า

ด้านหลัง

อามุค-ดา-ช

อยู่ต่อ- FUT - เนกาทีฟ

กิลา อาบูร์-อุน แฟร์มา ฮามิชาลูว กึ่ว อูนา อามูค-ดา-ช

ตอนนี้พวกเขา-OBL-GEN ฟาร์มอยู่ข้างหลังตลอดไป stay-FUT-NEG

'ต่อไปนี้ฟาร์มของพวกเขาจะไม่ถูกทิ้งไว้เบื้องหลังตลอดไปแล้ว'

ป้ายกำกับหมวดหมู่ทางไวยากรณ์ในamuqʼ-da-čคำหลัก ( amuq ) จะถูกแปลเป็นคำศัพท์ภาษาอังกฤษที่สอดคล้องกัน ( stay ) ในขณะที่หน่วยคำเติมแสดงการผัน ( da ) และ ( č ) เป็นหน่วยคำเติมแสดงการผันที่แสดงถึงกาลอนาคตและการปฏิเสธ หน่วยคำเติมแสดงการผันเหล่านี้จะถูกอธิบายด้วยFUTและNEGตามลำดับ รายชื่อคำย่อมาตรฐานสำหรับหมวดหมู่ทางไวยากรณ์ที่ใช้กันอย่างแพร่หลายในทางภาษาศาสตร์สามารถพบได้ในกฎการอธิบายความหมายของไลป์ซิก

การจับคู่แบบหนึ่งต่อหลายเมื่อองค์ประกอบภาษาวัตถุเดียวสอดคล้องกับองค์ประกอบภาษาเมตาหลายรายการ จะถูกคั่นด้วยจุด[ 3 ]เช่น

çık-mak

ออกมา- INF

çık-mak

ออกมา-INF

'ออกมา'

องค์ประกอบที่ไม่เปิดเผยหากคำอธิบายแบบมอร์ฟีมต่อมอร์ฟีม (บรรทัดกลาง) มีองค์ประกอบที่ไม่สอดคล้องกับองค์ประกอบที่เปิดเผยในตัวอย่าง กลยุทธ์มาตรฐานคือการรวม "ø" ที่เปิดเผยไว้ในข้อความภาษาวัตถุ[ 3 ]ซึ่งคั่นด้วยเครื่องหมายยัติภังค์เหมือนกับองค์ประกอบที่เปิดเผย

puer-ø

เด็กผู้ชาย- นอม

puer-ø

บอย-นอม

'เด็กผู้ชาย'

การทำซ้ำจะได้รับการปฏิบัติในลักษณะเดียวกับการเติมคำต่อท้าย แต่ใช้เครื่องหมายทิลเด (แทนเครื่องหมายยัติภังค์มาตรฐาน) ที่เชื่อมต่อองค์ประกอบที่คัดลอกกับรากศัพท์: [ 3 ]

บิ~บิลิ

IPFV ~ซื้อ

บิ~บิลิ

IPFV~ซื้อ

'กำลังซื้อ'

เครื่องหมายวรรคตอน

ในการเขียนคำอธิบายความหมายแบบบรรทัดต่อบรรทัดนั้น มีการใช้เครื่องหมายวรรคตอนหลายรูปแบบเพื่อแยกคำอธิบายความหมาย โดยทั่วไปแล้ว คำต่างๆ จะเรียงตัวตรงกับคำอธิบายความหมาย และใช้เครื่องหมายยัติภังค์ (-) เมื่อมีการแบ่งแยกทั้งในข้อความและคำอธิบายความหมาย และใช้เครื่องหมายจุด (.) เมื่อมีการแบ่งแยกเฉพาะในข้อความหรือคำอธิบายความหมายเท่านั้น กล่าวคือ จำนวนคำที่คั่นด้วยช่องว่างในข้อความและคำอธิบายความหมายควรเท่ากัน รวมถึงจำนวนหน่วยคำที่คั่นด้วยยัติภังค์ในคำและคำอธิบายความหมายก็ควรเท่ากันด้วย นี่คือระบบพื้นฐานและสามารถนำไปใช้ได้ทั่วไป ตัวอย่างเช่น:

Odadan hızlı çıktım.

โอดะดัน

ห้อง-เอบีแอล

ห้องจาก

ฮิซ-ลี

ความเร็ว- คอม

ความเร็วด้วย

çık-tı-m

go.out- PFV - 1sg

ออกไปข้างนอกอย่างสมบูรณ์แบบ

ตุรกี

 

 

oda-dan hız-lı çık-tı-m

room-ABL speed-COM go.out-PFV-1sg

ห้องจากความเร็วด้วย ออกไปอย่างสมบูรณ์แบบ ฉัน

'ฉันออกจากห้องไปอย่างรวดเร็ว'

อาจใช้เครื่องหมายขีดล่างแทนจุดได้ เช่นgo_out- PFVเมื่อคำเดียวในภาษาต้นฉบับตรงกับวลีในภาษาที่แปลความหมาย แต่ในกรณีอื่นๆ จะยังคงใช้จุดอยู่ เช่น Greek oikíais house. FEM.PL.DAT 'to the houses'.

อย่างไรก็ตาม บางครั้งอาจมีการแบ่งแยกที่ละเอียดกว่านั้น ตัวอย่างเช่น คำที่แยกออกมา จากเนื้อหนังอาจคั่นด้วยเครื่องหมายยัติภังค์คู่ (หรือเพื่อความสะดวกในการพิมพ์ อาจใช้เครื่องหมายเท่ากับ) แทนที่จะใช้เครื่องหมายยัติภังค์เดี่ยว ตัวอย่างจากภาษาฝรั่งเศส:

Je t'aime.

je⹀te⹀aime

ฉัน⹀คุณ⹀รัก

(ภาษาฝรั่งเศส)

 

je⹀te⹀aime

ฉัน⹀คุณ⹀รัก

'ฉันรักคุณ.'

คำเติมที่ทำให้เกิดความไม่ต่อเนื่อง ( เช่นคำเติมกลางคำเติมครอบ คำเติมแทรก ฯลฯ) อาจใช้เครื่องหมายวงเล็บเหลี่ยมคั่นไว้ และการซ้ำคำอาจใช้เครื่องหมายทิลดีสแทนเครื่องหมายยัติภังค์:

sulat, susulat, sumulat, sumusulat (การปฏิเสธด้วยวาจา) (ตากาล็อก)

สุลัต

เขียน

สุสุลัต

อารมณ์ครุ่นคิด ~เขียน

s ⟨um⟩ ulat

ตัวกระตุ้นเอเจนต์ .อดีต⟩เขียน

s ⟨um⟩ u~sulat

 ตัวกระตุ้น ตัวแทน⟩ เขียนอย่างครุ่นคิด

ซูลัต ซู~ซูลัต s ⟨um⟩ ulat s ⟨um⟩ u~sulat

write contemplative mood~write agent trigger.past⟩write ⟨agent trigger⟩contemplative~write

(ดูส่วนต่อท้ายสำหรับตัวอย่างอื่นๆ)

หน่วยคำที่ไม่สามารถแยกออกจากกันได้ง่าย เช่นอุมเลาต์อาจใช้เครื่องหมายแบ็กสแลชแทนจุด:

อันเซอร์-เอ็น

ของเรา- DAT . PL

Väter-n

พ่อ\ PL - DAT . PL

(ภาษาเยอรมัน)

 

unser-n Väter-n

our-DAT.PL father\PL-DAT.PL

'แด่บรรพบุรุษของเรา' (คำเอกพจน์ของVäter 'บรรพบุรุษ' คือVater )

ธรรมเนียมปฏิบัติอื่นๆ อีกเล็กน้อยที่พบเห็นได้บางครั้งนั้นแสดงไว้ในกฎการอธิบายความหมายของไลป์ซิก[ 3 ]

แหล่งข้อมูลคำอธิบายความหมายแบบบรรทัดต่อบรรทัด

มีความพยายามในการแปลง IGT ให้เป็นดิจิทัลสำหรับภาษาต่างๆ ทั่วโลกหลายร้อยภาษา[ 5 ]

ฐานข้อมูลออนไลน์ของข้อความแปลระหว่างบรรทัด

ฐานข้อมูลข้อความระหว่างบรรทัดออนไลน์ (ODIN) เป็นฐานข้อมูลที่มีคำอธิบายความหมายระหว่างบรรทัดมากกว่า 200,000 รายการสำหรับภาษามากกว่า 1,500 ภาษา ซึ่งสกัดมาจากงานวิจัยทางภาษาศาสตร์เชิงวิชาการ[ 6 ]ฐานข้อมูลนี้ถูกสร้างขึ้นในสองขั้นตอน ได้แก่ การสร้างอัตโนมัติตามด้วยการแก้ไขด้วยตนเอง ขั้นตอนการสร้างอัตโนมัตินั้นเสร็จสมบูรณ์ในสามขั้นตอน:

  1. ขั้นแรก ใช้เครื่องมือค้นหา (เช่น Google, Bing) เพื่อค้นหาเอกสารทางวิชาการที่น่าจะมีคำอธิบายความหมายแบบบรรทัดต่อบรรทัด คำค้นหาประกอบด้วยคำที่เกี่ยวข้องกับการวิจัยทางภาษาศาสตร์ เช่น หน่วยคำทางไวยากรณ์ (เช่น "NOM" ซึ่งย่อมาจาก nominative; "3SG" ซึ่งย่อมาจาก 3rd person singular)
  2. ประการที่สอง แต่ละบรรทัดในเอกสารที่แยกออกมาจะถูกติดแท็กว่าเป็นบรรทัดที่อยู่ในคำอธิบายความหมายแบบบรรทัดต่อบรรทัดหรือไม่ โดยใช้วิธีการติดป้ายลำดับจากแมชชีนเลิร์นนิง
  3. ประการที่สาม อินสแตนซ์คำอธิบายความหมายแบบบรรทัดต่อบรรทัดแต่ละรายการจะได้รับการกำหนดชื่อภาษา (เช่น ตากาล็อก) และรหัสภาษา ISO 693-3 ชื่อภาษาและรหัสภาษาจะถูกกำหนดให้กับคำอธิบายความหมายแบบบรรทัดต่อบรรทัดโดยอัตโนมัติโดยใช้โมเดลการแก้ไขการอ้างอิงร่วมจากการประมวลผลภาษาธรรมชาติ โดยที่อินสแตนซ์คำอธิบายความหมายแบบบรรทัดต่อบรรทัดจะถูกติดแท็กด้วยชื่อภาษา (และรหัส) ที่ปรากฏในเอกสารวิชาการที่อินสแตนซ์คำอธิบายความหมายแบบบรรทัดต่อบรรทัดถูกดึงออกมา[ 6 ]

ในขั้นตอนการแก้ไขด้วยตนเอง ผู้สร้างฐานข้อมูลได้แก้ไขขอบเขตของคำอธิบายความหมายระหว่างบรรทัดที่ค้นพบโดยวิธีการติดป้ายลำดับในขั้นตอนที่ 2 ของขั้นตอนการสร้างอัตโนมัติด้วยตนเอง จากนั้นผู้สร้างได้ตรวจสอบชื่อภาษาและรหัสภาษาอีกครั้งในการตรวจสอบข้อมูลรอบที่สองและสามตามลำดับ

การกระจายภาษาของคำอธิบายความหมายแบบบรรทัดต่อบรรทัดในฐานข้อมูลข้อความแบบบรรทัดต่อบรรทัดออนไลน์ หลังจากระยะที่ 1 และ (ระยะที่ 2)
ช่วงของความเงาระหว่างบรรทัด

ตัวอย่าง

จำนวนของ

ภาษา

จำนวนของ

ตัวอย่างความเงางามระหว่างบรรทัด

เปอร์เซ็นต์ของ

ตัวอย่างความเงางามระหว่างบรรทัด

>10,000 3 (1) 36,691 (10,814) 19.39 (6.88)
1000-9999 37 (31) 97,158 (81,218) 51.34 (51.69)
100-999 122 (139) 40,260 (46,420) 21.27 (29.55)
10-99 326 (460) 12,822 (15,560) 6.78 (9.96)
1-9 838 (862) 2,313 (3,012) 1.22 (1.92)
ทั้งหมด 1,326 (1,493) 189,244 (157,114) 100 (100)

การประมวลผลอัตโนมัติของกรณีความเงาแบบแทรกเส้น

ได้มีการพัฒนารูปแบบการประมวลผลภาษาธรรมชาติที่ใช้ประโยชน์จากแหล่งข้อมูลคำอธิบายความหมายแบบบรรทัดต่อบรรทัด เช่น ฐานข้อมูลข้อความแบบบรรทัดต่อบรรทัดออนไลน์[ 7 ] [ 8 ]

การเคลือบเงาอัตโนมัติ

ตัวอย่างเช่น ระบบการประมวลผลภาษาธรรมชาติได้รับการพัฒนาเพื่อสร้างคำอธิบายความหมายระหว่างบรรทัดโดยอัตโนมัติ: [ 7 ]

มิ-ส

คุณ- เจน

ħumukuli

อูฐ

elu-ab-ok'ek'-asi

เรา. OBL - ERG . 1 . PL -ขโมย- PRT

อานู

เป็นลบ

mi-s ħumukuli elu-ab-ok'ek'-asi anu

you-GEN camel we.OBL-ERG.1.PL-steal-PRT be.NEG

'พวกเราไม่ได้ขโมยอูฐของคุณ'

เมื่อพิจารณาจากบรรทัดที่แบ่งส่วนของหน่วยคำ (บรรทัดแรกด้านบน) และบรรทัดการแปลอิสระ (บรรทัดที่สามด้านบน) งานคือการสร้างบรรทัดคำอธิบายตรงกลางซึ่งประกอบด้วยการแปลคำหลัก (เช่นmi : you ) และป้ายกำกับหมวดหมู่ทางไวยากรณ์ที่สอดคล้องกับคำต่อท้าย (เช่นa : ERG.1.PL ) มีการใช้แบบจำลองการทำนายลำดับจากการประมวลผลภาษาธรรมชาติเพื่อดำเนินการงานนี้[ 7 ]ปัจจัยสองประการมีส่วนทำให้งานนี้ยาก:

  1. คำแปลไม่จำเป็นต้องสอดคล้องกับลำดับการแบ่งหน่วยคำ (เช่น คำว่า " อูฐ"เป็นคำสุดท้ายในคำแปล แต่เป็นคำที่สองในลำดับการแบ่งหน่วยคำ)
  2. คำบางคำในหน่วยคำที่แบ่งเป็นส่วนๆ มีการจับคู่หลายแบบในคำอธิบายความหมาย (เช่นanu : be.NEG )

ภาษาประดิษฐ์บางภาษา เช่นIthkuilและLojbanมีเครื่องมืออัตโนมัติที่ (ในทางทฤษฎี) จะให้ผลลัพธ์การอธิบายความหมายที่ถูกต้องเสมอ เนื่องจากลักษณะที่เป็นระเบียบและมีเหตุผลของภาษาเหล่านี้ ต่อไปนี้เป็นตัวอย่างการอธิบายความหมายของภาษาIthkuilและLojbanตามลำดับ:

A'zvaţcaxüẓpöňḑeššaščëirktöňçogjahnói

S1 -“สุนัข”-'สิ่งที่อนุมานได้ว่าเป็น X'₁-'ใหญ่โต'₁-'เป็นผลจากการกระทำของมนุษย์ตามแผน'₁-'อย่างใดอย่างหนึ่ง'₁- DDF -'เป็นผงหรือฝุ่น'₁-'กินเป็นอาหารว่างตอนบ่าย'₁-'ไม่ทราบความน่าเชื่อถือของแหล่งที่มา และข้อมูลไม่สามารถตรวจสอบได้'₁-'การคาดเดา/ทฤษฎี/สมมติฐานที่สามารถทดสอบ/ตรวจสอบได้' ₁- COU - POT

nnţ

"มันหมายความได้เพียงอย่างเดียว..."

A'zvaţcaxüẓpöňḑeššaščëirktöňçogjahnói nnţ

S1-“dog”-‘what is inferred to be X’₁-‘huge’₁-‘as a planned result of human action’₁-‘some or other’₁-DDF-'as powder or dust’₁-‘eaten as afternoon snack’₁-‘trustworthiness of source unknown, and info not verifiable’₁-‘conjecture/theory/hypothesis that is testable/verifiable’₁-COU-POT "It can only mean one thing..."

มีคำอธิบายเดียวเท่านั้น; พิสูจน์ไม่ได้หรอก และสภาพจิตใจฉันก็ค่อนข้างมึนงง แต่แน่นอนว่ามันคงเป็นการผสมผสานที่ผิดรูปของสิ่งมีชีวิตขนาดยักษ์ที่มนุษย์สร้างขึ้นสองตัวที่ดูเหมือนสุนัขในรูปของฝุ่นละอองที่เสิร์ฟเป็นอาหารว่างยามบ่ายอยู่แถวนั้นของคุณนั่นแหละ อ้อ แล้วก็อย่าเอาคำพูดฉันไปอ้างอิงนะ

มิ

I=x 1

ลุมซี

ล้าง

เล

ดีที

เครกา

เสื้อเชิ้ต = x 2

เล

ดีที

กราสุ

จาระบี = x 3

เล

ดีที

ริร์เซ

แม่น้ำ = x 4

mi lumci le creka le grasu le rirxe

I=x1 wash DET shirt=x2 DET grease=x3 DET river=x4

'ฉันล้างคราบไขมันออกจากเสื้อในแม่น้ำ'

การค้นพบโครงสร้างทางสัณฐานวิทยาโดยอัตโนมัติจากคำอธิบายศัพท์

นักวิจัยได้ใช้คำอธิบายแบบบรรทัดต่อบรรทัดเพื่อรับแบบแผนทางสัณฐานวิทยาของภาษาเป้าหมาย (เช่น ภาษาที่กำลังได้รับคำอธิบาย) เพื่อสร้างแบบแผนทางสัณฐานวิทยาโดยอัตโนมัติจากคำอธิบายแบบบรรทัดต่อบรรทัด นักวิจัยได้สร้างตารางสำหรับรากศัพท์ทุกคำในคำอธิบายและช่อง (อาจว่างเปล่า) สำหรับหมวดหมู่ทางไวยากรณ์ทุกหมวด (เช่น ERG) ในคำอธิบาย ตัวอย่างเช่น เมื่อพิจารณาประโยคที่อธิบายแล้วด้านล่าง: [ 7 ]

เวเชอร์-ออม

ตอนเย็น - อินเอส

ยา

1. SG . NOM

pobeja-la

รัน- PFV . PST . SG . FEM

วี

ใน

นิตยสาร

ร้านค้าACC

Vecher-om ya pobeja-la v magazin

evening-INS 1.SG.NOM run-PFV.PST.SG.FEM in store.ACC

'ตอนเย็นฉันไปซื้อของที่ร้าน'

จะมีแบบจำลองสำหรับลำต้นpobejaที่มีช่องสำหรับPFV.PST.SG.FEMและPFV.PST.SG.MASC :

(บางส่วน) แบบจำลองสำหรับ pobeja
สล็อต การผันคำ
พีเอฟวี.พีเอสที.เอสจี.เฟม pobeja-la
พีเอฟวี.พีเอสที.เอสจี.เอ็มเอสซี ?

ช่องสำหรับPFV.PST.SG.FEMจะถูกเติม (เนื่องจากพบในข้อมูลคำอธิบายระหว่างบรรทัด) แต่ช่องสำหรับPFV.PST.SG.MASCจะว่างเปล่า (โดยสมมติว่าไม่มีอินสแตนซ์คำอธิบายระหว่างบรรทัดอื่นใดที่มีpobejaที่ผันตาม หมวดหมู่ไวยากรณ์ PFV.PST.SG.MASC ) สามารถใช้แบบจำลองการเรียนรู้ของเครื่องเชิงสถิติสำหรับการผันคำทางสัณฐานวิทยาเพื่อเติมรายการที่หายไปได้[ 8 ] [ 9 ] [ 10 ] [ 11 ] [ 12 ]

ดูเพิ่มเติม

  • คันบุน – ธรรมเนียมญี่ปุ่นในการแปลความหมายจากตำราภาษาจีนคลาสสิก
  • ข้อความรูบี้ – คำอธิบายเพิ่มเติมที่บางครั้งใช้กับภาษาจีนหรือญี่ปุ่นเพื่อแสดงการออกเสียง
  • การระบุชนิดของคำมักแสดงเป็นคำอธิบายความหมายแบบบรรทัดต่อบรรทัดใต้คำที่ระบุชนิดคำไว้ บางครั้งอาจแสดงพร้อมกับการแปลคำต่อคำแบบบรรทัดต่อบรรทัดด้วย
  • Treebanksมักแสดงเป็นคำอธิบายเพิ่มเติมหรือหมายเหตุประกอบข้อความต้นฉบับ
  • เจมส์ แฮมิลตันนักแต่งเพลงในศตวรรษที่สิบเก้าและผู้ส่งเสริมการใช้ตำราเรียนภาษาแบบมีคำแปลคั่นบรรทัด
  • การตีความใหม่
  • รายการคำย่อสำหรับอธิบายความหมาย
  • กฎการอธิบายความหมายแบบไลป์ซิก: ข้อตกลงสำหรับการอธิบายความหมายแบบบรรทัดต่อบรรทัดของหน่วยคำ
  • มาตรฐานข้อความอธิบายความหมายแบบบรรทัดต่อบรรทัด (E-MELD)
  • ระดับคำอธิบายข้อความแบบบรรทัดต่อบรรทัด (E-MELD)
  • สู่แบบจำลองทั่วไปของข้อความระหว่างบรรทัด (E-MELD)
  • ความหมายเชิงสัณฐานวิทยาแบบระหว่างบรรทัด
  • การถอดความภาษาและตำราโบราณเวทีสำหรับเสนอแนะเกี่ยวกับการถอดความเชิงหน่วยคำระหว่างบรรทัดของภาษาโบราณตามที่ปรากฏในต้นฉบับโบราณ
  • ข้อความแปลพระคัมภีร์ภาษากรีกแบบเรียงบรรทัดออนไลน์ (พันธสัญญาใหม่)
  • ODIN - ฐานข้อมูลข้อความระหว่างบรรทัดออนไลน์
  • หน้าเว็บ Latinum Interlinear Methodแสดงรายการข้อความแปลแบบบรรทัดต่อบรรทัดและข้อความที่แปลความหมายแบบเก่า ส่วนใหญ่มาจากภาษาละตินหรือกรีกโบราณ และส่วนใหญ่แปลเป็นภาษาอังกฤษ
  • เออร์เนสต์ บลัม, "วิธีการเรียนภาษาแบบใหม่แต่ดั้งเดิม" , วารสาร The American Scholar , ฤดูใบไม้ร่วง ปี 2008
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Interlinear_gloss&oldid=1358958101 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ความหมายเชิงเส้น

ใน ด้านภาษาศาสตร์ และ การศึกษา คำอธิบายระหว่างบรรทัด ( interlinear gloss) คือคำ อธิบาย (ชุดคำอธิบายสั้นๆ เช่น คำจำกัดความหรือการออกเสียง) ที่วางไว้ระหว่างบรรทัด เช่น...

ประวัติศาสตร์

การใส่คำอธิบายความหมายแบบบรรทัดต่อบรรทัดถูกนำมาใช้เพื่อวัตถุประสงค์ที่หลากหลายมาเป็นเวลานานแล้ว การใช้งานที่พบได้ทั่วไปอย่างหนึ่งคือการใส่คำอธิบายประกอบในตำราเรียนสองภาษาสำหรับการศึกษาภาษา การใส่คำอธิบายความหมายแบบบรรทัดต่อบรรทัดในลักษณะนี้ช่วยให้ความหมายของ...

โครงสร้าง

แม้ว่าจะไม่มีข้อกำหนดอย่างเป็นทางการสำหรับรูปแบบ IGT แต่กฎ Leipzig Glossing [ 3 ] เป็นชุดแนวทางที่มุ่งทำให้รูปแบบเป็นมาตรฐานมากที่สุดเท่าที่จะเป็นไปได้

เครื่องหมายวรรคตอน

ในการเขียนคำอธิบายความหมายแบบบรรทัดต่อบรรทัดนั้น มีการใช้เครื่องหมายวรรคตอนหลายรูปแบบเพื่อแยกคำอธิบายความหมาย โดยทั่วไปแล้ว คำต่างๆ จะเรียงตัวตรงกับคำอธิบายความหมาย และใช้เครื่องหมายยัติภังค์ (-) เมื่อมีการแบ่งแยกทั้งในข้อความและคำอธิบายความหมาย...