อ่าน 5 นาที
เครื่องมือและวิธีการจัดทำเอกสารภาษา
สาขา การจัดทำเอกสารภาษา ในบริบทสมัยใหม่เกี่ยวข้องกับชุดเครื่องมือและวิธีการที่ซับซ้อนและมีการพัฒนาอย่างต่อเนื่อง และการศึกษาและการพัฒนาการใช้งานเครื่องมือและวิธีการเหล่านั้น...
เครื่องมือและวิธีการจัดทำเอกสารภาษา
สาขาการจัดทำเอกสารภาษาในบริบทสมัยใหม่เกี่ยวข้องกับชุดเครื่องมือและวิธีการที่ซับซ้อนและมีการพัฒนาอย่างต่อเนื่อง และการศึกษาและการพัฒนาการใช้งานเครื่องมือและวิธีการเหล่านั้น โดยเฉพาะอย่างยิ่งการระบุและการส่งเสริมแนวปฏิบัติที่ดีที่สุด ถือเป็นสาขาย่อยของการจัดทำเอกสารภาษาโดยเฉพาะ[ 1 ]ซึ่งรวมถึงหลักการทางจริยธรรมและการบันทึก กระบวนการทำงานและวิธีการ เครื่องมือฮาร์ดแวร์ และเครื่องมือซอฟต์แวร์[ 2 ]
หลักการและขั้นตอนการทำงาน
นักวิจัยด้านการบันทึกภาษา มักทำการสำรวจภาคสนามทางภาษาศาสตร์เพื่อรวบรวมข้อมูลที่เป็นพื้นฐานของงานวิจัย โดยบันทึกไฟล์ภาพและเสียงที่แสดงให้เห็นถึงการใช้ภาษาในบริบทดั้งเดิม เนื่องจากสภาพแวดล้อมในการสำรวจภาคสนามทางภาษาศาสตร์มักมีความท้าทายในด้านโลจิสติกส์ เครื่องมือบันทึกทุกประเภทจึงไม่จำเป็นหรือเหมาะสมเสมอไป และมักต้องมีการประนีประนอมระหว่างคุณภาพ ต้นทุน และความสะดวกในการใช้งาน นอกจากนี้ยังสำคัญที่จะต้องมองเห็นภาพรวมของขั้นตอนการทำงานและผลลัพธ์ที่ต้องการ ตัวอย่างเช่น หากมีการสร้างไฟล์วิดีโอ อาจจำเป็นต้องมีการประมวลผลบางส่วนเพื่อนำส่วนประกอบเสียงไปประมวลผลในรูปแบบต่างๆ โดยใช้โปรแกรมซอฟต์แวร์ที่แตกต่างกัน
จริยธรรม
แนวปฏิบัติทางจริยธรรมในการบันทึกภาษาเป็นประเด็นสำคัญของการอภิปรายและการถกเถียงในช่วงไม่นานมานี้[ 3 ]สมาคมภาษาศาสตร์แห่งอเมริกาได้จัดทำแถลงการณ์ด้านจริยธรรมและดูแลบล็อกสนทนาด้านจริยธรรมซึ่งมุ่งเน้นไปที่จริยธรรมในบริบทของการบันทึกภาษาเป็นหลักสภาวัฒนธรรมชนพื้นเมืองและโครงการภาษาที่ใกล้สูญพันธุ์ได้ออกประมวลจริยธรรมของนักภาษาศาสตร์สำหรับการทำงานด้านการบันทึก จริยธรรมของระเบียบปฏิบัติเองก็ถูกตั้งคำถามโดยGeorge van Driem [ 4 ] โปรแกรมระดับบัณฑิตศึกษาส่วนใหญ่ที่เกี่ยวข้องกับการบันทึกและอธิบายภาษาในรูปแบบใดรูปแบบหนึ่ง กำหนดให้นักวิจัยต้องส่งระเบียบปฏิบัติที่เสนอไปยังคณะกรรมการตรวจสอบสถาบันภายใน ซึ่งรับรองว่าการวิจัยดำเนินการอย่างมีจริยธรรม อย่างน้อยที่สุด ผู้เข้าร่วมควรได้รับแจ้งเกี่ยวกับกระบวนการและการใช้งานที่ตั้งใจไว้ของการบันทึก และให้การอนุญาตด้วยเสียงหรือลายลักษณ์อักษรสำหรับการใช้สื่อภาพและเสียงเพื่อการวิจัยทางภาษาศาสตร์โดยนักวิจัย ผู้เข้าร่วมจำนวนมากอาจต้องการให้ระบุชื่อตนเองเป็นที่ปรึกษา แต่บางคนอาจไม่ต้องการ ซึ่งจะเป็นตัวกำหนดว่าข้อมูลจำเป็นต้องถูกปกปิดตัวตนหรือจำกัดการเข้าถึงของสาธารณะหรือไม่
รูปแบบข้อมูล
การปฏิบัติตามมาตรฐานรูปแบบข้อมูลมีความสำคัญอย่างยิ่งต่อการทำงานร่วมกันระหว่างเครื่องมือซอฟต์แวร์ คลังข้อมูลหรือแหล่งเก็บข้อมูลแต่ละแห่งมีมาตรฐานและข้อกำหนดเฉพาะของตนเองสำหรับข้อมูลที่จัดเก็บไว้ในเซิร์ฟเวอร์ ความรู้เกี่ยวกับข้อกำหนดเหล่านี้ควรเป็นข้อมูลประกอบในการกำหนดกลยุทธ์การรวบรวมข้อมูลและเครื่องมือที่ใช้ และควรเป็นส่วนหนึ่งของแผนการจัดการข้อมูลที่พัฒนาขึ้นก่อนเริ่มการวิจัย ตัวอย่างแนวทางจากแหล่งเก็บข้อมูลที่ใช้กันอย่างแพร่หลายมีดังต่อไปนี้:
- แนวทางปฏิบัติของEndangered Languages Archive (ELAR)
- รูปแบบที่ยอมรับได้ของหอจดหมายเหตุสถาบันแม็กซ์พลังค์
- แนวทางการใช้งานสื่อโสตทัศนูปกรณ์ของห้องสมุดมหาวิทยาลัยเยล
มาตรฐานการจัดเก็บ วิดีโอส่วนใหญ่ในปัจจุบันใช้ MPEG-4 (H264) เป็นรูปแบบการเข้ารหัสหรือการจัดเก็บ ซึ่งรวมถึงสตรีมเสียง AAC (โดยทั่วไปสูงสุด 320 กิโลบิต/วินาที) คุณภาพการจัดเก็บ เสียงอย่างน้อยที่สุดคือ WAV 44.1 kHz, 16 บิต
หลักการสำหรับการบันทึก
เนื่องจากการบันทึกภาษาเป็นเรื่องยาก และหลายภาษาที่นักภาษาศาสตร์ทำงานอยู่ก็อยู่ในภาวะเสี่ยงต่อการสูญหาย (อาจไม่มีคนพูดในอนาคตอันใกล้นี้) จึงแนะนำให้บันทึกด้วยคุณภาพสูงสุดเท่าที่จะเป็นไปได้ภายใต้ข้อจำกัดของเครื่องบันทึก สำหรับวิดีโอ หมายถึงการบันทึกที่ความละเอียด HD ( 1080pหรือ 720p) หรือสูงกว่านั้นหากเป็นไปได้ ในขณะที่สำหรับเสียง หมายถึงการบันทึกอย่างน้อยที่สุดในรูปแบบ PCM ที่ไม่บีบอัด 44,100 ตัวอย่างต่อวินาที ความละเอียด 16 บิต อย่างไรก็ตาม อาจกล่าวได้ว่าเทคนิคการบันทึกที่ดี (การแยกเสียง การเลือกและการใช้ไมโครโฟน การใช้ขาตั้งกล้องเพื่อลดความเบลอ) มีความสำคัญมากกว่าความละเอียด ไมโครโฟนที่ให้การบันทึกเสียงที่ชัดเจนของผู้พูดที่กำลังเล่านิทานพื้นบ้าน (อัตราส่วนสัญญาณต่อเสียงรบกวนสูง) ในรูปแบบ MP3 (อาจผ่านทางโทรศัพท์) ดีกว่าการบันทึกที่มีเสียงรบกวนมากในรูปแบบ WAV ที่ได้ยินแต่เสียงรถยนต์วิ่งผ่าน เพื่อให้แน่ใจว่าสามารถบันทึกเสียงได้ดี นักภาษาศาสตร์ควรฝึกฝนการใช้เครื่องบันทึกของตนให้มากที่สุดเท่าที่จะเป็นไปได้ และเปรียบเทียบผลลัพธ์เพื่อสังเกตว่าเทคนิคใดให้ผลลัพธ์ที่ดีที่สุด[ 5 ] [ 2 ] [ 6 ] [ 7 ] [ 8 ]
เวิร์กโฟลว์
สำหรับนักภาษาศาสตร์หลายคน ผลลัพธ์สุดท้ายของการบันทึกเสียงคือการวิเคราะห์ภาษา ซึ่งมักเป็นการตรวจสอบคุณสมบัติทางด้านเสียงหรือไวยากรณ์ของภาษาโดยใช้เครื่องมือซอฟต์แวร์ต่างๆ ซึ่งต้องมีการถอดเสียงจากไฟล์เสียง โดยทั่วไปแล้วจะทำร่วมกับผู้พูดภาษาแม่ของภาษานั้นๆ สำหรับการถอดเสียงทั่วไป ไฟล์เสียงสามารถเล่นบนคอมพิวเตอร์ (หรืออุปกรณ์อื่นๆ ที่สามารถเล่นได้) และหยุดชั่วคราวเพื่อถอดเสียงในโปรแกรมแก้ไขข้อความเครื่องมืออื่นๆ (ที่ใช้งานได้หลายแพลตฟอร์ม) ที่ช่วยในกระบวนการนี้ ได้แก่AudacityและTranscriberในขณะที่โปรแกรมอย่างELAN (ซึ่งจะอธิบายเพิ่มเติมด้านล่าง) ก็สามารถทำหน้าที่นี้ได้เช่นกัน
โปรแกรมอย่างToolboxหรือFLExมักเป็นที่นิยมในหมู่นักภาษาศาสตร์ที่ต้องการวิเคราะห์ ข้อความแบบ บรรทัดต่อบรรทัดเนื่องจากโปรแกรมเหล่านี้สร้างพจนานุกรมของรูปแบบและกฎการวิเคราะห์เพื่อช่วยเร่งความเร็วในการวิเคราะห์ อย่างไรก็ตาม โดยทั่วไปแล้วโปรแกรมเหล่านี้จะไม่เชื่อมโยงไฟล์มีเดีย (ต่างจาก ELAN ที่นิยมใช้ไฟล์ที่เชื่อมโยงกัน) ทำให้ยากต่อการดูหรือฟังบันทึกเสียงเพื่อตรวจสอบการถอดเสียงปัจจุบันมีวิธีแก้ปัญหาสำหรับ Toolbox ที่อนุญาตให้ใช้ไทม์โค้ดอ้างอิงไฟล์เสียงและเปิดใช้งานการเล่น (ข้อความทั้งหมดหรือประโยคที่อ้างอิง) จากภายใน Toolbox ได้ ในขั้นตอนการทำงานนี้ การจัดเรียงเวลาของข้อความจะทำใน Transcriber จากนั้นไทม์โค้ดและข้อความที่เกี่ยวข้องจะถูกแปลงเป็นรูปแบบที่ Toolbox สามารถอ่านได้
ฮาร์ดแวร์
เครื่องบันทึกวิดีโอและเสียง
โดยทั่วไปแล้ว เครื่องบันทึกวิดีโอจะบันทึกเสียงด้วยเช่นกัน อย่างไรก็ตาม เสียงที่บันทึกได้มักไม่ตรงตามเกณฑ์ความต้องการขั้นต่ำและแนวทางปฏิบัติที่ดีที่สุดสำหรับการบันทึกภาษา (รูปแบบ WAV ที่ไม่บีบอัด ความถี่ 44.1 kHz ความละเอียด 16 บิต) และมักไม่เป็นประโยชน์สำหรับวัตถุประสงค์ทางภาษาศาสตร์ เช่น การวิเคราะห์สัทศาสตร์ อุปกรณ์บันทึกวิดีโอหลายชนิดจึงบันทึกเป็นรูปแบบเสียงที่บีบอัด เช่น AAC หรือ MP3 ซึ่งรวมเข้ากับสตรีมวิดีโอในรูปแบบต่างๆข้อยกเว้นสำหรับกฎทั่วไปนี้คือ เครื่องบันทึกวิดีโอและเสียงต่อไปนี้:
ซี รี ส์ Zoomโดยเฉพาะรุ่นQ8 , Q4nและQ2nสามารถบันทึกวิดีโอและเสียงได้หลายความละเอียด/รูปแบบ โดยเฉพาะอย่างยิ่ง WAV (44.1/48/96 kHz, 16/24 บิต)
เมื่อใช้เครื่องบันทึกวิดีโอที่ไม่บันทึกเสียงในรูปแบบ WAV (เช่น กล้อง DSLR ส่วนใหญ่) ขอแนะนำให้บันทึกเสียงแยกต่างหากบนเครื่องบันทึกอื่น โดยปฏิบัติตามคำแนะนำบางส่วนด้านล่าง เช่นเดียวกับเครื่องบันทึกเสียงที่อธิบายไว้ด้านล่าง เครื่องบันทึกวิดีโอหลายรุ่นยังรับอินพุตไมโครโฟนได้หลายประเภท (โดยทั่วไปผ่านขั้วต่อขนาด 1/8 นิ้วหรือ TRS) ซึ่งจะช่วยให้มั่นใจได้ว่ามีการบันทึกเสียงสำรองคุณภาพสูงที่ซิงค์กับวิดีโอที่บันทึกไว้ ซึ่งอาจเป็นประโยชน์ในบางกรณี (เช่น สำหรับการถอดเสียง)
เครื่องบันทึกเสียงและไมโครโฟน
เครื่องบันทึกเสียงอย่างเดียวสามารถใช้ได้ในสถานการณ์ที่การบันทึกวิดีโอทำได้ยากหรือไม่เป็นที่ต้องการ ในกรณีส่วนใหญ่ การใช้เครื่องบันทึกเสียงอย่างเดียวร่วมกับไมโครโฟนภายนอกหนึ่งตัวหรือมากกว่านั้นจะให้ประโยชน์มากกว่า อย่างไรก็ตาม เครื่องบันทึกเสียงสมัยใหม่หลายรุ่นมีไมโครโฟนในตัว ซึ่งสามารถใช้งานได้หากต้นทุนหรือความเร็วในการติดตั้งเป็นสิ่งสำคัญ เครื่องบันทึกเสียงดิจิทัล (โซลิดสเตท) เป็นที่นิยมมากกว่าสำหรับสถานการณ์การบันทึกเสียงภาษาต่างๆ เครื่องบันทึกเสียงดิจิทัลสมัยใหม่ให้คุณภาพสูงมากในราคาที่ค่อนข้างต่ำ เครื่องบันทึกเสียงภาคสนามที่ได้รับความนิยมมากที่สุดบางรุ่นอยู่ใน กลุ่ม ผลิตภัณฑ์ Zoomได้แก่H1 , H2 , H4 , H5และH6 โดยเฉพาะอย่างยิ่ง H1 เหมาะสำหรับสถานการณ์ที่ต้นทุนและความง่ายในการใช้งานเป็นสิ่งสำคัญ เครื่องบันทึกเสียงยอดนิยมอื่นๆ สำหรับสถานการณ์ที่ขนาดเป็นปัจจัยสำคัญ ได้แก่ซีรี่ส์ Olympus LSและเครื่องบันทึกเสียงดิจิทัลของ Sony (แต่ในกรณีหลัง ตรวจสอบให้แน่ใจว่าอุปกรณ์สามารถบันทึกในรูปแบบ WAV/Linear PCM ได้)
ไมโครโฟนหลายประเภทสามารถใช้งานได้อย่างมีประสิทธิภาพในสถานการณ์การบันทึกเสียง ขึ้นอยู่กับสถานการณ์ (โดยเฉพาะอย่างยิ่ง ปัจจัยต่างๆ เช่น จำนวน ตำแหน่ง และการเคลื่อนที่ของผู้พูด) และงบประมาณ โดยทั่วไป ควรเลือกใช้ ไมโครโฟนแบบคอนเดนเซอร์มากกว่าไมโครโฟนแบบไดนามิกในสถานการณ์ภาคสนามส่วนใหญ่ การที่ไมโครโฟนคอนเดนเซอร์มีแหล่งจ่ายไฟในตัว (ผ่านแบตเตอรี่) จะเป็นข้อได้เปรียบ แต่หากพลังงานไม่ใช่ปัจจัยสำคัญ ก็สามารถใช้รุ่นที่มีแหล่งจ่ายไฟแบบแฟนทอมได้เช่นกัน จำเป็นต้องใช้ชุดไมโครโฟนสเตอริโอเมื่อมีผู้พูดมากกว่าหนึ่งคนในการบันทึก ซึ่งสามารถทำได้โดยใช้ไมโครโฟนโมโนสองตัว หรือใช้ไมโครโฟนสเตอริโอโดยเฉพาะ
โดยทั่วไปควรใช้ไมโครโฟนแบบรับเสียงทิศทาง เพื่อแยกเสียงของผู้พูดออกจากแหล่งเสียงรบกวนอื่นๆ อย่างไรก็ตาม ในสถานการณ์ที่มีผู้พูดจำนวนมากเรียงตัวอยู่ในพื้นที่ค่อนข้างกว้าง อาจเลือกใช้ไมโครโฟนแบบรับเสียงรอบทิศทางได้ ในบรรดาไมโครโฟนแบบรับเสียงทิศทาง ไมโครโฟนแบบ คาร์ดิออยด์เหมาะสำหรับงานส่วนใหญ่ แต่ในบางกรณี อาจเลือกใช้ไมโครโฟน แบบไฮเปอร์คาร์ดิอ อยด์ ("ช็อตกัน") แทนได้
ไมโครโฟนแบบหูฟังคุณภาพดีมีราคาค่อนข้างสูง แต่สามารถบันทึกเสียงได้คุณภาพสูงมากในสถานการณ์ที่มีการควบคุม[ 9 ] ไมโครโฟน แบบหนีบปกเสื้อหรือ "ไมโครโฟนแบบหนีบปกเสื้อ" อาจใช้ได้ในบางสถานการณ์ อย่างไรก็ตาม ขึ้นอยู่กับไมโครโฟนนั้นๆ การบันทึกเสียงอาจด้อยกว่าไมโครโฟนแบบหูฟังสำหรับการวิเคราะห์เสียงพูด และอาจมีข้อจำกัดเช่นเดียวกับไมโครโฟนแบบหูฟังในแง่ของการบันทึกเสียงที่จำกัดเฉพาะผู้พูดคนเดียว แม้ว่าผู้พูดคนอื่นๆ อาจได้ยินเสียงในการบันทึก แต่เสียงของพวกเขาจะถูกกลบด้วยเสียงของผู้พูดที่สวมไมโครโฟนแบบหนีบปกเสื้อ[ 10 ]
ไมโครโฟนคุณภาพดีที่ใช้ในการถ่ายทำภาพยนตร์และการสัมภาษณ์ ได้แก่ไมโครโฟนแบบช็อตกัน Røde VideoMic และไมโครโฟนแบบหนีบปกเสื้อ Røde series , ไมโครโฟนแบบสวมศีรษะ Shureและ ไมโครโฟน แบบหนีบปกเสื้อ Shure ทั้งนี้ ขึ้นอยู่กับเครื่องบันทึกและไมโครโฟน อาจจำเป็นต้องใช้ สายเคเบิลเพิ่มเติม(XLR, ตัวแปลงสเตอริโอ/โมโน หรืออะแดปเตอร์ TRRS เป็น TRS )
เครื่องมือบันทึกเสียงอื่นๆ
การผลิต การจัดเก็บ และการจัดการพลังงานไฟฟ้า
ระบบคอมพิวเตอร์
เครื่องประดับ
ซอฟต์แวร์
ปัจจุบันยังไม่มีชุดซอฟต์แวร์ ใดชุดเดียว ที่ออกแบบมาหรือสามารถจัดการทุกแง่มุมของกระบวนการทำงานด้านเอกสารภาษาทั่วไปได้ แต่มีซอฟต์แวร์หลายแพ็กเกจที่ออกแบบมาเพื่อจัดการแง่มุมต่างๆ ของกระบวนการทำงาน ซึ่งหลายแพ็กเกจก็ซ้ำซ้อนกันอย่างมาก บางแพ็กเกจใช้รูปแบบมาตรฐานและสามารถทำงานร่วมกันได้ ในขณะที่บางแพ็กเกจก็ทำงานร่วมกันได้ยากกว่ามาก
เซย์มอร์
SayMoreเป็นแพ็กเกจจัดทำเอกสารภาษาที่พัฒนาโดยSIL Internationalในเมืองดัลลัสซึ่งเน้นไปที่ขั้นตอนเริ่มต้นของการจัดทำเอกสารภาษาเป็นหลัก และมีเป้าหมายเพื่อให้ผู้ใช้ได้รับประสบการณ์การใช้งานที่ไม่ซับซ้อนมากนัก
หน้าที่หลักของ SayMore ได้แก่: (a) การบันทึกเสียง (b) การนำเข้าไฟล์จากอุปกรณ์บันทึก (วิดีโอและ/หรือเสียง) (c) การจัดระเบียบไฟล์ (d) การป้อนข้อมูลเมตาในระดับเซสชันและระดับไฟล์ (e) การเชื่อมโยงไฟล์ AV กับหลักฐานการยินยอมโดยแจ้งให้ทราบและวัตถุเสริมอื่นๆ (เช่น ภาพถ่าย) (f) การแบ่งส่วนไฟล์ AV (g) การถอดเสียง/การแปล (h) การใส่คำอธิบายประกอบคำพูดอย่างระมัดระวังและการแปลด้วยวาจาในรูปแบบ ตัวหนา
ไฟล์ SayMore สามารถส่งออกเพิ่มเติมเพื่อใส่คำอธิบายประกอบในFLEx ได้และข้อมูลเมตาสามารถส่งออกใน รูปแบบ .csvและIMDI เพื่อการจัดเก็บถาวรได้
อีแลน
ELANพัฒนาโดยThe Language Archiveที่สถาบัน Max Planck Institute for Psycholinguisticsในเมืองไนจ์เมเกน ELAN เป็นเครื่องมือถอดเสียงที่มีคุณสมบัติครบถ้วน มีประโยชน์อย่างยิ่งสำหรับนักวิจัยที่มีความต้องการ/เป้าหมายในการใส่คำอธิบายประกอบที่ซับซ้อน
เฟล็กซ์
โปรแกรม FieldWorks Language Explorer หรือ FLExพัฒนาโดยSIL International ซึ่งเดิมชื่อ Summer Institute of Linguistics, Inc.ที่SIL Internationalในเมืองดัลลัส FLEx ช่วยให้ผู้ใช้สร้าง "พจนานุกรม" ของภาษาได้ กล่าวคือ รายการคำศัพท์พร้อมคำจำกัดความและข้อมูลทางไวยากรณ์ และยังสามารถจัดเก็บข้อความจากภาษาได้อีกด้วย ภายในข้อความแต่ละคำหรือส่วนหนึ่งของคำ (เช่น "หน่วยคำ") จะเชื่อมโยงกับรายการในพจนานุกรม สำหรับโครงการใหม่และสำหรับนักเรียนที่เรียนภาษาเป็นครั้งแรกFLExจึงเป็นเครื่องมือที่ดีที่สุดสำหรับการสร้างพจนานุกรมและการวิเคราะห์ความหมายในข้อความ
กล่องเครื่องมือ
Field Linguist's Toolbox (โดยทั่วไปเรียกว่า Toolbox) เป็นโปรแกรมต้นแบบของFLExและเป็นหนึ่งในแพ็กเกจเอกสารภาษาที่ใช้กันอย่างแพร่หลายมานานหลายทศวรรษ ก่อนหน้านี้รู้จักกันในชื่อShoeboxหน้าที่หลักของ Toolbox คือการสร้างฐานข้อมูลคำศัพท์ และการแทรกบรรทัดของข้อความผ่านการโต้ตอบกับฐานข้อมูลคำศัพท์ ทั้งฐานข้อมูลคำศัพท์และข้อความสามารถส่งออกไปยังสภาพแวดล้อมการประมวลผลคำได้ ในกรณีของฐานข้อมูลคำศัพท์โดยใช้เครื่องมือแปลง Multi-Dictionary Formatter ( MDF ) นอกจากนี้ยังสามารถใช้ Toolbox เป็นสภาพแวดล้อมการถอดเสียงได้อีกด้วย[ 11 ]เมื่อเปรียบเทียบกับ ELAN และ FLEx Toolbox มีฟังก์ชันการทำงานที่ค่อนข้างจำกัด และบางคนรู้สึกว่ามีการออกแบบและอินเทอร์เฟซที่ไม่ใช้งานง่าย อย่างไรก็ตาม โครงการจำนวนมากได้ดำเนินการในสภาพแวดล้อม Shoebox/Toolbox ตลอดอายุการใช้งาน และฐานผู้ใช้ยังคงได้รับประโยชน์จากความคุ้นเคย ความเร็ว และการสนับสนุนจากชุมชน นอกจากนี้ Toolbox ยังมีข้อดีคือสามารถทำงานได้โดยตรงกับไฟล์ข้อความที่มนุษย์อ่านได้ ซึ่งสามารถเปิดได้ในโปรแกรมแก้ไขข้อความใดก็ได้ และแก้ไขและจัดเก็บได้อย่างง่ายดาย ไฟล์ Toolbox ยังสามารถแปลงเพื่อจัดเก็บในรูปแบบ XML ได้อย่างง่ายดาย (แนะนำสำหรับการจัดเก็บถาวร) เช่นเดียวกับไลบรารี Python แบบโอเพนซอร์สอย่างXigtซึ่งออกแบบมาสำหรับการใช้งานเชิงคำนวณของข้อมูล IGT
เครื่องมือสำหรับการทำงานอัตโนมัติในบางส่วนของเวิร์กโฟลว์
การจัดทำเอกสารเกี่ยวกับภาษาอาจทำได้โดยอัตโนมัติบางส่วนด้วยเครื่องมือซอฟต์แวร์หลายชนิด ซึ่งรวมถึง:
- อีสปีค
- เอชทีเค
- Lingua Libreเป็น เครื่องมือออนไลน์ ฟรีที่ช่วยให้บันทึกคำและวลีจำนวนมากได้ในเวลาอันสั้น (สูงสุด 1,000 คำต่อชั่วโมง หากมีรายการคำศัพท์ที่สะอาดและผู้ใช้ที่มีประสบการณ์) เครื่องมือนี้จะทำให้ขั้นตอนการบันทึกเสียงและวิดีโอการออกเสียงแบบดั้งเดิม (สำหรับ ภาษา พูดและ ภาษา มือ ) เป็นไปโดยอัตโนมัติ เมื่อการบันทึกเสร็จสิ้น แพลตฟอร์มจะอัปโหลดไฟล์ที่สะอาด เรียบร้อย ตั้งชื่ออย่างดี และใช้งานได้ง่ายกับแอปพลิเคชัน ไปยังWikimedia Commons โดยอัตโนมัติ (สามารถดาวน์โหลดชุดข้อมูลสำหรับภาษาใดภาษาหนึ่งได้)
- เมาส์
- Prosodylab Aligner
- ซ็อกซ์
วรรณกรรม
วารสารวิชาการที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิอย่างLanguage Documentation and Conservationได้ตีพิมพ์บทความจำนวนมากที่เน้นเรื่องเครื่องมือและวิธีการในการบันทึกภาษา
ฟิล์ม
ภาพยนตร์สารคดีอินเดียปี 2021 เรื่อง Dreaming of WordsติดตามชีวิตและผลงานของNjattyela Sreedharanผู้ที่เรียนไม่จบชั้นประถมศึกษาปีที่ 4 ซึ่งได้รวบรวมพจนานุกรมหลายภาษาที่เชื่อมโยงภาษาดราวิเดียน หลัก 4 ภาษา ได้แก่ มาลายาลัม กันนาดา ทมิฬและเตลูกู [ 12 ] [ 13 ] [ 14 ] เขาใช้เวลา 25 ปี[ 15 ]ในการสร้างพจนานุกรมหลายภาษานี้ โดยเดินทางไปทั่ว 4 รัฐและทำการวิจัยอย่างกว้างขวาง
ดูเพิ่มเติม
แผนที่ทรัพยากรภาษา LRE Mapสามารถค้นหาได้ตามประเภททรัพยากร ภาษา ประเภทภาษา รูปแบบการใช้งาน การใช้งานทรัพยากร ความพร้อมใช้งาน สถานะการผลิต การประชุม และชื่อทรัพยากร
แคตตาล็อก GitHub ของ Richard Littauer: แคตตาล็อกของ "โค้ดโอเพนซอร์สที่จะเป็นประโยชน์สำหรับการจัดทำเอกสาร การอนุรักษ์ การพัฒนา การรักษา หรือการทำงานกับภาษาที่ใกล้สูญพันธุ์"
หน้าซอฟต์แวร์ RNLD: หน้าเว็บของเครือข่ายวิจัยเพื่อความหลากหลายทางภาษา (Research Network for Linguistic Diversity) เกี่ยวกับซอฟต์แวร์ทางภาษาศาสตร์
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เครื่องมือและวิธีการจัดทำเอกสารภาษา
สาขา การจัดทำเอกสารภาษา ในบริบทสมัยใหม่เกี่ยวข้องกับชุดเครื่องมือและวิธีการที่ซับซ้อนและมีการพัฒนาอย่างต่อเนื่อง และการศึกษาและการพัฒนาการใช้งานเครื่องมือและวิธีการเหล่านั้น...
หลักการและขั้นตอนการทำงาน
นักวิจัยด้านการบันทึกภาษา มักทำการสำรวจภาคสนามทางภาษาศาสตร์เพื่อรวบรวมข้อมูลที่เป็นพื้นฐานของงานวิจัย โดยบันทึกไฟล์ภาพและเสียงที่แสดงให้เห็นถึงการใช้ภาษาในบริบทดั้งเดิม เนื่องจากสภาพแวดล้อมในการสำรวจภาคสนามทางภาษาศาสตร์มักมีความท้าทายในด้านโลจิสติกส์...
จริยธรรม
แนวปฏิบัติทางจริยธรรมในการบันทึกภาษาเป็นประเด็นสำคัญของการอภิปรายและการถกเถียงในช่วงไม่นานมานี้ [ 3 ] สมาคม ภาษาศาสตร์แห่งอเมริกา ได้จัดทำแถลงการณ์ด้านจริยธรรมและดูแลบล็อกสนทนาด้านจริยธรรมซึ่งมุ่งเน้นไปที่จริยธรรมในบริบทของการบันทึกภาษาเป็นหลัก...
รูปแบบข้อมูล
การปฏิบัติตามมาตรฐานรูปแบบข้อมูลมีความสำคัญอย่างยิ่งต่อการทำงานร่วมกันระหว่างเครื่องมือซอฟต์แวร์ คลังข้อมูลหรือแหล่งเก็บข้อมูลแต่ละแห่งมีมาตรฐานและข้อกำหนดเฉพาะของตนเองสำหรับข้อมูลที่จัดเก็บไว้ในเซิร์ฟเวอร์...