กลับไปหน้าบทความ

อ่าน 10 นาที

อักษรโรมัน

ในทางภาษาศาสตร์การถอดเสียงเป็นอักษรโรมันหรือการแปลงเป็นอักษรโรมันคือการแปลงข้อความจากระบบการเขียน อื่น ไปเป็นอักษรโรมัน (ละติน)หรือระบบที่ใช้ในการแปลงนั้น...

อักษรโรมัน

ภาษาจีนกลางเช่นเดียวกับภาษาอื่นๆ อีกมากมาย สามารถถอดเสียงเป็นอักษรโรมันได้หลายวิธี ดังภาพด้านบน: อักษร จีนตัว เต็ม และ ตัวย่อ ที่แสดงความหมายภาษาจีน และระบบการถอดเสียงเป็นอักษรโรมัน ได้แก่ Hanyu Pinyin , Gwoyeu Romatzyh , Wade-GilesและYaleสำหรับอักษรเหล่านั้น

ในทางภาษาศาสตร์การถอดเสียงเป็นอักษรโรมันหรือการแปลงเป็นอักษรโรมันคือการแปลงข้อความจากระบบการเขียน อื่น ไปเป็นอักษรโรมัน (ละติน)หรือระบบที่ใช้ในการแปลงนั้น วิธีการถอดเสียงเป็นอักษรโรมัน ได้แก่การถอดเสียงแบบธรรมดา (Transliteration ) สำหรับการแสดงข้อความที่เขียน และการถอดเสียง แบบตรงตัว (Transcription ) สำหรับการแสดงคำพูด และการผสมผสานทั้งสองวิธี วิธีการถอดเสียงแบบตรงตัวสามารถแบ่งย่อยได้เป็นการถอดเสียงแบบหน่วยเสียง (Phonemic Transcription ) ซึ่งบันทึกหน่วยเสียงหรือหน่วยความหมายในคำพูด และ การถอดเสียงแบบสัทศาสตร์ (Phonetic Transcription ) ที่เข้มงวดกว่า ซึ่งบันทึกเสียงพูดด้วยความแม่นยำ

วิธีการ

มีระบบการถอดเสียงเป็นอักษรโรมันที่สอดคล้องกันหรือได้มาตรฐาน อยู่หลาย ระบบ สามารถจำแนกประเภทได้ตามลักษณะเฉพาะของระบบนั้นๆ ลักษณะเฉพาะของระบบใดระบบหนึ่งอาจทำให้เหมาะสมกับการใช้งานที่หลากหลาย ซึ่งบางครั้งอาจขัดแย้งกัน เช่น การค้นหาเอกสาร การวิเคราะห์ทางภาษาศาสตร์ การอ่านง่าย และการถ่ายทอดการออกเสียงอย่างถูกต้อง

  • ภาษาต้นฉบับ หรือภาษาผู้ให้ – ระบบอาจได้รับการปรับแต่งเพื่อแปลงข้อความจากภาษาใดภาษาหนึ่งโดยเฉพาะ หรือจากกลุ่มภาษา หรือสำหรับภาษาใดภาษาหนึ่งในระบบการเขียนเฉพาะ ระบบที่เฉพาะเจาะจงกับภาษาโดยทั่วไปจะรักษาลักษณะเฉพาะของภาษา เช่น การออกเสียง ในขณะที่ระบบทั่วไปอาจเหมาะสมกว่าสำหรับการจัดทำรายการข้อความระหว่างประเทศ
  • ภาษาเป้าหมาย หรือภาษาของผู้รับ – ระบบส่วนใหญ่มีจุดประสงค์เพื่อกลุ่มเป้าหมายที่พูดหรืออ่านภาษาใดภาษาหนึ่งโดยเฉพาะ ( ระบบการถอดเสียงอักษรซีริลลิกเป็นอักษรโรมัน สากลนั้น อิงตามอักษรในยุโรปกลาง เช่น อักษร เช็กและโครเอเชีย )
  • ความเรียบง่าย – เนื่องจากอักษรละติน พื้นฐาน มีจำนวนตัวอักษรน้อยกว่าระบบการเขียนอื่นๆ หลายระบบ จึงต้องใช้ อักษรคู่ เครื่องหมายกำกับเสียงหรืออักขระพิเศษเพื่อแทนตัวอักษรทั้งหมดในอักษรละติน ซึ่งส่งผลต่อความสะดวกในการสร้าง การจัดเก็บและการส่งข้อมูลดิจิทัล การทำสำเนา และการอ่านข้อความที่เขียนเป็นอักษรโรมัน
  • ความสามารถในการย้อนกลับ – ว่าจะสามารถกู้คืนข้อความต้นฉบับจากข้อความที่แปลงแล้วได้หรือไม่ ระบบที่สามารถย้อนกลับได้บางระบบอาจอนุญาตให้สร้างเวอร์ชันที่เรียบง่ายกว่าซึ่งไม่สามารถย้อนกลับได้

การถอดเสียง

หากการถอดเสียงเป็นอักษรโรมันพยายามถอดเสียงจากอักษรต้นฉบับ หลักการสำคัญคือการจับคู่ตัวอักษรจากภาษาต้นฉบับไปยังอักษรโรมันแบบหนึ่งต่อหนึ่ง โดยให้ความสำคัญน้อยลงกับเสียงที่ได้ยินเมื่อออกเสียงตามภาษาของผู้รับชม ตัวอย่างเช่นการถอดเสียงภาษาญี่ปุ่น เป็นอักษรโรมัน แบบ Nihon-shiki ช่วยให้ผู้รับชมที่มีความรู้สามารถถอดเสียงพยางค์คะนะ ภาษาญี่ปุ่นต้นฉบับได้อย่างถูกต้อง 100% แต่ต้องอาศัยความรู้เพิ่มเติมสำหรับการออกเสียงที่ถูกต้อง

การถอดเสียง

สัทศาสตร์

การถอดเสียงภาษาญี่ปุ่นเป็นอักษรโรมันส่วนใหญ่มีจุดประสงค์เพื่อให้ผู้อ่านทั่วไปที่ไม่คุ้นเคยกับอักษรต้นฉบับสามารถออกเสียงภาษาต้นฉบับได้อย่างถูกต้องแม่นยำพอสมควร การถอดเสียงเหล่านี้ยึดหลักการถอดเสียงตามหน่วยเสียงและพยายามถ่ายทอดเสียงสำคัญ ( หน่วยเสียง ) ของภาษาต้นฉบับให้ซื่อตรงที่สุดเท่าที่จะเป็นไปได้ในภาษาเป้าหมาย การถอดเสียงภาษาญี่ปุ่น เป็นอักษรโรมันแบบเฮปเบิร์นที่เป็นที่นิยมเป็นตัวอย่างหนึ่งของการถอดเสียงตามหน่วยเสียงที่ออกแบบมาสำหรับผู้พูดภาษาอังกฤษ

สัทศาสตร์

การแปลง เป็นสัทศาสตร์นั้นก้าวไปอีกขั้นหนึ่งโดยพยายามแสดงหน่วยเสียง ทั้งหมด ในภาษาต้นฉบับ โดยยอมเสียสละความชัดเจนหากจำเป็นด้วยการใช้ตัวอักษรหรือแบบแผนที่ไม่มีอยู่ในอักษรเป้าหมาย ในทางปฏิบัติ การแสดงผลแบบนี้แทบจะไม่พยายามแสดง หน่วยเสียงย่อยที่เป็นไปได้ ทั้งหมดโดยเฉพาะอย่างยิ่งหน่วยเสียงย่อยที่เกิดขึ้นตามธรรมชาติเนื่องจาก ผล ของการออกเสียงร่วมกันและจะจำกัดตัวเองไว้เฉพาะความแตกต่างของหน่วยเสียงย่อยที่สำคัญที่สุดเท่านั้นอักษรสัทศาสตร์สากลเป็นระบบการถอดเสียงสัทศาสตร์ที่ใช้กันมากที่สุด

ประนีประนอม

สำหรับคู่ภาษาส่วนใหญ่ การสร้างระบบการถอดเสียงเป็นอักษรโรมันที่ใช้งานได้นั้นเกี่ยวข้องกับการประนีประนอมระหว่างสองขั้ว การถอดเสียงแบบบริสุทธิ์มักเป็นไปไม่ได้ เนื่องจากภาษาต้นฉบับมักมีเสียงและความแตกต่างที่ไม่พบในภาษาเป้าหมาย แต่จำเป็นต้องแสดงออกมาเพื่อให้รูปแบบการถอดเสียงเป็นอักษรโรมันนั้นเข้าใจได้ ยิ่งไปกว่านั้น เนื่องจาก การเปลี่ยนแปลงทั้งใน เชิงประวัติศาสตร์และเชิงปัจจุบันไม่มีภาษาเขียนใดที่แสดงถึงภาษาพูดได้อย่างแม่นยำสมบูรณ์แบบ และการตีความเสียงของตัวอักษรอาจแตกต่างกันอย่างมากในแต่ละภาษา ในยุคปัจจุบัน ลำดับการถอดเสียงมักจะเป็นภาษาต่างประเทศที่พูด ภาษาต่างประเทศที่เขียน ภาษาแม่ที่เขียน และภาษาแม่ที่พูด (อ่าน) การลดจำนวนกระบวนการเหล่านั้น กล่าวคือ การลบขั้นตอนการเขียนออกหนึ่งหรือทั้งสองขั้นตอน มักจะนำไปสู่การออกเสียงที่แม่นยำยิ่งขึ้น โดยทั่วไป นอกเหนือจากกลุ่มนักวิชาการจำนวนจำกัดแล้ว ระบบการถอดเสียงเป็นอักษรโรมันมักจะเอนเอียงไปทางการถอดเสียงมากกว่า ยกตัวอย่างเช่น ศิลปะการต่อสู้ของญี่ปุ่น 柔術: การถอดเสียงเป็นอักษรโรมันแบบ Nihon-shiki ว่าzyûzyutuอาจทำให้คนที่รู้ภาษาญี่ปุ่นสามารถถอดเสียงเป็นพยางค์คะนะ じゅうじゅつ ได้แต่ผู้พูดภาษาอังกฤษเป็นภาษาแม่ส่วนใหญ่ หรือที่จริงแล้วผู้อ่านภาษาอังกฤษส่วนใหญ่ จะเดาการออกเสียงจากเวอร์ชันของเฮปเบิร์นว่าjūjutsu ได้ ง่ายกว่า

การถอดเสียงระบบการเขียนเฉพาะบางระบบเป็นอักษรโรมัน

ภาษาอาหรับ

อักษรอาหรับใช้เขียนภาษาอาหรับเปอร์เซียอูร์ดูปัชโตและสินธีรวมถึงภาษาอื่นๆ อีกมากมายในโลกมุสลิม โดยเฉพาะ ภาษา แอฟริกันและเอเชียที่ไม่มีตัวอักษรเป็นของตนเอง มาตรฐานการถอดเสียงเป็นอักษรโรมันมีดังต่อไปนี้:

ภาษาอาหรับ

เปอร์เซีย

พยัญชนะ
ยูนิโค้ดอักษรเปอร์เซียไอพีเอดีเอ็มจี (1969)ALA-LC (1997)BGN/PCGN (1958)อีไอ (1960)อีไอ (2012)สหประชาชาติ (1967)สหประชาชาติ (2012) การออกเสียง
ยู+0627อะʔ, [ a ]ʾ, — [ b ]ʼ, — [ b ]ʾ - เช่น อุ๊ย!
ยู+0628บีบี เช่น บ็อบ
ยู+067อีพีพี P เหมือนกับคำว่า pet
ยู+062เอทีที T ย่อมาจาก Tall (สูง)
ยู+062บีثไทยS เช่นเดียวกับคำว่า sand
ยู+062ซีجǧเจเจดีเจเจเจ เจ เหมือนกับ แยม
ยู+0686چทีเอččč ช เหมือนกับ ชาร์ลี
ยู+062Dحชม.ชมชมḩ/ḥ [ c ]ชมชมชม. H เหมือนกับคำว่า holiday
ยู+062อีخxชมkhkhk͟hkhx ค่อนข้างคล้ายกับภาษาเยอรมัน Ch
ยู+062เอฟD เหมือนกับ Dave
U+0630ذzd͟hz Z หมายถึงศูนย์
ยู+0631R เหมือนกับคำว่ากระต่าย
ยู+0632زzz Z หมายถึงศูนย์
ยู+0698ژʒžzhzhz͟hžzhž S เช่นเดียวกับโทรทัศน์

หรือ G ในความหมายทั่วไป

ยู+0633S เหมือนกับแซม
ยู+0634ʃššš ช (Sh) เหมือนกับคำว่าแกะ
ยู+0635صş/ṣ [ c ]şS เหมือนกับแซม
ยู+0636ضzżżz Z หมายถึงศูนย์
ยู+0637طทีţ/ṭ [ c ]ţที t เหมือนกับคำว่า tank
ยู+0638ظzz̧/ẓ [ c ]z Z หมายถึงศูนย์
ยู+0639عʕʿʻʼ [ b ]ʻʻʿʿ _____
ยู+063เอغɢ~ɣġghghจีเอชghq ค่อนข้างคล้ายกับภาษาฝรั่งเศส R
ยู+0641เอฟเอฟ F เหมือนกับ Fred
ยู+0642قɢ~ɣqq ค่อนข้างคล้ายกับภาษาฝรั่งเศส R
ยู+06A9کเคเค C เหมือนกับคำว่า card
U+06AFɡจี G เหมือนกับคำว่า go
ยู+0644L เหมือนกับคำว่า lamp
ยู+0645M ย่อมาจาก Michael
ยู+0646nn N เหมือนกับชื่อ
ยู+0648และv~w [ a ] ​​[ d ]วีv, w [ e ]วี V เหมือนกับคำว่า vision (การมองเห็น)
ยู+0647ه[]ชม.ชม.[]ชม.[][]H เหมือนกับคำว่า ร้อน
ยู+0629ة∅, tเอช[จี]ไทย]เอช[จี]
ยู+06ซีซีیj [ a ]y Y เหมือนกับ Yale
ยู+0621ءʔ, ʾʼʾ
ยู+0623أʔ, ʾʼʾ
ยู+0624ؤʔ, ʾʼʾ
ยู+0626ئʔ, ʾʼʾ
สระ[ i ]
ยูนิโค้ดสุดท้ายด้านในอักษรย่อโดดเดี่ยวไอพีเอดีเอ็มจี (1969)ALA-LC (1997)BGN/PCGN (1958)อีไอ (2012)สหประชาชาติ (1967)สหประชาชาติ (2012) การออกเสียง
ยู+064อีـَـَاَاَæเอเอเอเอเอเอ A เหมือนกับแมว
ยู+064เอฟـُـُاُاُโอโอโอโอคุณโอโอ O เหมือนกับคำว่า go
U+0648 U+064Fـوـوโอ[เจ]โอโอโอคุณโอโอ O เหมือนกับคำว่า go
ยู+0650ـِـِاِاِอีอีฉันอีอีอีอี E เช่นเดียวกับคำว่า ten
U+064E U+0627ـَاـَاآآɑː~ɒːอาอาอาอาอาอา O เช่นเดียวกับคำว่า ร้อน
ยู+0622ـآـآآآɑː~ɒːā, ʾā [ k ]ā, ʼā [ k ]อาอาอาอา O เช่นเดียวกับคำว่า ร้อน
U+064E U+06CCـَیɑː~ɒːอาอาอาอาอาอา O เช่นเดียวกับคำว่า ร้อน
U+06CC U+0670ـیٰɑː~ɒːอาอาอาอาอาอา O เช่นเดียวกับคำว่า ร้อน
U+064F U+0648ـُوـُواُواُوuː, [ e ]ūūūu, ō [ e ]ūคุณ คุณหมายถึงตัวจริง ๆ
U+0650 U+06CCـیـیـایـอีiː, [ e ]ฉันฉันฉันi, ē [ e ]ฉันฉัน Y เหมือนกับคำว่ามีความสุข
U+064E U+0648ـَوـَواَواَوโอ้~โอ้[ e ]auโอ้โอ๊ยโอ้, โอ้[ e ]โอ๊ยโอ๊ย O เหมือนกับคำว่า go
U+064E U+06CCـَیـَیـاَیـاَیej~aj [ e ]AIอายeyey, ay [ e ]eyey เอย์ เหมือนกับการเล่น
U+064E U+06CCـیِ–e, –je-ดวงตา–ฉัน –ยี่-ดวงตา-ดวงตา-ดวงตา-ดวงตา ใช่ (Ye) ในความหมายว่า ใช่
ยู+06C0ـهٔ–เจ–เย-ฉัน–เย–เย–เย–เย ใช่ (Ye) ในความหมายว่า ใช่

หมายเหตุ :

  1. ^ a b c dใช้เป็นสระได้เช่นกัน
  2. ^ a b c Hamzeh และ eyn จะไม่ถูกถอดเสียงที่ต้นคำ
  3. ^ a b c dสามารถใช้จุดด้านล่างแทนตัวอักษร cedilla ได้
  4. ^ ในภาษาเปอร์เซียคลาสสิก เมื่อเริ่มต้นคำ การรวมกันของเสียงخوจะออกเสียงเป็น /xw/หรือ /xʷ/ในภาษาเปอร์เซียสมัยใหม่ เสียงเลื่อน /ʷ/ได้หายไปแล้ว แม้ว่าการสะกดคำจะไม่ได้เปลี่ยนแปลงก็ตาม อาจยังคงได้ยินในภาษาดารีในฐานะการออกเสียงที่หลงเหลืออยู่ การรวมกันของเสียง /xʷa/ได้เปลี่ยนเป็น /xo/ (ดูด้านล่าง)
  5. ^ a b c d e f g h iในภาษาดารี
  6. ^ a b cไม่มีการถอดเสียงที่ท้ายคำ
  7. ^ a bในการใช้یةต่อท้ายคำ
  8. ^เมื่อใช้แทนتที่ท้ายคำ
  9. ^เครื่องหมายกำกับเสียง ( harekat ) แทบจะไม่ถูกเขียนเลย
  10. ^ตามหลังخจาก /xʷa/ ก่อนหน้า มักถอดเสียงเป็น xwaหรือ xvaตัวอย่างเช่น خور /xor/ "ดวงอาทิตย์" คือ /xʷar/ในภาษาเปอร์เซียคลาสสิก
  11. ^ a bหลังสระ

อาร์เมเนีย

จอร์เจีย

จดหมายจอร์เจียไอพีเอระบบแห่งชาติ(2002)บีจีเอ็น/พีซีเอ็นจีเอ็น (1981–2009)ISO 9984 (1996)ALA-LC (1997)ระบบที่ไม่เป็นทางการKartvelo translitเอ็นจีอาร์2
/ɑ/เอ เอ เอ เอ เอ เอ เอ
/b/
/ɡ/จี จี จี จี จี จี จี
/d/
/ɛ/อี อี อี อี อี อี อี
/v/วี วี วี วี วี วี วี
/z/z z z z z z z
[ a ]/eɪ/ey เอ เอ เอ อีเจ
/tʰ/ที ที ที ที[บี]หรือ ที ที t / t̊
/ฉัน/ฉัน ฉัน ฉัน ฉัน ฉัน ฉัน ฉัน
/kʼ/เค เค เค เค ǩ
/ล/
/ม/
/n/n n n n n n n
[ a ]/i/, /j/เจ y y เจ ฉัน
/ɔ/โอโอ โอ โอ โอ โอ โอ
/pʼ/พี พี พี พี พี
/ʒ/zh zh ž ž J, [ b ] zh หรือ j ž
/r/
/s/
/tʼ/ที ที ที ที ที
[ a ]/w/ŭ
/u/คุณคุณ คุณ คุณ คุณ คุณ คุณ
/pʰ/พี พี พี พี หรือ เอฟ พี พี / พี̊
/kʰ/เคq หรือ k q หรือ k k / k̊
/ʁ/ghgh ġ g, gh หรือ R [ b ]g, gh หรือ R [ b ]
/qʼ/q q q y [ c ]q q
/ʃ/š š sh หรือ S [ b ]š x
/t͡ʃ(ʰ)/ชʼ č̕ čʻ ch หรือ C [ b ]č
/t͡s(ʰ)/ทีเอสtsʼ c cor ts
/d͡z/dz dz เจ ż dz หรือ Z [ b ]ʒ
/t͡sʼ/tsʼ ทีเอส w, c หรือ ts ʃ
/t͡ʃʼ/ชʼ č č W, [ b ] ch หรือ tch ʃ̌
/χ/kh kh x x x หรือ kh (พบได้น้อย) x
[ a ]/q/, /qʰ/ชม
/d͡ʒ/เจเจ ǰ เจ เจ - เจ
/ชม/ชม. ชม. ชม. ชม. ชม. ชม. ชม.
[ a ]/oː/โอ โอ ȯ ชม

หมายเหตุ :

  1. ^ a b c d eอักษรโบราณ
  2. ^ a b c d e f g hสิ่งเหล่านี้ได้รับอิทธิพลจากรูปแบบที่กล่าวมาข้างต้น และเป็นที่นิยมเพื่อหลีกเลี่ยงความกำกวม เนื่องจากสำนวน: t, j, g, ch สามารถหมายถึงตัวอักษรสองตัวได้
  3. ^ในขั้นต้น การใช้ตัวอักษร y แทน ყ น่าจะเป็นเพราะตัวอักษรทั้งสองมีความคล้ายคลึงกัน

กรีก

มีระบบการถอดเสียงภาษากรีกเป็นอักษรโรมันสำหรับทั้งภาษา กรีก สมัยใหม่และภาษากรีกโบราณ

ภาษาฮีบรู

อักษรฮีบรูถูกแปลงเป็นอักษรโรมันโดยใช้มาตรฐานหลายประการ:

  • ANSI Z39.25 (1975)
  • อุงเก็น (1977) [ 11 ]
  • ISO 259 (1984): การถอดเสียงเป็นอักษรโรมัน
  • ISO 259-2 (1994): การถอดเสียงแบบง่าย
  • ISO/DIS 259-3: การถอดเสียงตามหน่วยเสียง
  • ALA-LC [ 12 ]

อักษรอินเดีย (อักษรพราหมณ์)

ตระกูลอักษรพราหมณ์ของอักษรอะบูจิดาใช้สำหรับภาษาในอนุทวีปอินเดียและเอเชียตะวันออกเฉียงใต้ มีประเพณีอันยาวนานในตะวันตกในการศึกษา ภาษา สันสกฤตและตำราอินเดียอื่นๆ โดยใช้การถอดเสียงเป็นอักษรละติน มีการใช้แบบแผนการถอดเสียงต่างๆ สำหรับอักษรอินเดียมาตั้งแต่สมัยของเซอร์วิลเลียม โจนส์[ 13 ]

เทวนาครี–นัสตา'ลิก (ฮินดู)

ภาษา ฮินดูสถานีเป็นภาษาอินโด-อารยัน ที่มี การเขียนและการพูดสองแบบอย่างรุนแรงซึ่งเป็นผลมาจากข้อพิพาทระหว่างภาษาฮินดีและภาษาอูร์ดูที่เริ่มต้นขึ้นในช่วงทศวรรษ 1800 ในทางเทคนิคแล้ว ภาษาฮินดูสถานีเองก็ไม่ได้รับการยอมรับจากทั้งชุมชนภาษาหรือรัฐบาลใดๆ มีเพียงสองมาตรฐาน ภาษา คือภาษาฮินดีมาตรฐานและภาษาอูร์ดูมาตรฐานที่ได้รับการยอมรับเป็นภาษาราชการในอินเดียและปากีสถาน อย่างไรก็ตาม ในทางปฏิบัติ สถานการณ์เป็นเช่นนี้

  • ในปากีสถาน ภาษาอูร์ดูมาตรฐาน (Saaf หรือ Khaalis) เป็นภาษาอูร์ดู "ชั้นสูง" ในขณะที่ภาษาอูร์ดูฮินดูสถานีเป็นภาษาอูร์ดู "ชั้นต่ำ" ที่ใช้โดยประชาชนทั่วไป (เรียกว่าภาษาอูร์ดู เขียนด้วยอักษรนัสตาลีก )
  • ในอินเดีย ทั้งภาษาฮินดีมาตรฐาน (Shuddh) และภาษาอูร์ดูมาตรฐาน (Saaf หรือ Khaalis) เป็นภาษาประเภท "H" (เขียนด้วยอักษรเทวนาครีและนัสตาลีกตามลำดับ) ในขณะที่ภาษาฮินดูสถานีเป็นภาษาประเภท "L" ที่ใช้โดยคนทั่วไปและเขียนด้วยอักษรเทวนาครีหรือนัสตาลีก (และเรียกว่า 'ฮินดี' หรือ 'อูร์ดู' ตามลำดับ)

ระบบการเขียนแบบสองอักษรทำให้ผู้ใช้อักษรอีกแบบหนึ่งเข้าถึงงานเขียนใดๆ ได้ยาก แม้ว่าโดยทั่วไปแล้วภาษาฮินดูสถานีเป็นภาษาที่เข้าใจกันได้โดยสมบูรณ์ ซึ่งหมายความว่า การทำงานร่วมกัน แบบเปิดแหล่ง ที่มาโดยใช้ข้อความ นั้นเป็นไปไม่ได้ระหว่างผู้อ่านอักษรเทวนาครีและนัสตาลีก

โครงการ Hamari Boli Initiative [ 15 ] ซึ่งริเริ่มในปี 2011 เป็นโครงการ วางแผนภาษาแบบโอเพ่นซอร์สเต็มรูปแบบที่มุ่งเน้นการปฏิรูปและปรับปรุงระบบการเขียน รูปแบบ สถานะ และคำศัพท์ของภาษาฮินดูสถานี หนึ่งในวัตถุประสงค์หลักที่ระบุไว้ของ Hamari Boli คือการบรรเทาปัญหาการใช้ระบบอักษรคู่เทวนาครี-นัสตาลีคที่ทำให้ภาษาฮินดูสถานีอ่อนแอลงด้วยการใช้ระบบอักษรโรมัน[ 16 ]

ชาวจีน

การถอดเสียงภาษาจีนโดยเฉพาะภาษาจีนกลาง เป็นอักษร โรมัน พิสูจน์แล้วว่าเป็นปัญหาที่ยากมาก แม้ว่าปัญหานี้จะซับซ้อนยิ่งขึ้นด้วยปัจจัยทางการเมืองก็ตาม ด้วยเหตุนี้ ตารางการถอดเสียงเป็นอักษรโรมันจำนวนมากจึงประกอบด้วยอักษรจีนบวกกับอักษรโรมันหรือ จูหยินอย่าง น้อยหนึ่งตัว

ภาษาจีนกลาง

จีน
ไต้หวัน
  1. Gwoyeu Romatzyh (GR, 1928–1986, ในไต้หวัน 1945–1986; ไต้หวันใช้อักษรโรมาจิของญี่ปุ่นก่อนปี 1945)
  2. สัญลักษณ์สัทศาสตร์ภาษาจีนกลาง ฉบับที่ 2 (MPS II, 1986–2002)
  3. ทองหยง พินยิน (2545-2551), [ 19 ] [ 20 ]และ
  4. ฮันยู พินอิน (ตั้งแต่วันที่ 1 มกราคม พ.ศ. 2552) [ 21 ] [ 22 ]
สิงคโปร์

กวางตุ้ง

หวู

มินหนาน หรือ ฮกเกี้ยน

แต้จิ๋ว

มินดง

มินเป่ย

ญี่ปุ่น

การถอดเสียงเป็นอักษรโรมัน (หรือโดยทั่วไปเรียกว่าอักษรโรมัน ) ในภาษาญี่ปุ่นเรียกว่า " โรมาจิ " ระบบที่ใช้กันทั่วไปมากที่สุด ได้แก่:

  • เฮปเบิร์น (1867): การถอดเสียงตามหลักสัทศาสตร์ตามแบบแองโกล-อเมริกัน ซึ่งใช้ในชื่อทางภูมิศาสตร์
  • Nihon-shiki (1885): การถอดเสียงเป็นอักษรโรมัน และถูกนำมาใช้เป็นมาตรฐาน ( ISO 3602 Strict ) ในปี 1989 ด้วย
  • Kunrei-shiki (1937): การถอดเสียงตามหลักสัทศาสตร์ นำมาใช้เป็นมาตรฐาน ( ISO 3602 ) ด้วยเช่นกัน
  • JSL (1987): การถอดเสียงตามหน่วยเสียง ตั้งชื่อตามหนังสือJapanese: The Spoken Languageโดย Eleanor Jorden
  • ALA-LC : คล้ายกับ Modified Hepburn [ 23 ]
  • วา ปูโร (Wāpuro ): การถอดเสียงภาษาญี่ปุ่นเป็นอักษรโรมัน (word processor romanization) ไม่ใช่ระบบที่ตายตัว แต่เป็นชุดของแนวปฏิบัติทั่วไปที่ช่วยให้สามารถป้อนข้อความภาษาญี่ปุ่นได้

เกาหลี

ระบบต่อไปนี้เป็นระบบที่ใช้กันอย่างแพร่หลายที่สุดในปัจจุบัน:

แบบไทย

ภาษาไทยซึ่งใช้พูดในประเทศไทยและบางพื้นที่ของลาว พม่า และจีน เขียนด้วยอักษรของตนเองซึ่งน่าจะสืบเชื้อสายมาจากการผสมผสานระหว่างอักษรไท-ลาวและอักษรเขมรโบราณในตระกูลอักษรพราหมณ์

นัวซู

ภาษาหนูซูซึ่งเป็นภาษาที่พูดกันในภาคใต้ของจีน เขียนด้วยอักษรเฉพาะของตนเอง คืออักษรยี่ ระบบการถอดเสียงเป็นอักษร โรมันที่มีอยู่เพียงระบบเดียวคือYYPY (ยี่หยูพินอิน) ซึ่งใช้ตัวอักษรต่อท้ายพยางค์เพื่อแสดงวรรณยุกต์ เนื่องจากภาษาหนูซูห้ามใช้พยางค์ท้ายพยางค์ ระบบนี้ไม่ใช้เครื่องหมายกำกับเสียง และด้วยเหตุนี้ เนื่องจากภาษาหนูซูมีหน่วยเสียงจำนวนมาก จึงจำเป็นต้องใช้อักษรคู่บ่อยครั้ง รวมถึงสำหรับสระเดี่ยวด้วย

ทิเบต

อักษรทิเบตมีระบบการถอดเสียงเป็นอักษรโรมันอย่างเป็นทางการสองระบบ ได้แก่พินอินทิเบต (สำหรับภาษาทิเบตลาซา ) และดซองคาโรมัน (สำหรับภาษาดซองคา )

อักษรซีริลลิก

ในแคตตาล็อกห้องสมุด บรรณานุกรม และสิ่งพิมพ์ทางวิชาการส่วนใหญ่ที่เป็นภาษาอังกฤษจะใช้ ระบบการถอดเสียงแบบหอสมุดแห่งชาติสหรัฐอเมริกา (Library of Congress transliteration) ทั่วโลก

ในทางภาษาศาสตร์การถอดเสียงทางวิทยาศาสตร์ใช้สำหรับทั้งอักษรซีริลลิกและ อักษรกลาโกลิติก ซึ่ง รวมถึงภาษา สลาฟโบราณและภาษาสลาฟ สมัยใหม่ ที่ใช้อักษรเหล่านี้ด้วย

เบลารุส

ชาวบัลแกเรีย

ระบบที่ใช้การถอดเสียงทางวิทยาศาสตร์และISO/R 9:1968ถือเป็นระบบทางการในบัลแกเรียตั้งแต่ทศวรรษ 1970 เป็นต้นมา ตั้งแต่ปลายทศวรรษ 1990 ทางการบัลแกเรียได้เปลี่ยนมาใช้ระบบที่เรียกว่า Streamlined Systemซึ่งหลีกเลี่ยงการใช้เครื่องหมายกำกับเสียงและปรับให้เข้ากันได้กับภาษาอังกฤษ ระบบนี้กลายเป็นระบบบังคับสำหรับการใช้งานสาธารณะด้วยกฎหมายที่ผ่านในปี 2009 [ 26 ]โดยระบบเก่าใช้ <č,š,ž,št,c,j,ă> ส่วนระบบใหม่ใช้ <ch,sh,zh,sht,ts,y,a>

ระบบใหม่ของบัลแกเรียได้รับการรับรองให้ใช้อย่างเป็นทางการโดย UN ในปี 2555 [ 27 ]และโดยBGNและPCGNในปี 2556 [ 28 ]

ชาวคีร์กีซ

มาซิโดเนีย

รัสเซีย

ไม่มีระบบการเขียนภาษารัสเซียโดยใช้ตัวอักษรละตินที่เป็นที่ยอมรับในระดับสากล อันที่จริงแล้วมีระบบการเขียนมากมายหลายแบบ บางระบบปรับให้เข้ากับภาษาเป้าหมายเฉพาะ (เช่น ภาษาเยอรมันหรือภาษาฝรั่งเศส) บางระบบออกแบบมาเพื่อการถอดเสียงของบรรณารักษ์ บางระบบกำหนดไว้ในหนังสือเดินทางของนักเดินทางชาวรัสเซีย การถอดเสียงชื่อบางชื่อเป็นไปตามประเพณีดั้งเดิม ทั้งหมดนี้ส่งผลให้ชื่อซ้ำกันเป็นจำนวนมาก ตัวอย่างเช่น ชื่อของนักประพันธ์เพลงชาวรัสเซียไชคอ ฟสกี อาจเขียนได้หลายแบบ เช่นTchaykovsky , Tchajkovskij , Tchaikowski , Tschaikowski , Czajkowski , Čajkovskij , Čajkovski , Chajkovskij , Çaykovski , Chaykovsky , Chaykovskiy , Chaikovski , Tshaikovski , Tšaikovski , Tsjajkovskijเป็นต้น ระบบต่างๆ ได้แก่ :

  • BGN/PCGN (1947): ระบบการถอดเสียง (คณะกรรมการชื่อทางภูมิศาสตร์แห่งสหรัฐอเมริกาและคณะกรรมการถาวรเกี่ยวกับชื่อทางภูมิศาสตร์สำหรับการใช้งานอย่างเป็นทางการของอังกฤษ) [ 29 ]
  • GOST 16876-71 (1971): มาตรฐานการถอดเสียงภาษาอังกฤษของโซเวียตที่ยกเลิกไปแล้ว ถูกแทนที่ด้วย GOST 7.79 ซึ่งเทียบเท่ากับISO 9
  • ระบบการถอดเสียงชื่อทางภูมิศาสตร์เป็นอักษรโรมัน ของสหประชาชาติ (1987): อ้างอิงจากGOST 16876-71
  • ISO 9 (1995): การถอดเสียง จากองค์การมาตรฐานสากล
  • ALA-LC (1997) [ 30 ]
  • การเข้ารหัสแบบ "โวลาปุก" (ทศวรรษ 1990): คำสแลง (ไม่ใช่โวลาปุก จริงๆ ) สำหรับวิธีการเขียนที่ไม่ใช่การถอดเสียงอย่างแท้จริง แต่ใช้เพื่อจุดประสงค์ที่คล้ายคลึงกัน (ดูบทความ)
  • การถอดเสียงภาษาอังกฤษแบบดั้งเดิมนั้นอิงตาม BGN/PCGN แต่ไม่ได้ยึดตามมาตรฐานเฉพาะใดๆ สามารถดูรายละเอียดเพิ่มเติมได้ที่การถอดเสียงภาษารัสเซียเป็นอักษรโรมัน
  • ระบบที่คล่องตัว[ 31 ] [ 32 ] [ 33 ] [ 34 ] [ 35 ]สำหรับการถอดเสียงภาษารัสเซียเป็นอักษรโรมัน
  • การถอดเสียงเปรียบเทียบภาษารัสเซีย[ 36 ]ในภาษาต่างๆ (ยุโรปตะวันตก อาหรับ จอร์เจีย อักษรเบรลล์ มอร์ส)

ซีเรียค

อักษรละตินสำหรับภาษาซีเรียคได้รับการพัฒนาในช่วงทศวรรษ 1930 ตามนโยบายของรัฐสำหรับภาษาชนกลุ่มน้อยของสหภาพโซเวียตโดยมีการเผยแพร่เนื้อหาบางส่วน[ 37 ]

ยูเครน

ระบบภาษาแห่งชาติยูเครนปี 2010 ได้รับการรับรองโดย UNGEGN ในปี 2012 และโดย BGN/PCGN ในปี 2020 นอกจากนี้ยังมีความใกล้เคียงกับระบบ ALA-LC ที่ปรับปรุง (ทำให้ง่ายขึ้น) ซึ่งไม่มีการเปลี่ยนแปลงมาตั้งแต่ปี 1941

  • ALA-LC [ 38 ]
  • ไอโซ 9
  • การถอดเสียงภาษาอูเครน[ 39 ]
  • ระบบแห่งชาติยูเครนและ BGN/PCGN ในกลุ่มทำงานของสหประชาชาติเกี่ยวกับระบบการถอดเสียงเป็นอักษรโรมัน[ 40 ]
  • การเปรียบเทียบระบบห้าระบบของ Thomas T. Pedersen [ 41 ]

ภาพรวมและบทสรุป

ตารางด้านล่างแสดงการถอดเสียงตามหลักสัทศาสตร์ที่ใช้กันทั่วไปสำหรับอักษรต่างๆ แม้ว่าการถอดเสียงแบบนี้จะเพียงพอสำหรับผู้ใช้ทั่วไปหลายคน แต่ก็มีทางเลือกอื่นๆ อีกมากมายที่ใช้สำหรับแต่ละอักษร และมีข้อยกเว้นหลายประการ สำหรับรายละเอียดเพิ่มเติม โปรดดูที่ส่วนภาษาแต่ละส่วนด้านบน (อักษรฮันกุลถูกแบ่งออกเป็น ส่วนประกอบ จาโม )

โรมัน ไอพีเอกรีกอักษรซีริลลิกอามาซิห์ภาษาฮีบรูภาษาอาหรับเปอร์เซียคาตาคานะฮันกุลโบโปโมโฟ
เอ เอเอเอַ, ֲ, ָَ, اอะ, อะอา
เออี ไอ/เอ ไอ
AI AIי ַ
บี เอ็มพีเอ บีบีבּﺏ ﺑ ﺒ ﺐﺏ ﺑ
ซี k/sΞ
ซีเอช ʧTΣ̈Чצ׳چ
ชิ ʨi
ดี เอ็นที, Δⴷ, ⴹﺩ — ﺪ, ﺽ ﺿ ﻀ ﺾ
ดีเอช ðΔדֿﺫ — ﺬ
ดีซี ʣทีเอส.
อี e/ɛอี, ไออี, ֱ, י ֵֶ, ֵ, י ֶ
อีโอ ʌ
สหภาพยุโรป ɯ
เอฟ เอฟΦפ (หรือรูปสุดท้ายคือ ף )ﻑ ﻓ ﻔ ﻒ
ฟู ɸɯ
จี ɡΓΓ, ΓΚ, ΓГⴳ, ⴳⵯג
จีเอช ɣΓҒגֿ, עֿﻍ ﻏ ﻐ ﻎق غ
ชม ชม.เอชҺⵀ, ⵃח, הﻩ ﻫ ﻬ ﻪ, ﺡ ﺣ ﺤ ﺢه ح ﻫ
HA ฮา
เขา เขา
สวัสดี สวัสดี
โฮ โฮ
ฉัน i/ɪΗ, Ι, Υ, ΕΙ, ΟΙИ, Іִ, י ִดِไอ
ไอวาย ijدِي
เจ ʤTZ̈ДЖ, Џג׳ﺝ ﺟ ﺠ ﺞج
เจเจ ʦ͈/ʨ͈
เค เคเคเคⴽ, ⴽⵯכּﻙ ﻛ ﻜ ﻚکคิ
เคเอ กาคะ
เคอี เค
เคเอช xXХכ, э̿ (หรือรูปแบบสุดท้าย ך )ﺥ ﺧ ﺨ ﺦخ
เคไอ กิ
เคเค
น็อคเอาท์ โคโค
KU
แอล Λแอลﻝ ﻟ ﻠ ﻞ
เอ็ม เอ็มม.מ (หรือรูปสุดท้าย ם )ﻡ ﻣ ﻤ ﻢ
ปริญญาโท มา
ฉัน ฉัน
เอ็มไอ มิมิ
ม. โม
MU มɯ
เอ็น nเอ็นНנ (หรือรูปสุดท้าย ן )ﻥ ﻧ ﻨ ﻦ
เอ็นเอ นา
ตะวันออกเฉียงเหนือ เน
เอ็นจี ŋ
นีโอ ɲi
เลขที่ เลขที่
นู
โอ โอโอ, โอโอ, ֳ, וֹֹُا
โออี ø
พี พีΠพีפּ
พีพี
พีเอส psΨ
คิว qΘקﻕ ﻗ ﻘ ﻖغ ق
อาร์ พีพีⵔ, ⵕרﺭ — ﺮ
อาร์เอ ɾaรา
อีกครั้ง ɾe
ไออาร์ไอ ɾiลี
โรโอ ɾo
อาร์ยู ɾɯแอล
เอส Σซีⵙ, ⵚס, שׂﺱ ﺳ ﺴ ﺲ, ﺹ ﺻ ﺼ ﺺส ต ซ
เอสเอ ซา
เอสอี เซ
เอสเอช ʃΣ̈Шשׁﺵ ﺷ ﺸ ﺶ
ชช ʃʧЩ
ชิ ɕiซิ
ดังนั้น ดังนั้น
เอสเอส
SU
ที ทีทีทีⵜ, ⵟט, תּ, תﺕ ﺗ ﺘ ﺖ, ﻁ ﻃ ﻄ ﻂت ط
ทีเอ ตาต้า
ทีอี ที
ไทย θΘתֿﺙ ﺛ ﺜ ﺚ
ถึง ถึง
ทีเอส ʦΤΣЦצ (หรือรูปสุดท้าย ץ )
ทีเอสยู ʦɯ
ทีที
ยู คุณПХ, ХУ, וֻּดُ
อินเทอร์เฟซผู้ใช้ ɰi
ยูดับบลิว ยูดับบลิวدُو
วี วีบีบีבและ
Ωו, ווﻭ — ﻮ
วอชิงตัน วา
วาอี
เรา เรา
วิสคอนซิน y/ɥi
วอ โว
X x/ksΞ, Χ
วาย เจย, ย, ย, ยЙ, Ы, Јיﻱ ﻳ ﻴ ﻲی
ยา จาЯ
เยเอ เจเอ
เย เจอี, อี
เยโอ
วายไอ จีЇ
โย โจЁ
ยู จูЮ
zΖ3ⵣ, ⵥזﺯ — ﺰ, ﻅ ﻇ ﻈ ﻆز ظ ذ ض
ซเอช ʐ/ʒΖ̈Жז׳ژ

ดูเพิ่มเติม

เกี่ยวกับการถอดเสียงเป็นอักษรโรมัน
  • ไฟล์ IPA สำหรับภาษาอูร์ดูและภาษาอูร์ดูแบบโรมัน สำหรับผู้ใช้มือถือและอินเทอร์เน็ต (ดาวน์โหลด) เก็บถาวรเมื่อวันที่ 23 ธันวาคม 2008 ที่Wayback Machine
  • โปรแกรมแปลงอักษรของ Microsoft  – เครื่องมือสำหรับสร้าง แก้ไขข้อผิดพลาด และใช้งานโมดูลแปลงอักษรจากสคริปต์ใดๆ ไปยังสคริปต์อื่นๆ
  • Randall Barry (บรรณาธิการ) ตารางการถอดเสียงเป็นอักษรโรมันแบบ ALA-LCหอสมุดแห่งชาติสหรัฐอเมริกา, 1997, ISBN 0-8444-0940-5(หนึ่งในหนังสือไม่กี่เล่มที่ตีพิมพ์ซึ่งมีรายชื่อการถอดเสียงเป็นอักษรโรมัน)
  • ตารางการถอดเสียงเป็นอักษรโรมันของหอสมุดแห่งชาติสหรัฐอเมริกาในรูปแบบไฟล์ PDF
  • กลุ่มทำงานด้านระบบการถอดเสียงเป็นอักษรโรมันของ UNGEGN
  • หลักเกณฑ์การถอดอักษรยูนิโค้ด (Unicode Transliteration Guidelines) เก็บถาวรเมื่อวันที่ 28 มีนาคม 2009 ที่Wayback Machine
การถอดเสียงเป็นอักษรโรมันออนไลน์
  • เครื่องมือแปลงเสียงภาษาจีน  – แปลงระหว่างพินอินและรูปแบบอื่นๆ
  • การถอดเสียงและถอดความอักษรซีริลลิกออนไลน์ (ซีริลลิก -> ละติน)
  • eiktub เก็บถาวรเมื่อ 2019-10-25 ที่Wayback Machine  – แผ่นถอดเสียงภาษาอาหรับ
  • Lingua::Translit  – โมดูล Perlที่ครอบคลุมระบบการเขียนหลากหลาย เช่น อักษรซีริลลิกหรืออักษรกรีก มีมาตรฐานและรูปแบบการถอดเสียงที่ใช้กันทั่วไปมากมาย
  • Arabeasy  – โปรแกรมแปลงอักษรอาหรับเป็นภาษาอังกฤษ (มีส่วนขยาย Chrome ฟรี และใช้งานได้กับภาษาเปอร์เซียและภาษาอูร์ดูด้วย)
  • Russianeasy ถูกเก็บถาวรเมื่อวันที่ 8 มีนาคม 2016 ในWayback Machine  – การถอดเสียงภาษารัสเซีย (มีส่วนขยาย Chrome ฟรี)

สำหรับการถอดเสียงภาษาเปอร์เซียเป็นอักษรโรมัน

  • [ https://laatingar.com/dashboard}

สำหรับการถอดเสียงภาษาจีนกวางตุ้งเป็นอักษรโรมัน

  • [1]
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Romanization&oldid=1354081130 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ อักษรโรมัน

ในทางภาษาศาสตร์การถอดเสียงเป็นอักษรโรมันหรือการแปลงเป็นอักษรโรมันคือการแปลงข้อความจากระบบการเขียน อื่น ไปเป็นอักษรโรมัน (ละติน)หรือระบบที่ใช้ในการแปลงนั้น...

วิธีการ

มีระบบการถอดเสียงเป็นอักษรโรมันที่สอดคล้องกันหรือ ได้มาตรฐาน อยู่หลาย ระบบ สามารถจำแนกประเภทได้ตามลักษณะเฉพาะของระบบนั้นๆ ลักษณะเฉพาะของระบบใดระบบหนึ่งอาจทำให้เหมาะสมกับการใช้งานที่หลากหลาย ซึ่งบางครั้งอาจขัดแย้งกัน เช่น การค้นหาเอกสาร...

การถอดเสียง

หากการถอดเสียงเป็นอักษรโรมันพยายามถอดเสียงจากอักษรต้นฉบับ หลักการสำคัญคือการจับคู่ตัวอักษรจากภาษาต้นฉบับไปยังอักษรโรมันแบบหนึ่งต่อหนึ่ง โดยให้ความสำคัญน้อยลงกับเสียงที่ได้ยินเมื่อออกเสียงตามภาษาของผู้รับชม ตัวอย่างเช่นการถอดเสียง ภาษาญี่ปุ่น เป็นอักษรโรมัน...

ประนีประนอม

สำหรับคู่ภาษาส่วนใหญ่ การสร้างระบบการถอดเสียงเป็นอักษรโรมันที่ใช้งานได้นั้นเกี่ยวข้องกับการประนีประนอมระหว่างสองขั้ว การถอดเสียงแบบบริสุทธิ์มักเป็นไปไม่ได้ เนื่องจากภาษาต้นฉบับมักมีเสียงและความแตกต่างที่ไม่พบในภาษาเป้าหมาย...