กลับไปหน้าบทความ

อ่าน 18 นาที

รหัสฮันกึลแบบรวม

รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) หรือWansung แบบขยาย [ หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ )...

รหัสฮันกึลแบบรวม | วิกิภาษาไทย

บทความความรู้ภาษาไทย

รหัสฮันกึลแบบรวม

คำถามที่พบบ่อยเกี่ยวกับ รหัสฮันกึลแบบรวม

รหัสฮันกึลแบบรวม คืออะไร?

รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) หรือWansung แบบขยาย [ หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ ) เป็นรหัสหน้า ของ Micr…

บทความอธิบายเรื่อง “คำศัพท์” ที่เกี่ยวกับ รหัสฮันกึลแบบรวม อย่างไร?

รหัส Unified Hangul Code ไม่ได้จดทะเบียนกับIANAให้เป็นมาตรฐานในการสื่อสารข้อมูลผ่านอินเทอร์เน็ตทางเลือกอื่น ได้แก่UTF-8อย่างไรก็ตาม มาตรฐานการเข้ารหัส W3C / WHATWGที่ใช้โดยHTML5 ได้ รวมส่วนข…

บทความอธิบายเรื่อง “รหัสไบต์เดี่ยว” ที่เกี่ยวกับ รหัสฮันกึลแบบรวม อย่างไร?

ต่อไปนี้เป็นส่วนไบต์เดียวของโค้ดเพจตามที่ IBM กำหนดไว้ เช่นเดียวกับโค้ดเพจ 437 ไบต์ โค้ดควบคุมสามารถใช้เป็นโค้ดควบคุมหรือโค้ดกราฟิกได้ ขึ้นอยู่กับบริบท โดยโค้ดกราฟิกแสดงอยู่ด้านล่าง Microsof…

มีรายละเอียดใดเกี่ยวกับ รหัสฮันกึลแบบรวม ที่ควรรู้?

Wansung Code มีข้อเสียคือ กำหนดรหัสได้เฉพาะพยางค์ฮันกึลที่ประกอบไว้ล่วงหน้า 2,350 พยางค์เท่านั้น ซึ่งมี จุดรหัส KS X 1001 (KS C 5601) ของตัวเอง (จากทั้งหมด 11,172 จุด ไม่นับรวมจุดรหัสที่ใช้…

เนื้อหาอธิบาย รหัสฮันกึลแบบรวม ในแง่มุมใด?

ช่วงไบต์หลักถูกขยายเป็น0x 81–FE และช่วงไบต์ท้ายถูกขยายเป็น 0x41–5A, 0x61–7A และ 0x81–FE (ใน EUC-KR ช่วงทั้งสองคือ 0xA1–FE) รหัสที่อยู่นอกช่วง EUC-KR จะถูกใช้สำหรับฮันกึลเพิ่มเติมหากพิจารณาแย…

บทความอธิบายเรื่อง “คำศัพท์” ที่เกี่ยวกับ รหัสฮันกึลแบบรวม อย่างไร?

Microsoft กำหนดป้ายกำกับ "ks_c_5601-1987" ให้กับ Windows-949 ซึ่งใช้ได้กับKS X 1001เองอย่างถูกต้อง ( KS C 5601เป็นชื่อเดิมของ KS X 1001) WHATWG ถือว่าป้ายกำกับ "ks_c_5601-1987" สลับกับ "EUC-…

บทความอธิบายเรื่อง “คำศัพท์” ที่เกี่ยวกับ รหัสฮันกึลแบบรวม อย่างไร?

โค้ดเพจ 949 ของ IBMเป็นส่วนขยายของ EUC-KR อีกอันหนึ่ง ซึ่งไม่เกี่ยวข้องกันInternational Components for Unicode (ICU) ใช้ "cp949", "949" หรือ "ibm-949" เพื่ออ้างถึงโค้ดเพจของ IBM นั้นและ "ms9…

บทความอธิบายเรื่อง “คำศัพท์” ที่เกี่ยวกับ รหัสฮันกึลแบบรวม อย่างไร?

โค้ดเพจของ IBM สำหรับ Unified Hangul Code เรียกว่าCode page 1363 ( IBM-1363 ) หรือ "Korean MS-Win" ซึ่งเป็นการผสมผสานระหว่างSBCS Code page 1126และDBCS Code page 1362 แตกต่างกันตรงที่มีการแมป…

มีประเด็นใดที่เกี่ยวข้องกับ รหัสฮันกึลแบบรวม?

รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) [a]หรือWansung แบบขยาย [ 4] [b]หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ ) เป็นรหัสหน้า…

เปิดฉบับอ่านง่าย จัดเนื้อหาให้อ่านภาพรวมได้เร็วขึ้น

ภาพรวม

  • รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) หรือWansung แบบขยาย [ หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ ) เป็นรหัสหน้า ของ Micr…
  • Wansung Code มีข้อเสียคือ กำหนดรหัสได้เฉพาะพยางค์ฮันกึลที่ประกอบไว้ล่วงหน้า 2,350 พยางค์เท่านั้น ซึ่งมี จุดรหัส KS X 1001 (KS C 5601) ของตัวเอง (จากทั้งหมด 11,172 จุด ไม่นับรวมจุดรหัสที่ใช้…
  • ช่วงไบต์หลักถูกขยายเป็น0x 81–FE และช่วงไบต์ท้ายถูกขยายเป็น 0x41–5A, 0x61–7A และ 0x81–FE (ใน EUC-KR ช่วงทั้งสองคือ 0xA1–FE) รหัสที่อยู่นอกช่วง EUC-KR จะถูกใช้สำหรับฮันกึลเพิ่มเติมหากพิจารณาแย…

คำศัพท์

  • รหัส Unified Hangul Code ไม่ได้จดทะเบียนกับIANAให้เป็นมาตรฐานในการสื่อสารข้อมูลผ่านอินเทอร์เน็ตทางเลือกอื่น ได้แก่UTF-8อย่างไรก็ตาม มาตรฐานการเข้ารหัส W3C / WHATWGที่ใช้โดยHTML5 ได้ รวมส่วนข…
  • Microsoft กำหนดป้ายกำกับ "ks_c_5601-1987" ให้กับ Windows-949 ซึ่งใช้ได้กับKS X 1001เองอย่างถูกต้อง ( KS C 5601เป็นชื่อเดิมของ KS X 1001) WHATWG ถือว่าป้ายกำกับ "ks_c_5601-1987" สลับกับ "EUC-…
  • โค้ดเพจ 949 ของ IBMเป็นส่วนขยายของ EUC-KR อีกอันหนึ่ง ซึ่งไม่เกี่ยวข้องกันInternational Components for Unicode (ICU) ใช้ "cp949", "949" หรือ "ibm-949" เพื่ออ้างถึงโค้ดเพจของ IBM นั้นและ "ms9…

รหัสไบต์เดี่ยว

  • ต่อไปนี้เป็นส่วนไบต์เดียวของโค้ดเพจตามที่ IBM กำหนดไว้ เช่นเดียวกับโค้ดเพจ 437 ไบต์ โค้ดควบคุมสามารถใช้เป็นโค้ดควบคุมหรือโค้ดกราฟิกได้ ขึ้นอยู่กับบริบท โดยโค้ดกราฟิกแสดงอยู่ด้านล่าง Microsof…
บทความต้นฉบับฉบับเต็ม
ชุดอักขระ Windows สำหรับภาษาเกาหลี
รหัสฮันกึลแบบรวม
เค้าโครงของรหัสฮันกึลแบบรวม
นามแฝง
  • หน้าโค้ด Windows 949
  • หน้าโค้ด IBM 1363
ภาษาเกาหลี
มาตรฐานมาตรฐานการเข้ารหัส WHATWG (ในชื่อ "EUC-KR")
การจำแนกประเภท
ขยายออกไปEUC-KR
การเข้ารหัสอื่น ๆ ที่เกี่ยวข้อง
  1. ^ ไม่ใช่ในความหมายที่เข้มงวดที่สุดของคำศัพท์ เนื่องจากไบต์ ASCII สามารถปรากฏเป็นไบต์สุดท้ายได้ แม้ว่าจะจำกัดอยู่แค่ไบต์ตัวอักษรก็ตาม

รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) หรือWansung แบบขยาย [ หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ ) เป็นรหัสหน้า ของ Microsoft Windows สำหรับภาษาเกาหลีซึ่งเป็นส่วนขยายของรหัส Wansung ( KS C 5601 :1987, เข้ารหัสเป็นEUC-KR ) เพื่อรวมพยางค์ ฮันกึลที่ไม่ใช่พยางค์ย่อยทั้งหมด 11,172 พยางค์ที่มีอยู่ในJohab (KS C 5601:1992 ภาคผนวก 3) ซึ่งสอดคล้องกับพยางค์ที่แต่งไว้ล่วงหน้าที่มีอยู่ในUnicode 2.0 และเวอร์ชันที่ใหม่กว่า

Wansung Code มีข้อเสียคือ กำหนดรหัสได้เฉพาะพยางค์ฮันกึลที่ประกอบไว้ล่วงหน้า 2,350 พยางค์เท่านั้น ซึ่งมี จุดรหัส KS X 1001 (KS C 5601) ของตัวเอง (จากทั้งหมด 11,172 จุด ไม่นับรวมจุดรหัสที่ใช้ jamo ที่ล้าสมัย) และกำหนดให้พยางค์อื่นๆ ใช้ลำดับการเรียบเรียง 8 ไบต์ ซึ่งไม่ได้รับการสนับสนุนจากการใช้งานบางส่วนของมาตรฐาน UHC แก้ไขปัญหานี้โดยกำหนดรหัสเดี่ยวๆ ให้กับพยางค์ที่เป็นไปได้ทั้งหมดที่สร้างขึ้นโดยใช้ jamo สมัยใหม่ โดยกำหนดรหัสภายนอกพื้นที่การเข้ารหัสที่ใช้สำหรับ KS X 1001

ช่วงไบต์หลักถูกขยายเป็น0x 81–FE และช่วงไบต์ท้ายถูกขยายเป็น 0x41–5A, 0x61–7A และ 0x81–FE (ใน EUC-KR ช่วงทั้งสองคือ 0xA1–FE) รหัสที่อยู่นอกช่วง EUC-KR จะถูกใช้สำหรับฮันกึลเพิ่มเติมหากพิจารณาแยกกัน ทั้งบล็อกฮันกึล EUC-KR และส่วนฮันกึลที่ขยาย UHC จะอยู่ในลำดับ Unicode

คำศัพท์

รหัส Unified Hangul Code ไม่ได้จดทะเบียนกับIANAให้เป็นมาตรฐานในการสื่อสารข้อมูลผ่านอินเทอร์เน็ตทางเลือกอื่น ได้แก่UTF-8อย่างไรก็ตาม มาตรฐานการเข้ารหัส W3C / WHATWGที่ใช้โดยHTML5 ได้ รวมส่วนขยายของรหัส Unified Hangul Code ไว้ในคำจำกัดความของ "EUC-KR"

Microsoft กำหนดป้ายกำกับ "ks_c_5601-1987" ให้กับ Windows-949 ซึ่งใช้ได้กับKS X 1001เองอย่างถูกต้อง ( KS C 5601เป็นชื่อเดิมของ KS X 1001) WHATWG ถือว่าป้ายกำกับ "ks_c_5601-1987" สลับกับ "EUC-KR" โดยมีจุดประสงค์เพื่อ "เข้ากันได้กับเนื้อหาที่ปรับใช้" คอลเลกชัน "OBSOLETE/EASTASIA" ของการแมปที่ถูกถอนออกของ Unicode Consortiumรวมถึงการแมปสำหรับ Unified Hangul Code เป็น "KSC5601.TXT" โดยการแมปที่ได้มาโดยอัตโนมัติสำหรับ KS X 1001 7 บิตจะรวมเป็น "KSX1001.TXT"

โค้ดเพจ 949 ของ IBMเป็นส่วนขยายของ EUC-KR อีกอันหนึ่ง ซึ่งไม่เกี่ยวข้องกันInternational Components for Unicode (ICU) ใช้ "cp949", "949" หรือ "ibm-949" เพื่ออ้างถึงโค้ดเพจของ IBM นั้นและ "ms949" หรือ "windows-949" (หรือรูปแบบต่างๆ ของ "ks_c_5601-1987") เพื่ออ้างถึงการแมป UHC ใน Windows Pythonรู้จัก "cp949", "949", "ms949" และ "uhc" เป็นป้ายกำกับสำหรับ UHC และไม่รวมตัวแปลงสัญญาณ IBM-949 จากป้ายกำกับที่รวมหมายเลขโค้ดเพจ WHATWG รู้จักเฉพาะ "windows-949" เท่านั้น

โค้ดเพจของ IBM สำหรับ Unified Hangul Code เรียกว่าCode page 1363 ( IBM-1363 ) หรือ "Korean MS-Win" ซึ่งเป็นการผสมผสานระหว่างSBCS Code page 1126และDBCS Code page 1362 แตกต่างกันตรงที่มีการแมปไบต์เดียวของ 0x5C กับเครื่องหมาย Won (U+20A9); Windows แมป 0x5C กับ U+005C (จุดโค้ด Unicode สำหรับแบ็กสแลช ) เช่นเดียวกับใน ASCII แม้ว่าฟอนต์มักจะยังคงแสดงเป็นเครื่องหมาย Won การแมป Unicode ของเส้นประคลื่น (0xA1AD) ก็แตกต่างกันเช่นกัน โดยการแมปของ IBM นิยมใช้ U+301C ในขณะที่การแมปของ Microsoft นิยมใช้ U+223C (ตัวดำเนินการ Tilde) การแมป IBM สำหรับ UHC นั้นมีให้ใช้ในชื่อ "ibm-1363" ใน ICU ในขณะที่โคเดก ICU "windows-949" จะถูกอ้างถึงเป็น IBM-1261 ในความคิดเห็นของโค้ดต้นทาง ICU บางส่วน

รหัสไบต์เดี่ยว

ต่อไปนี้เป็นส่วนไบต์เดียวของโค้ดเพจตามที่ IBM กำหนดไว้ เช่นเดียวกับโค้ดเพจ 437 ไบต์ โค้ดควบคุมสามารถใช้เป็นโค้ดควบคุมหรือโค้ดกราฟิกได้ ขึ้นอยู่กับบริบท โดยโค้ดกราฟิกแสดงอยู่ด้านล่าง Microsoft ใช้การแมป ASCII สำหรับไบต์ ASCII ทั้งหมด แม้ว่าแบ็กสแลชอาจยังคงแสดงผลเป็นเครื่องหมาย wonก็ได้

รหัสหน้า 1126
0 1 2 3 4 5 6 7 8 9 เอ บี ซี อี เอฟ
0x เอ็นยูแอล -
1x - -
2x  เอสพี  - - - - - - - - - - - - - - -
3x 0 1 2 3 4 5 6 7 8 9 - - - - - -
4x - เอ บี ซี อี เอฟ จี ชม ฉัน เจ เค ล. เอ็ม เอ็น โอ
5x พี คิว อาร์ ที คุณ วี ว. เอ็กซ์ ย. ซี - - - -
6x - บี ซี อี เอฟ จี ชม. ฉัน เจ เค ล. ม. โอ้
7x พี คิว ที คุณ วี เอ็กซ์ - - - -
  ความแตกต่างจากหน้ารหัส 437

เชิงอรรถ

  1. เกาหลี통합형 HAN글 코d ; RRทงฮาพยอง ฮันกึล โคดือ
  2. เกาหลี 확장 완성형 ; RRฮวักจัง วันซองยอง
  • เอกสารอ้างอิงของ Microsoft สำหรับ Windows-949
  • เอกสารของ IBM สำหรับ IBM-1363
  • การแมป Windows-949 ให้เป็น Unicode
  • ไฟล์การแมปส่วนประกอบสากลสำหรับ Unicode (ICU): ibm-1363_P110-1997.ucm, ibm-1363_P11B-1998.ucm และ windows-949-2000.ucm
  • การสาธิต ICU สำหรับ Windows-949 (พร้อมการแมป ASCII)
  • การสาธิต ICU สำหรับ IBM-1363 (โดยมี 0x5C เป็นเครื่องหมาย Won)
  • แผนภูมิการแสดงภาพสำหรับ Windows-949 ในมาตรฐานการเข้ารหัส WHATWG
สืบค้นจาก "https://en.wikipedia.org/w/index.php?title=รหัสฮันกึลแบบรวม&oldid=1317910635"

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ รหัสฮันกึลแบบรวม

รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) หรือWansung แบบขยาย [ หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ )...

คำถามที่พบบ่อยเกี่ยวกับ รหัสฮันกึลแบบรวม

รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) หรือWansung แบบขยาย [ หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ ) เป็นรหัสหน้า ของ Micr…

ภาพรวม

รหัสฮันกึลรวม (Unified Hangul CodeหรือUHC ) หรือWansung แบบขยาย [ หรือที่รู้จักกันในชื่อCode Page 949 ใน Microsoft Windows ( Windows-949 , MS949หรือCP949 ที่คลุมเครือ ) เป็นรหัสหน้า ของ Micr… Wansung Code มีข้อเสียคือ...

คำศัพท์

รหัส Unified Hangul Code ไม่ได้จดทะเบียนกับIANAให้เป็นมาตรฐานในการสื่อสารข้อมูลผ่านอินเทอร์เน็ตทางเลือกอื่น ได้แก่UTF-8อย่างไรก็ตาม มาตรฐานการเข้ารหัส W3C / WHATWGที่ใช้โดยHTML5 ได้ รวมส่วนข… Microsoft กำหนดป้ายกำกับ "ks_c_5601-1987" ให้กับ Windows-949...