อ่าน 2 นาที
วินโดวส์-1258
Windows-1258เป็นรหัสหน้า (code page)ที่ใช้ในระบบปฏิบัติการ Microsoft Windowsเพื่อแสดง ข้อความภาษา เวียดนามโดยใช้การรวมเครื่องหมายกำกับเสียง (diacritical marks )
วินโดวส์-1258
| MIME / IANA | วินโดวส์-1258 |
|---|---|
| ชื่อเล่น | cp1258 ( รหัสหน้า 1258) |
| ภาษา | ภาษาเวียดนามอังกฤษฝรั่งเศสเยอรมันสเปนเดนมาร์กนอร์เวย์สวีเดนฟินแลนด์ไอริชอัลเบเนียลักเซมเบิร์กดัตช์พร้อมเครื่องหมายกำกับเสียง:อัสตูเรียนเอสโตเนียอิตาลีโปรตุเกสซิซิลีกัวรานีอิกโบมาร์แชลล์( MOD ) นอว์รูอันโยรูบา |
| สร้างโดย | ไมโครซอฟต์ |
| มาตรฐาน | มาตรฐานการเข้ารหัสWHATWG |
| การจำแนกประเภท | ASCII แบบขยาย , Windows-125x |
| อ้างอิงจาก | วินโดวส์-1252 |
Windows-1258เป็นรหัสหน้า (code page)ที่ใช้ในระบบปฏิบัติการ Microsoft Windowsเพื่อแสดง ข้อความภาษา เวียดนามโดยใช้การรวมเครื่องหมายกำกับเสียง (diacritical marks )
Windows-1258 ไม่สามารถใช้งานร่วมกับมาตรฐานภาษาเวียดนาม ( TCVN 5712 / VSCII) หรือการเข้ารหัสอื่นๆ ที่ใช้กันทั่วไป ( VISCII , VNI , VPS ) ได้ แต่กลับคล้ายคลึงกับWindows-1252 มาก โดยมีข้อแตกต่างคือ ขาดเครื่องหมาย s-caron และ z-caron (ซึ่งเพิ่มเข้ามาใน Windows-1252 ในภายหลัง) ตัวอักษรที่มีเครื่องหมายกำกับ 5 ตัวถูกแทนที่ด้วยการรวมเครื่องหมายกำกับเสียงวรรณยุกต์ของภาษาเวียดนามหนึ่งตัวถูกแทนที่ด้วยเครื่องหมาย đôngและอีก 8 ตัว (ตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก 4 ตัว) ถูกเปลี่ยนเป็นตัวอักษรเวียดนาม 4 ตัว ที่ปกติแล้วไม่รองรับ
การใช้เครื่องหมายเสริมเสียงแบบผสมผสานหมายความว่า Windows-1258 สามารถครอบคลุมการผสมผสานตัวอักษรและเครื่องหมายวรรณยุกต์จำนวนมากในภาษาเวียดนามได้โดยไม่กระทบต่อการครอบคลุมรหัสควบคุมหรือสัญลักษณ์ อย่างไรก็ตาม นั่นหมายความว่าซอฟต์แวร์ต้องระมัดระวังในการจัดการการแปลงระหว่างอักขระที่ประกอบขึ้นล่วงหน้าและลำดับการผสมผสานอย่างถูกต้องเมื่อแปลงไป/จากระบบการเข้ารหัสอื่น ๆ และทำให้การกำหนดความยาวของสตริงที่ผู้ใช้มองเห็นทำได้ยากขึ้น
IBMใช้โค้ดเพจ 1258 ( CCSID 1258 และ CCSID ขยาย สัญลักษณ์ยูโร 5354) สำหรับ Windows-1258 [ 1 ] [ 2 ] [ 3 ]
UTF-8เป็นการเข้ารหัสที่นิยมใช้สำหรับภาษาเวียดนามในแอปพลิเคชันสมัยใหม่ Windows-1258 อาจไม่ สามารถแปลง กลับจากการเข้ารหัส Unicode ของภาษาเวียดนามได้เสมอไปเนื่องจากการเปลี่ยนแปลงที่เกิดจากการ ทำให้เป็นมาตรฐาน ของUnicode [ 4 ]เครื่องหมายกำกับเสียงรวมจะถูกเข้ารหัสหลังตัวอักษรทั้งใน Windows-1258 และ Unicode [ 4 ] (เช่นVNIซึ่งแตกต่างจากANSEL )
ชุดอักขระ
ตารางต่อไปนี้แสดง Windows-1258 โดยแต่ละอักขระจะแสดงพร้อมกับค่าเทียบเท่า ในรหัส Unicode
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | เอ | บี | ซี | ดี | อี | เอฟ | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0x | นูแอล | เอสโอเอช | เอสทีเอ็กซ์ | อีทีเอ็กซ์ | อีโอที | เอ็นคิว | แอก | เบล | ปริญญาตรี | เอชที | แอลเอฟ | วีที | เอฟเอฟ | ซีอาร์ | ดังนั้น | ไอเอส |
| 1x | ดีแอลอี | ดีซี1 | ดีซี2 | ดีซี3 | ดีซี4 | นาค | ซิน | อีทีบี | สามารถ | อีเอ็ม | ซับ | เอสเอส | เอฟเอส | จีเอส | อาร์เอส | เรา |
| 2x | เอสพี | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | เอ | บี | ซี | ดี | อี | เอฟ | จี | ชม | ฉัน | เจ | เค | แอล | เอ็ม | เอ็น | โอ |
| 5x | พี | คิว | อาร์ | เอส | ที | ยู | วี | ว | X | วาย | ซ | [ | \ | ] | ^ | _ |
| 6x | ` | เอ | ข | ค | ง | อี | เอฟ | จี | ชม. | ฉัน | เจ | เค | ล | ม | n | โอ |
| 7x | พี | q | ร | ส | ที | คุณ | วี | ว | x | y | z | { | | | } | ~ | เดล |
| 8x | ยูโร | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | ‹ | Œ | |||||
| 9x | ' | ' | “ | ” | • | – | — | ˜ | ™ | › | œ | Ÿ | ||||
| ขวาน | เอ็นบีเอสพี | ¡ | ¢ | ปอนด์ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | อาย | ® | ¯ |
| บีเอ็กซ์ | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
| ซีเอ็กซ์ | À | อา | Â | Ă | Ä | Å | Æ | Ç | เอ | เอ | Ê | Ë | ◌̀ | ฉัน | ฉัน | ฉัน |
| ดีเอ็กซ์ | Đ | Ñ | ◌̉ | โอ | โอ | Ơ | โอ | × | Ø | Ù | Ú | Û | Ü | Ư | ◌̃ | ß |
| อดีต | à | อา | â | อา | เอ | å | æ | ç | เอ | เอ | ê | ë | ◌́ | ฉัน | ฉัน | ฉัน |
| เอฟเอ็กซ์ | đ | ñ | ◌̣ | โอ | โอ | ơ | ö | ÷ | ø | ù | อู | û | ü | ư | ₫ | ÿ |
ความแตกต่างจากWindows-1252 | ||||||||||||||||
รหัสหน้า 1129
รหัสเพจ 1129 ของ IBM ( CCSID 1129 และ CCSID 1163 ที่ขยาย สำหรับสัญลักษณ์ยูโร ) [ 11 ] [ 12 ] [ 13 ]คล้ายกับรหัสเพจ 1258 แต่มีความแตกต่างดังต่อไปนี้:
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | เอ | บี | ซี | ดี | อี | เอฟ | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 8x | ||||||||||||||||
| 9x | ||||||||||||||||
| ขวาน | เอ็นบีเอสพี | ¡ | ¢ | ปอนด์ | ¤ | ¥ | ¦ | § | œ | © | ª | « | ¬ | อาย | ® | ¯ |
| บีเอ็กซ์ | ° | ± | ² | ³ | Ÿ | µ | ¶ | · | Œ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
ความแตกต่างจาก Windows-1258 | ||||||||||||||||
ดูเพิ่มเติม
ลิงก์ภายนอก
- การลงทะเบียนชื่อชุดอักขระ IANA ของ windows-1258
- บล็อกของ Michael Kaplan อธิบายพฤติกรรมการเข้ารหัส Windows 1258
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ วินโดวส์-1258
Windows-1258เป็นรหัสหน้า (code page)ที่ใช้ในระบบปฏิบัติการ Microsoft Windowsเพื่อแสดง ข้อความภาษา เวียดนามโดยใช้การรวมเครื่องหมายกำกับเสียง (diacritical marks )
ชุดอักขระ
ตารางต่อไปนี้แสดง Windows-1258 โดยแต่ละอักขระจะแสดงพร้อมกับค่าเทียบเท่า ในรหัส Unicode
รหัสหน้า 1129
รหัสเพจ 1129 ของ IBM ( CCSID 1129 และ CCSID 1163 ที่ขยาย สำหรับสัญลักษณ์ยูโร ) [ 11 ] [ 12 ] [ 13 ] คล้ายกับรหัสเพจ 1258 แต่มีความแตกต่างดังต่อไปนี้:
ดูเพิ่มเติม
วีเอสซีไอ วิสซีไอ ชุดอักขระ VNI การเข้ารหัสอักขระ VPS