อ่าน 35 นาที
รหัสหน้า
ใน ทางคอมพิวเตอร์ รหัส หน้า (code page) คือ การเข้ารหัสอักขระ และเป็นความสัมพันธ์เฉพาะระหว่างชุด อักขระ ที่พิมพ์ได้ และ อักขระควบคุม กับตัวเลขที่ไม่ซ้ำกัน โดยทั่วไปแล้ว...
รหัสหน้า
ในทางคอมพิวเตอร์รหัสหน้า (code page)คือการเข้ารหัสอักขระและเป็นความสัมพันธ์เฉพาะระหว่างชุดอักขระ ที่พิมพ์ได้ และอักขระควบคุมกับตัวเลขที่ไม่ซ้ำกัน โดยทั่วไปแล้ว ตัวเลขแต่ละตัวจะแทนค่าไบนารีในไบต์เดียว (ในบางบริบท คำศัพท์เหล่านี้ถูกใช้ให้แม่นยำยิ่งขึ้น โปรดดูการเข้ารหัสอักขระ § ศัพท์เฉพาะ )
คำว่า "code page" มีต้นกำเนิดมาจากระบบเมนเฟรมEBCDICของIBM [ 1 ]แต่Microsoft , SAP [ 2 ]และOracle Corporation [ 3 ] ก็เป็นหนึ่งในผู้จำหน่ายที่ใช้คำนี้เช่นกัน ผู้จำหน่ายส่วนใหญ่ระบุชุดอักขระของตนเองด้วยชื่อ ในกรณีที่มีชุดอักขระจำนวนมาก (เช่นใน IBM) การระบุชุดอักขระด้วยตัวเลขเป็นวิธีที่สะดวกในการแยกแยะ เดิมทีหมายเลข code page หมายถึงหมายเลขหน้าในคู่มือชุดอักขระมาตรฐานของ IBM [ 4 ] [ 5 ] [ 6 ]ซึ่งเป็นเงื่อนไขที่ไม่คงอยู่มานาน ผู้จำหน่ายที่ใช้ระบบ code page จะจัดสรรหมายเลข code page ของตนเองให้กับการเข้ารหัสอักขระ แม้ว่าจะเป็นที่รู้จักกันดีในชื่ออื่นก็ตาม ตัวอย่างเช่นUTF-8ได้รับการกำหนดหมายเลขหน้าเป็น 1208 ที่ IBM, 65001 ที่ Microsoft และ 4110 ที่ SAP
Hewlett-Packardใช้แนวคิดที่คล้ายกันใน ระบบปฏิบัติการ HP-UXและ โปรโตคอล Printer Command Language [ 7 ] (PCL) สำหรับเครื่องพิมพ์ (ไม่ว่าจะเป็นเครื่องพิมพ์ HP หรือไม่ก็ตาม) อย่างไรก็ตาม คำศัพท์นั้นแตกต่างกัน: สิ่งที่คนอื่นเรียกว่าชุดอักขระ HP เรียกว่าชุดสัญลักษณ์และสิ่งที่ IBM หรือ Microsoft เรียกว่าหน้าโค้ด HP เรียกว่ารหัสชุดสัญลักษณ์ HP ได้พัฒนาชุดสัญลักษณ์หลายชุด[ 8 ] [ 9 ]โดยแต่ละชุดจะมีรหัสชุดสัญลักษณ์ที่เกี่ยวข้อง เพื่อเข้ารหัสทั้งชุดอักขระของตนเองและชุดอักขระของผู้จำหน่ายรายอื่น
เนื่องจากมีชุดอักขระจำนวนมาก ผู้จำหน่ายหลายรายจึงแนะนำให้ใช้ Unicode
ระบบการกำหนดหมายเลขหน้าโค้ด
IBM เป็นผู้ริเริ่มแนวคิดในการกำหนดหมายเลข 16 บิตขนาดเล็กแต่ไม่ซ้ำกันทั่วโลกให้กับรหัสอักขระแต่ละแบบที่ระบบคอมพิวเตอร์หรือกลุ่มระบบคอมพิวเตอร์อาจพบเจอ ที่มาของระบบการกำหนดหมายเลขนี้จาก IBM สะท้อนให้เห็นได้จากข้อเท็จจริงที่ว่า หมายเลขที่เล็กที่สุด (หมายเลขแรก) จะถูกกำหนดให้กับรหัส EBCDIC ของ IBM และหมายเลขที่ใหญ่กว่าเล็กน้อยจะหมายถึง รหัส ASCII แบบขยาย ของ IBM ที่ใช้ในฮาร์ดแวร์พีซีของ IBM
ด้วยการเปิดตัวPC DOS เวอร์ชัน 3.3 (และ MS-DOS 3.3 ที่เกือบจะเหมือนกัน) IBM ได้แนะนำระบบการกำหนดหมายเลขหน้าโค้ดให้กับผู้ใช้พีซีทั่วไป เนื่องจากหมายเลขหน้าโค้ด (และวลี "หน้าโค้ด") ถูกใช้ในคำสั่งใหม่เพื่อให้สามารถตั้งค่าการเข้ารหัสอักขระที่ใช้โดยทุกส่วนของระบบปฏิบัติการได้อย่างเป็นระบบ[ 10 ]

หลังจากที่ IBM และ Microsoft ยุติความร่วมมือกันในช่วงทศวรรษ 1990 บริษัททั้งสองได้รักษารายชื่อหมายเลขหน้าโค้ดที่กำหนดให้เป็นอิสระจากกัน ส่งผลให้มีการกำหนดหมายเลขที่ขัดแย้งกันอย่างน้อยหนึ่งรายการ ผู้จำหน่ายบุคคลที่สามอย่างน้อยหนึ่งราย ( Oracle ) ก็มีรายการหมายเลขที่กำหนดไว้แตกต่างกันเช่นกัน[ 3 ]การกำหนดหมายเลขปัจจุบันของ IBM อยู่ในคลัง ข้อมูล CCSID ของพวกเขา ในขณะที่การกำหนดหมายเลขของ Microsoft ได้รับการบันทึกไว้ในMSDN [ 11 ]นอกจากนี้ รายชื่อชื่อและตัวย่อโดยประมาณของ IANA ( Internet Assigned Numbers Authority ) สำหรับหน้าโค้ดที่ติดตั้งบนเครื่อง Windows ใดๆ สามารถพบได้ในรีจิสทรีของเครื่องนั้น (ข้อมูลนี้ใช้โดยโปรแกรมของ Microsoft เช่นInternet Explorer )
ชุดรหัสภาษาที่เป็นที่รู้จักกันดีส่วนใหญ่ ยกเว้นชุด รหัสภาษา จีน ญี่ปุ่น เกาหลีและเวียดนามจะบรรจุจุดรหัสทั้งหมดลงในบิตแปดบิต และไม่เกี่ยวข้องกับอะไรมากไปกว่าการจับคู่จุดรหัสแต่ละจุดกับอักขระตัวเดียว นอกจากนี้ ยังไม่มีการใช้เทคนิคต่างๆ เช่น การรวมอักขระ สคริปต์ที่ซับซ้อน เป็นต้น
โหมดข้อความของฮาร์ดแวร์กราฟิกพีซีมาตรฐาน ( ที่เข้ากันได้กับ VGA ) สร้างขึ้นโดยใช้หน้าโค้ด 8 บิต แม้ว่าจะสามารถใช้สองหน้าโค้ดพร้อมกันได้โดยต้องเสียสละความลึกของสีบ้าง และสามารถจัดเก็บได้ถึงแปดหน้าโค้ดในอะแดปเตอร์แสดงผลเพื่อการสลับที่ง่าย[ 12 ]มีแบบอักษรหน้าโค้ดของบุคคลที่สามให้เลือกใช้ซึ่งสามารถโหลดลงในฮาร์ดแวร์ดังกล่าวได้ อย่างไรก็ตาม ปัจจุบันเป็นเรื่องปกติที่ผู้จำหน่ายระบบปฏิบัติการจะจัดหาระบบการเข้ารหัสและแสดงผลอักขระของตนเองที่ทำงานในโหมดกราฟิกและข้ามข้อจำกัดของฮาร์ดแวร์นี้ไปโดยสิ้นเชิง อย่างไรก็ตาม ระบบการอ้างอิงการเข้ารหัสอักขระด้วยหมายเลขหน้าโค้ดยังคงใช้ได้ เนื่องจากเป็นทางเลือกที่มีประสิทธิภาพแทนตัวระบุสตริง เช่น ที่ระบุโดย IETF และ IANA สำหรับใช้ในโปรโตคอลต่างๆ เช่น อีเมลและเว็บเพจ
ความสัมพันธ์กับ ASCII
ชุดรหัสส่วนใหญ่ที่ใช้ในปัจจุบันเป็นชุดรหัสที่ครอบคลุมมากกว่าASCIIซึ่งเป็นรหัส 7 บิตที่ใช้แทนรหัสควบคุมและอักขระที่พิมพ์ได้ 128 ตัว ในอดีต การใช้งานรหัส ASCII แบบ 8 บิตจะตั้งค่าบิตบนสุดเป็นศูนย์หรือใช้เป็นบิตพาริตีในการส่งข้อมูลผ่านเครือข่าย เมื่อบิตบนสุดสามารถใช้แทนข้อมูลอักขระได้ ก็สามารถแทนอักขระและรหัสควบคุมได้ทั้งหมด 256 ตัว ผู้ผลิตส่วนใหญ่ (รวมถึง IBM) ใช้ช่วงที่ขยายนี้ในการเข้ารหัสอักขระที่ใช้ในภาษาต่างๆ และองค์ประกอบกราฟิกที่ช่วยให้สามารถจำลองกราฟิกแบบดั้งเดิมบนอุปกรณ์แสดงผลข้อความเท่านั้น ไม่มีมาตรฐานอย่างเป็นทางการสำหรับ "ชุดอักขระ ASCII ที่ขยาย" เหล่านี้ และผู้ผลิตเรียกตัวแปรเหล่านี้ว่าชุดรหัส เช่นเดียวกับที่ IBM เคยทำสำหรับตัวแปรของการเข้ารหัส EBCDIC มาโดยตลอด
ความสัมพันธ์กับยูนิโค้ด
Unicode คือความพยายามที่จะรวมอักขระทั้งหมดจากภาษาของมนุษย์ที่ใช้ในปัจจุบันและในอดีตทั้งหมดไว้ในการกำหนดหมายเลขอักขระเดียว (โดยพื้นฐานแล้วคือหน้าโค้ดขนาดใหญ่หน้าเดียว) ซึ่งจะช่วยขจัดความจำเป็นในการแยกแยะระหว่างหน้าโค้ดต่างๆ เมื่อจัดการกับข้อความที่จัดเก็บในรูปแบบดิจิทัล Unicode พยายามรักษาความเข้ากันได้กับหน้าโค้ดเก่าๆ หลายหน้า โดยคัดลอกหน้าโค้ดบางหน้าแบบ 1:1 ในกระบวนการออกแบบ เป้าหมายการออกแบบที่ชัดเจนของ Unicode คือการอนุญาตให้แปลงกลับไปกลับมาได้ระหว่างหน้าโค้ดเก่าๆ ทั่วไปทั้งหมด แม้ว่าเป้าหมายนี้จะไม่ประสบความสำเร็จเสมอไปก็ตาม ผู้ผลิตบางราย เช่น IBM และ Microsoft ได้กำหนดหมายเลขหน้าโค้ดให้กับการเข้ารหัส Unicode อย่างไม่สอดคล้องกับยุคสมัย ข้อตกลงนี้อนุญาตให้ใช้หมายเลขหน้าโค้ดเป็นเมตาเดตาเพื่อระบุอัลกอริทึมการถอดรหัสที่ถูกต้องเมื่อพบข้อมูลที่จัดเก็บในรูปแบบไบนารี
รหัสหน้าของ IBM
รหัสหน้าแบบ EBCDIC
หน้าโค้ดเหล่านี้ถูกใช้โดย IBM ในชุดอักขระ EBCDIC สำหรับคอมพิวเตอร์เมนเฟรม[ 13 ]
- 1 – USA WP, ต้นฉบับ
- 2 – สหรัฐอเมริกา
- 3 – การบัญชีของสหรัฐอเมริกา เวอร์ชัน A
- 4 – สหรัฐอเมริกา
- 5 – สหรัฐอเมริกา
- 6 – ลาตินอเมริกา
- 7 – เยอรมนี ฝรั่งเศส / ออสเตรีย
- 8 – เยอรมนี FR
- 9 – ฝรั่งเศส, เบลเยียม
- 10 – แคนาดา (ภาษาอังกฤษ)
- 11 – แคนาดา (ภาษาฝรั่งเศส)
- 12 – อิตาลี
- 13 – เนเธอร์แลนด์
- 14 – สเปน
- 15 – สวิตเซอร์แลนด์ (ภาษาฝรั่งเศส)
- 16 – สวิตเซอร์แลนด์ (ภาษาฝรั่งเศส / ภาษาเยอรมัน)
- 17 – สวิตเซอร์แลนด์ (ภาษาเยอรมัน)
- 18 – สวีเดน / ฟินแลนด์
- 19 – สวีเดน/ฟินแลนด์ WP เวอร์ชัน 2
- 20 – เดนมาร์ก/นอร์เวย์
- 21 – บราซิล
- 22 – โปรตุเกส
- 23 – สหราชอาณาจักร
- 24 – สหราชอาณาจักร
- 25 – ญี่ปุ่น (ละติน)
- 26 – ญี่ปุ่น (ละติน)
- 27 – ประเทศกรีซ (ละติน)
- 29 – ไอซ์แลนด์
- 30 – ตุรกี
- 31 – แอฟริกาใต้
- 32 – เชโกสโลวาเกีย (เช็ก/สโลวัก)
- 33 – เชโกสโลวาเกีย
- 34 – เชโกสโลวาเกีย
- 35 – โรมาเนีย
- 36 – โรมาเนีย
- 37 – สหรัฐอเมริกา/แคนาดา - CECP (เหมือนกับยูโร: 1140)
- 37-2 – รหัสหน้า APL 3279 ที่แท้จริง ซึ่งใช้โดย C/370 รหัสนี้ใกล้เคียงกับ 1047 มาก ยกเว้นเครื่องหมาย caret และ not-sign ที่กลับด้าน IBM ยังไม่รับรองรหัสนี้อย่างเป็นทางการ แม้ว่าSHAREจะชี้ให้เห็นถึงการมีอยู่ของมันก็ตาม[ 14 ]
- 38 – สหรัฐอเมริกา ASCII
- 39 – สหราชอาณาจักร / อิสราเอล
- 40 – สหราชอาณาจักร
- 251 – จีน
- 252 – โปแลนด์
- 254 – ฮังการี
- 256 – อันดับ 1 ระดับนานาชาติ (ถูกแซงหน้าโดย 500)
- 257 – นานาชาติ #2
- 258 – อันดับ 3 ระหว่างประเทศ
- 259 – สัญลักษณ์ ชุดที่ 7
- 260 – ภาษาฝรั่งเศสแคนาดา - 116
- 264 – การประมวลผลการพิมพ์และข้อความแบบขยาย
- 273 – เยอรมนี FR/ออสเตรีย - CECP (เหมือนกับยูโร: 1141)
- 274 – รหัสหน้าเก่าของเบลเยียม
- 275 – บราซิล - CECP
- 276 – แคนาดา (ภาษาฝรั่งเศส) - 94
- 277 – เดนมาร์ก, นอร์เวย์ - CECP (เช่นเดียวกับยูโร: 1142)
- 278 – ฟินแลนด์, สวีเดน - CECP (เช่นเดียวกับยูโร: 1143)
- 279 – ภาษาฝรั่งเศส - 94 [ 14 ]
- 280 – อิตาลี - CECP (รหัสเดียวกับยูโร: 1144)
- 281 – ญี่ปุ่น (ละติน) - CECP
- 282 – โปรตุเกส - CECP
- 283 – สเปน - 190 [ 14 ]
- 284 – สเปน/ลาตินอเมริกา - CECP (เหมือนกับยูโร: 1145)
- 285 – สหราชอาณาจักร - CECP (เช่นเดียวกับยูโร: 1146)
- 286 – ออสเตรีย / เยอรมนี FR ทางเลือก
- 287 – เดนมาร์ก / นอร์เวย์ (ทางเลือก)
- 288 – ฟินแลนด์ / สวีเดน (ทางเลือก)
- 289 – สเปน (ตัวสำรอง)
- 290 – ภาษาญี่ปุ่น (คาตาคานะ) ฉบับขยาย
- 293 – เอพีแอล
- 297 – ฝรั่งเศส (เช่นเดียวกับยูโร: 1147) [ 14 ]
- 298 – ญี่ปุ่น (คาตาคานะ)
- 300 – ญี่ปุ่น (คันจิ) DBCS (สำหรับ JIS X 0213)
- 310 – Graphic Escape APL/TN
- 320 – ฮังการี
- 321 – ยูโกสลาเวีย
- 322 – ตุรกี
- 330 – นานาชาติ #4
- 340 – EBCDIC, OCR (เหมือนกับ 893 ซึ่งถูกแทนที่ด้วย 892 และ 893)
- 351 – ค่าเริ่มต้นของ GDDM
- 352 – ตัวเลือกการพิมพ์และการเผยแพร่
- 353 – บีซีดีไอ-เอ
- 354 – บีซีดีไอซี-บี
- 355 – ตัวเลือกมาตรฐาน PTTC/BCD
- 357 – ตัวเลือก PTTC/BCD H
- 358 – ทางเลือกการเรียนทางไปรษณีย์ของ PTTC/BCD
- 359 – ตัวเลือก PTTC/BCD แบบเคสเดียว
- 360 – ตัวเลือกเคสคู่ PTTC/BCD
- 361 – สำนักพิมพ์ EBCDIC นานาชาติ
- 363 – สัญลักษณ์ ชุดที่ 8
- 382 – สำนักพิมพ์ EBCDIC ออสเตรีย เยอรมนี FR ทางเลือก
- 383 – สำนักพิมพ์ EBCDIC ประเทศเบลเยียม
- 384 – สำนักพิมพ์ EBCDIC ประเทศบราซิล
- 385 – สำนักพิมพ์ EBCDIC ประเทศแคนาดา (ภาษาฝรั่งเศส)
- 386 – สำนักพิมพ์ EBCDIC ประเทศเดนมาร์ก ประเทศนอร์เวย์
- 387 – สำนักพิมพ์ EBCDIC ประเทศฟินแลนด์ ประเทศสวีเดน
- 388 – สำนักพิมพ์ EBCDIC ประเทศฝรั่งเศส
- 389 – สำนักพิมพ์ EBCDIC ประเทศอิตาลี
- 390 – สำนักพิมพ์ EBCDIC ประเทศญี่ปุ่น (ภาษาละติน)
- 391 – สำนักพิมพ์ EBCDIC ประเทศโปรตุเกส
- 392 – สำนักพิมพ์ EBCDIC ประเทศสเปน ประเทศฟิลิปปินส์
- 393 – สำนักพิมพ์ EBCDIC ลาตินอเมริกา (ภาษา1สเปน)
- 394 – สำนักพิมพ์ EBCDIC ประเทศจีน (ฮ่องกง), สหราชอาณาจักร, ไอร์แลนด์
- 395 – สำนักพิมพ์ EBCDIC ประเทศออสเตรเลีย นิวซีแลนด์ สหรัฐอเมริกา และแคนาดา (ภาษาอังกฤษ)
- 396 – ข้อเสนอพิเศษจากบุ๊คมาสเตอร์
- 410 – อักษรซีริลลิก (แก้ไข: 880, 1025, 1154)
- 420 – ภาษาอาหรับ
- 421 – มาเกร็บ/ฝรั่งเศส
- 423 – กรีก (ถูกแทนที่โดย 875)
- 424 – ภาษาฮีบรู (รหัสประกาศ)
- 425 – ภาษาอาหรับ/ละติน สำหรับ OS/390 รุ่นเปิด
- 435 – เทเลเท็กซ์ ไอโซมอร์ฟิก
- 500 – สากล #5 (ECECP; แทนที่ 256) (เหมือนกับยูโร: 1148)
- 803 – ชุดอักขระภาษาฮีบรู A (รหัสเก่า)
- 829 – การจัดพิมพ์สัญลักษณ์ทางคณิตศาสตร์
- 830 – รูปแบบคณิตศาสตร์
- 831 – โปรตุเกส (เส้นทางสำรอง) (เหมือนกับเส้นทาง 37)
- 833 – ภาษาเกาหลีแบบขยาย (SBCS)
- 834 – อักษรฮันกุลเกาหลี (KSC5601; DBCS พร้อม UDC)
- 835 – DBCS ภาษาจีนดั้งเดิม
- 836 – ภาษาจีนตัวย่อแบบขยาย
- 837 – DBCS ภาษาจีนตัวย่อ
- 838 – ภาษาไทยที่มีเครื่องหมายต่ำและตัวอักษรที่มีเครื่องหมายเน้นเสียง (เหมือนกับภาษาอังกฤษ: 1160)
- 839 – ไทย DBCS
- 870 – ละติน 2 (เหมือนกับยูโร: 1153) (แก้ไข: 1110)
- 871 – ไอซ์แลนด์ (เท่ากับยูโร: 1149) [ 14 ]
- 875 – กรีก (แทนที่ 423)
- 880 – อักษรซีริลลิก (แก้ไขจาก 410) (การแก้ไข: 1025, 1154)
- 881 – สหรัฐอเมริกา - ระบบกราฟิก 5080
- 882 – สหราชอาณาจักร - ระบบกราฟิก 5080
- 883 – สวีเดน - ระบบกราฟิก 5080
- 884 – เยอรมนี - ระบบกราฟิก 5080
- 885 – ฝรั่งเศส - ระบบกราฟิก 5080
- 886 – อิตาลี - ระบบกราฟิก 5080
- 887 – ญี่ปุ่น - ระบบกราฟิก 5080
- 888 – ฝรั่งเศส AZERTY - ระบบกราฟิก 5080
- 889 – ประเทศไทย
- 890 – ยูโกสลาเวีย
- 892 – EBCDIC, OCR A
- 893 – EBCDIC, OCR B
- 905 – ละติน 3
- 918 – ภาษาอูร์ดูสองภาษา
- 924 – ละติน 9
- 930 – ญี่ปุ่น มิกซ์ (290 + 300) (ราคาเท่ากับยูโร: 1390)
- 931 – ญี่ปุ่น มิกซ์ (37 + 300)
- 933 – Korea MIX (833 + 834) (เหมือนกับเวอร์ชั่นยูโร: 1364)
- 935 – ภาษาจีนตัวย่อแบบผสม (836 + 837) (เหมือนกับเงินยูโร: 1388)
- 937 – อาหารจีนดั้งเดิมแบบผสม (37 + 835) (ราคาเท่ากับยูโร: 1371)
- 939 – ญี่ปุ่น มิกซ์ (1027 + 300) (ราคาเท่ากับยูโร: 1399)
- 1001 – MICR
- 1002 – ความเข้ากันได้กับ EBCDIC DCF รุ่น 2
- 1003 – EBCDIC DCF, ชุดย่อยข้อความของสหรัฐอเมริกา
- 1005 – EBCDIC การสื่อสารข้อความแบบไอโซมอร์ฟิก
- 1007 – EBCDIC ภาษาอาหรับ (XCOM2)
- 1024 – EBCDIC T.61
- 1025 – อักษรซีริลลิก หลายภาษา (เหมือนกับยูโร: 1154) (แก้ไขจาก 880)
- 1026 – EBCDIC ตุรกี (Latin 5) (เหมือนกับยูโร: 1155) (ใช้แทนที่ 905 ในประเทศนั้น)
- 1027 – ภาษาญี่ปุ่น (ละติน) ฉบับขยาย (JIS X 0201 ฉบับขยาย)
- 1028 – สำนักพิมพ์ EBCDIC ภาษาฮีบรู
- 1030 – ภาษาญี่ปุ่น (คาตาคานะ) ฉบับขยาย
- 1031 – ภาษาญี่ปุ่น (ละติน) ฉบับขยาย
- 1032 – MICR, E13-B แบบรวม
- 1033 – MICR, CMC-7 แบบผสม
- 1037 – เกาหลี - ระบบกราฟิก 5080/6090
- 1039 – ความเข้ากันได้กับ GML
- 1047 – ละติน 1/ระบบเปิด[ 14 ]
- 1068 – ความเข้ากันได้กับ DCF
- 1069 – ละติน 4
- 1070 – สหรัฐอเมริกา / แคนาดา เวอร์ชัน 0 (รหัสหน้า 37 เวอร์ชัน 0)
- 1071 – เยอรมนี FR / ออสเตรีย (รหัสหน้า 273 เวอร์ชัน 0)
- 1072 – เบลเยียม (รหัสหน้า 274 เวอร์ชัน 0)
- 1073 – บราซิล (รหัสหน้า 275 เวอร์ชัน 0)
- 1074 – เดนมาร์ก, นอร์เวย์ (รหัสหน้า 277 เวอร์ชัน 0)
- 1075 – ฟินแลนด์, สวีเดน (รหัสหน้า 278 เวอร์ชัน 0)
- 1076 – อิตาลี (รหัสหน้า 280 เวอร์ชัน 0)
- 1077 – ญี่ปุ่น (ละติน) (รหัสหน้า 281 เวอร์ชัน 0)
- 1078 – โปรตุเกส (รหัสหน้า 282 เวอร์ชัน 0)
- 1079 – สเปน / ลาตินอเมริกา เวอร์ชัน 0 (รหัสหน้า 284 เวอร์ชัน 0)
- 1080 – สหราชอาณาจักร (รหัสหน้า 285 เวอร์ชัน 0)
- 1081 – ฝรั่งเศส เวอร์ชัน 0 (รหัสหน้า 297 เวอร์ชัน 0)
- 1082 – อิสราเอล (ภาษาฮีบรู)
- 1083 – อิสราเอล (ภาษาฮีบรู)
- 1084 – International#5 เวอร์ชัน 0 ( รหัสหน้า 500เวอร์ชัน 0)
- 1085 – ไอซ์แลนด์ (รหัสหน้า 871 เวอร์ชัน 0)
- 1087 – ชุดสัญลักษณ์
- 1091 – สัญลักษณ์ที่แก้ไขแล้ว ชุดที่ 7
- 1093 – โลโก้ IBM [ 15 ]
- 1097 – ภาษาเปอร์เซียสองภาษา
- 1110 – ภาษาละติน 2 (ฉบับปรับปรุงจาก 870)
- 1112 – สกุลเงินบอลติกหลายภาษา (เหมือนกับสกุลเงินยูโร: 1156)
- 1113 – ละติน 6
- 1122 – เอสโตเนีย (ใช้เงินยูโรเหมือนกัน: 1157)
- 1123 – อักษรซีริลลิก ประเทศยูเครน (เหมือนกับเงินยูโร: 1158)
- 1130 – เวียดนาม (ราคาเท่ากับยูโร: 1164)
- 1132 – Lao EBCDIC
- 1136 – ฮิตาชิ คาตาคานะ
- 1137 – เทวนาครี EBCDIC
- 1140 – สหรัฐอเมริกา แคนาดา ฯลฯ ECECP (เหมือนกันหากไม่มีเงินยูโร: 37) (ฉบับภาษาจีนดั้งเดิม: 1159)
- 1141 – ออสเตรีย, เยอรมนี ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 273)
- 1142 – เดนมาร์ก, นอร์เวย์ ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 277)
- 1143 – ฟินแลนด์, สวีเดน ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 278)
- 1144 – อิตาลี ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 280)
- 1145 – สเปน, ลาตินอเมริกา (ภาษาสเปน) ECECP (เหมือนกันหากไม่ใช้ยูโร: 284)
- 1146 – UK ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 285)
- 1147 – ฝรั่งเศส ECECP ใช้เงินยูโร (แบบเดียวกันหากไม่ใช้เงินยูโร: 297)
- 1148 – สกุลเงิน ECECP ระหว่างประเทศ (แบบไม่ใช้ยูโร: 500)
- 1149 – สกุลเงิน ECECP ของไอซ์แลนด์ที่ใช้เงินยูโร (แบบเดียวกันหากไม่ใช้เงินยูโร: 871)
- 1150 – ภาษาเกาหลีแบบขยายพร้อมอักขระกรอบ
- 1151 – ภาษาจีนตัวย่อแบบขยายพร้อมอักขระกรอบ
- 1152 – ภาษาจีนดั้งเดิมแบบขยายพร้อมอักษรในกรอบ
- 1153 – ภาษาละติน 2 หลายภาษา พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 870)
- 1154 – อักษรซีริลลิก หลายภาษา พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 1025; รุ่นเก่ากว่าคือ * 1166)
- 1155 – ตุรกีเมื่อชำระด้วยเงินยูโร (ราคาเดียวกันเมื่อชำระด้วยเงินที่ไม่ใช่ยูโร: 1026) (ราคาเดียวกันเมื่อชำระด้วยเงินลีรา: 1175)
- 1156 – บัตร Baltic Multi พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 1112)
- 1157 – เอสโตเนียใช้เงินยูโร (เช่นเดียวกันหากไม่ใช้เงินยูโร: 1122)
- 1158 – อักษรซีริลลิก ประเทศยูเครน ใช้เงินยูโร (แบบเดียวกันหากไม่ใช้เงินยูโร: 1123)
- 1159 – T-Chinese EBCDIC (การปรับปรุงเงินยูโรแบบจีนดั้งเดิมของ * 1140)
- 1160 – ภาษาไทยที่มีเครื่องหมายต่ำและตัวอักษรที่มีเครื่องหมายเน้นเสียงพร้อมค่าเงินยูโร (แบบเดียวกันแต่ไม่มีค่าเงินยูโร: 838)
- 1164 – ราคาเวียดนามเป็นเงินยูโร (ราคาเดียวกันหากไม่ใช้เงินยูโร: 1130)
- 1165 – ละติน 2/ระบบเปิด
- 1166 – คาซัคซีริลลิก
- 1175 – ตุรกีในสกุลเงินยูโรและลีรา (เช่นเดียวกันหากไม่ใช้ลีรา: 1155)
- 1278 – การเข้ารหัสมาตรฐาน EBCDIC Adobe (PostScript)
- 1279 – Hitachi Japanese Katakana Host [ 6 ]
- 1300 – บาร์โค้ดทั่วไป/OCR-B
- 1301 – ซิป + 4 บาร์โค้ด POSTNET
- 1302 – เครื่องหมายระบุตัวตนด้านหน้า
- 1303 – บาร์โค้ด EBCDIC
- 1364 – Korea MIX (833 + 834 + ยูโร) (แบบไม่รวมยูโร: 933)
- 1371 – อาหารจีนดั้งเดิมแบบผสม (1159 + 835) (ราคาเดียวกันหากไม่รวมเงินยูโร: 937)
- 1376 – ส่วนขยายโฮสต์ DBCS ภาษาจีนดั้งเดิมสำหรับ HKSCS
- 1377 – การเจริญเติบโตของ HKSCS แบบผสม (37 + 1376)
- 1378 – ส่วนขยาย DBCS Host สำหรับภาษาจีนดั้งเดิม สำหรับ HKSCS และภาษาจีนตัวย่อ (ชุดย่อยของ 1376)
- 1379 – การปลูกแบบผสม HKSCS และภาษาจีนตัวย่อ (37 + 1378) (ซูเปอร์เซ็ตของ 1377)
- 1388 – ธนบัตรผสมภาษาจีนตัวย่อ (เหมือนกันหากไม่มีเงินยูโร: 935) (836 + 837 + ยูโร)
- 1390 – ภาษาจีนตัวย่อ ผสม ภาษาญี่ปุ่น ผสม (เหมือนกันหากไม่รวมยูโร: 930) (290 + 300 + ยูโร)
- 1399 – ชุดรวมสินค้าญี่ปุ่น (1027 + 300 + ยูโร) (ราคาเดียวกันหากไม่รวมยูโร: 939)
หน้าโค้ด DOS
ชุดอักขระเหล่านี้ถูกใช้โดย IBM ใน ระบบปฏิบัติการ PC DOSชุดอักขระเหล่านี้เดิมทีถูกฝังอยู่ใน ฮาร์ดแวร์ โหมดข้อความของการ์ดแสดงผลที่ใช้กับIBM PCและเครื่องเลียนแบบ รวมถึงการ์ดแสดงผล MDA และ CGA รุ่นแรกๆ ซึ่งชุดอักขระสามารถเปลี่ยนแปลงได้โดยการเปลี่ยนชิป ROM ที่มีฟอนต์เท่านั้น อินเทอร์เฟซของการ์ดแสดงผลเหล่านั้น (ซึ่งจำลองโดยการ์ดแสดงผลรุ่นหลังๆ เช่น VGA) โดยทั่วไปจะจำกัดอยู่ที่ชุดอักขระแบบไบต์เดียว โดยมีเพียง 256 ตัวอักขระในแต่ละฟอนต์/การเข้ารหัส (แม้ว่า VGA จะเพิ่มการสนับสนุนบางส่วนสำหรับชุดอักขระที่ใหญ่กว่าเล็กน้อย)
- 301 – IBM-PC ญี่ปุ่น (คันจิ) DBCS
- 437 – หน้าโค้ดฮาร์ดแวร์ดั้งเดิมของ IBM PC
- 720 – ภาษาอาหรับ (ASMO แบบโปร่งใส)
- 737 – กรีก
- 775 – ลาติน-7
- 808 – ตั๋วรัสเซียแบบใช้เงินยูโร (แบบเดียวกันแต่ไม่ใช้เงินยูโร: 866 )
- 848 – เงินยูเครนพร้อมเงินยูโร (ราคาเดียวกันหากไม่ใช้เงินยูโร: 1125 )
- 849 – เงินเบลารุสที่จ่ายเป็นยูโร (ราคาเดียวกันหากไม่จ่ายเป็นยูโร: 1131 )
- 850 – ลาติน-1
- 851 – กรีก
- 852 – ลาติน-2
- 853 – ลาติน-3
- 855 – อักษรซีริลลิก (เหมือนกับยูโร: 872)
- 856 – ภาษาฮีบรู
- 857 – ลาติน-5
- 858 – รหัสละติน 1 พร้อมสัญลักษณ์ยูโร
- 859 – ลาติน-9
- 860 – ภาษาโปรตุเกส
- 861 – ไอซ์แลนด์
- 862 – ภาษาฮีบรู
- 863 – ภาษาฝรั่งเศสแคนาดา
- 864 – ภาษาอาหรับ
- 865 – เดนมาร์ก / นอร์เวย์
- 866 – เบลารุส รัสเซีย ยูเครน (เช่นเดียวกับเงินยูโร: 808 )
- 867 – ภาษา ฮีบรู + ยูโร (อิงตาม CP862) (รหัสที่ขัดแย้ง: NEC เช็ก (Kamenický)ซึ่งสร้างขึ้นก่อนชุดรหัสนี้)
- 868 – ภาษาอูร์ดู
- 869 – กรีก
- 872 – อักษรซีริลลิกพร้อมสัญลักษณ์ยูโร (แบบเดียวกันแต่ไม่มีสัญลักษณ์ยูโร: 855)
- 874 – ภาษาไทยที่มีเครื่องหมายวรรณยุกต์ต่ำและอักขระโบราณ (รหัสขัดแย้งกับ Windows 874; เวอร์ชันที่มียูโร: 1161เวอร์ชัน Windows: คือ IBM 1162 )
- 876 – OCR A
- 877 – OCR B
- 878 – KOI8-R
- 891 – คอมพิวเตอร์พีซี SBC ของเกาหลี
- 898 – IBM-PC WP Multilingual
- 899 – สัญลักษณ์ IBM-PC
- 903 – คอมพิวเตอร์ส่วนบุคคลแบบจีนตัวย่อ (Simplified Chinese PC SBCS)
- 904 – คอมพิวเตอร์พีซีแบบจีนดั้งเดิม SBCS
- 906 – ชุดสากล #5 3812/3820
- 907 – ASCII APL (3812)
- 909 – IBM-PC APL2 Extended
- 910 – IBM-PC APL2
- 911 – IBM-PC ญี่ปุ่น #1
- 926 – คอมพิวเตอร์พีซีเกาหลี DBCS
- 927 – คอมพิวเตอร์จีนแบบดั้งเดิม DBCS
- 928 – คอมพิวเตอร์พีซีแบบจีนตัวย่อ DBCS
- 929 – ไทยพีซี DBCS
- 932 – IBM-PC Japan MIX (DOS/V) (DBCS) ( 897 + 301 ) (รหัสขัดแย้งกับ Windows 932; เวอร์ชัน Windows คือ IBM 943)
- 934 – IBM-PC Korea MIX (DOS/V) (DBCS) ( 891 + 926 )
- 936 – IBM-PC ภาษาจีนตัวย่อ MIX (gb2312) (DOS/V) (DBCS) ( 903 + 928 ) (รหัสขัดแย้งกับ Windows 936; เวอร์ชัน Windows คือ IBM 1386)
- 938 – IBM-PC ภาษาจีนดั้งเดิม MIX (DOS/V, OS/2) ( 904 + 927 )
- 942 – IBM-PC Japan MIX (Japanese SAA (OS/2)) ( 1041 + 301 )
- 943 – IBM-PC Japan OPEN ( 897 + 941 ) (Windows CP 932)
- 944 – IBM-PC Korea MIX (สมาคมนักวิเคราะห์หลักทรัพย์ของเกาหลี (OS/2)) ( 1040 + 926 )
- 946 – ภาษาจีนตัวย่อสำหรับ IBM-PC (ภาษาจีนตัวย่อ SAA (OS/2)) ( 1042 + 928 )
- 948 – ภาษาจีนดั้งเดิมสำหรับ IBM-PC (ภาษาจีนดั้งเดิม SAA (OS/2)) ( 1043 + 927 )
- 949 – ภาษาเกาหลี (Wansung ฉบับขยาย (ks_c_5601-1987)) ( 1088 + 951 ) (รหัสขัดแย้งกับ Windows 949 (รหัสฮันกุลรวม); เวอร์ชัน Windows คือ IBM 1363)
- 951 – DBCS ของเกาหลี (รหัส IBM KS) (รหัสขัดแย้งกับ Windows 951 ซึ่งเป็นการดัดแปลง Windows 950 ด้วยการแมป Unicode สำหรับอักขระ Unicode PUA บางตัวที่พบใน HKSCS โดยพิจารณาจากชื่อไฟล์)
- 1034 – แอปพลิเคชันสำหรับเครื่องพิมพ์ - ฉลากจัดส่งสินค้า ชุดที่ 2
- 1040 – เวอร์ชั่นภาษาเกาหลี (ขยาย)
- 1041 – มาตรฐานญี่ปุ่นฉบับขยาย (JIS X 0201 ฉบับขยาย)
- 1042 – ภาษาจีนตัวย่อแบบขยาย
- 1043 – ภาษาจีนดั้งเดิมแบบขยาย
- 1044 – แอปพลิเคชันสำหรับเครื่องพิมพ์ - ฉลากจัดส่งสินค้า ชุดที่ 1
- 1086 – IBM-PC ญี่ปุ่น #1
- 1088 – ภาษาเกาหลีฉบับปรับปรุง (SBCS)
- 1092 – สัญลักษณ์ที่แก้ไขแล้วของ IBM-PC
- 1098 – ภาษาเปอร์เซีย
- 1108 – ความเข้ากันได้ของฐาน DITROFF
- 1109 – ความเข้ากันได้ของ DITROFF รุ่นพิเศษ
- 1115 – IBM-PC สาธารณรัฐประชาชนจีน
- 1116 – เอสโตเนีย
- 1117 – ลัตเวีย
- 1118 – ภาษาลิทัวเนีย (การใช้งาน โค้ดเพจ 774ของ Lika โดย IBM )
- 1119 – ภาษาลิทัวเนียและรัสเซีย (การใช้งาน โค้ดเพจ 772ของ Lika โดย IBM )
- 1125 – อักษรซีริลลิก ยูเครน (เหมือนกับยูโร: 848 ) (การปรับเปลี่ยนRUSCII โดย IBM )
- 1127 – IBM-PC ภาษาอาหรับ/ฝรั่งเศส
- 1131 – ข้อมูล IBM-PC, อักษรซีริลลิก, ภาษาเบลารุส (เหมือนกับยูโร: 849 )
- 1139 – คาตาคานะและตัวเลขและตัวอักษรของญี่ปุ่น
- 1161 – ภาษาไทยที่มีเครื่องหมายเสียงต่ำและตัวอักษรโบราณพร้อมสัญลักษณ์ยูโร (แบบเดียวกันแต่ไม่มีสัญลักษณ์ยูโร: 874 )
- 1167 – KOI8-RU
- 1168 – KOI8-U
- 1370 – ภาษาจีนดั้งเดิมแบบผสม ( การเข้ารหัส Big5 ) ( 1114 + 947 + ยูโร) (ราคาเดียวกันหากไม่รวมยูโร: 950 )
- 1380 – IBM-PC ภาษาจีนตัวย่อ GB PC-DATA (DBCS PC IBM GB 2312-80)
- 1381 – ภาษาจีนตัวย่อสำหรับ IBM-PC ( 1115 + 1380 )
- 1393 – มาตรฐานญี่ปุ่น JIS X 0213 DBCS
- 1394 – IBM-PC ญี่ปุ่น (JIS X 0213) ( 897 + 1393 )
เมื่อต้องจัดการกับฮาร์ดแวร์ โปรโตคอล และรูปแบบไฟล์รุ่นเก่า มักจำเป็นต้องรองรับโค้ดเพจเหล่านั้น แต่ระบบการเข้ารหัสรุ่นใหม่ โดยเฉพาะยูนิโค้ด ได้รับการสนับสนุนสำหรับงานออกแบบใหม่ๆ
โดยทั่วไปแล้วหน้าโค้ด DOS จะถูกจัดเก็บไว้ในไฟล์ .CPI [ 16 ] [ 17 ] [ 18 ] [ 19 ] [ 20 ]
โค้ดเพจ IBM AIX
ชุดรหัสเหล่านี้ถูกใช้โดย IBM ใน ระบบปฏิบัติการ AIXโดยจำลองชุดอักขระหลายชุด โดยเฉพาะชุดอักขระที่ออกแบบมาเพื่อใช้งานตามมาตรฐาน ISO เช่น ระบบปฏิบัติการที่คล้าย UNIX
- 367 – US-ASCII 7 บิต
- 371 – APL แบบ US-ASCII 7 บิต
- 806 – ISCII
- 813 – ISO 8859-7
- 819 – ISO 8859-1
- 895 – 7-bit ญี่ปุ่น ละติน
- 896 – ภาษาญี่ปุ่น 7 บิต คาตาคานะ ฉบับขยาย
- 901 – ISO 8859-13พร้อมสกุลเงินยูโร (ต่อมามีการขยายเพิ่มเติม) (แบบเดียวกันแต่ไม่มีสกุลเงินยูโร: 921 )
- 902 – มาตรฐาน ISO เอสโตเนีย พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 922 )
- 912 – ISO 8859-2 (ปรับปรุงเพิ่มเติมในปี 1999)
- 913 – ISO 8859-3
- 914 – ISO 8859-4
- 915 – ISO 8859-5 (ขยายเพิ่มเติมหลังปี 1995)
- 916 – ISO 8859-8
- 919 – ISO 8859-10
- 920 – ISO 8859-9
- 921 – ISO 8859-13 (ขยายเพิ่มเติมหลังปี 1995) (เหมือนกับมาตรฐานยูโร: 901 )
- 922 – มาตรฐาน ISO ของเอสโตเนีย (เช่นเดียวกับยูโร: 902 )
- 923 – ISO 8859-15
- 952 – EUC ภาษาญี่ปุ่นสำหรับ JIS X 0208
- 953 – EUC ภาษาญี่ปุ่นสำหรับ JIS X 0212
- 954 – EUC ภาษาญี่ปุ่น ( 895 + 952 + 896 + 953 )
- 955 – TCP ของญี่ปุ่น, JIS X 0208-1978
- 956 – TCP ภาษาญี่ปุ่น ( 895 + 952 + 896 + 953 )
- 957 – TCP ภาษาญี่ปุ่น ( 895 + 955 + 896 + 953 )
- 958 – TCP ภาษาญี่ปุ่น ( 367 + 952 + 896 + 953 )
- 959 – TCP ภาษาญี่ปุ่น ( 367 + 955 + 896 + 953 )
- 960 – ชุดตัวอักษรจีนดั้งเดิม DBCS-EUC SICGCC หลัก (ลำดับที่ 1)
- 961 – ชุด DBCS-EUC SICGCC ภาษาจีนดั้งเดิมแบบครบชุด + IBM Select + UDC
- 963 – ภาษาจีนดั้งเดิม TCP, CNS 11643 ระนาบ 2 เท่านั้น
- 964 – ภาษาจีนดั้งเดิม EUC ( 367 + 960 + 961 )
- 965 – TCP ภาษาจีนดั้งเดิม ( 367 + 960 + 963 )
- 970 – EUC เกาหลี ( 367 + 971 )
- 971 – EUC Korean DBCS (G1, KSC 5601 1989 (รวม 188 UDC))
- 1006 – ISO ภาษาอูร์ดู 8 บิต
- 1008 – ISO ภาษาอาหรับ 8 บิต
- 1009 – IRV ISO 7 บิต
- 1010 – ฝรั่งเศส 7 บิต
- 1011 – 7-bit เยอรมนี FR
- 1012 – อิตาลี 7 บิต
- 1013 – สหราชอาณาจักร 7 บิต
- 1014 – สเปน 7 บิต
- 1015 – โปรตุเกส 7 บิต
- 1016 – นอร์เวย์ 7 บิต
- 1017 – เดนมาร์ก 7 บิต
- 1018 – 7-bit ฟินแลนด์/สวีเดน
- 1019 – เนเธอร์แลนด์ 7 บิต
- 1029 – ภาษาอาหรับฉบับขยาย
- 1036 – CCITT T.61
- 1046 – ภาษาอาหรับฉบับขยาย (ยูโร)
- 1089 – ISO 8859-6
- 1111 – รูปแบบหนึ่งของISO 8859-2
- 1124 – มาตรฐาน ISO ของยูเครน คล้ายกับISO 8859-5
- 1129 – มาตรฐาน ISO ของเวียดนาม (เหมือนกับมาตรฐานยูโร: 1163 )
- 1133 – ISO ลาว
- 1163 – ธนบัตร ISO เวียดนามพร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 1129 )
- 1350 – EUC ภาษาญี่ปุ่น (JISeucJP) ( 367 + 952 + 896 + 953 )
- 1382 – ภาษาจีนตัวย่อของสหภาพยุโรป (DBCS PC GB 2312-80)
- 1383 – ภาษาจีนตัวย่อของสหภาพยุโรป ( 367 + 1382 )
รหัสหน้า 819 เหมือนกับ Latin-1, ISO/IEC 8859-1และด้วยคำสั่งที่ดัดแปลงเล็กน้อย ทำให้เครื่อง MS-DOS สามารถใช้การเข้ารหัสนี้ได้ รหัสนี้เคยใช้กับมินิคอมพิวเตอร์ IBM AS/400
โค้ดเพจ IBM OS/2
ชุดรหัสเหล่านี้ถูกใช้โดย IBM ในระบบปฏิบัติการ OS/2 ของตน
หน้าโค้ดการจำลอง Windows
ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลอง ชุดอักขระ ของ Microsoft Windowsชุดรหัสส่วนใหญ่มีหมายเลขเดียวกันกับชุดรหัสของ Microsoft แม้ว่าจะไม่ เหมือนกัน ทุกประการก็ตาม อย่างไรก็ตาม ชุดรหัสบางชุดเป็นชุดรหัสใหม่ที่พัฒนาโดย IBM ไม่ได้คิดค้นโดย Microsoft
- 897 – IBM-PC SBCS ภาษาญี่ปุ่น (JIS X 0201-1976)
- 941 – IBM-PC DBCS ภาษาญี่ปุ่นสำหรับสภาพแวดล้อมแบบเปิด
- 947 – IBM-PC DBCS สำหรับ ( การเข้ารหัส Big5 )
- 950 – ภาษาจีนดั้งเดิมแบบผสม ( การเข้ารหัส Big5 ) ( 1114 + 947 ) (เหมือนกับยูโร: 1370 )
- 1114 – IBM-PC SBCS (ภาษาจีนตัวย่อ; GBK ; ภาษาจีนตัวเต็ม; การเข้ารหัส Big5 )
- 1126 – IBM-PC SBCs เกาหลี
- 1162 – Windows Thai (ส่วนขยายของ874แต่ยังคงใช้ชื่อนั้นใน Windows)
- 1169 – Windows Cyrillic Asian
- 1174 – คาซัคสถานวินโดวส์[ 22 ]
- 1250 – วินโดวส์เซ็นทรัล ยุโรป
- 1251 – อักษรซีริลลิก ของ Windows
- 1252 – วินโดวส์เวสเทิร์น
- 1253 – หน้าต่างภาษากรีก
- 1254 – Windows เวอร์ชั่นภาษาตุรกี
- 1255 – Windows ภาษาฮีบรู
- 1256 – ภาษาอาหรับ สำหรับ Windows
- 1257 – วินโดวส์บอลติก
- 1258 – วินโดวส์ ภาษาเวียดนาม
- 1360 – เกาหลี JOHAB DBCS
- 1361 – เกาหลี ( โจฮับ )
- 1362 – อักษรฮันกุลเกาหลี DBCS
- 1363 – Windows ภาษาเกาหลี ( 1126 + 1362 ) (Windows CP 949)
- 1372 – การเข้ารหัสภาษาจีน Big5สำหรับ IBM-PC MS T (พิเศษสำหรับ DB2)
- 1373 – Windows ภาษาจีนดั้งเดิม (ส่วนขยายของ950 )
- 1374 – ส่วนขยายการเข้ารหัส IBM-PC DB Big5สำหรับ HKSCS
- 1375 – ส่วนขยาย การเข้ารหัสแบบผสม Big5สำหรับ HKSCS (มีวัตถุประสงค์เพื่อให้ตรงกับ950 )
- 1385 – IBM-PC Simplified Chinese DBCS (Growing CS สำหรับ GB18030 ซึ่งใช้สำหรับ GBK PC-DATA ด้วย)
- 1386 – IBM-PC ภาษาจีนตัวย่อ GBK ( 1114 + 1385 ) (Windows CP 936)
- 1391 – ภาษาจีนตัวย่อ 4 ไบต์ (CS ที่เพิ่มขึ้นสำหรับ GB18030 และใช้สำหรับ GBK PC-DATA ด้วย)
- 1392 – IBM-PC ภาษาจีนตัวย่อ MIX ( 1252 + 1385 + 1391 )
หน้าโค้ดจำลอง Macintosh
ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ ของ Apple Macintosh
หน้าโค้ดจำลองของ Adobe
ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ ของ Adobe
หน้าโค้ดจำลอง HP
ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ ของ HP
- 1050 – HP Roman Extension
- 1051 – HP Roman-8
- 1052 – HP Gothic Legal
- 1053 – HP Gothic-1 (เกือบเหมือนกับISO 8859-1 )
- 1054 – HP ASCII
- 1055 – HP PC-Line
- 1056 – HP Line Draw
- 1057 – HP PC-8 (เกือบเหมือนกับรหัสหน้า 437 )
- 1058 – HP PC-8DN ( ไม่เหมือนกับรหัสหน้า 865 )
- 1351 – ชุดอักขระ DBCS HP ของญี่ปุ่น
- 5039 – มิกซ์เพลงญี่ปุ่น ( 1041 + 1351 )
รหัสเพจจำลอง DEC
ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ DEC
- 1020 – ชุด NRC 7 บิตของแคนาดา (ภาษาฝรั่งเศส)
- 1021 – ชุดเหรียญ NRC สวิตเซอร์แลนด์ 7 บิต
- 1023 – ชุด NRC ภาษาสเปน 7 บิต
- 1090 – ชุดอักขระพิเศษและการวาดเส้น
- 1100 – DEC บริษัทข้ามชาติ
- 1101 – ชุดเหรียญ NRC ของอังกฤษแบบ 7 บิต
- 1102 – ชุด NRC ดัตช์ 7 บิต
- 1103 – ชุด NRC ฟินแลนด์ 7 บิต
- 1104 – ชุด NRC ภาษาฝรั่งเศส 7 บิต
- 1105 – ชุด NRC ภาษา นอร์เวย์/เดนมาร์ก 7 บิต
- 1106 – ชุด NRC สวีเดน 7 บิต
- 1107 – รหัสทางเลือก NRC ภาษา นอร์เวย์/เดนมาร์ก 7 บิต
- 1287 – ธันวาคม กรีก
- 1288 – ธันวาคม ตุรกี
ชุดรหัสยูนิโค้ดของ IBM
- 1200 – UTF-16BE Unicode ( big-endian ) พร้อมพื้นที่ใช้งานส่วนตัว ของ IBM (PUA) [ 23 ]
- 1201 – UTF-16BE Unicode ( big-endian ) [ 23 ]
- 1202 – UTF-16LE Unicode ( little-endian ) พร้อม IBM PUA [ 23 ]
- 1203 – UTF-16LE Unicode ( little-endian ) [ 23 ]
- 1208 – UTF-8 Unicode พร้อม IBM PUA [ 23 ]
- 1209 – UTF-8 Unicode [ 23 ]
- 1400 – ISO 10646 UCS-BMP (อิงตาม Unicode 6.0) [ 23 ]
- 1401 – ISO 10646 UCS-SMP (อิงตาม Unicode 6.0) [ 23 ]
- 1402 – ISO 10646 UCS-SIP (อิงตาม Unicode 6.0) [ 23 ]
- 1414 – ISO 10646 UCS-SSP (อิงตาม Unicode 4.0) [ 23 ]
- 1445 – IBM AFP PUA หมายเลข 1
- 1446 – ISO 10646 UCS-PUP15 (อิงตาม Unicode 4.0) [ 23 ]
- 1447 – ISO 10646 UCS-PUP16 (อิงตาม Unicode 4.0) [ 23 ]
- 1448 – UCS-BMP (UDC ทั่วไป)
- 1449 – ค่าเริ่มต้น PUA ของ IBM
หน้าโค้ดของ Microsoft
หน้าโค้ดของ Windows
หน้าโค้ดเหล่านี้ถูกใช้โดย Microsoft ในระบบปฏิบัติการ Windows ของตนเอง Microsoft ได้กำหนดหน้าโค้ดจำนวนหนึ่งที่เรียกว่าหน้าโค้ด ANSI (โดยหน้าโค้ดแรก 1252 นั้นอิงตาม ร่าง ANSI ที่ไม่ได้รับการยืนยันซึ่งต่อมากลายเป็นISO 8859-1 ) หน้าโค้ด 1252 สร้างขึ้นบน ISO 8859-1 แต่ใช้ช่วง 0x80-0x9F สำหรับอักขระที่พิมพ์ได้เพิ่มเติมแทนที่จะใช้รหัสควบคุม C1 จากISO 6429ที่กล่าวถึงใน ISO 8859-1 [ 24 ] หน้าโค้ด อื่นๆ บางส่วนอิงตามส่วนอื่นๆ ของISO 8859แต่มักจะจัดเรียงใหม่เพื่อให้ใกล้เคียงกับ 1252 มากขึ้น
Microsoft แนะนำให้แอปพลิเคชันใหม่ใช้ UTF-8 หรือ UCS-2/UTF-16 แทนหน้าโค้ดเหล่านี้[ 25 ]
รหัสหน้า DBCS
ชุดรหัสเหล่านี้แสดงถึง การเข้ารหัสอักขระ DBCSสำหรับภาษาต่างๆ เช่น จีน ญี่ปุ่น และเกาหลี (CJK) ในระบบปฏิบัติการของ Microsoft ชุดรหัสเหล่านี้ถูกใช้เป็นทั้งชุดรหัส "OEM" และ "Windows" สำหรับภาษาท้องถิ่นที่เกี่ยวข้อง
- 932 – รองรับระบบหน่วยวัดแบบ Shift-JIS ของญี่ปุ่น
- 936 – รองรับภาษาจีนตัวย่อGB2312หรือGBK
- 949 – รองรับรหัสอักษรฮันกุลแบบรวมของเกาหลี
- 950 – รองรับภาษาจีนดั้งเดิม 5 รูปแบบหลัก (Big5)
- 951 – รองรับ อักษร จีนดั้งเดิม5 ตัวหลัก (Big5)พร้อมระบบตัวเลข HKSCS
โค้ดเพจ MS-DOS
หน้าโค้ดเหล่านี้ถูกใช้โดย Microsoft ในระบบปฏิบัติการ MS-DOS Microsoft เรียกหน้าโค้ดเหล่านี้ว่าหน้าโค้ด OEM เนื่องจากได้รับการกำหนดโดยผู้ผลิตอุปกรณ์ดั้งเดิมที่ได้รับอนุญาตให้แจกจ่าย MS-DOS พร้อมกับฮาร์ดแวร์ของตน ไม่ใช่โดย Microsoft หรือองค์กรมาตรฐาน หน้าโค้ดส่วนใหญ่เหล่านี้มีหมายเลขเดียวกันกับหน้าโค้ด IBM ที่เทียบเท่ากัน แม้ว่าบางหน้าจะไม่เหมือนกันทุกประการก็ตาม[ 26 ]
- 708 – ภาษาอาหรับ (ASMO 708)
- 720 – ภาษาอาหรับ (ASMO แบบโปร่งใส)
- 737 – กรีก
- 850 – ลาติน-1
- 851 – กรีก
- 852 – ลาติน-2
- 855 – อักษรซีริลลิก
- 857 – ลาติน-5
- 858 – รหัสละติน 1 พร้อมสัญลักษณ์ยูโร
- 859 – ลาติน-9
- 860 – ภาษาโปรตุเกส
- 861 – ไอซ์แลนด์
- 862 – ภาษาฮีบรู
- 863 – ภาษาฝรั่งเศสแคนาดา
- 864 – ภาษาอาหรับ
- 865 – เดนมาร์ก / นอร์เวย์
- 866 – เบลารุส รัสเซีย ยูเครน
- 869 – กรีก
หน้าโค้ดจำลอง Macintosh
ชุดรหัสเหล่านี้ถูกใช้โดย Microsoft เมื่อจำลองชุดอักขระ ของ Apple Macintosh
- 10000 - Apple Macintosh Roman
- 10001 - Apple ภาษาญี่ปุ่น
- 10002 - Apple Traditional Chinese (Big5)
- 10003 - Apple เกาหลี
- 10004 - Apple Arabic
- 10005 - Apple ภาษาฮีบรู
- 10006 - แอปเปิ้ลกรีก
- 10007 - Apple Macintosh อักษรซีริลลิก
- 10008 - ภาษาจีนตัวย่อของ Apple (GB 2312)
- 10010 - Apple โรมาเนีย
- 10017 - แอปเปิลยูเครน
- 10021 - แอปเปิ้ลไทย
- 10029 - Apple Macintosh ในยุโรปกลาง
- 10079 - Apple ไอซ์แลนด์
- 10081 - Apple ภาษาตุรกี
- 10082 - แอปเปิลโครเอเชีย
หน้าโค้ดอื่นๆ ของ Microsoft
หมายเลขหน้าโค้ดต่อไปนี้เป็นหมายเลขเฉพาะของ Microsoft Windows IBM อาจใช้หมายเลขที่แตกต่างกันสำหรับหน้าโค้ดเหล่านี้ โดยจะจำลองชุดอักขระหลายชุด โดยเฉพาะชุดอักขระที่ออกแบบมาเพื่อใช้งานตามมาตรฐาน ISO เช่น ระบบปฏิบัติการที่คล้ายกับ UNIX
- 20000 – ระบบประสาทส่วนกลางแบบจีนดั้งเดิม
- 20001 – แผนจีนดั้งเดิม (TCA)
- 20002 – ETEN ภาษาจีนตัวเต็ม
- 20003 – ภาษาจีนดั้งเดิม IBM5500
- 20004 – เทเลเท็กซ์ภาษาจีนดั้งเดิม
- 20005 – หวังแบบจีนดั้งเดิม
- 20105 – 7-bit IA5 IRV [ 27 ] [ 28 ] [ 29 ] ( CP 1009 )
- 20106 – 7 บิตIA5เยอรมัน ( DIN 66003 ) [ 27 ] [ 28 ] [ 30 ]
- 20107 – 7 บิตIA5สวีเดน (SEN 850200 C) [ 27 ] [ 28 ] [ 31 ]
- 20108 - ภาษานอร์เวย์ IA5 7 บิต(NS 4551-2) [ 27 ] [ 28 ] [ 32 ]
- 20127 – US-ASCII 7 บิต [ 27 ] [ 28 ] [ 33 ]
- 20261 – CCITT T.61
- 20269 – ISO 6937
- 20273
- 20277
- 20278
- 20284
- 20285
- 20290 - ภาษาญี่ปุ่นใน EBCDIC
- 20297
- 20420
- 20423
- 20424
- 20833
- 20838
- 20866 – KOI8-R
- 20871
- 20880 – EBCDIC อักษรซีริลลิก (880)
- 20905
- 20924
- 20932 - EUC-JP
- 20936
- 20949
- 21025 – EBCDIC อักษรซีริลลิก (1025)
- 21027
- 21866 – KOI8-U
- 28591 – ISO-8859-1
- 28592 – ISO-8859-2
- 28593 – ISO-8859-3
- 28594 – ISO-8859-4
- 28595 – ISO-8859-5
- 28596 – ISO-8859-6
- 28597 – ISO-8859-7
- 28598 – ISO-8859-8
- 28599 – ISO-8859-9
- 28600 – ISO-8859-10
- 28601 – ISO-8859-11
- 28602 – ไม่ได้ใช้ (สงวนไว้สำหรับISO-8859-12 )
- 28603 – ISO-8859-13
- 28604 – ISO-8859-14
- 28605 – ISO-8859-15
- 28606 – ISO-8859-16
- 38596 – ISO-8859-6
- 38598 – ISO-8859-8
ชุดรหัสยูนิโค้ดของ Microsoft
- 1200 – UTF-16LE Unicode ( little-endian )
- 1201 – ยูนิโค้ด UTF-16BE ( บิ๊กเอนเดียน )
- 12000 – UTF-32LE Unicode ( little-endian )
- 12001 – UTF-32BE Unicode ( big-endian )
- 65000 – ยูนิโค้ดUTF-7
- 65001 – ยูนิโค้ดUTF-8
- 65520 – พื้นที่ Unicode ว่างเปล่า
ชุดสัญลักษณ์ HP
HP ได้พัฒนาชุดสัญลักษณ์ (แต่ละชุดมีรหัสชุดสัญลักษณ์ที่เกี่ยวข้อง) เพื่อเข้ารหัสชุดอักขระของตนเองหรือชุดอักขระของผู้จำหน่ายรายอื่น โดยปกติจะเป็นชุดอักขระ 7 บิต ซึ่งเมื่อย้ายไปยังส่วนที่สูงกว่าและเชื่อมโยงกับชุดอักขระ ASCII จะกลายเป็นชุดอักขระ 8 บิต
ชุดสัญลักษณ์ของ HP เอง
- ชุดสัญลักษณ์ 0E — ส่วนขยาย HP Roman — ชุดอักขระ 7 บิตพร้อมตัวอักษรที่มีเครื่องหมายเน้นเสียง (กำหนดรหัสโดย IBM เป็นรหัสหน้า 1050 )
- ชุดสัญลักษณ์ 0G — HP ภาษาเยอรมัน 7 บิต
- ชุดสัญลักษณ์ 0L — HP 7-bit PC Line (กำหนดรหัสโดย IBM เป็นรหัสหน้า 1055 )
- ชุดสัญลักษณ์ 0M — HP Math-7
- ชุดสัญลักษณ์ 0T — HP Thai-8
- ชุดสัญลักษณ์ 1S — HP ภาษาสเปน 7 บิต
- ชุดสัญลักษณ์ 1U — แบบอักษร HP 7-bit Gothic Legal (กำหนดรหัสโดย IBM เป็นรหัสหน้า 1052 )
- ชุดสัญลักษณ์ 4Q — HP Line Draw (รหัสโดย IBM คือรหัสหน้า 1056 )
- ชุดสัญลักษณ์ 4U — HP โรมัน-9 — โรมัน-8 + €
- ชุดสัญลักษณ์ 7J — HP Desktop
- ชุดสัญลักษณ์ 7S — ภาษาสเปนยุโรป 7 บิตของ HP
- ชุดสัญลักษณ์ 8E — HP East-8
- ชุดสัญลักษณ์ 8G — HP Greek-8 (อ้างอิงจาก IR 088 ไม่ใช่ ELOT 927)
- ชุดสัญลักษณ์ 8H — HP Hebrew-8
- ชุดสัญลักษณ์ 8I — MS LineDraw (ASCII + HP PC Line)
- ชุดสัญลักษณ์ 8K — HP Kana-8 (ASCII + คาตาคานะญี่ปุ่น)
- ชุดสัญลักษณ์ 8L — HP LineDraw (ASCII + HP Line Draw)
- ชุดสัญลักษณ์ 8M — HP Math-8 (ASCII + HP Math-8)
- ชุดสัญลักษณ์ 8R — HP Cyrillic-8
- ชุดสัญลักษณ์ 8S — ภาษาสเปนละตินอเมริกา 7 บิตของ HP
- ชุดสัญลักษณ์ 8T — HP Turkish-8
- ชุดสัญลักษณ์ 8U — HP Roman-8 (ASCII + ส่วนขยาย HP Roman; กำหนดรหัสโดย IBM เป็นรหัสหน้า 1051 )
- ชุดสัญลักษณ์ 8V — HP ภาษาอาหรับ-8
- ชุดสัญลักษณ์ 9K — HP ภาษาเกาหลี-8
- ชุดสัญลักษณ์ 9T — PC 8T (หรือที่รู้จักกันในชื่อ รหัสหน้า 437-T; นี่ไม่ใช่รหัสหน้า 857)
- ชุดสัญลักษณ์ 9V — ละติน/อาหรับ สำหรับ Windows (นี่ไม่ใช่รหัสหน้า 1256 )
- ชุดสัญลักษณ์ 11U — PC 8D/N (หรือที่รู้จักกันในชื่อ รหัสหน้า 437-N; IBM กำหนดรหัสเป็นรหัสหน้า 1058 ; นี่ไม่ใช่รหัสหน้า 865 )
- ชุดสัญลักษณ์ 14G — PC-8 อักษรกรีกทางเลือก (หรือที่รู้จักกันในชื่อ รหัสหน้า 437-G; เกือบเหมือนกับรหัสหน้า 737 )
- ชุดสัญลักษณ์ 18K —
- ชุดสัญลักษณ์ 18T —
- ชุดสัญลักษณ์ 19C —
- ชุดสัญลักษณ์ 19K —
ชุดสัญลักษณ์จากผู้จำหน่ายรายอื่น
- ชุดสัญลักษณ์ 0D — ISO 60: ภาษานอร์เวย์ 7 บิต
- ชุดสัญลักษณ์ 0F — ISO 25: ภาษาฝรั่งเศส 7 บิต
- ชุดสัญลักษณ์ 0H — HP 7-bit ภาษาฮิบรู — แทบจะเหมือนกับมาตรฐานอิสราเอลSI 960
- ชุดสัญลักษณ์ 0I — ISO 15: ภาษาอิตาลี 7 บิต
- ชุดสัญลักษณ์ 0K — ISO 14: อักษรคาตาคานาญี่ปุ่น 7 บิต
- ชุดสัญลักษณ์ 0N — ISO 8859-1 ละติน 1 (เดิมเรียกว่า "Gothic-1"; กำหนดรหัสโดย IBM เป็นรหัสหน้า 1053)
- ชุดสัญลักษณ์ 0R — ISO 8859-5 ละติน/ซีริลลิก (ฉบับปี 1986 — IR 111)
- ชุดสัญลักษณ์ 0S — ISO 11: สวีเดน 7 บิต
- ชุดสัญลักษณ์ 0U — ISO 6: สหรัฐอเมริกา 7 บิต
- ชุดสัญลักษณ์ 0V — ภาษาอาหรับ
- ชุดสัญลักษณ์ 1D — ISO 61: ภาษานอร์เวย์ 7 บิต
- ชุดสัญลักษณ์ 1E — ISO 4: 7 บิต สหราชอาณาจักร
- ชุดสัญลักษณ์ 1F — ISO 69: ภาษาฝรั่งเศส 7 บิต
- ชุดสัญลักษณ์ 1G — ISO 21: ภาษาเยอรมัน 7 บิต
- ชุดสัญลักษณ์ 1K — ISO 13: อักษรละตินญี่ปุ่น 7 บิต
- ชุดสัญลักษณ์ 1T — Windows ภาษาไทย (แทบจะเหมือนกับ874 )
- ชุดสัญลักษณ์ 2K — ISO 57: อักษรละตินจีนตัวย่อ 7 บิต
- ชุดสัญลักษณ์ 2N — ISO 8859-2 ละติน 2
- ชุดสัญลักษณ์ 2S — ISO 17: ภาษาสเปน 7 บิต
- ชุดสัญลักษณ์ 2U — ISO 2: เวอร์ชันอ้างอิงสากล 7 บิต
- ชุดสัญลักษณ์ 3N — ISO 8859-3 ละติน 3
- ชุดสัญลักษณ์ 3R — PC-866 รัสเซีย (แทบจะเหมือนกับรหัสหน้า 866 )
- ชุดสัญลักษณ์ 3S — ISO 10: สวีเดน 7 บิต
- ชุดสัญลักษณ์ 4N — ISO 8859-4 ละติน 4
- ชุดสัญลักษณ์ 4S — ISO 16: ภาษาโปรตุเกส 7 บิต
- ชุดสัญลักษณ์ 5M — สัญลักษณ์คณิตศาสตร์สำหรับ PS (แทบจะเหมือนกับสัญลักษณ์ของ Adobe )
- ชุดสัญลักษณ์ 5N — ISO 8859-9 ละติน 5
- ชุดสัญลักษณ์ 5S — ISO 84: ภาษาโปรตุเกส 7 บิต
- ชุดสัญลักษณ์ 5T — Windows 3.1 Latin-5 (แทบจะเหมือนกับรหัสหน้า 1254 )
- ชุดสัญลักษณ์ 6J — สำนักพิมพ์ Microsoft
- ชุดสัญลักษณ์ 6M — คณิตศาสตร์เวนทูรา
- ชุดสัญลักษณ์ 6N — ISO 8859-10 ละติน 6
- ชุดสัญลักษณ์ 6S — ISO 85: ภาษาสเปน 7 บิต
- ชุดสัญลักษณ์ 7H — ISO 8859-8 ละติน/ฮิบรู
- ชุดสัญลักษณ์ 9E — Windows 3.1 ละติน 2 (แทบจะเหมือนกับรหัสหน้า 1250 )
- ชุดสัญลักษณ์ 9G — ภาษากรีกสำหรับ Windows 98 (แทบจะเหมือนกับรหัสหน้า 1253 )
- ชุดสัญลักษณ์ 9J — PC 1004
- ชุดสัญลักษณ์ 9L — Ventura ITC Zapf Dingbats
- ชุดสัญลักษณ์ 9N — ISO 8859-15 ละติน 9
- ชุดสัญลักษณ์ 9R — อักษรซีริลลิกของ Windows 98 (แทบจะเหมือนกับรหัสหน้า 1251 )
- ชุดสัญลักษณ์ 9U — Windows 3.0
- ชุดสัญลักษณ์ 10G — PC-851 ละติน/กรีก (แทบจะเหมือนกับรหัสหน้า 851)
- ชุดสัญลักษณ์ 10J — ข้อความ PS (แทบจะเหมือนกับมาตรฐานของ Adobe )
- ชุดสัญลักษณ์ 10L — PS ITC Zapf Dingbats (แทบจะเหมือนกับ Adobe Dingbats)
- ชุดสัญลักษณ์ 10N — ISO 8859-5 ละติน/ซีริลลิก (ฉบับปี 1988 — IR 144)
- ชุดสัญลักษณ์ 10R — PC-855 อักษรซีริลลิก (แทบจะเหมือนกับรหัสหน้า 855)
- ชุดสัญลักษณ์ 10T — เทเลเท็กซ์
- ชุดสัญลักษณ์ 10U — PC-8 (แทบจะเหมือนกับรหัสหน้า 437 ; IBM กำหนดให้เป็นรหัสหน้า 1057)
- ชุดสัญลักษณ์ 10V — CP-864 (แทบจะเหมือนกับรหัสหน้า 864 )
- ชุดสัญลักษณ์ 11G — CP-869 (แทบจะเหมือนกับรหัสหน้า 869 )
- ชุดสัญลักษณ์ 11J — PS ISO Latin-1 (แทบจะเหมือนกับ Adobe Latin-1)
- ชุดสัญลักษณ์ 11N — ISO 8859-6 ละติน/อาราบิก
- ชุดสัญลักษณ์ 12G — อักษรละติน/กรีกสำหรับพีซี (แทบจะเหมือนกับรหัสหน้า 737 )
- ชุดสัญลักษณ์ 12J — ตัวอักษร MC (แทบจะเหมือนกับตัวอักษรโรมันของ Macintosh )
- ชุดสัญลักษณ์ 12N — ISO 8859-7 ละติน/กรีก
- ชุดสัญลักษณ์ 12R — PC Gost (แทบจะเหมือนกับ PC GOST Main)
- ชุดสัญลักษณ์ 12U — PC-850 ละติน 1 (แทบจะเหมือนกับรหัสหน้า 850 )
- ชุดสัญลักษณ์ 13J — เวนทูรา อินเตอร์เนชั่นแนล
- ชุดสัญลักษณ์ 13R — ภาษาบัลแกเรียสำหรับพีซี (แทบจะเหมือนกับMIK )
- ชุดสัญลักษณ์ 13U — PC-858 ละติน 1 + € (แทบจะเหมือนกับรหัสหน้า 858 )
- ชุดสัญลักษณ์ 14J — เวนทูรา สหรัฐอเมริกา
- ชุดสัญลักษณ์ 14L — Windows Dingbats
- ชุดสัญลักษณ์ 14P — ABICOMP International (แทบจะเหมือนกับABICOMP ทุกประการ )
- ชุดสัญลักษณ์ 14R — ภาษาอูเครนสำหรับพีซี (แทบจะเหมือนกับRUSCII )
- ชุดสัญลักษณ์ 15H — PC-862 อิสราเอล (แทบจะเหมือนกับรหัสหน้า 862 )
- ชุดสัญลักษณ์ 16U — PC-857 ละติน 5 (แทบจะเหมือนกับรหัสหน้า 857)
- ชุดสัญลักษณ์ 17U — PC-852 ละติน 2 (แทบจะเหมือนกับรหัสหน้า 852)
- ชุดสัญลักษณ์ 18N — UTF-8
- ชุดสัญลักษณ์ 18U — PC-853 ละติน 3 (แทบจะเหมือนกับรหัสหน้า 853)
- ชุดสัญลักษณ์ 19L — Windows 98 Baltic (แทบจะเหมือนกับรหัสหน้า 1257 )
- ชุดสัญลักษณ์ 19M — สัญลักษณ์ Windows
- ชุดสัญลักษณ์ 19U — Windows 3.1 ละติน 1 (แทบจะเหมือนกับรหัสหน้า 1252 )
- ชุดสัญลักษณ์ 20U — PC-860 โปรตุเกส (แทบจะเหมือนกับรหัสหน้า 860)
- ชุดสัญลักษณ์ 21U — PC-861 ไอซ์แลนด์ (แทบจะเหมือนกับรหัสหน้า 861 )
- ชุดสัญลักษณ์ 23U — PC-863 แคนาดา - ภาษาฝรั่งเศส (แทบจะเหมือนกับรหัสหน้า 863 )
- ชุดสัญลักษณ์ 24Q — PC-Polish Mazowia (แทบจะเหมือนกับการเข้ารหัส Mazovia )
- ชุดสัญลักษณ์ 25U — PC-865 เดนมาร์ก/นอร์เวย์ (แทบจะเหมือนกับรหัสหน้า 865 )
- ชุดสัญลักษณ์ 26U — PC-775 ละติน 7 (แทบจะเหมือนกับรหัสหน้า 775)
- ชุดสัญลักษณ์ 27Q — PC-8 PC Nova (แทบจะเหมือนกับ [PC Nova])
- ชุดสัญลักษณ์ 27U — PC ภาษาลัตเวียรัสเซีย (หรือที่รู้จักกันในชื่อ 866-ลัตเวีย)
- ชุดสัญลักษณ์ 28U — ภาษาลิทัวเนีย/รัสเซียสำหรับพีซี (แทบจะเหมือนกับรหัสหน้า 774 )
- ชุดสัญลักษณ์ 29U — PC-772 ลิทัวเนีย/รัสเซีย (แทบจะเหมือนกับรหัสหน้า 772 )
รหัสหน้าจากผู้จำหน่ายรายอื่น
รหัสหน้าเหล่านี้เป็นการกำหนดโดยอิสระจากผู้จำหน่ายภายนอก เนื่องจากรหัสหน้าของ IBM PC ดั้งเดิม ( หมายเลข 437 ) ไม่ได้ถูกออกแบบมาเพื่อใช้งานในระดับสากล จึงทำให้เกิดรหัสหน้าเฉพาะประเทศหรือภูมิภาคที่มีความเข้ากันได้บางส่วนขึ้นมาหลายแบบ
การกำหนดหมายเลขหน้าโค้ดเหล่านี้ไม่ใช่การกำหนดอย่างเป็นทางการจากทั้ง IBM หรือ Microsoft และแทบไม่มีหมายเลขใดเลยที่ IANA อ้างถึงว่าเป็นชุดอักขระที่ใช้งานได้ หมายเลขที่กำหนดให้กับหน้าโค้ดเหล่านี้เป็นไปโดยพลการและอาจขัดแย้งกับหมายเลขที่จดทะเบียนไว้ซึ่งใช้งานโดย IBM หรือ Microsoft บางหมายเลขอาจมีมาก่อนที่การสลับหน้าโค้ดจะถูกเพิ่มเข้ามาใน DOS 3.3
- 100 – หน้าฟอนต์ฮาร์ดแวร์ภาษาฮีบรูของ DOS (ไม่ใช่จาก IBM; HDOS ) [ 34 ]
- 111 – DOS ภาษากรีก (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] )
- 112 – DOS ภาษาตุรกี (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] )
- 113 – DOS ยูโกสลาเวีย (ไม่ใช่จาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] )
- 151 – DOS Nafitha Arabic (ไม่ใช่ของ IBM; เป็น ADOS )
- 152 – DOS Nafitha Arabic (ไม่ใช่ของ IBM; เป็น ADOS )
- 161 – DOS ภาษาอาหรับ (ไม่ใช่จาก IBM; ADOS ) [ 34 ]
- 162 – ภาษาอาหรับ DOS พร้อมเครื่องหมายกำกับสระ (ไม่ใช่จาก IBM; ADOS)
- 163 – DOS ภาษาอาหรับและฝรั่งเศส (ไม่ได้มาจาก IBM; ADOS) [ 34 ]
- 164 – ภาษาอาหรับและฝรั่งเศสสำหรับระบบปฏิบัติการ DOS พร้อมเครื่องหมายกำกับสระ (ไม่ใช่จาก IBM; จาก ADOS)
- 165 – DOS Arabic (864 Extended) (ไม่ได้มาจาก IBM; ADOS) [ 34 ]
- 166 – IBM Arabic PC (ADOS) [ 34 ]
- 190 – DEC DOS ภาษาเยอรมัน (ดูเหมือนจะเหมือนกับรหัสหน้า 437)
- 210 – DEC DOS ภาษากรีก (เครื่องพิมพ์ NEC Jetmate)
- 220 – DEC DOS ภาษาสเปน (ไม่ใช่จาก IBM)
- 489 – ภาษาเช็กโกสโลวาเกีย [ซอฟต์แวร์ OCR ปี 1993]
- 620 – DOS ภาษาโปแลนด์ (มาโซเวีย) (ไม่ใช่จาก IBM)
- 667 – DOS ภาษาโปแลนด์ (มาโซเวีย) (ไม่ใช่ของ IBM)
- 668 – ภาษาโปแลนด์สำหรับ DOS (ไม่ใช่ของ IBM)
- 706 – MS-DOS Server Arabic Sakhr (ไม่ใช่ของ IBM; เป็นซอฟต์แวร์ SakhrจากMSX Computers)
- 707 – โปรแกรม Sakhr ภาษาอาหรับสำหรับ MS-DOS (ไม่ใช่ของ IBM; เป็นซอฟต์แวร์ SakhrจากMSX Computers)
- 709 – ภาษาอาหรับสำหรับ MS-DOS ( ASMO 449+ /BCON V4)
- 710 – MS-DOS ภาษาอาหรับ (ภาษาอาหรับแบบโปร่งใส)
- 711 – MS-DOS Arabic Nafitha Enhanced (ไม่ใช่ผลิตภัณฑ์ของ IBM)
- 714 – MS-DOS Arabic Sakr (ไม่ใช่ของ IBM)
- 715 – MS-DOS Arabic APTEC (ไม่ใช่ของ IBM)
- 721 – MS-DOS Arabic Nafitha International (ไม่ใช่ผลิตภัณฑ์ของ IBM)
- 768 – ภาษาอาหรับ (ไม่ใช่จาก IBM)
- 770 – DOS เอสโตเนีย ลัตเวีย ลิทัวเนีย[ 38 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย; [ 39 ]มาตรฐานแห่งชาติ RST 1095-89 ของลิทัวเนีย)
- 771 – DOS ลิทัวเนีย/ซีริลลิก — KBL [ 40 ] (จากซอฟต์แวร์ลิทัวเนีย Lika [ 39 ] )
- 772 – DOS ลิทัวเนีย/ซีริลลิก[ 41 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย; [ 39 ]มาตรฐานแห่งชาติ LST 1284:1993 ของลิทัวเนีย; นำมาใช้โดย IBM เป็นรหัสหน้า 1119 )
- 773 – DOS Latin-7 — KBL (จากซอฟต์แวร์ลิทัวเนียลิกา)
- 774 – DOS ภาษาลิทัวเนีย[ 42 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย; [ 39 ]มาตรฐานแห่งชาติ LST 1283:1993 ของลิทัวเนีย; นำมาใช้โดย IBM เป็นรหัสหน้า 1118 )
- 775 – DOS Latin-7 Baltic Rim (จาก Lithuanian Lika Software; [ 39 ] Lithuanian LST 1590-1 National Standard; นำมาใช้โดย IBM และ Microsoft เป็นรหัสหน้า 775)
- 776 – DOS ภาษาลิทัวเนีย (CP770 ขยาย) [ 43 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย[ 39 ] )
- 777 – ภาษาลิทัวเนียแบบมีสำเนียง DOS (แบบเก่า) (CP773 แบบขยาย) — KBL [ 43 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย[ 39 ] )
- 778 – ภาษาลิทัวเนียแบบมีสำเนียง DOS (CP775 แบบขยาย) [ 43 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย[ 39 ] )
- 790 – DOS Polish (Mazovia)พร้อมเครื่องหมายอัญประกาศแบบหยิก
- 854 – ภาษาสเปน[ 44 ] [ 6 ]
- 881 – ละติน 1 (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 881)
- 882 – ละติน 2 (ISO 8859-2) (ไม่ใช่จาก IBM; เหมือนกับรหัสหน้า 912; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 882)
- 883 – ละติน 3 (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 883)
- 884 – ละติน 4 (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 884)
- 885 – ละติน 5 (ไม่ใช่จาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 885)
- 895 – เช็ก (Kamenický) (ไม่ใช่ของ IBM; มีรหัสขัดแย้งกับ IBM CP895 — อักษรโรมันญี่ปุ่น 7 บิต EUC)
- 896 – ภาษาโปแลนด์สำหรับ DOS (Mazovia) (ไม่ใช่ของ IBM; มีรหัสขัดแย้งกับ IBM CP896 — ภาษาญี่ปุ่นคาตาคานา 7 บิตสำหรับ EUC)
- 900 – DOS รัสเซีย (Russian MS-DOS 5.0 LCD.CPI)
- 928 – ภาษากรีก (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับมาตรฐานแห่งชาติกรีกELOT 928 (ไม่ได้มาจาก IBM; รหัสขัดแย้งกับ IBM CP928 — DBCS พีซีภาษาจีนตัวย่อ)
- 966 – ประเทศซาอุดีอาระเบีย (ไม่ใช่จาก IBM)
- 972 – ภาษาฮีบรู (VT100) (ไม่ใช่จาก IBM)
- 991 – ระบบปฏิบัติการ DOS ภาษาโปแลนด์ (มาโซเวีย) (ไม่ใช่ของ IBM)
- 999 – ฟอนต์ DOS Serbo-Croatian I (ไม่ได้ผลิตโดย IBM); รู้จักกันในชื่อ PC Nova และ CroSCII; ส่วนล่างเป็น JUSI.B1.002 ส่วนบนเป็นโค้ดเพจ 437; รองรับภาษา สโลเวเนียและเซอร์โบ-โครเอเชีย (อักษรละติน)
- 1001 – ภาษาอาหรับ (บนเครื่องพิมพ์ Star [ 45 ] ) (ไม่ใช่จาก IBM; รหัสขัดแย้งกับ IBM CP1001 — MICR)
- 1261 – Windows เวอร์ชันภาษาเกาหลี IBM-1261 LMBCS-17 คล้ายกับ1363
- 1270 – Windows Sámi
- 1300 – ANSI [PTS-DOS 6.70 ไม่ใช่ 6.51] (ไม่ใช่จาก IBM; มีรหัสขัดแย้งกับ IBM EBCDIC 1300 — บาร์โค้ดทั่วไป/OCR-B)
- 2001 – KBL ของลิทัวเนีย (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 771
- 3001 – เอสโตเนีย 1 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 1116
- 3002 – ภาษาเอสโตเนีย 2 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 922
- 3011 – ลัตเวีย 1 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 437-ลัตเวีย
- 3012 – ลัตเวีย-2 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 866-ลัตเวีย (มาตรฐานแห่งชาติลัตเวีย RST 1040-90)
- 3021 – ภาษาบัลแกเรีย (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับ MIK
- 3031 – ภาษาฮีบรู (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 862
- 3041 – ภาษามอลตา (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับภาษามอลตาISO 646
- 3840 – IBM-รัสเซีย (บนเครื่องพิมพ์ Star [ 45 ] ); เกือบเหมือนกับCP 866
- 3841 – Gost-Russian (บนเครื่องพิมพ์ Star [ 45 ] ); GOST 13052พร้อมอักขระสำหรับภาษาเอเชียกลาง
- 3843 – โปแลนด์ (พิมพ์โดย Star [ 45 ] ); เหมือนกับ Mazovia
- 3844 – CS2 (บนเครื่องพิมพ์ Star [ 45 ] ); เช่นเดียวกับ Kamenický
- 3845 – ฮังการี (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับ CWI
- 3846 – ภาษาตุรกี (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับภาษาตุรกี PC-8 + สัญลักษณ์ลีราตุรกีแบบเก่า (Tʟ) ที่จุดรหัส A8
- 3847 – Brazil-ABNT (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับมาตรฐานแห่งชาติของบราซิล NBR-9614:1986
- 3848 – Brazil-ABICOMP (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับ ABICOMP
- 3850 – มาตรฐาน KU (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัสของมหาวิทยาลัยเกษตรศาสตร์สำหรับภาษาไทย
- 3860 – มหาวิทยาลัยราชวิทยา (บนเครื่องพิมพ์ดาว[ 45 ] ); รูปแบบการเข้ารหัสของมหาวิทยาลัยเกษตรศาสตร์สำหรับภาษาไทย
- 3861 – Microwiz KU (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัสของมหาวิทยาลัยเกษตรศาสตร์สำหรับภาษาไทย
- 3863 – STD988 TIS (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัส TIS 620 สำหรับภาษาไทย
- 3864 – TIS ยอดนิยม (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัส TIS 620 สำหรับภาษาไทย
- 3865 – Newsic TIS (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัส TIS 620 สำหรับภาษาไทย
- 28799 – FOCAL (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับชุดอักขระ FOCAL
- 28800 – HP RPL (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับRPL
- (หมายเลขหายไป) – CWI-2 (สำหรับ DOS) รองรับภาษาฮังการี
- (หมายเลขหายไป) – MIK (สำหรับ DOS) รองรับภาษาบัลแกเรีย
- (หมายเลขหายไป) – DOS Serbo-Croatian II; รองรับภาษา สโลเวเนียและเซอร์โบ-โครเอเชีย (อักษรละติน)
- (หมายเลขหายไป) — รหัสหน้าทางเลือก ของรัสเซีย (สำหรับ DOS); นี่คือต้นกำเนิดของ IBM CP 866
รายการการกำหนดรหัสหน้า
รายชื่อการกำหนดรหัสหน้า (ไม่สมบูรณ์):
| รหัสประจำตัว | ชื่อ | คำอธิบาย | ต้นทาง | แพลตฟอร์ม | ดีเอส | โอเอส/2 | วินโดวส์ | แม็ค | อื่น | การเข้ารหัส | ความคิดเห็น |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | ไม่มีข้อมูล | ที่สงวนไว้ | ไอบีเอ็ม, ไมโครซอฟต์ | ไม่มีข้อมูล | 3.3+ | 1.0+ | ? | ? | ? | การใช้งานระบบปฏิบัติการภายใน[ 34 ] | |
| 437 | ซีพี437, ไอบีเอ็ม437 | พีซี ยูเอส | IBM [ 46 ] | ไอบีเอ็มพีซี | 3.3+ | 1.0+ | ใช่ | ? | ใช่ | SBC 8 บิต | |
| 57344 - 61439 | ไม่มีข้อมูล | อนุพันธ์สำหรับการใช้งานส่วนตัว | ไอบีเอ็ม | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | หลากหลาย | รหัสหน้าสำหรับใช้งานส่วนตัว (E000h-EFFFh) |
| 65280 - 65533 | ไม่มีข้อมูล | คำจำกัดความสำหรับการใช้งานส่วนตัว | ไอบีเอ็ม | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | หลากหลาย | คำจำกัดความรหัสหน้าสำหรับใช้งานส่วนตัว (FF00h-FFFDh) |
| 65534 | ไม่มีข้อมูล | ที่สงวนไว้ | ไอบีเอ็ม, ไมโครซอฟต์ | ไม่มีข้อมูล | ? | ? | ? | ? | ? | หลากหลาย | การใช้งานระบบปฏิบัติการภายใน (FFFEh) |
| 65535 | ไม่มีข้อมูล | ที่สงวนไว้ | ไอบีเอ็ม, ไมโครซอฟต์ | ไม่มีข้อมูล | 3.3+ | 1.0+ | ? | ? | ? | หลากหลาย | การใช้งานระบบปฏิบัติการภายใน (FFFFh) [ 34 ] |
การวิจารณ์
ระบบการเข้ารหัสอักขระแบบเก่าหลายระบบ (ต่างจาก Unicode) มีปัญหาหลายประการ ผู้ผลิตบางรายไม่ได้จัดทำเอกสารอธิบายความหมายของค่าจุดรหัสทั้งหมดในหน้าโค้ดของตนอย่างเพียงพอ ซึ่งลดความน่าเชื่อถือในการจัดการข้อมูลข้อความอย่างสม่ำเสมอผ่านระบบคอมพิวเตอร์ต่างๆ ผู้ผลิตบางรายเพิ่มส่วนขยายที่เป็นกรรมสิทธิ์ลงในหน้าโค้ดที่กำหนดไว้ เพื่อเพิ่มหรือเปลี่ยนแปลงค่าจุดรหัสบางค่า ตัวอย่างเช่น ไบต์ 0x5C ในShift JISสามารถแทนได้ทั้งเครื่องหมายทับหรือเครื่องหมายเยนขึ้นอยู่กับแพลตฟอร์ม สุดท้าย เพื่อรองรับหลายภาษาในโปรแกรมที่ไม่ใช้ Unicode จำเป็นต้องจัดเก็บหน้าโค้ดที่ใช้สำหรับแต่ละสตริง/เอกสาร
แอปพลิเคชันอาจติดป้ายข้อความในWindows-1252 ผิดพลาด เป็นISO-8859-1ความแตกต่างเพียงอย่างเดียวระหว่างหน้าโค้ดเหล่านี้คือค่าจุดโค้ดในช่วง 0x80–0x9F ซึ่งใช้โดย ISO-8859-1 สำหรับอักขระควบคุม จะถูกใช้เป็นอักขระที่พิมพ์ได้เพิ่มเติมใน Windows-1252 แทน โดยเฉพาะอย่างยิ่งสำหรับเครื่องหมายอัญประกาศเครื่องหมายยูโรและสัญลักษณ์เครื่องหมายการค้าเป็นต้น เบราว์เซอร์บนแพลตฟอร์มที่ไม่ใช่ Windows มักจะแสดงกล่องว่างหรือเครื่องหมายคำถามสำหรับอักขระเหล่านี้ ทำให้ข้อความอ่านยาก เบราว์เซอร์ส่วนใหญ่แก้ไขปัญหานี้โดยการละเว้นชุดอักขระและตีความว่าเป็น Windows-1252 เพื่อให้ดูยอมรับได้ ใน HTML5 การปฏิบัติต่อ ISO-8859-1 เป็น Windows-1252 ยังได้รับการกำหนดเป็นมาตรฐานW3C อีกด้วย [ 47 ]แม้ว่าโดยทั่วไปแล้วเบราว์เซอร์จะถูกตั้งโปรแกรมให้จัดการกับพฤติกรรมนี้ แต่สิ่งนี้ไม่ได้เป็นจริงเสมอไปสำหรับซอฟต์แวร์อื่นๆ ด้วยเหตุนี้ เมื่อรับไฟล์ที่ถ่ายโอนจากระบบ Windows ระบบที่ไม่ใช่ Windows จะเพิกเฉยต่ออักขระเหล่านี้ หรือจะถือว่าอักขระเหล่านี้เป็นอักขระควบคุมมาตรฐาน และพยายามดำเนินการตามคำสั่งควบคุมที่ระบุไว้
เนื่องจาก Unicode มีเอกสารประกอบที่ครอบคลุม คลังอักขระจำนวนมาก และนโยบายความเสถียรของอักขระ ปัญหาที่กล่าวมาข้างต้นจึงไม่ค่อยเป็นปัญหาสำหรับ Unicode UTF-8 (ซึ่งสามารถเข้ารหัสโค้ดพอยต์ได้มากกว่าหนึ่งล้านตัว) ได้เข้ามาแทนที่วิธีการใช้โค้ดเพจในแง่ของความนิยมบนอินเทอร์เน็ต[ 48 ] [ 49 ]
หน้าโค้ดส่วนตัว
ในยุคแรกเริ่มของประวัติศาสตร์คอมพิวเตอร์ส่วนบุคคล เมื่อผู้ใช้ไม่พบว่าความต้องการด้านการเข้ารหัสอักขระของตนได้รับการตอบสนอง จึงมีการสร้างหน้าโค้ดส่วนตัวหรือหน้าโค้ดเฉพาะที่ขึ้นโดยใช้ ยูทิลิตี้ terminate-and-stay-residentหรือโดยการเขียนโปรแกรมใหม่ให้กับBIOS EPROMในบางกรณี มีการคิดค้นหมายเลขหน้าโค้ดที่ไม่เป็นทางการขึ้นมา (เช่น CP895)
เมื่อมีการรองรับชุดอักขระที่หลากหลายมากขึ้น ชุดรหัสอักขระส่วนใหญ่จึงเลิกใช้ไป ยกเว้นบางชุด เช่นชุดรหัสKamenický หรือ KEYBCS2 สำหรับอักษร เช็กและสโลวักอีกชุดอักขระหนึ่งคือมาตรฐานการเข้ารหัส Iran Systemซึ่งสร้างโดยบริษัท Iran System เพื่อ รองรับ ภาษาเปอร์เซียมาตรฐานนี้เคยใช้ในอิหร่านในโปรแกรมที่ใช้ระบบ DOS และหลังจากที่ Microsoft นำชุดรหัสอักขระ 1256 มาใช้ มาตรฐานนี้ก็ล้าสมัยไป อย่างไรก็ตาม โปรแกรม Windows และ DOS บางโปรแกรมที่ใช้การเข้ารหัสนี้ยังคงใช้งานอยู่ และยังมีฟอนต์ Windows บางตัวที่ใช้การเข้ารหัสนี้อยู่
เพื่อแก้ไขปัญหาดังกล่าวสถาปัตยกรรมแสดงข้อมูลอักขระระดับ 2 ของ IBM จึงสงวนช่วงรหัสหน้าโค้ดไว้สำหรับการกำหนดค่าโดยผู้ใช้และการใช้งานส่วนตัวโดยเฉพาะ เมื่อใดก็ตามที่มีการใช้รหัสหน้าโค้ดดังกล่าว ผู้ใช้ต้องไม่คาดหวังว่าฟังก์ชันการทำงานและลักษณะที่ปรากฏจะเหมือนกันในระบบการกำหนดค่าอื่นหรือบนอุปกรณ์หรือระบบอื่น เว้นแต่ผู้ใช้จะดูแลเรื่องนี้เป็นพิเศษ ช่วงรหัสหน้าโค้ด 57344-61439 ( E000h - EFFFh ) ถูกสงวนไว้อย่างเป็นทางการสำหรับรหัสหน้าโค้ดที่ผู้ใช้กำหนดเอง (หรือที่จริงแล้วคือ CCSID ในบริบทของIBM CDRA ) ในขณะที่ช่วง 65280-65533 ( FF00h - FFFDh ) ถูกสงวนไว้สำหรับการกำหนดค่า "ส่วนตัว" ที่ผู้ใช้กำหนดเอง ตัวอย่างเช่น รหัสหน้า 437 ( 1B5h ) หรือ 28591 ( 6FAF ) ที่ไม่ได้ลงทะเบียน อาจกลายเป็น 57781 ( E1B5h ) หรือ 61359 ( EFAFh ) ตามลำดับ เพื่อหลีกเลี่ยงความขัดแย้งที่อาจเกิดขึ้นกับการกำหนดค่าอื่นๆ และรักษาตรรกะเชิงตัวเลขภายในที่มีอยู่ในการกำหนดค่าของรหัสหน้าเดิม รหัสหน้าส่วนตัวที่ไม่ได้ลงทะเบียนซึ่งไม่ได้อิงตามรหัสหน้าที่มีอยู่ รหัสหน้าเฉพาะอุปกรณ์ เช่น ฟอนต์ของเครื่องพิมพ์ ซึ่งต้องการเพียงแฮนเดิลเชิงตรรกะเพื่อให้ระบบสามารถเข้าถึงได้ ฟอนต์ดาวน์โหลดที่เปลี่ยนแปลงบ่อย หรือหมายเลขรหัสหน้าที่มีความหมายเชิงสัญลักษณ์ในสภาพแวดล้อมท้องถิ่น อาจมีการกำหนดค่าในช่วงส่วนตัว เช่น 65280 ( FF00h )
รหัสหน้าโค้ด 0, 65534 ( FFFEh ) และ 65535 ( FFFFh ) สงวนไว้สำหรับการใช้งานภายในของระบบปฏิบัติการ เช่น DOS และห้ามกำหนดให้กับหน้าโค้ดใดๆ โดยเฉพาะ
ดูเพิ่มเติม
- หน้าโค้ดของ Windows
- การเข้ารหัสอักขระ
- CCSID คือคำจำกัดความและการกำหนด "รหัสหน้า" อย่างเป็นทางการของ IBM
- การตรวจจับชุดอักขระ
- ยูนิโค้ด
ลิงก์ภายนอก
- คำศัพท์เฉพาะของ IBM CDRA
- รหัสหน้าของ IBMในWayback Machine (เก็บถาวรเมื่อ 5 กุมภาพันธ์ 2016)
- รหัสหน้าของ IBM ตามรูปแบบการเข้ารหัสในWayback Machine (เก็บถาวรเมื่อ 2009-09-06)
- ข้อมูลชุดอักขระ IBM/ICU
- ตัวระบุหน้าโค้ดของ Microsoft (รายการของ Microsoft มีเฉพาะหน้าโค้ดที่แอปพลิเคชันทั่วไปใช้งานบน Windows เท่านั้น โปรดดูรายการของ Torsten Mohrinสำหรับรายการหน้าโค้ดที่รองรับทั้งหมด)
- รายการที่สั้นกว่าของ Microsoft ซึ่งมีเฉพาะรหัสหน้า ANSI และ OEM แต่มีลิงก์ไปยังรายละเอียดเพิ่มเติมเกี่ยวกับแต่ละรายการในWayback Machine (เก็บถาวรเมื่อ 23 ตุลาคม 2012)
- ชุดอักขระและหน้าโค้ด เพียงกดปุ่มเดียว
- คำสั่ง Chcp ของ Microsoft: แสดงและตั้งค่ารหัสหน้าเพจที่ใช้งานอยู่ของคอนโซล
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ รหัสหน้า
ใน ทางคอมพิวเตอร์ รหัส หน้า (code page) คือ การเข้ารหัสอักขระ และเป็นความสัมพันธ์เฉพาะระหว่างชุด อักขระ ที่พิมพ์ได้ และ อักขระควบคุม กับตัวเลขที่ไม่ซ้ำกัน โดยทั่วไปแล้ว...
ระบบการกำหนดหมายเลขหน้าโค้ด
IBM เป็นผู้ริเริ่มแนวคิดในการกำหนดหมายเลข 16 บิตขนาดเล็กแต่ไม่ซ้ำกันทั่วโลกให้กับรหัสอักขระแต่ละแบบที่ระบบคอมพิวเตอร์หรือกลุ่มระบบคอมพิวเตอร์อาจพบเจอ ที่มาของระบบการกำหนดหมายเลขนี้จาก IBM สะท้อนให้เห็นได้จากข้อเท็จจริงที่ว่า หมายเลขที่เล็กที่สุด (หมายเลขแรก)...
ความสัมพันธ์กับ ASCII
ชุดรหัสส่วนใหญ่ที่ใช้ในปัจจุบันเป็นชุดรหัสที่ครอบคลุมมากกว่า ASCII ซึ่งเป็นรหัส 7 บิตที่ใช้แทนรหัสควบคุมและอักขระที่พิมพ์ได้ 128 ตัว ในอดีต การใช้งานรหัส ASCII แบบ 8 บิตจะตั้งค่าบิตบนสุดเป็นศูนย์หรือใช้เป็น บิตพาริตี ในการส่งข้อมูลผ่านเครือข่าย...
ความสัมพันธ์กับยูนิโค้ด
Unicode คือความพยายามที่จะรวมอักขระทั้งหมดจากภาษาของมนุษย์ที่ใช้ในปัจจุบันและในอดีตทั้งหมดไว้ในการกำหนดหมายเลขอักขระเดียว (โดยพื้นฐานแล้วคือหน้าโค้ดขนาดใหญ่หน้าเดียว) ซึ่งจะช่วยขจัดความจำเป็นในการแยกแยะระหว่างหน้าโค้ดต่างๆ...