กลับไปหน้าบทความ

อ่าน 35 นาที

รหัสหน้า

ใน ทางคอมพิวเตอร์ รหัส หน้า (code page) คือ การเข้ารหัสอักขระ และเป็นความสัมพันธ์เฉพาะระหว่างชุด อักขระ ที่พิมพ์ได้ และ อักขระควบคุม กับตัวเลขที่ไม่ซ้ำกัน โดยทั่วไปแล้ว...

รหัสหน้า

ในทางคอมพิวเตอร์รหัสหน้า (code page)คือการเข้ารหัสอักขระและเป็นความสัมพันธ์เฉพาะระหว่างชุดอักขระ ที่พิมพ์ได้ และอักขระควบคุมกับตัวเลขที่ไม่ซ้ำกัน โดยทั่วไปแล้ว ตัวเลขแต่ละตัวจะแทนค่าไบนารีในไบต์เดียว (ในบางบริบท คำศัพท์เหล่านี้ถูกใช้ให้แม่นยำยิ่งขึ้น โปรดดูการเข้ารหัสอักขระ § ศัพท์เฉพาะ )

คำว่า "code page" มีต้นกำเนิดมาจากระบบเมนเฟรมEBCDICของIBM [ 1 ]แต่Microsoft , SAP [ 2 ]และOracle Corporation [ 3 ] ก็เป็นหนึ่งในผู้จำหน่ายที่ใช้คำนี้เช่นกัน ผู้จำหน่ายส่วนใหญ่ระบุชุดอักขระของตนเองด้วยชื่อ ในกรณีที่มีชุดอักขระจำนวนมาก (เช่นใน IBM) การระบุชุดอักขระด้วยตัวเลขเป็นวิธีที่สะดวกในการแยกแยะ เดิมทีหมายเลข code page หมายถึงหมายเลขหน้าในคู่มือชุดอักขระมาตรฐานของ IBM [ 4 ] [ 5 ] [ 6 ]ซึ่งเป็นเงื่อนไขที่ไม่คงอยู่มานาน ผู้จำหน่ายที่ใช้ระบบ code page จะจัดสรรหมายเลข code page ของตนเองให้กับการเข้ารหัสอักขระ แม้ว่าจะเป็นที่รู้จักกันดีในชื่ออื่นก็ตาม ตัวอย่างเช่นUTF-8ได้รับการกำหนดหมายเลขหน้าเป็น 1208 ที่ IBM, 65001 ที่ Microsoft และ 4110 ที่ SAP

Hewlett-Packardใช้แนวคิดที่คล้ายกันใน ระบบปฏิบัติการ HP-UXและ โปรโตคอล Printer Command Language [ 7 ] (PCL) สำหรับเครื่องพิมพ์ (ไม่ว่าจะเป็นเครื่องพิมพ์ HP หรือไม่ก็ตาม) อย่างไรก็ตาม คำศัพท์นั้นแตกต่างกัน: สิ่งที่คนอื่นเรียกว่าชุดอักขระ HP เรียกว่าชุดสัญลักษณ์และสิ่งที่ IBM หรือ Microsoft เรียกว่าหน้าโค้ด HP เรียกว่ารหัสชุดสัญลักษณ์ HP ได้พัฒนาชุดสัญลักษณ์หลายชุด[ 8 ] [ 9 ]โดยแต่ละชุดจะมีรหัสชุดสัญลักษณ์ที่เกี่ยวข้อง เพื่อเข้ารหัสทั้งชุดอักขระของตนเองและชุดอักขระของผู้จำหน่ายรายอื่น

เนื่องจากมีชุดอักขระจำนวนมาก ผู้จำหน่ายหลายรายจึงแนะนำให้ใช้ Unicode

ระบบการกำหนดหมายเลขหน้าโค้ด

IBM เป็นผู้ริเริ่มแนวคิดในการกำหนดหมายเลข 16 บิตขนาดเล็กแต่ไม่ซ้ำกันทั่วโลกให้กับรหัสอักขระแต่ละแบบที่ระบบคอมพิวเตอร์หรือกลุ่มระบบคอมพิวเตอร์อาจพบเจอ ที่มาของระบบการกำหนดหมายเลขนี้จาก IBM สะท้อนให้เห็นได้จากข้อเท็จจริงที่ว่า หมายเลขที่เล็กที่สุด (หมายเลขแรก) จะถูกกำหนดให้กับรหัส EBCDIC ของ IBM และหมายเลขที่ใหญ่กว่าเล็กน้อยจะหมายถึง รหัส ASCII แบบขยาย ของ IBM ที่ใช้ในฮาร์ดแวร์พีซีของ IBM

ด้วยการเปิดตัวPC DOS เวอร์ชัน 3.3 (และ MS-DOS 3.3 ที่เกือบจะเหมือนกัน) IBM ได้แนะนำระบบการกำหนดหมายเลขหน้าโค้ดให้กับผู้ใช้พีซีทั่วไป เนื่องจากหมายเลขหน้าโค้ด (และวลี "หน้าโค้ด") ถูกใช้ในคำสั่งใหม่เพื่อให้สามารถตั้งค่าการเข้ารหัสอักขระที่ใช้โดยทุกส่วนของระบบปฏิบัติการได้อย่างเป็นระบบ[ 10 ]

หมายเลขหน้าโค้ดของ IBM (CPGID และ CCSID) ใช้สำหรับการเข้ารหัส CJK การใช้หมายเลขหน้าโค้ดของ Microsoft สำหรับการเข้ารหัส CJK นั้นแตกต่างออกไป และจะระบุไว้ในวงเล็บในกรณีที่เกี่ยวข้อง

หลังจากที่ IBM และ Microsoft ยุติความร่วมมือกันในช่วงทศวรรษ 1990 บริษัททั้งสองได้รักษารายชื่อหมายเลขหน้าโค้ดที่กำหนดให้เป็นอิสระจากกัน ส่งผลให้มีการกำหนดหมายเลขที่ขัดแย้งกันอย่างน้อยหนึ่งรายการ ผู้จำหน่ายบุคคลที่สามอย่างน้อยหนึ่งราย ( Oracle ) ก็มีรายการหมายเลขที่กำหนดไว้แตกต่างกันเช่นกัน[ 3 ]การกำหนดหมายเลขปัจจุบันของ IBM อยู่ในคลัง ข้อมูล CCSID ของพวกเขา ในขณะที่การกำหนดหมายเลขของ Microsoft ได้รับการบันทึกไว้ในMSDN [ 11 ]นอกจากนี้ รายชื่อชื่อและตัวย่อโดยประมาณของ IANA ( Internet Assigned Numbers Authority ) สำหรับหน้าโค้ดที่ติดตั้งบนเครื่อง Windows ใดๆ สามารถพบได้ในรีจิสทรีของเครื่องนั้น (ข้อมูลนี้ใช้โดยโปรแกรมของ Microsoft เช่นInternet Explorer )

ชุดรหัสภาษาที่เป็นที่รู้จักกันดีส่วนใหญ่ ยกเว้นชุด รหัสภาษา จีน ญี่ปุ่น เกาหลีและเวียดนามจะบรรจุจุดรหัสทั้งหมดลงในบิตแปดบิต และไม่เกี่ยวข้องกับอะไรมากไปกว่าการจับคู่จุดรหัสแต่ละจุดกับอักขระตัวเดียว นอกจากนี้ ยังไม่มีการใช้เทคนิคต่างๆ เช่น การรวมอักขระ สคริปต์ที่ซับซ้อน เป็นต้น

โหมดข้อความของฮาร์ดแวร์กราฟิกพีซีมาตรฐาน ( ที่เข้ากันได้กับ VGA ) สร้างขึ้นโดยใช้หน้าโค้ด 8 บิต แม้ว่าจะสามารถใช้สองหน้าโค้ดพร้อมกันได้โดยต้องเสียสละความลึกของสีบ้าง และสามารถจัดเก็บได้ถึงแปดหน้าโค้ดในอะแดปเตอร์แสดงผลเพื่อการสลับที่ง่าย[ 12 ]มีแบบอักษรหน้าโค้ดของบุคคลที่สามให้เลือกใช้ซึ่งสามารถโหลดลงในฮาร์ดแวร์ดังกล่าวได้ อย่างไรก็ตาม ปัจจุบันเป็นเรื่องปกติที่ผู้จำหน่ายระบบปฏิบัติการจะจัดหาระบบการเข้ารหัสและแสดงผลอักขระของตนเองที่ทำงานในโหมดกราฟิกและข้ามข้อจำกัดของฮาร์ดแวร์นี้ไปโดยสิ้นเชิง อย่างไรก็ตาม ระบบการอ้างอิงการเข้ารหัสอักขระด้วยหมายเลขหน้าโค้ดยังคงใช้ได้ เนื่องจากเป็นทางเลือกที่มีประสิทธิภาพแทนตัวระบุสตริง เช่น ที่ระบุโดย IETF และ IANA สำหรับใช้ในโปรโตคอลต่างๆ เช่น อีเมลและเว็บเพจ

ความสัมพันธ์กับ ASCII

ชุดรหัสส่วนใหญ่ที่ใช้ในปัจจุบันเป็นชุดรหัสที่ครอบคลุมมากกว่าASCIIซึ่งเป็นรหัส 7 บิตที่ใช้แทนรหัสควบคุมและอักขระที่พิมพ์ได้ 128 ตัว ในอดีต การใช้งานรหัส ASCII แบบ 8 บิตจะตั้งค่าบิตบนสุดเป็นศูนย์หรือใช้เป็นบิตพาริตีในการส่งข้อมูลผ่านเครือข่าย เมื่อบิตบนสุดสามารถใช้แทนข้อมูลอักขระได้ ก็สามารถแทนอักขระและรหัสควบคุมได้ทั้งหมด 256 ตัว ผู้ผลิตส่วนใหญ่ (รวมถึง IBM) ใช้ช่วงที่ขยายนี้ในการเข้ารหัสอักขระที่ใช้ในภาษาต่างๆ และองค์ประกอบกราฟิกที่ช่วยให้สามารถจำลองกราฟิกแบบดั้งเดิมบนอุปกรณ์แสดงผลข้อความเท่านั้น ไม่มีมาตรฐานอย่างเป็นทางการสำหรับ "ชุดอักขระ ASCII ที่ขยาย" เหล่านี้ และผู้ผลิตเรียกตัวแปรเหล่านี้ว่าชุดรหัส เช่นเดียวกับที่ IBM เคยทำสำหรับตัวแปรของการเข้ารหัส EBCDIC มาโดยตลอด

ความสัมพันธ์กับยูนิโค้ด

Unicode คือความพยายามที่จะรวมอักขระทั้งหมดจากภาษาของมนุษย์ที่ใช้ในปัจจุบันและในอดีตทั้งหมดไว้ในการกำหนดหมายเลขอักขระเดียว (โดยพื้นฐานแล้วคือหน้าโค้ดขนาดใหญ่หน้าเดียว) ซึ่งจะช่วยขจัดความจำเป็นในการแยกแยะระหว่างหน้าโค้ดต่างๆ เมื่อจัดการกับข้อความที่จัดเก็บในรูปแบบดิจิทัล Unicode พยายามรักษาความเข้ากันได้กับหน้าโค้ดเก่าๆ หลายหน้า โดยคัดลอกหน้าโค้ดบางหน้าแบบ 1:1 ในกระบวนการออกแบบ เป้าหมายการออกแบบที่ชัดเจนของ Unicode คือการอนุญาตให้แปลงกลับไปกลับมาได้ระหว่างหน้าโค้ดเก่าๆ ทั่วไปทั้งหมด แม้ว่าเป้าหมายนี้จะไม่ประสบความสำเร็จเสมอไปก็ตาม ผู้ผลิตบางราย เช่น IBM และ Microsoft ได้กำหนดหมายเลขหน้าโค้ดให้กับการเข้ารหัส Unicode อย่างไม่สอดคล้องกับยุคสมัย ข้อตกลงนี้อนุญาตให้ใช้หมายเลขหน้าโค้ดเป็นเมตาเดตาเพื่อระบุอัลกอริทึมการถอดรหัสที่ถูกต้องเมื่อพบข้อมูลที่จัดเก็บในรูปแบบไบนารี

รหัสหน้าของ IBM

รหัสหน้าแบบ EBCDIC

หน้าโค้ดเหล่านี้ถูกใช้โดย IBM ในชุดอักขระ EBCDIC สำหรับคอมพิวเตอร์เมนเฟรม[ 13 ]

  • 1 – USA WP, ต้นฉบับ
  • 2 – สหรัฐอเมริกา
  • 3 – การบัญชีของสหรัฐอเมริกา เวอร์ชัน A
  • 4 – สหรัฐอเมริกา
  • 5 – สหรัฐอเมริกา
  • 6 – ลาตินอเมริกา
  • 7 – เยอรมนี ฝรั่งเศส / ออสเตรีย
  • 8 – เยอรมนี FR
  • 9 – ฝรั่งเศส, เบลเยียม
  • 10 – แคนาดา (ภาษาอังกฤษ)
  • 11 – แคนาดา (ภาษาฝรั่งเศส)
  • 12 – อิตาลี
  • 13 – เนเธอร์แลนด์
  • 14 – สเปน
  • 15 – สวิตเซอร์แลนด์ (ภาษาฝรั่งเศส)
  • 16 – สวิตเซอร์แลนด์ (ภาษาฝรั่งเศส / ภาษาเยอรมัน)
  • 17 – สวิตเซอร์แลนด์ (ภาษาเยอรมัน)
  • 18 – สวีเดน / ฟินแลนด์
  • 19 – สวีเดน/ฟินแลนด์ WP เวอร์ชัน 2
  • 20 – เดนมาร์ก/นอร์เวย์
  • 21 – บราซิล
  • 22 – โปรตุเกส
  • 23 – สหราชอาณาจักร
  • 24 – สหราชอาณาจักร
  • 25 – ญี่ปุ่น (ละติน)
  • 26 – ญี่ปุ่น (ละติน)
  • 27 – ประเทศกรีซ (ละติน)
  • 29 – ไอซ์แลนด์
  • 30 – ตุรกี
  • 31 – แอฟริกาใต้
  • 32 – เชโกสโลวาเกีย (เช็ก/สโลวัก)
  • 33 – เชโกสโลวาเกีย
  • 34 – เชโกสโลวาเกีย
  • 35 – โรมาเนีย
  • 36 – โรมาเนีย
  • 37 – สหรัฐอเมริกา/แคนาดา - CECP (เหมือนกับยูโร: 1140)
  • 37-2 – รหัสหน้า APL 3279 ที่แท้จริง ซึ่งใช้โดย C/370 รหัสนี้ใกล้เคียงกับ 1047 มาก ยกเว้นเครื่องหมาย caret และ not-sign ที่กลับด้าน IBM ยังไม่รับรองรหัสนี้อย่างเป็นทางการ แม้ว่าSHAREจะชี้ให้เห็นถึงการมีอยู่ของมันก็ตาม[ 14 ]
  • 38 – สหรัฐอเมริกา ASCII
  • 39 – สหราชอาณาจักร / อิสราเอล
  • 40 – สหราชอาณาจักร
  • 251 – จีน
  • 252 – โปแลนด์
  • 254 – ฮังการี
  • 256 – อันดับ 1 ระดับนานาชาติ (ถูกแซงหน้าโดย 500)
  • 257 – นานาชาติ #2
  • 258 – อันดับ 3 ระหว่างประเทศ
  • 259 – สัญลักษณ์ ชุดที่ 7
  • 260 – ภาษาฝรั่งเศสแคนาดา - 116
  • 264 – การประมวลผลการพิมพ์และข้อความแบบขยาย
  • 273 – เยอรมนี FR/ออสเตรีย - CECP (เหมือนกับยูโร: 1141)
  • 274 – รหัสหน้าเก่าของเบลเยียม
  • 275 – บราซิล - CECP
  • 276 – แคนาดา (ภาษาฝรั่งเศส) - 94
  • 277 – เดนมาร์ก, นอร์เวย์ - CECP (เช่นเดียวกับยูโร: 1142)
  • 278 – ฟินแลนด์, สวีเดน - CECP (เช่นเดียวกับยูโร: 1143)
  • 279 – ภาษาฝรั่งเศส - 94 [ 14 ]
  • 280 – อิตาลี - CECP (รหัสเดียวกับยูโร: 1144)
  • 281 – ญี่ปุ่น (ละติน) - CECP
  • 282 – โปรตุเกส - CECP
  • 283 – สเปน - 190 [ 14 ]
  • 284 – สเปน/ลาตินอเมริกา - CECP (เหมือนกับยูโร: 1145)
  • 285 – สหราชอาณาจักร - CECP (เช่นเดียวกับยูโร: 1146)
  • 286 – ออสเตรีย / เยอรมนี FR ทางเลือก
  • 287 – เดนมาร์ก / นอร์เวย์ (ทางเลือก)
  • 288 – ฟินแลนด์ / สวีเดน (ทางเลือก)
  • 289 – สเปน (ตัวสำรอง)
  • 290 – ภาษาญี่ปุ่น (คาตาคานะ) ฉบับขยาย
  • 293 – เอพีแอล
  • 297 – ฝรั่งเศส (เช่นเดียวกับยูโร: 1147) [ 14 ]
  • 298 – ญี่ปุ่น (คาตาคานะ)
  • 300 – ญี่ปุ่น (คันจิ) DBCS (สำหรับ JIS X 0213)
  • 310 – Graphic Escape APL/TN
  • 320 – ฮังการี
  • 321 – ยูโกสลาเวีย
  • 322 – ตุรกี
  • 330 – นานาชาติ #4
  • 340 – EBCDIC, OCR (เหมือนกับ 893 ซึ่งถูกแทนที่ด้วย 892 และ 893)
  • 351 – ค่าเริ่มต้นของ GDDM
  • 352 – ตัวเลือกการพิมพ์และการเผยแพร่
  • 353 – บีซีดีไอ-เอ
  • 354 – บีซีดีไอซี-บี
  • 355 – ตัวเลือกมาตรฐาน PTTC/BCD
  • 357 – ตัวเลือก PTTC/BCD H
  • 358 – ทางเลือกการเรียนทางไปรษณีย์ของ PTTC/BCD
  • 359 – ตัวเลือก PTTC/BCD แบบเคสเดียว
  • 360 – ตัวเลือกเคสคู่ PTTC/BCD
  • 361 – สำนักพิมพ์ EBCDIC นานาชาติ
  • 363 – สัญลักษณ์ ชุดที่ 8
  • 382 – สำนักพิมพ์ EBCDIC ออสเตรีย เยอรมนี FR ทางเลือก
  • 383 – สำนักพิมพ์ EBCDIC ประเทศเบลเยียม
  • 384 – สำนักพิมพ์ EBCDIC ประเทศบราซิล
  • 385 – สำนักพิมพ์ EBCDIC ประเทศแคนาดา (ภาษาฝรั่งเศส)
  • 386 – สำนักพิมพ์ EBCDIC ประเทศเดนมาร์ก ประเทศนอร์เวย์
  • 387 – สำนักพิมพ์ EBCDIC ประเทศฟินแลนด์ ประเทศสวีเดน
  • 388 – สำนักพิมพ์ EBCDIC ประเทศฝรั่งเศส
  • 389 – สำนักพิมพ์ EBCDIC ประเทศอิตาลี
  • 390 – สำนักพิมพ์ EBCDIC ประเทศญี่ปุ่น (ภาษาละติน)
  • 391 – สำนักพิมพ์ EBCDIC ประเทศโปรตุเกส
  • 392 – สำนักพิมพ์ EBCDIC ประเทศสเปน ประเทศฟิลิปปินส์
  • 393 – สำนักพิมพ์ EBCDIC ลาตินอเมริกา (ภาษา1สเปน)
  • 394 – สำนักพิมพ์ EBCDIC ประเทศจีน (ฮ่องกง), สหราชอาณาจักร, ไอร์แลนด์
  • 395 – สำนักพิมพ์ EBCDIC ประเทศออสเตรเลีย นิวซีแลนด์ สหรัฐอเมริกา และแคนาดา (ภาษาอังกฤษ)
  • 396 – ข้อเสนอพิเศษจากบุ๊คมาสเตอร์
  • 410 – อักษรซีริลลิก (แก้ไข: 880, 1025, 1154)
  • 420 – ภาษาอาหรับ
  • 421 – มาเกร็บ/ฝรั่งเศส
  • 423 – กรีก (ถูกแทนที่โดย 875)
  • 424 – ภาษาฮีบรู (รหัสประกาศ)
  • 425 – ภาษาอาหรับ/ละติน สำหรับ OS/390 รุ่นเปิด
  • 435 – เทเลเท็กซ์ ไอโซมอร์ฟิก
  • 500 – สากล #5 (ECECP; แทนที่ 256) (เหมือนกับยูโร: 1148)
  • 803 – ชุดอักขระภาษาฮีบรู A (รหัสเก่า)
  • 829 – การจัดพิมพ์สัญลักษณ์ทางคณิตศาสตร์
  • 830 – รูปแบบคณิตศาสตร์
  • 831 – โปรตุเกส (เส้นทางสำรอง) (เหมือนกับเส้นทาง 37)
  • 833 – ภาษาเกาหลีแบบขยาย (SBCS)
  • 834 – อักษรฮันกุลเกาหลี (KSC5601; DBCS พร้อม UDC)
  • 835 – DBCS ภาษาจีนดั้งเดิม
  • 836 – ภาษาจีนตัวย่อแบบขยาย
  • 837 – DBCS ภาษาจีนตัวย่อ
  • 838 – ภาษาไทยที่มีเครื่องหมายต่ำและตัวอักษรที่มีเครื่องหมายเน้นเสียง (เหมือนกับภาษาอังกฤษ: 1160)
  • 839 – ไทย DBCS
  • 870 – ละติน 2 (เหมือนกับยูโร: 1153) (แก้ไข: 1110)
  • 871 – ไอซ์แลนด์ (เท่ากับยูโร: 1149) [ 14 ]
  • 875 – กรีก (แทนที่ 423)
  • 880 – อักษรซีริลลิก (แก้ไขจาก 410) (การแก้ไข: 1025, 1154)
  • 881 – สหรัฐอเมริกา - ระบบกราฟิก 5080
  • 882 – สหราชอาณาจักร - ระบบกราฟิก 5080
  • 883 – สวีเดน - ระบบกราฟิก 5080
  • 884 – เยอรมนี - ระบบกราฟิก 5080
  • 885 – ฝรั่งเศส - ระบบกราฟิก 5080
  • 886 – อิตาลี - ระบบกราฟิก 5080
  • 887 – ญี่ปุ่น - ระบบกราฟิก 5080
  • 888 – ฝรั่งเศส AZERTY - ระบบกราฟิก 5080
  • 889 – ประเทศไทย
  • 890 – ยูโกสลาเวีย
  • 892 – EBCDIC, OCR A
  • 893 – EBCDIC, OCR B
  • 905 – ละติน 3
  • 918 – ภาษาอูร์ดูสองภาษา
  • 924 – ละติน 9
  • 930 – ญี่ปุ่น มิกซ์ (290 + 300) (ราคาเท่ากับยูโร: 1390)
  • 931 – ญี่ปุ่น มิกซ์ (37 + 300)
  • 933 – Korea MIX (833 + 834) (เหมือนกับเวอร์ชั่นยูโร: 1364)
  • 935 – ภาษาจีนตัวย่อแบบผสม (836 + 837) (เหมือนกับเงินยูโร: 1388)
  • 937 – อาหารจีนดั้งเดิมแบบผสม (37 + 835) (ราคาเท่ากับยูโร: 1371)
  • 939 – ญี่ปุ่น มิกซ์ (1027 + 300) (ราคาเท่ากับยูโร: 1399)
  • 1001 – MICR
  • 1002 – ความเข้ากันได้กับ EBCDIC DCF รุ่น 2
  • 1003 – EBCDIC DCF, ชุดย่อยข้อความของสหรัฐอเมริกา
  • 1005 – EBCDIC การสื่อสารข้อความแบบไอโซมอร์ฟิก
  • 1007 – EBCDIC ภาษาอาหรับ (XCOM2)
  • 1024 – EBCDIC T.61
  • 1025 – อักษรซีริลลิก หลายภาษา (เหมือนกับยูโร: 1154) (แก้ไขจาก 880)
  • 1026 – EBCDIC ตุรกี (Latin 5) (เหมือนกับยูโร: 1155) (ใช้แทนที่ 905 ในประเทศนั้น)
  • 1027 – ภาษาญี่ปุ่น (ละติน) ฉบับขยาย (JIS X 0201 ฉบับขยาย)
  • 1028 – สำนักพิมพ์ EBCDIC ภาษาฮีบรู
  • 1030 – ภาษาญี่ปุ่น (คาตาคานะ) ฉบับขยาย
  • 1031 – ภาษาญี่ปุ่น (ละติน) ฉบับขยาย
  • 1032 – MICR, E13-B แบบรวม
  • 1033 – MICR, CMC-7 แบบผสม
  • 1037 – เกาหลี - ระบบกราฟิก 5080/6090
  • 1039 – ความเข้ากันได้กับ GML
  • 1047 – ละติน 1/ระบบเปิด[ 14 ]
  • 1068 – ความเข้ากันได้กับ DCF
  • 1069 – ละติน 4
  • 1070 – สหรัฐอเมริกา / แคนาดา เวอร์ชัน 0 (รหัสหน้า 37 เวอร์ชัน 0)
  • 1071 – เยอรมนี FR / ออสเตรีย (รหัสหน้า 273 เวอร์ชัน 0)
  • 1072 – เบลเยียม (รหัสหน้า 274 เวอร์ชัน 0)
  • 1073 – บราซิล (รหัสหน้า 275 เวอร์ชัน 0)
  • 1074 – เดนมาร์ก, นอร์เวย์ (รหัสหน้า 277 เวอร์ชัน 0)
  • 1075 – ฟินแลนด์, สวีเดน (รหัสหน้า 278 เวอร์ชัน 0)
  • 1076 – อิตาลี (รหัสหน้า 280 เวอร์ชัน 0)
  • 1077 – ญี่ปุ่น (ละติน) (รหัสหน้า 281 เวอร์ชัน 0)
  • 1078 – โปรตุเกส (รหัสหน้า 282 เวอร์ชัน 0)
  • 1079 – สเปน / ลาตินอเมริกา เวอร์ชัน 0 (รหัสหน้า 284 เวอร์ชัน 0)
  • 1080 – สหราชอาณาจักร (รหัสหน้า 285 เวอร์ชัน 0)
  • 1081 – ฝรั่งเศส เวอร์ชัน 0 (รหัสหน้า 297 เวอร์ชัน 0)
  • 1082 – อิสราเอล (ภาษาฮีบรู)
  • 1083 – อิสราเอล (ภาษาฮีบรู)
  • 1084 – International#5 เวอร์ชัน 0 ( รหัสหน้า 500เวอร์ชัน 0)
  • 1085 – ไอซ์แลนด์ (รหัสหน้า 871 เวอร์ชัน 0)
  • 1087 – ชุดสัญลักษณ์
  • 1091 – สัญลักษณ์ที่แก้ไขแล้ว ชุดที่ 7
  • 1093 – โลโก้ IBM [ 15 ]
  • 1097 – ภาษาเปอร์เซียสองภาษา
  • 1110 – ภาษาละติน 2 (ฉบับปรับปรุงจาก 870)
  • 1112 – สกุลเงินบอลติกหลายภาษา (เหมือนกับสกุลเงินยูโร: 1156)
  • 1113 – ละติน 6
  • 1122 – เอสโตเนีย (ใช้เงินยูโรเหมือนกัน: 1157)
  • 1123 – อักษรซีริลลิก ประเทศยูเครน (เหมือนกับเงินยูโร: 1158)
  • 1130 – เวียดนาม (ราคาเท่ากับยูโร: 1164)
  • 1132 – Lao EBCDIC
  • 1136 – ฮิตาชิ คาตาคานะ
  • 1137 – เทวนาครี EBCDIC
  • 1140 – สหรัฐอเมริกา แคนาดา ฯลฯ ECECP (เหมือนกันหากไม่มีเงินยูโร: 37) (ฉบับภาษาจีนดั้งเดิม: 1159)
  • 1141 – ออสเตรีย, เยอรมนี ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 273)
  • 1142 – เดนมาร์ก, นอร์เวย์ ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 277)
  • 1143 – ฟินแลนด์, สวีเดน ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 278)
  • 1144 – อิตาลี ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 280)
  • 1145 – สเปน, ลาตินอเมริกา (ภาษาสเปน) ECECP (เหมือนกันหากไม่ใช้ยูโร: 284)
  • 1146 – UK ECECP (เหมือนกันหากไม่ใช้เงินยูโร: 285)
  • 1147 – ฝรั่งเศส ECECP ใช้เงินยูโร (แบบเดียวกันหากไม่ใช้เงินยูโร: 297)
  • 1148 – สกุลเงิน ECECP ระหว่างประเทศ (แบบไม่ใช้ยูโร: 500)
  • 1149 – สกุลเงิน ECECP ของไอซ์แลนด์ที่ใช้เงินยูโร (แบบเดียวกันหากไม่ใช้เงินยูโร: 871)
  • 1150 – ภาษาเกาหลีแบบขยายพร้อมอักขระกรอบ
  • 1151 – ภาษาจีนตัวย่อแบบขยายพร้อมอักขระกรอบ
  • 1152 – ภาษาจีนดั้งเดิมแบบขยายพร้อมอักษรในกรอบ
  • 1153 – ภาษาละติน 2 หลายภาษา พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 870)
  • 1154 – อักษรซีริลลิก หลายภาษา พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 1025; รุ่นเก่ากว่าคือ * 1166)
  • 1155 – ตุรกีเมื่อชำระด้วยเงินยูโร (ราคาเดียวกันเมื่อชำระด้วยเงินที่ไม่ใช่ยูโร: 1026) (ราคาเดียวกันเมื่อชำระด้วยเงินลีรา: 1175)
  • 1156 – บัตร Baltic Multi พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 1112)
  • 1157 – เอสโตเนียใช้เงินยูโร (เช่นเดียวกันหากไม่ใช้เงินยูโร: 1122)
  • 1158 – อักษรซีริลลิก ประเทศยูเครน ใช้เงินยูโร (แบบเดียวกันหากไม่ใช้เงินยูโร: 1123)
  • 1159 – T-Chinese EBCDIC (การปรับปรุงเงินยูโรแบบจีนดั้งเดิมของ * 1140)
  • 1160 – ภาษาไทยที่มีเครื่องหมายต่ำและตัวอักษรที่มีเครื่องหมายเน้นเสียงพร้อมค่าเงินยูโร (แบบเดียวกันแต่ไม่มีค่าเงินยูโร: 838)
  • 1164 – ราคาเวียดนามเป็นเงินยูโร (ราคาเดียวกันหากไม่ใช้เงินยูโร: 1130)
  • 1165 – ละติน 2/ระบบเปิด
  • 1166 – คาซัคซีริลลิก
  • 1175 – ตุรกีในสกุลเงินยูโรและลีรา (เช่นเดียวกันหากไม่ใช้ลีรา: 1155)
  • 1278 – การเข้ารหัสมาตรฐาน EBCDIC Adobe (PostScript)
  • 1279 – Hitachi Japanese Katakana Host [ 6 ]
  • 1300 – บาร์โค้ดทั่วไป/OCR-B
  • 1301 – ซิป + 4 บาร์โค้ด POSTNET
  • 1302 – เครื่องหมายระบุตัวตนด้านหน้า
  • 1303 – บาร์โค้ด EBCDIC
  • 1364 – Korea MIX (833 + 834 + ยูโร) (แบบไม่รวมยูโร: 933)
  • 1371 – อาหารจีนดั้งเดิมแบบผสม (1159 + 835) (ราคาเดียวกันหากไม่รวมเงินยูโร: 937)
  • 1376 – ส่วนขยายโฮสต์ DBCS ภาษาจีนดั้งเดิมสำหรับ HKSCS
  • 1377 – การเจริญเติบโตของ HKSCS แบบผสม (37 + 1376)
  • 1378 – ส่วนขยาย DBCS Host สำหรับภาษาจีนดั้งเดิม สำหรับ HKSCS และภาษาจีนตัวย่อ (ชุดย่อยของ 1376)
  • 1379 – การปลูกแบบผสม HKSCS และภาษาจีนตัวย่อ (37 + 1378) (ซูเปอร์เซ็ตของ 1377)
  • 1388 – ธนบัตรผสมภาษาจีนตัวย่อ (เหมือนกันหากไม่มีเงินยูโร: 935) (836 + 837 + ยูโร)
  • 1390 – ภาษาจีนตัวย่อ ผสม ภาษาญี่ปุ่น ผสม (เหมือนกันหากไม่รวมยูโร: 930) (290 + 300 + ยูโร)
  • 1399 – ชุดรวมสินค้าญี่ปุ่น (1027 + 300 + ยูโร) (ราคาเดียวกันหากไม่รวมยูโร: 939)

หน้าโค้ด DOS

ชุดอักขระเหล่านี้ถูกใช้โดย IBM ใน ระบบปฏิบัติการ PC DOSชุดอักขระเหล่านี้เดิมทีถูกฝังอยู่ใน ฮาร์ดแวร์ โหมดข้อความของการ์ดแสดงผลที่ใช้กับIBM PCและเครื่องเลียนแบบ รวมถึงการ์ดแสดงผล MDA และ CGA รุ่นแรกๆ ซึ่งชุดอักขระสามารถเปลี่ยนแปลงได้โดยการเปลี่ยนชิป ROM ที่มีฟอนต์เท่านั้น อินเทอร์เฟซของการ์ดแสดงผลเหล่านั้น (ซึ่งจำลองโดยการ์ดแสดงผลรุ่นหลังๆ เช่น VGA) โดยทั่วไปจะจำกัดอยู่ที่ชุดอักขระแบบไบต์เดียว โดยมีเพียง 256 ตัวอักขระในแต่ละฟอนต์/การเข้ารหัส (แม้ว่า VGA จะเพิ่มการสนับสนุนบางส่วนสำหรับชุดอักขระที่ใหญ่กว่าเล็กน้อย)

  • 301 – IBM-PC ญี่ปุ่น (คันจิ) DBCS
  • 437 – หน้าโค้ดฮาร์ดแวร์ดั้งเดิมของ IBM PC
  • 720 – ภาษาอาหรับ (ASMO แบบโปร่งใส)
  • 737กรีก
  • 775 – ลาติน-7
  • 808 – ตั๋วรัสเซียแบบใช้เงินยูโร (แบบเดียวกันแต่ไม่ใช้เงินยูโร: 866 )
  • 848 – เงินยูเครนพร้อมเงินยูโร (ราคาเดียวกันหากไม่ใช้เงินยูโร: 1125 )
  • 849 – เงินเบลารุสที่จ่ายเป็นยูโร (ราคาเดียวกันหากไม่จ่ายเป็นยูโร: 1131 )
  • 850 – ลาติน-1
  • 851 – กรีก
  • 852 – ลาติน-2
  • 853 – ลาติน-3
  • 855 – อักษรซีริลลิก (เหมือนกับยูโร: 872)
  • 856 – ภาษาฮีบรู
  • 857 – ลาติน-5
  • 858 – รหัสละติน 1 พร้อมสัญลักษณ์ยูโร
  • 859 – ลาติน-9
  • 860 – ภาษาโปรตุเกส
  • 861ไอซ์แลนด์
  • 862ภาษาฮีบรู
  • 863ภาษาฝรั่งเศสแคนาดา
  • 864ภาษาอาหรับ
  • 865เดนมาร์ก / นอร์เวย์
  • 866 – เบลารุส รัสเซีย ยูเครน (เช่นเดียวกับเงินยูโร: 808 )
  • 867 – ภาษา ฮีบรู + ยูโร (อิงตาม CP862) (รหัสที่ขัดแย้ง: NEC เช็ก (Kamenický)ซึ่งสร้างขึ้นก่อนชุดรหัสนี้)
  • 868ภาษาอูร์ดู
  • 869กรีก
  • 872 – อักษรซีริลลิกพร้อมสัญลักษณ์ยูโร (แบบเดียวกันแต่ไม่มีสัญลักษณ์ยูโร: 855)
  • 874 – ภาษาไทยที่มีเครื่องหมายวรรณยุกต์ต่ำและอักขระโบราณ (รหัสขัดแย้งกับ Windows 874; เวอร์ชันที่มียูโร: 1161เวอร์ชัน Windows: คือ IBM 1162 )
  • 876 – OCR A
  • 877 – OCR B
  • 878KOI8-R
  • 891 – คอมพิวเตอร์พีซี SBC ของเกาหลี
  • 898 – IBM-PC WP Multilingual
  • 899 – สัญลักษณ์ IBM-PC
  • 903 – คอมพิวเตอร์ส่วนบุคคลแบบจีนตัวย่อ (Simplified Chinese PC SBCS)
  • 904 – คอมพิวเตอร์พีซีแบบจีนดั้งเดิม SBCS
  • 906 – ชุดสากล #5 3812/3820
  • 907 – ASCII APL (3812)
  • 909 – IBM-PC APL2 Extended
  • 910 – IBM-PC APL2
  • 911 – IBM-PC ญี่ปุ่น #1
  • 926 – คอมพิวเตอร์พีซีเกาหลี DBCS
  • 927 – คอมพิวเตอร์จีนแบบดั้งเดิม DBCS
  • 928 – คอมพิวเตอร์พีซีแบบจีนตัวย่อ DBCS
  • 929 – ไทยพีซี DBCS
  • 932 – IBM-PC Japan MIX (DOS/V) (DBCS) ( 897 + 301 ) (รหัสขัดแย้งกับ Windows 932; เวอร์ชัน Windows คือ IBM 943)
  • 934 – IBM-PC Korea MIX (DOS/V) (DBCS) ( 891 + 926 )
  • 936 – IBM-PC ภาษาจีนตัวย่อ MIX (gb2312) (DOS/V) (DBCS) ( 903 + 928 ) (รหัสขัดแย้งกับ Windows 936; เวอร์ชัน Windows คือ IBM 1386)
  • 938 – IBM-PC ภาษาจีนดั้งเดิม MIX (DOS/V, OS/2) ( 904 + 927 )
  • 942 – IBM-PC Japan MIX (Japanese SAA (OS/2)) ( 1041 + 301 )
  • 943 – IBM-PC Japan OPEN ( 897 + 941 ) (Windows CP 932)
  • 944 – IBM-PC Korea MIX (สมาคมนักวิเคราะห์หลักทรัพย์ของเกาหลี (OS/2)) ( 1040 + 926 )
  • 946 – ภาษาจีนตัวย่อสำหรับ IBM-PC (ภาษาจีนตัวย่อ SAA (OS/2)) ( 1042 + 928 )
  • 948 – ภาษาจีนดั้งเดิมสำหรับ IBM-PC (ภาษาจีนดั้งเดิม SAA (OS/2)) ( 1043 + 927 )
  • 949 – ภาษาเกาหลี (Wansung ฉบับขยาย (ks_c_5601-1987)) ( 1088 + 951 ) (รหัสขัดแย้งกับ Windows 949 (รหัสฮันกุลรวม); เวอร์ชัน Windows คือ IBM 1363)
  • 951 – DBCS ของเกาหลี (รหัส IBM KS) (รหัสขัดแย้งกับ Windows 951 ซึ่งเป็นการดัดแปลง Windows 950 ด้วยการแมป Unicode สำหรับอักขระ Unicode PUA บางตัวที่พบใน HKSCS โดยพิจารณาจากชื่อไฟล์)
  • 1034 – แอปพลิเคชันสำหรับเครื่องพิมพ์ - ฉลากจัดส่งสินค้า ชุดที่ 2
  • 1040 – เวอร์ชั่นภาษาเกาหลี (ขยาย)
  • 1041 – มาตรฐานญี่ปุ่นฉบับขยาย (JIS X 0201 ฉบับขยาย)
  • 1042 – ภาษาจีนตัวย่อแบบขยาย
  • 1043 – ภาษาจีนดั้งเดิมแบบขยาย
  • 1044 – แอปพลิเคชันสำหรับเครื่องพิมพ์ - ฉลากจัดส่งสินค้า ชุดที่ 1
  • 1086 – IBM-PC ญี่ปุ่น #1
  • 1088 – ภาษาเกาหลีฉบับปรับปรุง (SBCS)
  • 1092 – สัญลักษณ์ที่แก้ไขแล้วของ IBM-PC
  • 1098ภาษาเปอร์เซีย
  • 1108 – ความเข้ากันได้ของฐาน DITROFF
  • 1109 – ความเข้ากันได้ของ DITROFF รุ่นพิเศษ
  • 1115 – IBM-PC สาธารณรัฐประชาชนจีน
  • 1116 – เอสโตเนีย
  • 1117 – ลัตเวีย
  • 1118 – ภาษาลิทัวเนีย (การใช้งาน โค้ดเพจ 774ของ Lika โดย IBM )
  • 1119 – ภาษาลิทัวเนียและรัสเซีย (การใช้งาน โค้ดเพจ 772ของ Lika โดย IBM )
  • 1125 – อักษรซีริลลิก ยูเครน (เหมือนกับยูโร: 848 ) (การปรับเปลี่ยนRUSCII โดย IBM )
  • 1127 – IBM-PC ภาษาอาหรับ/ฝรั่งเศส
  • 1131 – ข้อมูล IBM-PC, อักษรซีริลลิก, ภาษาเบลารุส (เหมือนกับยูโร: 849 )
  • 1139 – คาตาคานะและตัวเลขและตัวอักษรของญี่ปุ่น
  • 1161 – ภาษาไทยที่มีเครื่องหมายเสียงต่ำและตัวอักษรโบราณพร้อมสัญลักษณ์ยูโร (แบบเดียวกันแต่ไม่มีสัญลักษณ์ยูโร: 874 )
  • 1167KOI8-RU
  • 1168KOI8-U
  • 1370 – ภาษาจีนดั้งเดิมแบบผสม ( การเข้ารหัส Big5 ) ( 1114 + 947 + ยูโร) (ราคาเดียวกันหากไม่รวมยูโร: 950 )
  • 1380 – IBM-PC ภาษาจีนตัวย่อ GB PC-DATA (DBCS PC IBM GB 2312-80)
  • 1381 – ภาษาจีนตัวย่อสำหรับ IBM-PC ( 1115 + 1380 )
  • 1393 – มาตรฐานญี่ปุ่น JIS X 0213 DBCS
  • 1394 – IBM-PC ญี่ปุ่น (JIS X 0213) ( 897 + 1393 )

เมื่อต้องจัดการกับฮาร์ดแวร์ โปรโตคอล และรูปแบบไฟล์รุ่นเก่า มักจำเป็นต้องรองรับโค้ดเพจเหล่านั้น แต่ระบบการเข้ารหัสรุ่นใหม่ โดยเฉพาะยูนิโค้ด ได้รับการสนับสนุนสำหรับงานออกแบบใหม่ๆ

โดยทั่วไปแล้วหน้าโค้ด DOS จะถูกจัดเก็บไว้ในไฟล์ .CPI [ 16 ] [ 17 ] [ 18 ] [ 19 ] [ 20 ]

โค้ดเพจ IBM AIX

ชุดรหัสเหล่านี้ถูกใช้โดย IBM ใน ระบบปฏิบัติการ AIXโดยจำลองชุดอักขระหลายชุด โดยเฉพาะชุดอักขระที่ออกแบบมาเพื่อใช้งานตามมาตรฐาน ISO เช่น ระบบปฏิบัติการที่คล้าย UNIX

  • 367 – US-ASCII 7 บิต
  • 371 – APL แบบ US-ASCII 7 บิต
  • 806 – ISCII
  • 813ISO 8859-7
  • 819ISO 8859-1
  • 895 – 7-bit ญี่ปุ่น ละติน
  • 896 – ภาษาญี่ปุ่น 7 บิต คาตาคานะ ฉบับขยาย
  • 901ISO 8859-13พร้อมสกุลเงินยูโร (ต่อมามีการขยายเพิ่มเติม) (แบบเดียวกันแต่ไม่มีสกุลเงินยูโร: 921 )
  • 902 – มาตรฐาน ISO เอสโตเนีย พร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 922 )
  • 912ISO 8859-2 (ปรับปรุงเพิ่มเติมในปี 1999)
  • 913ISO 8859-3
  • 914ISO 8859-4
  • 915ISO 8859-5 (ขยายเพิ่มเติมหลังปี 1995)
  • 916ISO 8859-8
  • 919ISO 8859-10
  • 920ISO 8859-9
  • 921ISO 8859-13 (ขยายเพิ่มเติมหลังปี 1995) (เหมือนกับมาตรฐานยูโร: 901 )
  • 922 – มาตรฐาน ISO ของเอสโตเนีย (เช่นเดียวกับยูโร: 902 )
  • 923ISO 8859-15
  • 952 – EUC ภาษาญี่ปุ่นสำหรับ JIS X 0208
  • 953 – EUC ภาษาญี่ปุ่นสำหรับ JIS X 0212
  • 954 – EUC ภาษาญี่ปุ่น ( 895 + 952 + 896 + 953 )
  • 955 – TCP ของญี่ปุ่น, JIS X 0208-1978
  • 956 – TCP ภาษาญี่ปุ่น ( 895 + 952 + 896 + 953 )
  • 957 – TCP ภาษาญี่ปุ่น ( 895 + 955 + 896 + 953 )
  • 958 – TCP ภาษาญี่ปุ่น ( 367 + 952 + 896 + 953 )
  • 959 – TCP ภาษาญี่ปุ่น ( 367 + 955 + 896 + 953 )
  • 960 – ชุดตัวอักษรจีนดั้งเดิม DBCS-EUC SICGCC หลัก (ลำดับที่ 1)
  • 961 – ชุด DBCS-EUC SICGCC ภาษาจีนดั้งเดิมแบบครบชุด + IBM Select + UDC
  • 963 – ภาษาจีนดั้งเดิม TCP, CNS 11643 ระนาบ 2 เท่านั้น
  • 964 – ภาษาจีนดั้งเดิม EUC ( 367 + 960 + 961 )
  • 965 – TCP ภาษาจีนดั้งเดิม ( 367 + 960 + 963 )
  • 970 – EUC เกาหลี ( 367 + 971 )
  • 971 – EUC Korean DBCS (G1, KSC 5601 1989 (รวม 188 UDC))
  • 1006 – ISO ภาษาอูร์ดู 8 บิต
  • 1008 – ISO ภาษาอาหรับ 8 บิต
  • 1009 – IRV ISO 7 บิต
  • 1010 – ฝรั่งเศส 7 บิต
  • 1011 – 7-bit เยอรมนี FR
  • 1012 – อิตาลี 7 บิต
  • 1013 – สหราชอาณาจักร 7 บิต
  • 1014 – สเปน 7 บิต
  • 1015 – โปรตุเกส 7 บิต
  • 1016 – นอร์เวย์ 7 บิต
  • 1017 – เดนมาร์ก 7 บิต
  • 1018 – 7-bit ฟินแลนด์/สวีเดน
  • 1019 – เนเธอร์แลนด์ 7 บิต
  • 1029 – ภาษาอาหรับฉบับขยาย
  • 1036 – CCITT T.61
  • 1046 – ภาษาอาหรับฉบับขยาย (ยูโร)
  • 1089ISO 8859-6
  • 1111 – รูปแบบหนึ่งของISO 8859-2
  • 1124 – มาตรฐาน ISO ของยูเครน คล้ายกับISO 8859-5
  • 1129 – มาตรฐาน ISO ของเวียดนาม (เหมือนกับมาตรฐานยูโร: 1163 )
  • 1133 – ISO ลาว
  • 1163 – ธนบัตร ISO เวียดนามพร้อมเงินยูโร (แบบเดียวกันแต่ไม่มีเงินยูโร: 1129 )
  • 1350 – EUC ภาษาญี่ปุ่น (JISeucJP) ( 367 + 952 + 896 + 953 )
  • 1382 – ภาษาจีนตัวย่อของสหภาพยุโรป (DBCS PC GB 2312-80)
  • 1383 – ภาษาจีนตัวย่อของสหภาพยุโรป ( 367 + 1382 )

รหัสหน้า 819 เหมือนกับ Latin-1, ISO/IEC 8859-1และด้วยคำสั่งที่ดัดแปลงเล็กน้อย ทำให้เครื่อง MS-DOS สามารถใช้การเข้ารหัสนี้ได้ รหัสนี้เคยใช้กับมินิคอมพิวเตอร์ IBM AS/400

โค้ดเพจ IBM OS/2

ชุดรหัสเหล่านี้ถูกใช้โดย IBM ในระบบปฏิบัติการ OS/2 ของตน

  • 1004 – Latin-1 Extended, การจัดพิมพ์บนเดสก์ท็อป/Windows [ 21 ]

หน้าโค้ดการจำลอง Windows

ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลอง ชุดอักขระ ของ Microsoft Windowsชุดรหัสส่วนใหญ่มีหมายเลขเดียวกันกับชุดรหัสของ Microsoft แม้ว่าจะไม่ เหมือนกัน ทุกประการก็ตาม อย่างไรก็ตาม ชุดรหัสบางชุดเป็นชุดรหัสใหม่ที่พัฒนาโดย IBM ไม่ได้คิดค้นโดย Microsoft

หน้าโค้ดจำลอง Macintosh

ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ ของ Apple Macintosh

  • 1275 – แอปเปิ้ลโรมัน
  • 1280 – แอปเปิ้ลกรีก
  • 1281 – แอปเปิ้ลตุรกี
  • 1282 – แอปเปิลยุโรปกลาง
  • 1283 – แอปเปิลซีริลลิก
  • 1284 – แอปเปิ้ลโครเอเชีย
  • 1285 – แอปเปิลโรมาเนีย
  • 1286 – แอปเปิลไอซ์แลนด์

หน้าโค้ดจำลองของ Adobe

ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ ของ Adobe

  • 1038 – การเข้ารหัสสัญลักษณ์ของ Adobe
  • 1276 – การเข้ารหัสมาตรฐาน Adobe (PostScript)
  • 1277 – Adobe (PostScript) Latin 1

หน้าโค้ดจำลอง HP

ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ ของ HP

รหัสเพจจำลอง DEC

ชุดรหัสเหล่านี้ถูกใช้โดย IBM เมื่อจำลองชุดอักขระ DEC

  • 1020 – ชุด NRC 7 บิตของแคนาดา (ภาษาฝรั่งเศส)
  • 1021 – ชุดเหรียญ NRC สวิตเซอร์แลนด์ 7 บิต
  • 1023 – ชุด NRC ภาษาสเปน 7 บิต
  • 1090 – ชุดอักขระพิเศษและการวาดเส้น
  • 1100 – DEC บริษัทข้ามชาติ
  • 1101 – ชุดเหรียญ NRC ของอังกฤษแบบ 7 บิต
  • 1102 – ชุด NRC ดัตช์ 7 บิต
  • 1103 – ชุด NRC ฟินแลนด์ 7 บิต
  • 1104 – ชุด NRC ภาษาฝรั่งเศส 7 บิต
  • 1105 – ชุด NRC ภาษา นอร์เวย์/เดนมาร์ก 7 บิต
  • 1106 – ชุด NRC สวีเดน 7 บิต
  • 1107 – รหัสทางเลือก NRC ภาษา นอร์เวย์/เดนมาร์ก 7 บิต
  • 1287 – ธันวาคม กรีก
  • 1288 – ธันวาคม ตุรกี

ชุดรหัสยูนิโค้ดของ IBM

หน้าโค้ดของ Microsoft

หน้าโค้ดของ Windows

หน้าโค้ดเหล่านี้ถูกใช้โดย Microsoft ในระบบปฏิบัติการ Windows ของตนเอง Microsoft ได้กำหนดหน้าโค้ดจำนวนหนึ่งที่เรียกว่าหน้าโค้ด ANSI (โดยหน้าโค้ดแรก 1252 นั้นอิงตาม ร่าง ANSI ที่ไม่ได้รับการยืนยันซึ่งต่อมากลายเป็นISO 8859-1 ) หน้าโค้ด 1252 สร้างขึ้นบน ISO 8859-1 แต่ใช้ช่วง 0x80-0x9F สำหรับอักขระที่พิมพ์ได้เพิ่มเติมแทนที่จะใช้รหัสควบคุม C1 จากISO 6429ที่กล่าวถึงใน ISO 8859-1 [ 24 ] หน้าโค้ด อื่นๆ บางส่วนอิงตามส่วนอื่นๆ ของISO 8859แต่มักจะจัดเรียงใหม่เพื่อให้ใกล้เคียงกับ 1252 มากขึ้น

Microsoft แนะนำให้แอปพลิเคชันใหม่ใช้ UTF-8 หรือ UCS-2/UTF-16 แทนหน้าโค้ดเหล่านี้[ 25 ]

รหัสหน้า DBCS

ชุดรหัสเหล่านี้แสดงถึง การเข้ารหัสอักขระ DBCSสำหรับภาษาต่างๆ เช่น จีน ญี่ปุ่น และเกาหลี (CJK) ในระบบปฏิบัติการของ Microsoft ชุดรหัสเหล่านี้ถูกใช้เป็นทั้งชุดรหัส "OEM" และ "Windows" สำหรับภาษาท้องถิ่นที่เกี่ยวข้อง

โค้ดเพจ MS-DOS

หน้าโค้ดเหล่านี้ถูกใช้โดย Microsoft ในระบบปฏิบัติการ MS-DOS Microsoft เรียกหน้าโค้ดเหล่านี้ว่าหน้าโค้ด OEM เนื่องจากได้รับการกำหนดโดยผู้ผลิตอุปกรณ์ดั้งเดิมที่ได้รับอนุญาตให้แจกจ่าย MS-DOS พร้อมกับฮาร์ดแวร์ของตน ไม่ใช่โดย Microsoft หรือองค์กรมาตรฐาน หน้าโค้ดส่วนใหญ่เหล่านี้มีหมายเลขเดียวกันกับหน้าโค้ด IBM ที่เทียบเท่ากัน แม้ว่าบางหน้าจะไม่เหมือนกันทุกประการก็ตาม[ 26 ]

หน้าโค้ดจำลอง Macintosh

ชุดรหัสเหล่านี้ถูกใช้โดย Microsoft เมื่อจำลองชุดอักขระ ของ Apple Macintosh

หน้าโค้ดอื่นๆ ของ Microsoft

หมายเลขหน้าโค้ดต่อไปนี้เป็นหมายเลขเฉพาะของ Microsoft Windows IBM อาจใช้หมายเลขที่แตกต่างกันสำหรับหน้าโค้ดเหล่านี้ โดยจะจำลองชุดอักขระหลายชุด โดยเฉพาะชุดอักขระที่ออกแบบมาเพื่อใช้งานตามมาตรฐาน ISO เช่น ระบบปฏิบัติการที่คล้ายกับ UNIX

ชุดรหัสยูนิโค้ดของ Microsoft

ชุดสัญลักษณ์ HP

HP ได้พัฒนาชุดสัญลักษณ์ (แต่ละชุดมีรหัสชุดสัญลักษณ์ที่เกี่ยวข้อง) เพื่อเข้ารหัสชุดอักขระของตนเองหรือชุดอักขระของผู้จำหน่ายรายอื่น โดยปกติจะเป็นชุดอักขระ 7 บิต ซึ่งเมื่อย้ายไปยังส่วนที่สูงกว่าและเชื่อมโยงกับชุดอักขระ ASCII จะกลายเป็นชุดอักขระ 8 บิต

ชุดสัญลักษณ์ของ HP เอง

  • ชุดสัญลักษณ์ 0E — ส่วนขยาย HP Roman — ชุดอักขระ 7 บิตพร้อมตัวอักษรที่มีเครื่องหมายเน้นเสียง (กำหนดรหัสโดย IBM เป็นรหัสหน้า 1050 )
  • ชุดสัญลักษณ์ 0G — HP ภาษาเยอรมัน 7 บิต
  • ชุดสัญลักษณ์ 0L — HP 7-bit PC Line (กำหนดรหัสโดย IBM เป็นรหัสหน้า 1055 )
  • ชุดสัญลักษณ์ 0M — HP Math-7
  • ชุดสัญลักษณ์ 0T — HP Thai-8
  • ชุดสัญลักษณ์ 1S — HP ภาษาสเปน 7 บิต
  • ชุดสัญลักษณ์ 1U — แบบอักษร HP 7-bit Gothic Legal (กำหนดรหัสโดย IBM เป็นรหัสหน้า 1052 )
  • ชุดสัญลักษณ์ 4Q — HP Line Draw (รหัสโดย IBM คือรหัสหน้า 1056 )
  • ชุดสัญลักษณ์ 4U — HP โรมัน-9 — โรมัน-8 + €
  • ชุดสัญลักษณ์ 7J — HP Desktop
  • ชุดสัญลักษณ์ 7S — ภาษาสเปนยุโรป 7 บิตของ HP
  • ชุดสัญลักษณ์ 8E — HP East-8
  • ชุดสัญลักษณ์ 8G — HP Greek-8 (อ้างอิงจาก IR 088 ไม่ใช่ ELOT 927)
  • ชุดสัญลักษณ์ 8H — HP Hebrew-8
  • ชุดสัญลักษณ์ 8I — MS LineDraw (ASCII + HP PC Line)
  • ชุดสัญลักษณ์ 8K — HP Kana-8 (ASCII + คาตาคานะญี่ปุ่น)
  • ชุดสัญลักษณ์ 8L — HP LineDraw (ASCII + HP Line Draw)
  • ชุดสัญลักษณ์ 8M — HP Math-8 (ASCII + HP Math-8)
  • ชุดสัญลักษณ์ 8R — HP Cyrillic-8
  • ชุดสัญลักษณ์ 8S — ภาษาสเปนละตินอเมริกา 7 บิตของ HP
  • ชุดสัญลักษณ์ 8T — HP Turkish-8
  • ชุดสัญลักษณ์ 8U — HP Roman-8 (ASCII + ส่วนขยาย HP Roman; กำหนดรหัสโดย IBM เป็นรหัสหน้า 1051 )
  • ชุดสัญลักษณ์ 8V — HP ภาษาอาหรับ-8
  • ชุดสัญลักษณ์ 9K — HP ภาษาเกาหลี-8
  • ชุดสัญลักษณ์ 9T — PC 8T (หรือที่รู้จักกันในชื่อ รหัสหน้า 437-T; นี่ไม่ใช่รหัสหน้า 857)
  • ชุดสัญลักษณ์ 9V — ละติน/อาหรับ สำหรับ Windows (นี่ไม่ใช่รหัสหน้า 1256 )
  • ชุดสัญลักษณ์ 11U — PC 8D/N (หรือที่รู้จักกันในชื่อ รหัสหน้า 437-N; IBM กำหนดรหัสเป็นรหัสหน้า 1058 ; นี่ไม่ใช่รหัสหน้า 865 )
  • ชุดสัญลักษณ์ 14G — PC-8 อักษรกรีกทางเลือก (หรือที่รู้จักกันในชื่อ รหัสหน้า 437-G; เกือบเหมือนกับรหัสหน้า 737 )
  • ชุดสัญลักษณ์ 18K —
  • ชุดสัญลักษณ์ 18T —
  • ชุดสัญลักษณ์ 19C —
  • ชุดสัญลักษณ์ 19K —

ชุดสัญลักษณ์จากผู้จำหน่ายรายอื่น

  • ชุดสัญลักษณ์ 0D — ISO 60: ภาษานอร์เวย์ 7 บิต
  • ชุดสัญลักษณ์ 0F — ISO 25: ภาษาฝรั่งเศส 7 บิต
  • ชุดสัญลักษณ์ 0H — HP 7-bit ภาษาฮิบรู — แทบจะเหมือนกับมาตรฐานอิสราเอลSI 960
  • ชุดสัญลักษณ์ 0I — ISO 15: ภาษาอิตาลี 7 บิต
  • ชุดสัญลักษณ์ 0K — ISO 14: อักษรคาตาคานาญี่ปุ่น 7 บิต
  • ชุดสัญลักษณ์ 0N — ISO 8859-1 ละติน 1 (เดิมเรียกว่า "Gothic-1"; กำหนดรหัสโดย IBM เป็นรหัสหน้า 1053)
  • ชุดสัญลักษณ์ 0R — ISO 8859-5 ละติน/ซีริลลิก (ฉบับปี 1986 — IR 111)
  • ชุดสัญลักษณ์ 0S — ISO 11: สวีเดน 7 บิต
  • ชุดสัญลักษณ์ 0U — ISO 6: สหรัฐอเมริกา 7 บิต
  • ชุดสัญลักษณ์ 0V — ภาษาอาหรับ
  • ชุดสัญลักษณ์ 1D — ISO 61: ภาษานอร์เวย์ 7 บิต
  • ชุดสัญลักษณ์ 1E — ISO 4: 7 บิต สหราชอาณาจักร
  • ชุดสัญลักษณ์ 1F — ISO 69: ภาษาฝรั่งเศส 7 บิต
  • ชุดสัญลักษณ์ 1G — ISO 21: ภาษาเยอรมัน 7 บิต
  • ชุดสัญลักษณ์ 1K — ISO 13: อักษรละตินญี่ปุ่น 7 บิต
  • ชุดสัญลักษณ์ 1T — Windows ภาษาไทย (แทบจะเหมือนกับ874 )
  • ชุดสัญลักษณ์ 2K — ISO 57: อักษรละตินจีนตัวย่อ 7 บิต
  • ชุดสัญลักษณ์ 2N — ISO 8859-2 ละติน 2
  • ชุดสัญลักษณ์ 2S — ISO 17: ภาษาสเปน 7 บิต
  • ชุดสัญลักษณ์ 2U — ISO 2: เวอร์ชันอ้างอิงสากล 7 บิต
  • ชุดสัญลักษณ์ 3N — ISO 8859-3 ละติน 3
  • ชุดสัญลักษณ์ 3R — PC-866 รัสเซีย (แทบจะเหมือนกับรหัสหน้า 866 )
  • ชุดสัญลักษณ์ 3S — ISO 10: สวีเดน 7 บิต
  • ชุดสัญลักษณ์ 4N — ISO 8859-4 ละติน 4
  • ชุดสัญลักษณ์ 4S — ISO 16: ภาษาโปรตุเกส 7 บิต
  • ชุดสัญลักษณ์ 5M — สัญลักษณ์คณิตศาสตร์สำหรับ PS (แทบจะเหมือนกับสัญลักษณ์ของ Adobe )
  • ชุดสัญลักษณ์ 5N — ISO 8859-9 ละติน 5
  • ชุดสัญลักษณ์ 5S — ISO 84: ภาษาโปรตุเกส 7 บิต
  • ชุดสัญลักษณ์ 5T — Windows 3.1 Latin-5 (แทบจะเหมือนกับรหัสหน้า 1254 )
  • ชุดสัญลักษณ์ 6J — สำนักพิมพ์ Microsoft
  • ชุดสัญลักษณ์ 6M — คณิตศาสตร์เวนทูรา
  • ชุดสัญลักษณ์ 6N — ISO 8859-10 ละติน 6
  • ชุดสัญลักษณ์ 6S — ISO 85: ภาษาสเปน 7 บิต
  • ชุดสัญลักษณ์ 7H — ISO 8859-8 ละติน/ฮิบรู
  • ชุดสัญลักษณ์ 9E — Windows 3.1 ละติน 2 (แทบจะเหมือนกับรหัสหน้า 1250 )
  • ชุดสัญลักษณ์ 9G — ภาษากรีกสำหรับ Windows 98 (แทบจะเหมือนกับรหัสหน้า 1253 )
  • ชุดสัญลักษณ์ 9J — PC 1004
  • ชุดสัญลักษณ์ 9L — Ventura ITC Zapf Dingbats
  • ชุดสัญลักษณ์ 9N — ISO 8859-15 ละติน 9
  • ชุดสัญลักษณ์ 9R — อักษรซีริลลิกของ Windows 98 (แทบจะเหมือนกับรหัสหน้า 1251 )
  • ชุดสัญลักษณ์ 9U — Windows 3.0
  • ชุดสัญลักษณ์ 10G — PC-851 ละติน/กรีก (แทบจะเหมือนกับรหัสหน้า 851)
  • ชุดสัญลักษณ์ 10J — ข้อความ PS (แทบจะเหมือนกับมาตรฐานของ Adobe )
  • ชุดสัญลักษณ์ 10L — PS ITC Zapf Dingbats (แทบจะเหมือนกับ Adobe Dingbats)
  • ชุดสัญลักษณ์ 10N — ISO 8859-5 ละติน/ซีริลลิก (ฉบับปี 1988 — IR 144)
  • ชุดสัญลักษณ์ 10R — PC-855 อักษรซีริลลิก (แทบจะเหมือนกับรหัสหน้า 855)
  • ชุดสัญลักษณ์ 10T — เทเลเท็กซ์
  • ชุดสัญลักษณ์ 10U — PC-8 (แทบจะเหมือนกับรหัสหน้า 437 ; IBM กำหนดให้เป็นรหัสหน้า 1057)
  • ชุดสัญลักษณ์ 10V — CP-864 (แทบจะเหมือนกับรหัสหน้า 864 )
  • ชุดสัญลักษณ์ 11G — CP-869 (แทบจะเหมือนกับรหัสหน้า 869 )
  • ชุดสัญลักษณ์ 11J — PS ISO Latin-1 (แทบจะเหมือนกับ Adobe Latin-1)
  • ชุดสัญลักษณ์ 11N — ISO 8859-6 ละติน/อาราบิก
  • ชุดสัญลักษณ์ 12G — อักษรละติน/กรีกสำหรับพีซี (แทบจะเหมือนกับรหัสหน้า 737 )
  • ชุดสัญลักษณ์ 12J — ตัวอักษร MC (แทบจะเหมือนกับตัวอักษรโรมันของ Macintosh )
  • ชุดสัญลักษณ์ 12N — ISO 8859-7 ละติน/กรีก
  • ชุดสัญลักษณ์ 12R — PC Gost (แทบจะเหมือนกับ PC GOST Main)
  • ชุดสัญลักษณ์ 12U — PC-850 ละติน 1 (แทบจะเหมือนกับรหัสหน้า 850 )
  • ชุดสัญลักษณ์ 13J — เวนทูรา อินเตอร์เนชั่นแนล
  • ชุดสัญลักษณ์ 13R — ภาษาบัลแกเรียสำหรับพีซี (แทบจะเหมือนกับMIK )
  • ชุดสัญลักษณ์ 13U — PC-858 ละติน 1 + € (แทบจะเหมือนกับรหัสหน้า 858 )
  • ชุดสัญลักษณ์ 14J — เวนทูรา สหรัฐอเมริกา
  • ชุดสัญลักษณ์ 14L — Windows Dingbats
  • ชุดสัญลักษณ์ 14P — ABICOMP International (แทบจะเหมือนกับABICOMP ทุกประการ )
  • ชุดสัญลักษณ์ 14R — ภาษาอูเครนสำหรับพีซี (แทบจะเหมือนกับRUSCII )
  • ชุดสัญลักษณ์ 15H — PC-862 อิสราเอล (แทบจะเหมือนกับรหัสหน้า 862 )
  • ชุดสัญลักษณ์ 16U — PC-857 ละติน 5 (แทบจะเหมือนกับรหัสหน้า 857)
  • ชุดสัญลักษณ์ 17U — PC-852 ละติน 2 (แทบจะเหมือนกับรหัสหน้า 852)
  • ชุดสัญลักษณ์ 18N — UTF-8
  • ชุดสัญลักษณ์ 18U — PC-853 ละติน 3 (แทบจะเหมือนกับรหัสหน้า 853)
  • ชุดสัญลักษณ์ 19L — Windows 98 Baltic (แทบจะเหมือนกับรหัสหน้า 1257 )
  • ชุดสัญลักษณ์ 19M — สัญลักษณ์ Windows
  • ชุดสัญลักษณ์ 19U — Windows 3.1 ละติน 1 (แทบจะเหมือนกับรหัสหน้า 1252 )
  • ชุดสัญลักษณ์ 20U — PC-860 โปรตุเกส (แทบจะเหมือนกับรหัสหน้า 860)
  • ชุดสัญลักษณ์ 21U — PC-861 ไอซ์แลนด์ (แทบจะเหมือนกับรหัสหน้า 861 )
  • ชุดสัญลักษณ์ 23U — PC-863 แคนาดา - ภาษาฝรั่งเศส (แทบจะเหมือนกับรหัสหน้า 863 )
  • ชุดสัญลักษณ์ 24Q — PC-Polish Mazowia (แทบจะเหมือนกับการเข้ารหัส Mazovia )
  • ชุดสัญลักษณ์ 25U — PC-865 เดนมาร์ก/นอร์เวย์ (แทบจะเหมือนกับรหัสหน้า 865 )
  • ชุดสัญลักษณ์ 26U — PC-775 ละติน 7 (แทบจะเหมือนกับรหัสหน้า 775)
  • ชุดสัญลักษณ์ 27Q — PC-8 PC Nova (แทบจะเหมือนกับ [PC Nova])
  • ชุดสัญลักษณ์ 27U — PC ภาษาลัตเวียรัสเซีย (หรือที่รู้จักกันในชื่อ 866-ลัตเวีย)
  • ชุดสัญลักษณ์ 28U — ภาษาลิทัวเนีย/รัสเซียสำหรับพีซี (แทบจะเหมือนกับรหัสหน้า 774 )
  • ชุดสัญลักษณ์ 29U — PC-772 ลิทัวเนีย/รัสเซีย (แทบจะเหมือนกับรหัสหน้า 772 )

รหัสหน้าจากผู้จำหน่ายรายอื่น

รหัสหน้าเหล่านี้เป็นการกำหนดโดยอิสระจากผู้จำหน่ายภายนอก เนื่องจากรหัสหน้าของ IBM PC ดั้งเดิม ( หมายเลข 437 ) ไม่ได้ถูกออกแบบมาเพื่อใช้งานในระดับสากล จึงทำให้เกิดรหัสหน้าเฉพาะประเทศหรือภูมิภาคที่มีความเข้ากันได้บางส่วนขึ้นมาหลายแบบ

การกำหนดหมายเลขหน้าโค้ดเหล่านี้ไม่ใช่การกำหนดอย่างเป็นทางการจากทั้ง IBM หรือ Microsoft และแทบไม่มีหมายเลขใดเลยที่ IANA อ้างถึงว่าเป็นชุดอักขระที่ใช้งานได้ หมายเลขที่กำหนดให้กับหน้าโค้ดเหล่านี้เป็นไปโดยพลการและอาจขัดแย้งกับหมายเลขที่จดทะเบียนไว้ซึ่งใช้งานโดย IBM หรือ Microsoft บางหมายเลขอาจมีมาก่อนที่การสลับหน้าโค้ดจะถูกเพิ่มเข้ามาใน DOS 3.3

  • 100 – หน้าฟอนต์ฮาร์ดแวร์ภาษาฮีบรูของ DOS (ไม่ใช่จาก IBM; HDOS ) [ 34 ]
  • 111 – DOS ภาษากรีก (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] )
  • 112 – DOS ภาษาตุรกี (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] )
  • 113 – DOS ยูโกสลาเวีย (ไม่ใช่จาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] )
  • 151 – DOS Nafitha Arabic (ไม่ใช่ของ IBM; เป็น ADOS )
  • 152 – DOS Nafitha Arabic (ไม่ใช่ของ IBM; เป็น ADOS )
  • 161 – DOS ภาษาอาหรับ (ไม่ใช่จาก IBM; ADOS ) [ 34 ]
  • 162 – ภาษาอาหรับ DOS พร้อมเครื่องหมายกำกับสระ (ไม่ใช่จาก IBM; ADOS)
  • 163 – DOS ภาษาอาหรับและฝรั่งเศส (ไม่ได้มาจาก IBM; ADOS) [ 34 ]
  • 164 – ภาษาอาหรับและฝรั่งเศสสำหรับระบบปฏิบัติการ DOS พร้อมเครื่องหมายกำกับสระ (ไม่ใช่จาก IBM; จาก ADOS)
  • 165 – DOS Arabic (864 Extended) (ไม่ได้มาจาก IBM; ADOS) [ 34 ]
  • 166 – IBM Arabic PC (ADOS) [ 34 ]
  • 190 – DEC DOS ภาษาเยอรมัน (ดูเหมือนจะเหมือนกับรหัสหน้า 437)
  • 210 – DEC DOS ภาษากรีก (เครื่องพิมพ์ NEC Jetmate)
  • 220 – DEC DOS ภาษาสเปน (ไม่ใช่จาก IBM)
  • 489 – ภาษาเช็กโกสโลวาเกีย [ซอฟต์แวร์ OCR ปี 1993]
  • 620 – DOS ภาษาโปแลนด์ (มาโซเวีย) (ไม่ใช่จาก IBM)
  • 667 – DOS ภาษาโปแลนด์ (มาโซเวีย) (ไม่ใช่ของ IBM)
  • 668 – ภาษาโปแลนด์สำหรับ DOS (ไม่ใช่ของ IBM)
  • 706 – MS-DOS Server Arabic Sakhr (ไม่ใช่ของ IBM; เป็นซอฟต์แวร์ SakhrจากMSX Computers)
  • 707 – โปรแกรม Sakhr ภาษาอาหรับสำหรับ MS-DOS (ไม่ใช่ของ IBM; เป็นซอฟต์แวร์ SakhrจากMSX Computers)
  • 709 – ภาษาอาหรับสำหรับ MS-DOS ( ASMO 449+ /BCON V4)
  • 710 – MS-DOS ภาษาอาหรับ (ภาษาอาหรับแบบโปร่งใส)
  • 711 – MS-DOS Arabic Nafitha Enhanced (ไม่ใช่ผลิตภัณฑ์ของ IBM)
  • 714 – MS-DOS Arabic Sakr (ไม่ใช่ของ IBM)
  • 715 – MS-DOS Arabic APTEC (ไม่ใช่ของ IBM)
  • 721 – MS-DOS Arabic Nafitha International (ไม่ใช่ผลิตภัณฑ์ของ IBM)
  • 768 – ภาษาอาหรับ (ไม่ใช่จาก IBM)
  • 770 – DOS เอสโตเนีย ลัตเวีย ลิทัวเนีย[ 38 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย; [ 39 ]มาตรฐานแห่งชาติ RST 1095-89 ของลิทัวเนีย)
  • 771 – DOS ลิทัวเนีย/ซีริลลิก — KBL [ 40 ] (จากซอฟต์แวร์ลิทัวเนีย Lika [ 39 ] )
  • 772 – DOS ลิทัวเนีย/ซีริลลิก[ 41 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย; [ 39 ]มาตรฐานแห่งชาติ LST 1284:1993 ของลิทัวเนีย; นำมาใช้โดย IBM เป็นรหัสหน้า 1119 )
  • 773 – DOS Latin-7 — KBL (จากซอฟต์แวร์ลิทัวเนียลิกา)
  • 774 – DOS ภาษาลิทัวเนีย[ 42 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย; [ 39 ]มาตรฐานแห่งชาติ LST 1283:1993 ของลิทัวเนีย; นำมาใช้โดย IBM เป็นรหัสหน้า 1118 )
  • 775 – DOS Latin-7 Baltic Rim (จาก Lithuanian Lika Software; [ 39 ] Lithuanian LST 1590-1 National Standard; นำมาใช้โดย IBM และ Microsoft เป็นรหัสหน้า 775)
  • 776 – DOS ภาษาลิทัวเนีย (CP770 ขยาย) [ 43 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย[ 39 ] )
  • 777 – ภาษาลิทัวเนียแบบมีสำเนียง DOS (แบบเก่า) (CP773 แบบขยาย) — KBL [ 43 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย[ 39 ] )
  • 778 – ภาษาลิทัวเนียแบบมีสำเนียง DOS (CP775 แบบขยาย) [ 43 ] (จากซอฟต์แวร์ Lika ของลิทัวเนีย[ 39 ] )
  • 790 – DOS Polish (Mazovia)พร้อมเครื่องหมายอัญประกาศแบบหยิก
  • 854 – ภาษาสเปน[ 44 ] [ 6 ]
  • 881 – ละติน 1 (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 881)
  • 882 – ละติน 2 (ISO 8859-2) (ไม่ใช่จาก IBM; เหมือนกับรหัสหน้า 912; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 882)
  • 883 – ละติน 3 (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 883)
  • 884 – ละติน 4 (ไม่ได้มาจาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 884)
  • 885 – ละติน 5 (ไม่ใช่จาก IBM; AST Premium Exec DOS 5.0 [ 35 ] [ 36 ] [ 37 ] ) (รหัสขัดแย้งกับ IBM EBCDIC 885)
  • 895เช็ก (Kamenický) (ไม่ใช่ของ IBM; มีรหัสขัดแย้งกับ IBM CP895 — อักษรโรมันญี่ปุ่น 7 บิต EUC)
  • 896ภาษาโปแลนด์สำหรับ DOS (Mazovia) (ไม่ใช่ของ IBM; มีรหัสขัดแย้งกับ IBM CP896 — ภาษาญี่ปุ่นคาตาคานา 7 บิตสำหรับ EUC)
  • 900 – DOS รัสเซีย (Russian MS-DOS 5.0 LCD.CPI)
  • 928 – ภาษากรีก (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับมาตรฐานแห่งชาติกรีกELOT 928 (ไม่ได้มาจาก IBM; รหัสขัดแย้งกับ IBM CP928 — DBCS พีซีภาษาจีนตัวย่อ)
  • 966 – ประเทศซาอุดีอาระเบีย (ไม่ใช่จาก IBM)
  • 972 – ภาษาฮีบรู (VT100) (ไม่ใช่จาก IBM)
  • 991 – ระบบปฏิบัติการ DOS ภาษาโปแลนด์ (มาโซเวีย) (ไม่ใช่ของ IBM)
  • 999 – ฟอนต์ DOS Serbo-Croatian I (ไม่ได้ผลิตโดย IBM); รู้จักกันในชื่อ PC Nova และ CroSCII; ส่วนล่างเป็น JUSI.B1.002 ส่วนบนเป็นโค้ดเพจ 437; รองรับภาษา สโลเวเนียและเซอร์โบ-โครเอเชีย (อักษรละติน)
  • 1001 – ภาษาอาหรับ (บนเครื่องพิมพ์ Star [ 45 ] ) (ไม่ใช่จาก IBM; รหัสขัดแย้งกับ IBM CP1001 — MICR)
  • 1261 – Windows เวอร์ชันภาษาเกาหลี IBM-1261 LMBCS-17 คล้ายกับ1363
  • 1270 – Windows Sámi
  • 1300 – ANSI [PTS-DOS 6.70 ไม่ใช่ 6.51] (ไม่ใช่จาก IBM; มีรหัสขัดแย้งกับ IBM EBCDIC 1300 — บาร์โค้ดทั่วไป/OCR-B)
  • 2001 – KBL ของลิทัวเนีย (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 771
  • 3001 – เอสโตเนีย 1 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 1116
  • 3002 – ภาษาเอสโตเนีย 2 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 922
  • 3011 – ลัตเวีย 1 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 437-ลัตเวีย
  • 3012 – ลัตเวีย-2 (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 866-ลัตเวีย (มาตรฐานแห่งชาติลัตเวีย RST 1040-90)
  • 3021 – ภาษาบัลแกเรีย (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับ MIK
  • 3031 – ภาษาฮีบรู (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับรหัสหน้า 862
  • 3041 – ภาษามอลตา (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับภาษามอลตาISO 646
  • 3840 – IBM-รัสเซีย (บนเครื่องพิมพ์ Star [ 45 ] ); เกือบเหมือนกับCP 866
  • 3841 – Gost-Russian (บนเครื่องพิมพ์ Star [ 45 ] ); GOST 13052พร้อมอักขระสำหรับภาษาเอเชียกลาง
  • 3843 – โปแลนด์ (พิมพ์โดย Star [ 45 ] ); เหมือนกับ Mazovia
  • 3844 – CS2 (บนเครื่องพิมพ์ Star [ 45 ] ); เช่นเดียวกับ Kamenický
  • 3845 – ฮังการี (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับ CWI
  • 3846 – ภาษาตุรกี (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับภาษาตุรกี PC-8 + สัญลักษณ์ลีราตุรกีแบบเก่า (Tʟ) ที่จุดรหัส A8
  • 3847 – Brazil-ABNT (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับมาตรฐานแห่งชาติของบราซิล NBR-9614:1986
  • 3848 – Brazil-ABICOMP (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับ ABICOMP
  • 3850 – มาตรฐาน KU (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัสของมหาวิทยาลัยเกษตรศาสตร์สำหรับภาษาไทย
  • 3860 – มหาวิทยาลัยราชวิทยา (บนเครื่องพิมพ์ดาว[ 45 ] ); รูปแบบการเข้ารหัสของมหาวิทยาลัยเกษตรศาสตร์สำหรับภาษาไทย
  • 3861 – Microwiz KU (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัสของมหาวิทยาลัยเกษตรศาสตร์สำหรับภาษาไทย
  • 3863 – STD988 TIS (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัส TIS 620 สำหรับภาษาไทย
  • 3864 – TIS ยอดนิยม (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัส TIS 620 สำหรับภาษาไทย
  • 3865 – Newsic TIS (บนเครื่องพิมพ์ Star [ 45 ] ); รูปแบบการเข้ารหัส TIS 620 สำหรับภาษาไทย
  • 28799FOCAL (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับชุดอักขระ FOCAL
  • 28800HP RPL (บนเครื่องพิมพ์ Star [ 45 ] ); เหมือนกับRPL
  • (หมายเลขหายไป) – CWI-2 (สำหรับ DOS) รองรับภาษาฮังการี
  • (หมายเลขหายไป) – MIK (สำหรับ DOS) รองรับภาษาบัลแกเรีย
  • (หมายเลขหายไป) – DOS Serbo-Croatian II; รองรับภาษา สโลเวเนียและเซอร์โบ-โครเอเชีย (อักษรละติน)
  • (หมายเลขหายไป) — รหัสหน้าทางเลือก ของรัสเซีย (สำหรับ DOS); นี่คือต้นกำเนิดของ IBM CP 866

รายการการกำหนดรหัสหน้า

รายชื่อการกำหนดรหัสหน้า (ไม่สมบูรณ์):

รหัสประจำตัวชื่อคำอธิบายต้นทางแพลตฟอร์มดีเอสโอเอส/2วินโดวส์แม็คอื่นการเข้ารหัสความคิดเห็น
0ไม่มีข้อมูลที่สงวนไว้ไอบีเอ็ม, ไมโครซอฟต์ไม่มีข้อมูล3.3+1.0+???การใช้งานระบบปฏิบัติการภายใน[ 34 ]
437ซีพี437, ไอบีเอ็ม437พีซี ยูเอสIBM [ 46 ]ไอบีเอ็มพีซี3.3+1.0+ใช่?ใช่SBC 8 บิต
57344 - 61439ไม่มีข้อมูลอนุพันธ์สำหรับการใช้งานส่วนตัวไอบีเอ็มไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลหลากหลายรหัสหน้าสำหรับใช้งานส่วนตัว (E000h-EFFFh)
65280 - 65533ไม่มีข้อมูลคำจำกัดความสำหรับการใช้งานส่วนตัวไอบีเอ็มไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลไม่มีข้อมูลหลากหลายคำจำกัดความรหัสหน้าสำหรับใช้งานส่วนตัว (FF00h-FFFDh)
65534ไม่มีข้อมูลที่สงวนไว้ไอบีเอ็ม, ไมโครซอฟต์ไม่มีข้อมูล?????หลากหลายการใช้งานระบบปฏิบัติการภายใน (FFFEh)
65535ไม่มีข้อมูลที่สงวนไว้ไอบีเอ็ม, ไมโครซอฟต์ไม่มีข้อมูล3.3+1.0+???หลากหลายการใช้งานระบบปฏิบัติการภายใน (FFFFh) [ 34 ]

การวิจารณ์

ระบบการเข้ารหัสอักขระแบบเก่าหลายระบบ (ต่างจาก Unicode) มีปัญหาหลายประการ ผู้ผลิตบางรายไม่ได้จัดทำเอกสารอธิบายความหมายของค่าจุดรหัสทั้งหมดในหน้าโค้ดของตนอย่างเพียงพอ ซึ่งลดความน่าเชื่อถือในการจัดการข้อมูลข้อความอย่างสม่ำเสมอผ่านระบบคอมพิวเตอร์ต่างๆ ผู้ผลิตบางรายเพิ่มส่วนขยายที่เป็นกรรมสิทธิ์ลงในหน้าโค้ดที่กำหนดไว้ เพื่อเพิ่มหรือเปลี่ยนแปลงค่าจุดรหัสบางค่า ตัวอย่างเช่น ไบต์ 0x5C ในShift JISสามารถแทนได้ทั้งเครื่องหมายทับหรือเครื่องหมายเยนขึ้นอยู่กับแพลตฟอร์ม สุดท้าย เพื่อรองรับหลายภาษาในโปรแกรมที่ไม่ใช้ Unicode จำเป็นต้องจัดเก็บหน้าโค้ดที่ใช้สำหรับแต่ละสตริง/เอกสาร

แอปพลิเคชันอาจติดป้ายข้อความในWindows-1252 ผิดพลาด เป็นISO-8859-1ความแตกต่างเพียงอย่างเดียวระหว่างหน้าโค้ดเหล่านี้คือค่าจุดโค้ดในช่วง 0x80–0x9F ซึ่งใช้โดย ISO-8859-1 สำหรับอักขระควบคุม จะถูกใช้เป็นอักขระที่พิมพ์ได้เพิ่มเติมใน Windows-1252 แทน โดยเฉพาะอย่างยิ่งสำหรับเครื่องหมายอัญประกาศเครื่องหมายยูโรและสัญลักษณ์เครื่องหมายการค้าเป็นต้น เบราว์เซอร์บนแพลตฟอร์มที่ไม่ใช่ Windows มักจะแสดงกล่องว่างหรือเครื่องหมายคำถามสำหรับอักขระเหล่านี้ ทำให้ข้อความอ่านยาก เบราว์เซอร์ส่วนใหญ่แก้ไขปัญหานี้โดยการละเว้นชุดอักขระและตีความว่าเป็น Windows-1252 เพื่อให้ดูยอมรับได้ ใน HTML5 การปฏิบัติต่อ ISO-8859-1 เป็น Windows-1252 ยังได้รับการกำหนดเป็นมาตรฐานW3C อีกด้วย [ 47 ]แม้ว่าโดยทั่วไปแล้วเบราว์เซอร์จะถูกตั้งโปรแกรมให้จัดการกับพฤติกรรมนี้ แต่สิ่งนี้ไม่ได้เป็นจริงเสมอไปสำหรับซอฟต์แวร์อื่นๆ ด้วยเหตุนี้ เมื่อรับไฟล์ที่ถ่ายโอนจากระบบ Windows ระบบที่ไม่ใช่ Windows จะเพิกเฉยต่ออักขระเหล่านี้ หรือจะถือว่าอักขระเหล่านี้เป็นอักขระควบคุมมาตรฐาน และพยายามดำเนินการตามคำสั่งควบคุมที่ระบุไว้

เนื่องจาก Unicode มีเอกสารประกอบที่ครอบคลุม คลังอักขระจำนวนมาก และนโยบายความเสถียรของอักขระ ปัญหาที่กล่าวมาข้างต้นจึงไม่ค่อยเป็นปัญหาสำหรับ Unicode UTF-8 (ซึ่งสามารถเข้ารหัสโค้ดพอยต์ได้มากกว่าหนึ่งล้านตัว) ได้เข้ามาแทนที่วิธีการใช้โค้ดเพจในแง่ของความนิยมบนอินเทอร์เน็ต[ 48 ] [ 49 ]

หน้าโค้ดส่วนตัว

ในยุคแรกเริ่มของประวัติศาสตร์คอมพิวเตอร์ส่วนบุคคล เมื่อผู้ใช้ไม่พบว่าความต้องการด้านการเข้ารหัสอักขระของตนได้รับการตอบสนอง จึงมีการสร้างหน้าโค้ดส่วนตัวหรือหน้าโค้ดเฉพาะที่ขึ้นโดยใช้ ยูทิลิตี้ terminate-and-stay-residentหรือโดยการเขียนโปรแกรมใหม่ให้กับBIOS EPROMในบางกรณี มีการคิดค้นหมายเลขหน้าโค้ดที่ไม่เป็นทางการขึ้นมา (เช่น CP895)

เมื่อมีการรองรับชุดอักขระที่หลากหลายมากขึ้น ชุดรหัสอักขระส่วนใหญ่จึงเลิกใช้ไป ยกเว้นบางชุด เช่นชุดรหัสKamenický หรือ KEYBCS2 สำหรับอักษร เช็กและสโลวักอีกชุดอักขระหนึ่งคือมาตรฐานการเข้ารหัส Iran Systemซึ่งสร้างโดยบริษัท Iran System เพื่อ รองรับ ภาษาเปอร์เซียมาตรฐานนี้เคยใช้ในอิหร่านในโปรแกรมที่ใช้ระบบ DOS และหลังจากที่ Microsoft นำชุดรหัสอักขระ 1256 มาใช้ มาตรฐานนี้ก็ล้าสมัยไป อย่างไรก็ตาม โปรแกรม Windows และ DOS บางโปรแกรมที่ใช้การเข้ารหัสนี้ยังคงใช้งานอยู่ และยังมีฟอนต์ Windows บางตัวที่ใช้การเข้ารหัสนี้อยู่

เพื่อแก้ไขปัญหาดังกล่าวสถาปัตยกรรมแสดงข้อมูลอักขระระดับ 2 ของ IBM จึงสงวนช่วงรหัสหน้าโค้ดไว้สำหรับการกำหนดค่าโดยผู้ใช้และการใช้งานส่วนตัวโดยเฉพาะ เมื่อใดก็ตามที่มีการใช้รหัสหน้าโค้ดดังกล่าว ผู้ใช้ต้องไม่คาดหวังว่าฟังก์ชันการทำงานและลักษณะที่ปรากฏจะเหมือนกันในระบบการกำหนดค่าอื่นหรือบนอุปกรณ์หรือระบบอื่น เว้นแต่ผู้ใช้จะดูแลเรื่องนี้เป็นพิเศษ ช่วงรหัสหน้าโค้ด 57344-61439 ( E000h - EFFFh ) ถูกสงวนไว้อย่างเป็นทางการสำหรับรหัสหน้าโค้ดที่ผู้ใช้กำหนดเอง (หรือที่จริงแล้วคือ CCSID ในบริบทของIBM CDRA ) ในขณะที่ช่วง 65280-65533 ( FF00h - FFFDh ) ถูกสงวนไว้สำหรับการกำหนดค่า "ส่วนตัว" ที่ผู้ใช้กำหนดเอง ตัวอย่างเช่น รหัสหน้า 437 ( 1B5h ) หรือ 28591 ( 6FAF ) ที่ไม่ได้ลงทะเบียน อาจกลายเป็น 57781 ( E1B5h ) หรือ 61359 ( EFAFh ) ตามลำดับ เพื่อหลีกเลี่ยงความขัดแย้งที่อาจเกิดขึ้นกับการกำหนดค่าอื่นๆ และรักษาตรรกะเชิงตัวเลขภายในที่มีอยู่ในการกำหนดค่าของรหัสหน้าเดิม รหัสหน้าส่วนตัวที่ไม่ได้ลงทะเบียนซึ่งไม่ได้อิงตามรหัสหน้าที่มีอยู่ รหัสหน้าเฉพาะอุปกรณ์ เช่น ฟอนต์ของเครื่องพิมพ์ ซึ่งต้องการเพียงแฮนเดิลเชิงตรรกะเพื่อให้ระบบสามารถเข้าถึงได้ ฟอนต์ดาวน์โหลดที่เปลี่ยนแปลงบ่อย หรือหมายเลขรหัสหน้าที่มีความหมายเชิงสัญลักษณ์ในสภาพแวดล้อมท้องถิ่น อาจมีการกำหนดค่าในช่วงส่วนตัว เช่น 65280 ( FF00h )

รหัสหน้าโค้ด 0, 65534 ( FFFEh ) และ 65535 ( FFFFh ) สงวนไว้สำหรับการใช้งานภายในของระบบปฏิบัติการ เช่น DOS และห้ามกำหนดให้กับหน้าโค้ดใดๆ โดยเฉพาะ

ดูเพิ่มเติม

  • คำศัพท์เฉพาะของ IBM CDRA
  • รหัสหน้าของ IBMในWayback Machine (เก็บถาวรเมื่อ 5 กุมภาพันธ์ 2016)
  • รหัสหน้าของ IBM ตามรูปแบบการเข้ารหัสในWayback Machine (เก็บถาวรเมื่อ 2009-09-06)
  • ข้อมูลชุดอักขระ IBM/ICU
  • ตัวระบุหน้าโค้ดของ Microsoft (รายการของ Microsoft มีเฉพาะหน้าโค้ดที่แอปพลิเคชันทั่วไปใช้งานบน Windows เท่านั้น โปรดดูรายการของ Torsten Mohrinสำหรับรายการหน้าโค้ดที่รองรับทั้งหมด)
  • รายการที่สั้นกว่าของ Microsoft ซึ่งมีเฉพาะรหัสหน้า ANSI และ OEM แต่มีลิงก์ไปยังรายละเอียดเพิ่มเติมเกี่ยวกับแต่ละรายการในWayback Machine (เก็บถาวรเมื่อ 23 ตุลาคม 2012)
  • ชุดอักขระและหน้าโค้ด เพียงกดปุ่มเดียว
  • คำสั่ง Chcp ของ Microsoft: แสดงและตั้งค่ารหัสหน้าเพจที่ใช้งานอยู่ของคอนโซล
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Code_page&oldid=1332449167 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ รหัสหน้า

ใน ทางคอมพิวเตอร์ รหัส หน้า (code page) คือ การเข้ารหัสอักขระ และเป็นความสัมพันธ์เฉพาะระหว่างชุด อักขระ ที่พิมพ์ได้ และ อักขระควบคุม กับตัวเลขที่ไม่ซ้ำกัน โดยทั่วไปแล้ว...

ระบบการกำหนดหมายเลขหน้าโค้ด

IBM เป็นผู้ริเริ่มแนวคิดในการกำหนดหมายเลข 16 บิตขนาดเล็กแต่ไม่ซ้ำกันทั่วโลกให้กับรหัสอักขระแต่ละแบบที่ระบบคอมพิวเตอร์หรือกลุ่มระบบคอมพิวเตอร์อาจพบเจอ ที่มาของระบบการกำหนดหมายเลขนี้จาก IBM สะท้อนให้เห็นได้จากข้อเท็จจริงที่ว่า หมายเลขที่เล็กที่สุด (หมายเลขแรก)...

ความสัมพันธ์กับ ASCII

ชุดรหัสส่วนใหญ่ที่ใช้ในปัจจุบันเป็นชุดรหัสที่ครอบคลุมมากกว่า ASCII ซึ่งเป็นรหัส 7 บิตที่ใช้แทนรหัสควบคุมและอักขระที่พิมพ์ได้ 128 ตัว ในอดีต การใช้งานรหัส ASCII แบบ 8 บิตจะตั้งค่าบิตบนสุดเป็นศูนย์หรือใช้เป็น บิตพาริตี ในการส่งข้อมูลผ่านเครือข่าย...

ความสัมพันธ์กับยูนิโค้ด

Unicode คือความพยายามที่จะรวมอักขระทั้งหมดจากภาษาของมนุษย์ที่ใช้ในปัจจุบันและในอดีตทั้งหมดไว้ในการกำหนดหมายเลขอักขระเดียว (โดยพื้นฐานแล้วคือหน้าโค้ดขนาดใหญ่หน้าเดียว) ซึ่งจะช่วยขจัดความจำเป็นในการแยกแยะระหว่างหน้าโค้ดต่างๆ...