กลับไปหน้าบทความ

อ่าน 18 นาที

ไอโซ/อีอีซี 646

ISO/IEC 646 เทคโนโลยีสารสนเทศ — ชุดอักขระเข้ารหัส 7 บิต ISO สำหรับการแลกเปลี่ยนข้อมูล เป็น มาตรฐาน ISO / IEC ในด้าน การเข้ารหัสอักขระ เทียบเท่ากับมาตรฐาน ECMA -6...

ไอโซ/อีอีซี 646

ตระกูลการเข้ารหัส ISO/IEC 646
มาตรฐาน ISO/IEC 646 คงที่สี่เหลี่ยมวงกลม สีแดง ( ) แสดงถึงรหัสมาตรฐานของประเทศต่างๆ อักขระสีแดงอื่นๆ มีการเปลี่ยนแปลงในรายละเอียดปลีกย่อยที่สำคัญ
มาตรฐานISO/IEC 646, ITU T.50
การจำแนกประเภทการเข้ารหัสภาษาละตินพื้นฐาน 7 บิต
นำหน้าโดยยูเอส-เอเอสไอไอ
ประสบความสำเร็จโดยISO/IEC 8859 , ISO/IEC 10646
การเข้ารหัสอื่นๆ ที่เกี่ยวข้องDEC NRCS , การดัดแปลง ระบบเทเลเท็กซ์โลกสำหรับอักษรอื่นๆ : ELOT 927 , Symbol , KOI-7 , SRPSCII และ MAKSCII , ASMO 449 , SI 960

ISO/IEC 646 เทคโนโลยีสารสนเทศ — ชุดอักขระเข้ารหัส 7 บิต ISO สำหรับการแลกเปลี่ยนข้อมูลเป็น มาตรฐาน ISO / IECในด้านการเข้ารหัสอักขระเทียบเท่ากับมาตรฐานECMA -6และได้รับการพัฒนาร่วมกับASCIIอย่างน้อยตั้งแต่ปี 1964 [ 1 ] [ 2 ]เวอร์ชันแรกของ ECMA-6 ได้รับการเผยแพร่ในปี 1965 [ 3 ]โดยอิงจากงานที่คณะกรรมการทางเทคนิค TC1 ของ ECMA ได้ดำเนินการมาตั้งแต่เดือนธันวาคม 1960 [ 3 ] ISO/IEC 646 ฉบับแรกได้รับการเผยแพร่ในปี 1973 และฉบับล่าสุด ฉบับที่สาม ในปี 1991

ISO/IEC 646 กำหนดรหัสอักขระ 7 บิตซึ่งเป็นที่มาของมาตรฐานระดับชาติหลายฉบับ โดยจัดสรรชุดอักขระกราฟิกที่ไม่ซ้ำกัน 82 ตัวให้กับจุดรหัส 7 บิต ซึ่งเรียกว่าชุดอักขระคงที่[ 4 ] (INV) หรือชุดอักขระพื้นฐาน[ 5 ]ซึ่งรวมถึงตัวอักษรของอักษรละตินพื้นฐานของ ISOตัวเลขและเครื่องหมายวรรคตอนภาษาอังกฤษ ทั่วไปบาง ส่วน เหลือจุดรหัส 12 จุดที่จะต้องจัดสรรโดยมาตรฐานระดับชาติที่สอดคล้องกันสำหรับตัวอักษรเพิ่มเติมของอักษรละตินหรือสัญลักษณ์อื่นๆ

นอกจากนี้ ยังกำหนดมาตรฐานเวอร์ชันอ้างอิงสากล (IRV) ซึ่งรวมถึงการจัดสรรอักขระกราฟิกครบชุด 94 ตัว เพื่อใช้ในกรณีที่ไม่จำเป็นต้องระบุเวอร์ชันเฉพาะของแต่ละประเทศ นับตั้งแต่ฉบับปี 1991 ของ ISO/IEC 646 เป็นต้นมา IRV และASCIIมีความเหมือนกันทุกประการ ฉบับก่อนหน้านี้แตกต่างกันเพียงหนึ่งหรือสองจุดรหัสเท่านั้น

ประวัติศาสตร์

ASCII รุ่นแรก ( ASA X3.4 :1963)

ISO/IEC 646 และ มาตรฐาน ก่อนหน้าอย่างASCII (ASA X3.4) ส่วนใหญ่รับรองแนวปฏิบัติที่มีอยู่เกี่ยวกับการเข้ารหัสอักขระในอุตสาหกรรมโทรคมนาคม

US-ASCII หรือ ISO/IEC 646:US

เนื่องจาก ASCII ไม่ได้มีอักขระจำนวนหนึ่งที่จำเป็นสำหรับภาษาอื่นนอกเหนือจากภาษาอังกฤษ จึงมีการสร้างตัวแปรระดับชาติขึ้นมาหลายตัวเพื่อแทนที่อักขระที่ใช้งานน้อยบางตัวด้วยอักขระที่จำเป็น เนื่องจากความไม่เข้ากันของตัวแปรระดับชาติต่างๆ จึงมีการนำเวอร์ชันอ้างอิงสากล (International Reference Version หรือ IRV) ของ ISO/IEC 646 มาใช้ เพื่อพยายามจำกัดชุดอักขระที่ถูกแทนที่ให้เป็นอักขระเดียวกันในทุกตัวแปร เวอร์ชันดั้งเดิม (ISO 646 IRV) แตกต่างจากASCIIเพียงแค่จุดรหัส 0x24 ซึ่งเป็นเครื่องหมายดอลลาร์$ ของ ASCII ถูกแทนที่ด้วยสัญลักษณ์สกุลเงินสากล¤เวอร์ชันสุดท้ายปี 1991 ของรหัส ISO/IEC 646:1991 หรือที่รู้จักกันในชื่อITU T.50 , International Reference Alphabet หรือ IRA ซึ่งเดิมเรียกว่าInternational Alphabet No. 5 (IA5) มาตรฐานนี้อนุญาตให้ผู้ใช้ใช้อักขระแปรผันได้ 12 ตัว (เช่น อักขระกราฟิกทางเลือก 2 ตัว และอักขระที่กำหนดโดยแต่ละประเทศ 10 ตัว) ในบรรดาแบบฝึกหัดเหล่า นี้ ISO 646:1991 IRV (International Reference Version) ได้รับการกำหนดไว้อย่างชัดเจนและเหมือนกับASCII [ 6 ]

มาตรฐานISO/IEC 8859ซึ่งควบคุมการเข้ารหัสอักขระ 8 บิตนั้น มาแทนที่มาตรฐานสากล ISO/IEC 646 และมาตรฐานระดับประเทศต่างๆ โดยเพิ่มอักขระอีก 96 ตัวด้วยบิตเพิ่มเติม จึงหลีกเลี่ยงการแทนที่รหัส ASCII ใดๆ ส่วน มาตรฐาน ISO/IEC 10646ซึ่งเกี่ยวข้องโดยตรงกับUnicodeนั้น มาแทนที่ชุดมาตรฐาน ISO 646 และ ISO/IEC 8859 ทั้งหมด ด้วยชุดการเข้ารหัสอักขระที่เป็นหนึ่งเดียวโดยใช้ค่า 21 บิตที่ใหญ่กว่า

ISO 646:JP

มรดกของ ISO/IEC 646 ยังคงปรากฏให้เห็นใน Windows โดยในหลายๆ ภาษาของเอเชียตะวันออก อักขระ แบ็กสแลชที่ใช้ในชื่อไฟล์จะถูกแสดงเป็น¥หรืออักขระอื่นๆ เช่นถึงแม้ว่าจะมีรหัสที่แตกต่างกันสำหรับ ¥ อยู่แล้วในโค้ดเพจ 437 ของ IBM PC รุ่นแรก และมีรหัสสองไบต์แยกต่างหากสำหรับ ¥ ในShift JIS (ถึงแม้ว่ามักจะใช้การแมปแบบอื่น ) แต่ข้อความจำนวนมากถูกสร้างขึ้นโดยใช้รหัสแบ็กสแลชที่ใช้สำหรับ ¥ (เนื่องจาก Shift_JIS อิงตาม ISO 646:JP อย่างเป็นทางการ แม้ว่า Microsoft จะแมปเป็น ASCII ก็ตาม) จนกระทั่งฟอนต์ Windows สมัยใหม่ก็ยังจำเป็นต้องแสดงรหัสในลักษณะนั้น สถานการณ์ที่คล้ายกันนี้เกิดขึ้นกับ ₩ และEUC-KRมรดกอีกอย่างหนึ่งคือการมีอยู่ของไตรกราฟในภาษาโปรแกรม C

มาตรฐานที่เผยแพร่

  • ECMA-6 (30 เมษายน 1965) ฉบับพิมพ์ครั้งแรก (ถูกถอนออก) [ 3 ]
  • ISO/R646-1967 (ยกเลิกแล้ว) [ 7 ]หรือ ECMA-6 (1967-06) ฉบับที่สอง (ยกเลิกแล้ว) [ 7 ] [ 3 ]
  • ECMA-6 (1970-07) ฉบับที่สาม (ถูกยกเลิก) [ 3 ] [ 8 ]
  • ISO 646:1972 (ยกเลิกแล้ว) หรือ ECMA-6 (1973-08) ฉบับที่สี่ (ยกเลิกแล้ว) [ 3 ] [ 8 ]
  • ISO 646:1983 (ถูกยกเลิก) [ 9 ]หรือ ECMA-6 (1984-12, 1985-03) ฉบับที่ห้า (ถูกยกเลิก) [ 3 ]
  • ข้อแนะนำ ITU-T T.50 IA5 (25 พฤศจิกายน 1988) (ถูกยกเลิก) [ 10 ] [ 11 ]หรือ ISO/IEC 646:1991 (มีผลบังคับใช้) [ 12 ] [ 13 ]หรือ ECMA-6 (ธันวาคม 1991, สิงหาคม 1997) ฉบับที่หก (มีผลบังคับใช้) [ 12 ]
  • ข้อแนะนำ ITU-T T.50 IRA (1992-09-18) (มีผลบังคับใช้) [ 10 ] [ 14 ]

เค้าโครงหน้าโค้ด

ตารางต่อไปนี้แสดงชุดอักขระมาตรฐาน ISO/IEC 646:1991 ฉบับอ้างอิงสากล อักขระแต่ละตัวแสดงพร้อมกับ ค่าเทียบเท่าใน Unicodeจุดรหัสที่สามารถใช้แทนกันได้ในเวอร์ชันของแต่ละประเทศจะแสดงด้วยพื้นหลังสีเทา พื้นหลังสีเหลืองแสดงถึงอักขระที่ในบางเวอร์ชันอาจรวมกับอักขระก่อนหน้าเป็นเครื่องหมายกำกับเสียงโดยใช้ ปุ่ม Backspaceซึ่งอาจส่งผลต่อการเลือก สัญลักษณ์

นอกเหนือจากข้อจำกัดของเซตคงที่แล้ว 0x23 ยังถูกจำกัดให้เป็น#หรือ£และ 0x24 ถูกจำกัดให้เป็น$หรือ¤เท่านั้น[ 12 ]อย่างไรก็ตาม ข้อจำกัดเหล่านี้ไม่ได้ถูกปฏิบัติตามโดยตัวแปรระดับชาติทั้งหมด[ 15 ] [ 16 ]

ISO/IEC 646:1991 IRV
0 1 2 3 4 5 6 7 8 9 เอ บี ซี ดี อี เอฟ
0x นูแอลเอสโอเอชเอสทีเอ็กซ์อีทีเอ็กซ์อีโอทีเอ็นคิวแอกเบล  ปริญญาตรี   เอชที   แอลเอฟ   วีที   เอฟเอฟ   ซีอาร์   ดังนั้น   ไอเอส  
1x ดีแอลอีดีซี1ดีซี2ดีซี3ดีซี4นาคซินอีทีบีสามารถ  อีเอ็ม  ซับเอสเอส  เอฟเอส   จีเอส   อาร์เอส   เรา 
2x  เอสพี  !"#$%&'()*+,-./
3x 0123456789:;<=>?
4x @เอบีซีดีอีเอฟจีชมฉันเจเคแอลเอ็มเอ็นโอ
5x พีคิวอาร์เอสทียูวีXวาย[\]^_
6x `เออีเอฟจีชม.ฉันเจเคnโอ
7x พีqทีคุณวีxyz{|}~เดล

อักขระกราฟิกผสม

ตามมาตรฐาน ISO/IEC 646 อักขระกราฟิกทุกตัวต้องเป็นอักขระเว้นวรรค กล่าวคือ ต้องเลื่อนตำแหน่งอักขระไปข้างหน้า ด้วยเหตุนี้อักขระรวม ที่ไม่เว้นวรรค จึงไม่ได้รับอนุญาตในเวอร์ชันระดับชาติใดๆ ซึ่งแตกต่างจากมาตรฐานรุ่นหลังๆ เช่นISO/IEC 2022และISO/IEC 10646ที่อนุญาตหรือรวมถึงอักขระรวมไว้ด้วย

อักขระเว้นวรรคหลายตัวสามารถใช้เป็นเครื่องหมายเน้นเสียงได้เมื่อนำหน้าหรือตามหลังด้วย ปุ่ม Backspace C0เพื่อสร้างตัวอักษรที่มีเครื่องหมายเน้นเสียง ซึ่งในมาตรฐาน เรียกว่าอักขระกราฟิกแบบผสมตัวอย่างเช่น ลำดับดังกล่าวE<BS>'อาจใช้เพื่อสร้างภาพตัวอักษรÉวิธีการเข้ารหัสนี้มีต้นกำเนิดมาจากยุคเครื่องพิมพ์ดีด/ โทรเลขเมื่อการใช้ปุ่ม Backspace จะทับซ้อนกับสัญลักษณ์ และอาจถือว่าล้าสมัยแล้ว

วิธีการนี้ได้รับการรับรองในแผนภูมิรหัสสำหรับ IRV รวมถึงเวอร์ชันระดับชาติ GB, FR1, CA และ CA2 ซึ่งระบุว่า", ', ,, และ^อาจทำหน้าที่เป็นเครื่องหมายไดแอรีซิสเครื่องหมายเน้นเสียง เครื่องหมายเซดิลลาและ เครื่องหมาย เซอร์ คัม เฟล็กซ์ (แทนที่จะเป็นเครื่องหมายอัญประกาศเครื่องหมายจุลภาคและเครื่องหมายลูกศรชี้ขึ้น ) ตามลำดับ เมื่อมีเครื่องหมายแบ็กสเปซอยู่ข้างหน้าหรือข้างหลัง มาตรฐาน PL-2002 ปัจจุบันกำหนดอย่างชัดเจนให้ใช้แบ็กสเปซและอะพอสโทรฟีเพื่อสร้างตัวอักษรภาษาโปแลนด์ที่มีเครื่องหมายเน้นเสียง บางฉบับของ ISO/IEC 646 ยังแนะนำว่า/อาจใช้เครื่องหมายโซลิดัสร่วมกับเครื่องหมายเท่ากับ=เพื่อสร้างเครื่องหมายไม่เท่ากับ , และ_อาจใช้เครื่องหมายขีดล่างเพื่อสร้างข้อความที่ขีดเส้นใต้เครื่องหมายทิลเด ก็ถูก นำมาใช้เป็นเครื่องหมายกำกับเสียง~เช่นกันแม้ว่ามาตรฐานจะไม่ได้กล่าวถึงการใช้งานก็ตาม ˜

ต่อมา เมื่อชุดอักขระที่กว้างขึ้นได้รับการยอมรับมากขึ้นISO/IEC 8859ชุดอักขระเฉพาะของผู้ผลิต และในที่สุดUnicodeก็กลายเป็นวิธีการเข้ารหัสตัวอักษรที่มีเครื่องหมายเน้นเสียงที่นิยมใช้

รหัสและคำอธิบายตัวแปร

มาตรฐาน ISO/IEC 646 ฉบับมาตรฐานระดับประเทศ

มาตรฐาน ISO/IEC 646 เวอร์ชันเฉพาะประเทศบางฉบับมีดังต่อไปนี้:

รหัสเวอร์ชัน[ a ]ไอโซ-อินฟราเรด ลำดับการหลบหนีที่ลงทะเบียนมาตรฐาน คำอธิบาย
ซีเอ 121 ESC 2/8 7/7 CSA Z243.4-1985-1 แคนาดา (ทางเลือกที่ 1 พร้อม "î") ( ภาษาฝรั่งเศสคลาสสิก) ( รหัสหน้า 1020 [ 17 ] )
ซีเอ2 122 ESC 2/8 7/8 CSA Z243.4-1985-2 แคนาดา (ทางเลือกที่ 2 ที่มี "É") ( ภาษาฝรั่งเศสการสะกดคำแบบปฏิรูป)
ซีเอ็น 57 [ 18 ]เอสซี 2/8 5/4 จีบี/ที 1988-80 สาธารณรัฐประชาชนจีน (ภาษาละตินพื้นฐาน)
CU 151 เอสซี 2/8 2/1 4/1 NC 99-10:81 / NC NC00-10:81 คิวบา ( ภาษาสเปน )
ดาโน่ 9-1 [ 19 ]ESC 2/8 4/5 [ 19 ]NATS-DANO ( SIS ) นอร์เวย์และเดนมาร์ก (ข้อความทางวารสารศาสตร์) รหัสจุดคงที่ 0x22 จะแสดงเป็น«, (เปรียบเทียบ"ใน IRV) อย่างไรก็ตาม ยังคงถือว่าเป็นเครื่องหมายอัญประกาศคู่[ 20 ]มาพร้อมกับ SEFI (NATS-SEFI)
ดีอี 21 [ 19 ] [ 18 ]ESC 2/8 4/11 [ 19 ]ดีเอ็นไอ66003เยอรมนี ( ภาษาเยอรมัน ) ( รหัสหน้า 1011 , [ 21 ] 20106 [ 22 ] [ 23 ] [ 24 ] )
ดีเค DS 2089 [ 25 ] [ 26 ]เดนมาร์ก ( ภาษาเดนมาร์ก ) ( รหัสหน้า 1017 [ 27 ] )
อีเอส 17 [ 19 ]ESC 2/8 5/10 [ 19 ]โอลิเวตติภาษาสเปน (สากล) ( รหัสหน้า 1023 [ 28 ] )
อีเอส2 85 [ 18 ]ESC 2/8 6/8 ไอบีเอ็มสเปน ( บาสก์ , คาสติเลียน , คาตาลัน , กาลิเซียน ) ( รหัสหน้า 1014 [ 29 ] )
เอฟไอ 10 [ 18 ]SFS 4017 ฟินแลนด์ (เวอร์ชันพื้นฐาน) ( รหัสหน้า 1018 [ 30 ] )
เอฟอาร์ 69 [ 18 ]ESC 2/8 6/6 AFNOR NF Z 62010-1982 ฝรั่งเศส ( ภาษาฝรั่งเศส ) ( รหัสหน้า 1010 [ 31 ] )
เอฟอาร์1 25 [ 19 ] [ 18 ]ESC 2/8 5/2 [ 19 ]AFNOR NF Z 62010-1973 ฝรั่งเศส (ล้าสมัยตั้งแต่เดือนเมษายน พ.ศ. 2528) ( รหัสหน้า 1104 [ 32 ] )
สหราชอาณาจักร 4 [ 19 ] [ 18 ]ESC 2/8 4/1 [ 19 ]บีเอส 4730 สหราชอาณาจักร ( ภาษาอังกฤษ ) ( รหัสหน้า 1013 [ 33 ] )
HU 86 ESC 2/8 6/9 MSZ 7795-3:1984 ฮังการี ( ภาษาฮังการี )
เช่น 207 ESC 2/8 2/1 4/3 IS 433:1996 ไอร์แลนด์ ( ไอริช )
อินวี 170 เอสซี 2/8 2/1 4/2 ISO 646:1983 เซตย่อยที่ไม่เปลี่ยนแปลง
(IRV) 2 [ 19 ] [ 18 ]ESC 2/8 4/0 [ 19 ]ISO 646:1973 เวอร์ชันอ้างอิงสากล 0x7E เป็นเส้นขีดทับ (ISO-IR-002) [ 34 ]
ISO 646:1983 เวอร์ชันอ้างอิงสากล 0x7E เป็นเครื่องหมายทิลเด ( รหัสหน้า 1009 , [ 35 ] 20105 [ 22 ] [ 23 ] [ 36 ] )
มาตรฐาน ISO 646:1991 ฉบับอ้างอิงสากลตรงกับฉบับของสหรัฐอเมริกา (ดูด้านล่าง)
เป็น ไอซ์แลนด์ ( ภาษาไอซ์แลนด์ ) มาตรฐานโดยพฤตินัยเสนอขึ้นในปี 1978 แต่ไม่เคยได้รับการอนุมัติอย่างเป็นทางการ
มัน 15 [ 19 ] [ 18 ]ESC 2/8 5/9 [ 19 ]UNI 0204-70 / Olivetti ? ภาษาอิตาลี ( รหัสหน้า 1012 [ 37 ] )
เจพี 14 [ 19 ] [ 18 ]ESC 2/8 4/10 [ 19 ]JIS C 6220:1969-roญี่ปุ่น ( โรมาจิ ) ( รหัสหน้า 895 [ 38 ] ) ใช้เป็นรหัส 8 บิตด้วยชุดเสริมคาตาคานะที่สอดคล้องกัน
เจพี-โอซีอาร์-บี 92 ESC 2/8 6/14 JIS C 6229-1984-b ญี่ปุ่น ( OCR -B)
เคอาร์ KS C 5636-1989 เกาหลีใต้
เอ็มที ? มอลตา ( ภาษามอลตาภาษาอังกฤษ )
เอ็นแอล ไอบีเอ็มเนเธอร์แลนด์ ( ดัตช์ ) ( รหัสหน้า 1019 [ 39 ] )
เลขที่ 60 [ 18 ]เอสซีเอส 2/8 6/0 NS 4551 เวอร์ชัน 1 [ 18 ]นอร์เวย์ ( รหัสหน้า 1016 [ 40 ] )
หมายเลข 2 61 [ 18 ]เอสซีเอส 2/8 6/1 NS 4551 เวอร์ชัน 2 [ 18 ]นอร์เวย์ (ล้าสมัยตั้งแต่เดือนมิถุนายน พ.ศ. 2530) ( รหัสหน้า 20108 [ 22 ] [ 23 ] [ 41 ] )
พีแอล-2002 PN -I-10050:2002 [ 42 ]โปแลนด์ (ข้อมูล ณ ปี 2025) ชุดตัวอักษรสำหรับเขียนภาษาโปแลนด์รวมถึงสัญลักษณ์ ยูโร
พีแอล-ซูยู0 PN -T-42109-02:1984 [ 43 ]โปแลนด์ (ถอนตัวในปี 2000) ชุดชื่อ "ZU0" สำหรับเขียนภาษา โปแลนด์
พีที 16 [ 18 ]ESC 2/8 4/12 โอลิเวตติภาษาโปรตุเกส (สากล)
PT2 84 [ 18 ]ESC 2/8 6/7 ไอบีเอ็มโปรตุเกส ( โปรตุเกสสเปน ) ( รหัสหน้า 1015 [ 44 ] )
เอสอี 10 [ 19 ] [ 18 ]ESC 2/8 4/7 [ 19 ]SEN 850200 ภาคผนวก B, SIS 63 61 27 สวีเดน ( ภาษาสวีเดน พื้นฐาน ) ( รหัสหน้า 1018 , [ 30 ] D47)
SE2 11 [ 19 ] [ 18 ]ESC 2/8 4/8 [ 19 ]SEN 850200 ภาคผนวก C, SIS 63 61 27 สวีเดน ( ภาษาสวีเดน แบบขยาย สำหรับชื่อ) ( รหัสหน้า 20107 , [ 22 ] [ 23 ] [ 45 ] E47)
เซเอฟไอ 8-1 [ 19 ]ESC 2/8 4/3 [ 19 ]NATS-SEFI ( SIS ) สวีเดนและฟินแลนด์ (บทความข่าว) ประกอบกับ DANO (NATS-DANO)
ที.61-7บิต 102 เอสซีเอส 2/8 7/5 ข้อแนะนำ ITU / CCITT T.61ระบบโทรคมนาคม ระหว่างประเทศ ( Teletex ) นอกจากนี้ยังใช้ร่วมกับชุดอุปกรณ์เสริมที่เกี่ยวข้องในรูปแบบรหัส 8 บิต ด้วย
ทวี ซีเอ็นเอส 5205-1996 สาธารณรัฐจีน ( ไต้หวัน )
สหรัฐอเมริกา / (IRV) 6 [ 19 ] [ 18 ]ESC 2/8 4/2 [ 19 ]ANSI X3.4-1968 และ ISO 646:1983 (รวมถึง IRV ใน ISO/IEC 646:1991) สหรัฐอเมริกา ( ASCII , รหัสหน้า 367 , [ 46 ] 20127 [ 22 ] [ 23 ] [ 47 ] )
ยู 141 ESC 2/8 7/10 JUS I.B1.002 ( YUSCII ) อดีตยูโกสลาเวีย ( โครเอเชียโลวีเนียเซอร์เบีบอสเนีย )
อินนิส 49 ESC 2/8 5/7 INIS ( IAEA ) ชุดย่อย IRV ของ ISO 646

อนุพันธ์ระดับชาติ

นอกจากนี้ยังมีชุดอักขระประจำชาติบางชุดที่อิงตามมาตรฐาน ISO/IEC 646 แต่ไม่ได้ปฏิบัติตามชุดอักขระคงที่อย่างเคร่งครัด (ดูเพิ่มเติมในหัวข้อ§ อนุพันธ์ สำหรับตัวอักษรอื่นๆ )

ชุดอักขระ ไอโซ-อินฟราเรด ลำดับการหลบหนีที่ลงทะเบียนมาตรฐาน คำอธิบาย
BS_viewdata 47 ESC 2/8 5/6 ที่ทำการไปรษณีย์อังกฤษViewdataและTeletextสี่เหลี่ยม Viewdata (⌗) แทนที่ขีดล่าง (_) ที่ปกติไม่เปลี่ยนแปลง ซึ่งไม่สามารถแสดงบนฮาร์ดแวร์เป้าหมายได้[ 48 ]นี่คือการเข้ารหัสของ WST_Engl ของ Microsoft
GR / กรีก7 88 ESC 2/8 6/10 โฮสเอล็อต 927กรีซ (ถอนออกในเดือนพฤศจิกายน พ.ศ. 2529) ใช้ตัวอักษรกรีกแทนตัวอักษรโรมัน[ 49 ]ดังนั้นจึงไม่ถือว่าเป็นรูปแบบ ISO 646 อย่างแท้จริง
กรีก 7-เก่า 18 ESC 2/8 5/11 ? ชุดตัวอักษรกราฟิกภาษากรีก มีแนวคิดคล้ายกับgreek7แต่ใช้การจัดเรียงตัวอักษรที่แตกต่างกัน นอกจากนี้ ตัวพิมพ์ใหญ่จะอยู่ต่อจากตัวพิมพ์เล็ก
ละติน-กรีก 19 ESC 2/8 5/12 ? รูปแบบตัวอักษรผสมละติน-กรีก (ตัวพิมพ์ใหญ่เท่านั้น) เป็นไปตามแบบgreek7-oldแต่รวมตัวพิมพ์ใหญ่ละตินโดยไม่แก้ไข และตัวพิมพ์ใหญ่กรีกทับตัวพิมพ์เล็กละติน
ละติน-กรีก-1 27 [ 19 ]ESC 2/8 5/5 [ 19 ]ฮันนี่เวลล์-บูลล์กราฟิกผสมละติน-กรีก (ตัวพิมพ์ใหญ่กรีกเท่านั้น) [ 19 ]รวมตัวพิมพ์ใหญ่กรีกกับตัวพิมพ์ใหญ่ละตินเข้าด้วยกันเมื่อเป็นไปได้ และเพิ่มตัวพิมพ์ใหญ่กรีกที่เหลือ ต่างจากเวอร์ชันกรีกอื่นๆ ตัวอักษรละตินพื้นฐานทั้งหมดยังคงอยู่ครบถ้วน แทนที่เครื่องหมายวรรคตอนที่ไม่เปลี่ยนแปลงรวมถึงอักขระประจำชาติด้วย[ 50 ]ดังนั้นจึงยังไม่ใช่รูปแบบ ISO 646 อย่างแท้จริง
CH7DEC ธันวาคมสวิตเซอร์ แลนด์ ( ฝรั่งเศสเยอรมัน) ( รหัสหน้า 1021 [ 51 ] ) รหัสจุดคงที่ 0x5F เปลี่ยนจากเป็น เป็น รูปแบบ DEC NRCSที่เกี่ยวข้องอย่างใกล้ชิดกับ ISO 646 แต่ไม่มีรูปแบบที่สอดคล้องกับ ISO 646 อย่าง สมบูรณ์_è
พีแอล-ซู1 PN -⁠T⁠-⁠42109-02 [ 43 ]ชุดอักขระ "ZU1" (ถูกยกเลิกในปี 2000) ของโปแลนด์ มีจุดประสงค์เพื่อใช้กับ เมนเฟรม ODRA 1300โดยใช้ชุดอักขระเดียวกันกับเมนเฟรม ICT 1900 ซึ่งอิงตามเวอร์ชัน ASCII ที่เสนอในปี 1963 ก่อนที่จะมีการกำหนดมาตรฐานอย่างเป็นทางการ
TR7DEC ธันวาคมชุด 7 บิตสำหรับการเขียนภาษาตุรกีมีอยู่ในเทอร์มินัลและอุปกรณ์การพิมพ์ของ DEC บางรุ่น[ 52 ]ไม่ได้มีการอ้างถึงว่าเป็นNRCSในเอกสารของ DEC แต่มีการกล่าวถึงแยกต่างหาก รหัสจุดคงที่ 0x21 เปลี่ยนจาก!เป็นıและ 0x26 เปลี่ยนจาก &เป็นğ

ตัวละครควบคุม

รูปแบบต่างๆ ที่ระบุไว้ข้างต้นทั้งหมดเป็นเพียงชุดอักขระกราฟิก และต้องใช้ร่วมกับ ชุด อักขระควบคุม C0ดังที่แสดงในตารางต่อไปนี้:

ไอโซ-อินฟราเรด ไอเอสเอสคำอธิบาย
1 [ 19 ]ESC 2/1 4/0 [ 19 ]การควบคุม ISO 646 [ 19 ] ("การควบคุม ASCII")
7 [ 19 ]ESC 2/1 4/1 [ 19 ]หนังสือพิมพ์สแกนดิเนเวีย (NATS) ควบคุม[ 19 ]
26 [ 19 ]ESC 2/1 4/3 [ 19 ]การควบคุมIPTC [ 19 ]

ชุดอักขระเสริมที่เกี่ยวข้อง

ตารางต่อไปนี้แสดงรายการชุดอักขระกราฟิกเสริมที่กำหนดโดยมาตรฐานเดียวกันกับตัวแปร ISO/IEC 646 เฉพาะ ซึ่งจะถูกเลือกโดยใช้กลไก เช่นshift outหรือ NATS super shift (single shift) [ 53 ]หรือโดยการตั้งค่าบิตที่แปดในสภาพแวดล้อมที่มีให้ใช้งาน:

ไอโซ-อินฟราเรด ISO/IEC ESCมาตรฐานแห่งชาติ คำอธิบาย
8-2 [ 19 ]ESC 2/8 4/4 [ 19 ]NATS-SEFI-ADD รหัสเสริมที่ใช้ร่วมกับ NATS-SEFI
9-2 [ 19 ]ESC 2/8 4/6 [ 19 ]แนทส์-ดาโน-แอดด์ รหัสเสริมที่ใช้ร่วมกับ NATS-DANO
13 [ 19 ] [ 18 ]ESC 2/8 4/9 [ 19 ]JIS C 6220:1969-jpอักษรคาตาคานะใช้เป็นรหัสเสริมร่วมกับมาตรฐาน ISO-646-JP
103 ESC 2/8 7/6 ข้อแนะนำ ITU / CCITT T.61ชุดเสริม รหัสเสริมที่ใช้ร่วมกับ T.61
PN⁠-⁠T⁠-⁠42109-03:1986 [ 54 ](ยกเลิกในปี 2000) ชุดตัวอักษรชื่อ "ZU2" สำหรับเขียนภาษาโปแลนด์ประกอบด้วยตัวอักษรทั้งหมดที่ใช้ในภาษาโปแลนด์ รวมถึงตัวอักษรพิมพ์ใหญ่ที่ไม่มีในชุด ZU0 มีจุดประสงค์เพื่อใช้เป็นชุดเสริมควบคู่กับชุด IRV, ZU0 หรือ ZU1 เป็นชุดหลัก

ตารางเปรียบเทียบรุ่นต่างๆ

รายละเอียดของการเปลี่ยนแปลงสำหรับบางรูปแบบเหล่านี้แสดงอยู่ในตารางต่อไปนี้ การกำหนดอักขระที่ไม่เปลี่ยนแปลงในทุกรูปแบบที่ระบุไว้ (กล่าวคือ ซึ่งยังคงเหมือนกับ ASCII) จะไม่แสดงไว้

เพื่อให้ง่ายต่อการเปรียบเทียบ รายละเอียดต่างๆ ประกอบด้วยมาตรฐาน ISO/IEC 646 ในแต่ละประเทศชุดอักขระทดแทนแห่งชาติ (NRCS) ของ DEC ที่เกี่ยวข้องอย่างใกล้ชิด ซึ่งใช้ในเทอร์มินัลVT200 ชุดการเข้ารหัส Teletext ระบบโลก ของยุโรปที่เกี่ยวข้อง ซึ่งกำหนดไว้ในETS 300 706 และการเข้ารหัสอื่นๆ ที่เกี่ยวข้องอย่างใกล้ชิดอีกเล็กน้อยโดยอิงจาก ISO/IEC 646 แผนภูมิรหัสแต่ละรายการจะเชื่อมโยงจากคอลัมน์ที่สอง เซลล์ที่มีพื้นหลังไม่ใช่สีขาวจะเน้นความแตกต่างจากUS-ASCII (ซึ่งเป็น ชุดย่อย Basic Latinของ ISO/IEC 10646 และ Unicode ด้วย)

รหัสเวอร์ชัน[ a ]แผนภูมิรหัส อักขระสำหรับแต่ละชุดอักขระที่เข้ากันได้หรือได้มาจากมาตรฐาน ISO 646 / NRCS
สหรัฐอเมริกา / IRV (1991) ISO-IR-006 [ 55 ]! " # $ & : ? @ [ \ ] ^ _ ` { | } ~
ฉบับอ้างอิงสากลเก่า
IRV (1973) ISO-IR-002 [ 34 ]! " # ¤ & : ? @ [ \ ] ^ _ ` { | }
IRV (1983) CP01009 [ 56 ]! " # ¤ & : ? @ [ \ ] ^ _ ` { | } ~
เซตย่อยที่ไม่เปลี่ยนแปลงและเซตย่อย IRV อื่นๆ
อินวี ISO-IR-170 [ 5 ]! "     & : ?           _          
INV ( NRCS ) [ b ]--- ! "   $ & : ?                      
INV ( เทเลเท็กซ์ ) []ETS WST [ 57 ]! "     & : ?                      
ชุดย่อย INIS [ b ]ISO-IR-049 [ 58 ]$ : [ ] |
ที.61 ISO-IR-102 [ 59 ]! " # ¤ & : ? @ [   ]   _     |    
เอเชียตะวันออก
เจพี ISO-IR-014 [ 60 ]! " # $ & : ? @ [ ¥ ] ^ _ ` { | }
เจพี-โอซีอาร์-บี ISO-IR-092 [ 61 ]! " # $ & : ? @ [ ¥ ] ^ _   { | }  
เคอาร์ (KS X 1003) [ 62 ]! " # $ & : ? @ [ ] ^ _ ` { | }
ซีเอ็น ISO-IR-057 [ 16 ]! " # ¥ & : ? @ [ \ ] ^ _ ` { | }
ทวี (CNS 5205) [ 62 ]! " # $ & : ? @ [ \ ] ^ _ ` { | }
ชาวอังกฤษและชาวไอริช
สหราชอาณาจักร ISO-IR-004 [ 63 ]! " ปอนด์ $ & : ? @ [ \ ] ^ _ ` { | }
สหราชอาณาจักร ( NRCS ) CP01101 [ 64 ]! " ปอนด์ $ & : ? @ [ \ ] ^ _ ` { | } ~
ดูข้อมูล[ c ] [ d ]ISO-IR-047 [ 48 ]! " ปอนด์ $ & : ? @ ½ ¼ ¾ ÷
เช่น ISO-IR-207 [ 65 ]! " ปอนด์ $ & : ? โอ เอ ฉัน Ú อา _ โอ เอ ฉัน อู อา
ภาษาอิตาลีหรือภาษาฝรั่งเศส
ไอที[ e ]ISO-IR-015 [ 66 ]! " ปอนด์ $ & : ? § ° ç เอ ^ _ ù à ò เอ ฉัน
ไอที ( เทเลเท็กซ์ ) [ d ]ETS WST [ 67 ]! " ปอนด์ $ & : ? เอ ° ç ù à ò เอ ฉัน
เอฟอาร์ ISO-IR-069 [ 68 ]! " ปอนด์ $ & : ? à ° ç § ^ _ µ เอ ù เอ ¨
FR1 [ e ]ISO-IR-025 [ 69 ]! " ปอนด์ $ & : ? à ° ç § ^ _ ` เอ ù เอ ¨
FR เทเลเท็กซ์[ d ]ETS WST [ 67 ]! " เอ ฉัน & : ? à ë ê ù ฉัน เอ â โอ û ç
CA [ e ]ISO-IR-121 [ 70 ]! " # $ & : ? à â ç ê ฉัน _ โอ เอ ù เอ û
ซีเอ2 ISO-IR-122 [ 71 ]! " # $ & : ? à â ç ê เอ _ โอ เอ ù เอ û
ผู้พูดภาษาฝรั่งเศส-ผู้พูดภาษาเยอรมัน
CH ( NRCS ) [ d ]CP01021 [ 72 ]! " ù $ & : ? à เอ ç ê ฉัน เอ โอ เอ ö ü û
ชาวเยอรมัน
DE [ e ] [ f ]ISO-IR-021 [ 73 ]! " # $ & : ? § Ä โอ Ü ^ _ ` เอ ö ü ß
นอร์ดิก (ตะวันออก) และบอลติก
FI / SE ISO-IR-010 [ 74 ]! " # ¤ & : ? @ Ä โอ Å ^ _ ` เอ ö å
SE2 [ f ]ISO-IR-011 [ 75 ]! " # ¤ & : ? เอ Ä โอ Å Ü _ เอ เอ ö å ü
SE ( NRCS ) CP01106 [ 76 ]! " # $ & : ? เอ Ä โอ Å Ü _ เอ เอ ö å ü
FI ( NRCS ) CP01103 [ 77 ]! " # $ & : ? @ Ä โอ Å Ü _ เอ เอ ö å ü
SEFI (NATS) [ g ]ISO-IR-008-1 [ 78 ]! " # $ & : ? Ä โอ Å _ เอ ö å
อีอี ( เทเลเท็กซ์ ) []ETS WST [ 67 ]! " # โอ & : ? Š Ä โอ Ž Ü โอ š เอ ö ž ü
LV / LT ( เทเลเท็กซ์ ) [ d ]ETS WST [ 67 ]! " # $ & : ? Š ė ę Ž č ū š อา ų ž ฉัน
นอร์ดิก (ตะวันตก)
ดีเค CP01017 [ 79 ]! " # ¤ & : ? @ Æ Ø Å Ü _ ` æ ø å ü
ไม่ทราบ/ไม่ใช่ ( NRCS ) CP01105 [ 80 ]! " # $ & : ? Ä Æ Ø Å Ü _ เอ æ ø å ü
DK/NO-alt ( NRCS ) CP01107 [ 81 ]! " # $ & : ? @ Æ Ø Å ^ _ ` æ ø å ~
เลขที่ ISO-IR-060 [ 82 ]! " # $ & : ? @ Æ Ø Å ^ _ ` æ ø å
หมายเลข 2 ISO-IR-061 [ 15 ]! " § $ & : ? @ Æ Ø Å ^ _ ` æ ø å |
DANO (NATS) [ g ] [ h ]ISO-IR-009-1 [ 20 ]! « » $ & : ? Æ Ø Å _ æ ø å
เป็น [เสนอ] [ 83 ]! " # ¤ & : ? Ð ไทย ฉัน]Æ โอ _ ð ไทย ฉัน]æ ö
ผู้พูดภาษาสเปน
อีเอส[อี]ISO-IR-017 [ 84 ]! " ปอนด์ $ & : ? § ¡ Ñ ¿ ^ _ ` ° ñ ç ~
อีเอส2 ISO-IR-085 [ 85 ]! " # $ & : ? · ¡ Ñ Ç ¿ _ ` ´ ñ ç ¨
CU ISO-IR-151 [ 86 ]! " # ¤ & : ? @ ¡ Ñ ] ¿ _ ` ´ ñ [ ¨
ผู้พูดภาษาสเปน-ผู้พูดภาษาโปรตุเกส
เทเลเท็กซ์ ES/PT [ d ]ETS WST [ 67 ]! " ç $ & : ? ¡ อา เอ ฉัน โอ อู ¿ ü ñ เอ à
ลูโซโฟน
พีที ISO-IR-016 [ 87 ]! " # $ & : ? § เอ Ç โอ ^ _ ` ã ç โอ °
PT2 ISO-IR-084 [ 88 ]! " # $ & : ? ´ เอ Ç โอ ^ _ ` ã ç โอ ~
PT ( NRCS ) --- ! " # $ & : ? @ เอ Ç โอ ^ _ ` ã ç โอ ~
กรีก
ละติน-GR ผสม[ d ]ISO-IR-027 [ 50 ]Ξ " Γ ¤ & Ψ Π Δ Ω Θ Φ Λ Σ ` { | }
ISO-IR-088 (GR / ELOT 927), ISO-IR-018 และ ISO-IR-019 ใช้ตัวอักษรกรีกแทนตัวอักษรโรมัน และมีรายละเอียดอยู่ในแผนภูมิแยกต่างหาก
สลาฟ (อักษรละติน)
ยู ISO-IR-141 [ 89 ]! " # $ & : ? Ž Š Đ Ć Č _ ž š đ ć č
ยูวายเทเลเท็กซ์[ d ]ETS WST [ 67 ]! " # Ë & : ? Č Ć Ž Đ Š ë č ć ž đ š
YU-alt เทเลเท็กซ์[ d ]ETS WST [ 67 ]! " # $ & : ? Č Ć Ž Đ Š ë č ć ž đ š
CS/CZ/SK ( เทเลเท็กซ์ ) [ d ]ETS WST [ 67 ]! " # ů & : ? č ť ž ý ฉัน ř เอ อา ě อู š
พีแอล-2002 PN⁠-⁠I-⁠10050 [ 42 ]! " # $ & : ? @ อา Ę Ł Ż _ ยูโร อา ę ł ż
พีแอล-ซูยู0 PN⁠-⁠T⁠-⁠42109-02 [ 43 ]! " # ¤ & : ? ę ź Ł ń ś _ อา โอ ł ż ć
PL-ZU1 [ d ]PN⁠-⁠T⁠-⁠42109-02 [ 43 ]! " # ปอนด์ & : ? @ [ $ ] _        
PL-ZU2 [ j ] [ d ]PN⁠-⁠T⁠-⁠42109-03 [ 54 ]! " Ę Ć Ż : ? ę ź Ł ń ś _ อา โอ ł ż ć
PL เทเลเท็กซ์[ d ]ETS WST [ 67 ]! " # ń & : ? อา Ƶ Ś Ł ć โอ ę ż ś ł ź
การปรับเปลี่ยนสำหรับอักษรซีริลลิกจะใช้แทนอักษรโรมัน และมีรายละเอียดอยู่ในแผนภูมิแยกต่างหาก
อื่น
เอ็นแอล CP01019 [ 90 ]! " # $ & : ? @ [ \ ] ^ _ ` { | }
NL NRCSCP01102 [ 91 ]! " ปอนด์ $ & : ? ¾ ij ½ | ^ _ ` ¨ ƒ ¼ ´
HU ISO-IR-086 [ 92 ]! " # ¤ & : ? อา เอ โอ Ü ^ _ อา เอ ö ü ˝
เอ็มที CP03041 [ 93 ]! " # $ & : ? @ ġ ż ชม ^ _ ċ Ġ Ż ชม Ċ
RO ( เทเลเท็กซ์ ) [ d ]ETS WST [ 67 ]! " # ¤ & : ? Ţ Â Ş Ă ฉัน ฉัน ţ â ş อา ฉัน
TR ( ธ.ค. ) []ธันวาคม[ 52 ]ฉัน " # $ ğ : ? ฉัน Ş โอ Ç Ü _ Ğ ş ö ç ü
TR ( เทเลเท็กซ์ ) [ d ]ETS WST [ 67 ]! " ทีแอล ğ & : ? ฉัน Ş โอ Ç Ü Ğ ฉัน ş ö ç ü
  1. ^ a bรหัสย่อที่ใช้ในตารางเหล่านี้มาจากส่วนสุดท้ายของชื่อเรียกย่อ "ISO646- xx " ในทะเบียนชุดอักขระของ IANA หากมีอยู่ สำหรับชุดอักขระที่ไม่ได้ลงทะเบียนกับ IANA ได้เลือกชื่อย่อที่เหมาะสมสำหรับวัตถุประสงค์ของบทความนี้ ไม่มีรูปแบบการตั้งชื่อที่เป็นมาตรฐานที่ครอบคลุมชุดอักขระที่เกี่ยวข้องกับ ISO/IEC 646 ทั้งหมด
  2. ^ a b cเป็นส่วนย่อยของเวอร์ชันอ้างอิงสากลของ ISO 646 แต่ไม่รวมอักขระทั้งหมดที่มีอยู่ในชุดอักขระคงที่ รวมไว้เพื่อการเปรียบเทียบ
  3. ^รวมถึงบริการ Teletext ของสหราชอาณาจักรด้วย
  4. ^ a b c d e f g h i j k l m n o p qไม่สอดคล้องกับมาตรฐาน ISO/IEC 646 อย่างสมบูรณ์ แต่เป็นมาตรฐานที่เกี่ยวข้องอย่างใกล้ชิด รวมไว้เพื่อการเปรียบเทียบ
  5. ^ a b c d eชุด DEC NRC ที่สอดคล้องกันก็มีอยู่เช่นกันและเหมือนกับเวอร์ชันระดับชาติ ISO/IEC 646 ทุกประการ
  6. ^ a bตัวเลือกมาตรฐาน WST ระดับชาติที่สอดคล้องกันก็มีอยู่เช่นกัน และเหมือนกับเวอร์ชันมาตรฐาน ISO/IEC 646 ระดับชาติทุกประการ
  7. ^ a bชุดอักขระ NATS แทนที่@(0x40) และ`(0x60) ด้วย "ช่องว่างหน่วย A" (UA) และ "ช่องว่างหน่วย B" (UB) ช่องว่างธรรมดา (0x20) จะขยายเมื่อจัดตำแหน่ง UA และ UB ใช้สำหรับความกว้างคงที่ โดย UA ต้องมีความกว้างอย่างน้อยเท่ากับ UB RFC  1345แมป UA และ UB กับ จุดรหัส ISO 10646 (UCS) U+E002 และ U+E003 ตามลำดับ ซึ่งทั้งสองอยู่ในพื้นที่ใช้งานส่วนตัว (แม้ว่าจะมีรายการการแมป PUA สำหรับอักขระอื่นๆ อีกหลายตัวที่มีจุดรหัส UCS แล้วก็ตาม) Unicode มีอักขระช่องว่างจำนวนหนึ่งที่อาจตรงกันโดยประมาณ
  8. ^การปฏิบัติตามชุดตัวแปรคงที่ของ ISO 646 นั้นเป็นที่น่าสงสัย แต่เป็นมาตรฐานที่พัฒนามาจาก ISO 646 อย่างใกล้ชิด จึงนำมาแสดงไว้เพื่อเปรียบเทียบ
  9. ^ a bอักขระที่ตำแหน่ง 0x5C และ 0x7C ในชุดอักขระภาษาไอซ์แลนด์ต่างก็เป็นเครื่องหมายเน้นเสียง (acute accent) ตัวแรกใช้สำหรับตัวอักษรพิมพ์ใหญ่ ส่วนตัวที่สองใช้สำหรับตัวอักษรพิมพ์เล็ก
  10. ^นอกจากการแทนที่ที่แสดงไว้ที่นี่แล้ว ZU2 ยังแทนที่'(0x27) ด้วยÓ,*(0x2A) ด้วยŹ,;(0x3B) ด้วยĄ,<(0x3C) ด้วยŃ, และ>(0x3E) ด้วยŚซึ่งเป็นการครอบคลุมตัวอักษรภาษาโปแลนด์ทั้งตัวพิมพ์ใหญ่และตัวพิมพ์เล็กอย่างสมบูรณ์

ชุดอักขระทดแทนระดับชาติ

ชุดอักขระทดแทนแห่งชาติ ( NRCS ) เป็นตระกูลการเข้ารหัส 7 บิตที่DEC นำมาใช้ในปี 1983 กับ เทอร์มินัลคอมพิวเตอร์ซีรีส์ VT200มีความเกี่ยวข้องอย่างใกล้ชิดกับ ISO/IEC 646 โดยใช้พื้นฐานจากชุดย่อยที่ไม่เปลี่ยนแปลงของ ASCII ที่คล้ายกัน แตกต่างกันตรงที่ยังคงรักษาอักขระบางตัวไว้$เป็นอักขระที่ไม่เปลี่ยนแปลง แต่บางตัวไม่_เปลี่ยนแปลง NRCS ทุกรูปแบบยกเว้นรูปแบบสวิสยังคงรักษาอักขระ_บางตัวไว้ในตำแหน่ง ASCII ดังนั้นจึงสอดคล้องกับ ISO/IEC 646 NRCS หลายรูปแบบเหมือนกับ ISO/IEC 646 ทุกประการ และบางรูปแบบก็คล้ายคลึงกันมาก ยกเว้น รูป แบบ ดัตช์

ระบบเทเลเท็กซ์โลก

มาตรฐานโทรคมนาคมของยุโรป ETS 300 706 "ข้อกำหนดเทเลเท็กซ์ขั้นสูง" กำหนดชุดรหัสภาษาละติน กรีก ซีริลลิก อาหรับ และฮิบรู พร้อมด้วยตัวแปรระดับชาติหลายตัวสำหรับทั้งภาษาละตินและซีริลลิก[ 67 ]เช่นเดียวกับ NRCS และ ISO/IEC 646 ภายในตัวแปรภาษาละติน ตระกูลการเข้ารหัสที่รู้จักกันในชื่อชุด G0นั้นอิงตามชุดย่อยที่ไม่เปลี่ยนแปลงที่คล้ายกันของ ASCII แต่ไม่ได้รักษา$หรือ_เป็นตัวแปรที่ไม่เปลี่ยนแปลง แตกต่างจาก NRCS ตัวแปรมักจะแตกต่างกันอย่างมากจากตัวแปร ISO/IEC 646 ระดับชาติที่สอดคล้องกัน

เอชพี

HP มีรหัสหน้า 1054ซึ่งเพิ่มเฉดสีกลาง (▒, U+2592) ที่ 0x7F [ 94 ]รหัสหน้า 1052แทนที่อักขระ ASCII บางตัวจากรหัสหน้า 1054 [ 95 ]

รหัสหน้า 1052
0 1 2 3 4 5 6 7 8 9 เอ บี ซี ดี อี เอฟ
2x  เอสพี !"#$%&()*+,-./
3x 0123456789:;=¢?
4x @เอบีซีดีอีเอฟจีชมฉันเจเคแอลเอ็มเอ็นโอ
5x พีคิวอาร์เอสทียูวีXวาย[®]©_
6x °เออีเอฟจีชม.ฉันเจเคnโอ
7x พีqทีคุณวีxyz§
  ความแตกต่างจาก ASCII

อนุพันธ์สำหรับอักษรอื่นๆ

ชุดอักขระ 7 บิตบางชุดสำหรับอักษรที่ไม่ใช่อักษรละตินนั้นได้มาจากมาตรฐาน ISO/IEC 646: แต่ชุดอักขระเหล่านี้ไม่ได้เป็นไปตามมาตรฐาน ISO/IEC 646 อย่างแท้จริง เนื่องจากไม่ได้ปฏิบัติตามจุดรหัสคงที่ (มักจะแทนที่ตัวอักษรอย่างน้อยหนึ่งตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก) และเนื่องจากรองรับอักษรที่แตกต่างกันซึ่งชุดจุดรหัสประจำชาติมีพื้นที่การเข้ารหัสไม่เพียงพอ ตัวอย่างเช่น:

  • เติร์กเมนิสถาน 7 บิต (ISO-IR-230) [ 96 ]
  • ภาษากรีก 7 บิต
    • ในELOT 927 (ISO-IR-088) [ 49 ]อักษรกรีกจะถูกแมปตามลำดับตัวอักษร (ยกเว้นซิกมาตัวสุดท้าย) ไปยังตำแหน่ง 0x61–0x71 และ 0x73–0x79 เหนืออักษรละตินตัวพิมพ์เล็ก
    • ISO-IR-018 [ 97 ]แมปอักษรกรีกกับตัวพิมพ์ใหญ่และตัวพิมพ์เล็กโดยใช้รูปแบบที่แตกต่างกัน (ไม่ได้เรียงตามลำดับตัวอักษร แต่พยายามจับคู่อักษรกรีกกับอักษรโรมันที่สอดคล้องกันในบางแง่) และ ISO-IR-019 [ 98 ]แมปอักษรกรีกตัวพิมพ์ใหญ่กับอักษรละตินตัวพิมพ์เล็กโดยใช้รูปแบบเดียวกับ ISO-IR-018
    • ครึ่งล่างของการเข้ารหัสอักขระแบบอักษรSymbol [ 99 ]ใช้รูปแบบเฉพาะในการแมปตัวอักษรกรีกทั้งสองแบบกับตัวอักษรโรมัน ASCII โดยพยายามแมปตัวอักษรกรีกกับตัวอักษรโรมันที่สอดคล้องกันในบางแง่ แต่มีการตัดสินใจที่แตกต่างกันในเรื่องนี้ (ดูแผนภูมิด้านล่าง) นอกจากนี้ยังแทนที่จุดรหัสคงที่ 0x22 และ 0x27 และจุดรหัสแห่งชาติห้าจุดด้วยสัญลักษณ์ทางคณิตศาสตร์ แม้ว่าจะไม่ได้มีจุดประสงค์เพื่อใช้ในการเรียงพิมพ์ร้อยแก้วภาษากรีก แต่บางครั้งก็ใช้เพื่อจุดประสงค์นั้น
    • ISO-IR-027 [ 50 ] (รายละเอียดอยู่ในแผนภูมิด้านบนแทนที่จะเป็นด้านล่าง) ประกอบด้วยอักษรละตินที่ไม่เปลี่ยนแปลง แต่เพิ่มอักษรกรีกตัวพิมพ์ใหญ่บางตัวที่ไม่สามารถแสดงด้วยโฮโมก ลิฟอักษรละติน ได้ แม้ว่าจะอิงตาม ISO/IEC 646 อย่างชัดเจน แต่บางส่วนเหล่านี้ถูกแมปไปยังจุดรหัสที่ไม่เปลี่ยนแปลงใน ISO/IEC 646 (0x21, 0x3A และ 0x3F) ดังนั้นจึงไม่ใช่ตัวแปร ISO/IEC 646 ที่แท้จริง
    • การเข้ารหัส เทเลเท็กซ์ระบบโลกสำหรับภาษากรีกใช้รูปแบบการแมปตัวอักษรกรีกตามลำดับตัวอักษรเหนือตัวอักษร ASCII ของทั้งสองกรณี โดยเฉพาะอย่างยิ่งรวมถึงตัวอักษรที่มีเครื่องหมายกำกับหลายตัว[ 100 ]
  • อักษรซีริลลิก 7 บิต
    • KOI-7หรือ KOI สั้น ใช้สำหรับภาษารัสเซียอักษรซีริลลิกจะถูกแมปไปยังตำแหน่ง 0x60–0x7E ทับซ้อนกับอักษรละตินตัวเล็ก โดยจับคู่กับอักษรที่คล้ายคลึงกันเท่าที่จะเป็นไปได้ (เช่น в จะถูกแมปกับ w ไม่ใช่ v) ถูกแทนที่ด้วยKOI-8รูปแบบต่างๆ
    • SRPSCII และ MAKSCIIเป็นรูปแบบอักษรซีริลลิกของ YUSCII (รูปแบบอักษรละตินคือ YU/ISO-IR-141 ในแผนภูมิข้างต้น) ซึ่งใช้สำหรับภาษาเซอร์เบียและมาซิโดเนียตามลำดับ โดยส่วนใหญ่มีความคล้ายคลึงกับรูปแบบอักษรละตินของ YUSCII (ตามกฎไดกราฟ ของภาษาเซอร์เบีย ) ยกเว้นЉ (lj), Њ (nj), Џ (dž) และѕ (dz) ซึ่งตรงกับไดกราฟในระบบการเขียนอักษรละตินและถูกแมปทับตัวอักษรที่ไม่ใช้ในภาษาเซอร์เบียหรือมาซิโดเนีย (q, w, x, y)
    • ชุด G0 สำหรับ การเข้ารหัส เทเลเท็กซ์ระบบโลกสำหรับภาษารัสเซีย/บัลแกเรีย[ 101 ]และยูเครน[ 102 ]ใช้ชุด G0 ที่คล้ายกับ KOI-7 โดยมีการปรับเปลี่ยนบางส่วน ชุด G0 ที่สอดคล้องกันสำหรับอักษรซีริลลิกเซอร์เบีย[ a ] ​​[ 103 ]ใช้รูปแบบที่อิงตามการเข้ารหัสเทเลเท็กซ์สำหรับภาษาเซอร์โบ-โครเอเชียและสโลเวเนีย ที่เขียนด้วยอักษรละติน ซึ่งแตกต่างจาก YUSCII อย่างมาก
  • อักษร ฮีบรู 7 บิต, SI 960อักษรฮีบรูถูกแมปไปยังตำแหน่ง 0x60–0x7A เหนืออักษรละตินตัวเล็ก (และเครื่องหมายเน้นเสียงสำหรับอเลฟ) อักษรฮีบรู 7 บิตถูกจัดเก็บตามลำดับภาพเสมอ การแมปนี้โดยตั้งค่าบิตสูงสุดไว้ กล่าวคือ อักษรฮีบรูอยู่ในตำแหน่ง 0xE0–0xFA เป็นไปตามมาตรฐานISO/IEC 8859-8การเข้ารหัสเทเลเท็กซ์ระบบโลกสำหรับภาษาฮีบรูใช้การแมปตัวอักษรแบบเดียวกัน แต่ใช้ BS_Viewdata เป็นการเข้ารหัสพื้นฐาน (ในขณะที่ SI 960 ใช้ US-ASCII) และรวมสัญลักษณ์เชเกลไว้ที่ 0x7B
  • ภาษา อาหรับ 7 บิตASMO 449 (ISO-IR-089) [ 104 ]อักษรอาหรับถูกแมปไปยังตำแหน่ง 0x41–0x5A และ 0x60–0x6A เหนืออักษรละตินทั้งตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก

ด้านล่างนี้คือการเปรียบเทียบการเข้ารหัสบางส่วน แสดงเพียงกรณีเดียว ยกเว้นในกรณีที่กรณีต่างๆ ถูกกำหนดให้กับตัวอักษรที่แตกต่างกัน ในกรณีเช่นนั้น จะแสดงการจับคู่ที่มีรหัสเล็กที่สุดก่อน มีการแสดงการถอดเสียงที่เป็นไปได้สำหรับตัวอักษรบางตัว หากไม่มีการแสดงการถอดเสียง ตัวอักษรนั้นจะถือว่าตรงกับตัวอักษรโรมันที่ถูกกำหนดทับอยู่

ภาษาอังกฤษ( ASCII )อักษรซีริลลิกอักษรกรีกภาษาฮีบรู
การถอดเสียงแบบกึ่งอักษร เรียงลำดับตามธรรมชาติ
รัสเซีย( KOI-7 )รัสเซีย, บัลแกเรีย( WST RU/BG )ยูเครน( WST UKR )ภาษาเซอร์เบีย( SRPSCII )มาซิโดเนีย( MAKSCII )เซอร์เบีย, มาซิโดเนีย[ a ] ​​( WST SRP )กรีก( สัญลักษณ์ )กรีก(IR-18 [ 97 ] )กรีก( ELOT 927 )กรีก( WST EL )ภาษาฮีบรู( SI 960 )
@ `Ю (จู/ยู)Ю (จู/ยู)Ю (จู/ยู)Ж (ž)Ж (ž)Ч (č)≅ ‾´ `@ `ΐ ΰא (ʾ/ʔ)
เอเอА (a/á)เอเอเอเอเอเอเอเอב (b)
บีบีบีบีบีบีบีบีบีบีบีג (g)
ซีЦ (c/ts)Ц (c/ts)Ц (c/ts)Ц (c/ts)Ц (c/ts)Ц (c/ts)Χ (ch/kh)Ψ (ps)Γ (g)Γ (g)ד (d)
ดีΔΔΔΔה (h)
อีЕ (เจ/เย)Е (เจ/เย)อี (อี)อี (อี)อี (อี)อี (อี)อีอีอีอีו (w)
เอฟΦ (ph/f)Φ (ph/f)Ζ (z)Ζ (z)ז (z)
จีГГГГГΓΓΓΗ (ē)Η (ē)ח (ch/kh)
ชมХ (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)Х (h/kh/ch)Η (ē)Η (ē)Θ (th)Θ (th)ט (tt)
ฉันИИИ (y)ИИИไอไอไอไอי (j/y)
เจЙ (j/y)Й (j/y)Й (j/y)Ј (จูล/ปี)Ј (จูล/ปี)Ј (จูล/ปี)ϑ (th) ϕ (ph/f)Ξ (x/ks) เค (k)ך (k สุดท้าย)
เคเคเคเคเคเคเคเคเคเคΛ (ล)כ
แอลแอลแอลแอลแอลแอลแอลΛΛΛม (ม)
เอ็มม.ม.ม.ม.ม.ม.เอ็มเอ็มเอ็มเอ็น (น)ם (m สุดท้าย)
เอ็นННННННเอ็นเอ็นเอ็นΞ (x/ks)ม (ม)
โอโอโอโอโอโอโอโอโอΞ (x/ks)โอן (n สุดท้าย)
พีพีพีพีพีพีพีΠΠΟ (o)Πנ (n)
คิวЯ (ja/ya)Я (ja/ya)Я (ja/ya)Љ (lj/ly)Љ (lj/ly)Ќ (Ḱ/kj)Θ (th)ͺ ( i )Π (p)พี (ร)ส (s)
อาร์พีพีพีพีพีพีพีพีพีʹ ς (s สุดท้าย)ע (ʽ/ŋ)
เอสซีซีซีซีซีซีΣΣΣΣף (p สุดท้าย)
ทีทีทีทีทีทีทีทีทีทีทีפ (p)
ยูУУУУУУย.Θ (th)ย.ย.ץ (ṣ/ts ตัวสุดท้าย)
วีЖ (ž)Ж (ž)Ж (ž)บีบีบีς (s สุดท้าย) ϖ (p)Ω (ō)Φ (f/ph)Φ (f/ph)צ (ṣ/ts)
В (v)В (v)В (v)Њ (nj/ny/ñ)Њ (nj/ny/ñ)Ѓ (ǵ/gj)Ω (ō)ς (s สุดท้าย)ς (s สุดท้าย)Χ (ch/kh)ק (q)
XЬ (')Ь (')Ь (')Џ (dž)Џ (dž)Љ (lj/ly)ΞΧ (ch/kh)Χ (ch/kh)Ψ (ps)ר (r)
วายЫ (y/ı)Ъ (″/ǎ/ŭ)І (i)Ѕ (dz)Ѕ (dz)Њ (nj/ny/ñ)Ψ (ps)ย (u)Ψ (ps)Ω (ō)ש (š/sh)
333333ΖΖΩ (ō)Ϊת (t)
[ {Ш (š/sh)Ш (š/sh)Ш (š/sh)Ш (š/sh)Ш (š/sh)Ћ (ć)[ {῏ ῟[ {Ϋ[ {
|​อี (อี)อี (อี)Є (je/ye)Ђ (đ/dj)Ѓ (ǵ/gj)Ж (ž)∴ |᾿ ῾ (h)|​ά ό|​
] }Щ (šč)Щ (šč)Щ (šč)Ћ (ć)Ќ (Ḱ/kj)Ђ (đ/dj)] }῎ ῞] }έ ύ] }
^ ~Ч (č)Ч (č)Ч (č)Ч (č)Ч (č)Ш (š/sh)⊥ ~˜ ¨^ ‾ή ώ^ ‾
_Ъ (″)Ы (y/ı)Ї (ji/yi)__Џ (dž)___ί_

ดูเพิ่มเติม

เชิงอรรถ

  1. ^ a bระบุว่า "ชุดตัวอักษรซีริลลิก G0 หลัก - ตัวเลือกที่ 1 - เซอร์เบีย/โครเอเชีย" แต่รวมถึงตัวอักษรมาซิโดเนียЌและЃ (แต่ไม่รวมЅ ) ชุดตัวอักษรโรมันบางส่วน ส่วนใหญ่เป็นตัวอักษรที่ไม่มีโฮโมกลิฟในชุด G0 รวมอยู่ในชุด G1 (15.6.7 ตารางที่ 41) รวมถึงS /s ที่ 0x6B/7B ภาษาโครเอเชียเขียนด้วยอักษรละติน

อ่านเพิ่มเติม

  • Fischer, Eric, ed. (1975) [1972]. เอกสารต้นฉบับเกี่ยวกับประวัติของรหัสตัวอักษร 1972–1975 (รวบรวม). เก็บถาวรจากต้นฉบับเมื่อ 2020-06-07 . สืบค้นเมื่อ2020-06-07{{cite book}}: CS1 maint: bot: สถานะ URL เดิมไม่ทราบ ( ลิงก์ )(79 หน้า) รวมถึง: Bemer, Robert William (1972). "มุมมองเกี่ยวกับประวัติของชุดอักขระ ISO" Honeywell Computer Journal . 6 (4). ฟีนิกซ์, แอริโซนา, สหรัฐอเมริกา: Honeywell Information Systems: 274– 286, 287– 291.(13+5 หน้า) และเอกสารและจดหมายโต้ตอบอื่นๆ อีกมากมาย
  • ISO/IEC 646:1991 เทคโนโลยีสารสนเทศ — ชุดอักขระเข้ารหัส 7 บิต ISO สำหรับการแลกเปลี่ยนข้อมูล
  • Zeichensatz nach ISO 646 (ASCII) (ภาษาเยอรมัน)
  • ประวัติความเป็นมาที่เว็บไซต์GNU Aspell
  • ตารางอักขระ ISO646 โดย โคอิจิ ยาสุโอกะ (安岡孝) (ดูตารางอักขระ ISO646 ภายในประเทศและตารางอักขระกึ่ง ISO646 )
  • Turkish Text Deasciifierเป็นเครื่องมือ (ที่ใช้การวิเคราะห์ทางสถิติแบบเพนทาแกรมของภาษาตุรกี) ซึ่งแปลงข้อความภาษาตุรกีที่เป็น ASCII กลับมาเป็นข้อความตุรกีอีกครั้ง โดยการหาเครื่องหมายกำกับเสียงที่เหมาะสม (แต่มีความกำกวม) ซึ่งโดยปกติแล้วจำเป็นในภาษาตุรกี แต่ไม่มีอยู่ในชุด ASCII ของสหรัฐอเมริกา
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=ISO/IEC_646&oldid=1356947120#ECMA-6 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ไอโซ/อีอีซี 646

ISO/IEC 646 เทคโนโลยีสารสนเทศ — ชุดอักขระเข้ารหัส 7 บิต ISO สำหรับการแลกเปลี่ยนข้อมูล เป็น มาตรฐาน ISO / IEC ในด้าน การเข้ารหัสอักขระ เทียบเท่ากับมาตรฐาน ECMA -6...

ประวัติศาสตร์

ISO/IEC 646 และ มาตรฐาน ก่อนหน้าอย่าง ASCII (ASA X3.4) ส่วนใหญ่รับรองแนวปฏิบัติที่มีอยู่เกี่ยวกับการเข้ารหัสอักขระใน อุตสาหกรรมโทรคมนาคม

มาตรฐานที่เผยแพร่

ECMA-6 (30 เมษายน 1965) ฉบับพิมพ์ครั้งแรก (ถูกถอนออก) [ 3 ] ISO/R646-1967 (ยกเลิกแล้ว) [ 7 ] หรือ ECMA-6 (1967-06) ฉบับที่สอง (ยกเลิกแล้ว) [ 7 ] [ 3 ] ECMA-6 (1970-07) ฉบับที่สาม (ถูกยกเลิก) [ 3 ] [ 8 ] ISO 646:1972 (ยกเลิกแล้ว) หรือ ECMA-6 (1973-08)...

เค้าโครงหน้าโค้ด

ตารางต่อไปนี้แสดงชุดอักขระมาตรฐาน ISO/IEC 646:1991 ฉบับอ้างอิงสากล อักขระแต่ละตัวแสดงพร้อมกับ ค่าเทียบเท่าใน Unicode จุดรหัสที่สามารถใช้แทนกันได้ในเวอร์ชันของแต่ละประเทศจะแสดงด้วยพื้นหลังสีเทา...