อ่าน 10 นาที
รหัสหน้า 437
รหัสหน้า 437 ( CCSID 437 ) คือ ชุดอักขระ ของ IBM PC (คอมพิวเตอร์ส่วนบุคคล) รุ่นดั้งเดิม [ 2 ] เรียกอีกอย่างว่า CP437 , OEM-US , OEM 437 [ 3 ] PC -8 [ 4 ] หรือ MS-DOS Latin US [ 5...
รหัสหน้า 437
| MIME / IANA | ไอบีเอ็ม437 |
|---|---|
| ชื่อเล่น | cp437, 437, csPC8CodePage437, [ 1 ] OEM-US |
| ภาษา | ภาษาอังกฤษภาษาเยอรมันภาษาสวีเดน |
| การจำแนกประเภท | รหัส ASCII แบบขยาย , รหัสหน้า OEM |
| ขยาย | ยูเอส-เอเอสไอไอ |
| การเข้ารหัสอื่นๆ ที่เกี่ยวข้อง | รหัสหน้า 850 , CWI-2 |
รหัสหน้า 437 ( CCSID 437 ) คือชุดอักขระของIBM PC (คอมพิวเตอร์ส่วนบุคคล) รุ่นดั้งเดิม [ 2 ]เรียกอีกอย่างว่าCP437 , OEM-US , OEM 437 [ 3 ] PC -8 [ 4 ]หรือMS-DOS Latin US [ 5 ] ชุดนี้ประกอบด้วย อักขระ ASCII ที่พิมพ์ได้ทั้งหมด รวมถึงตัวอักษรที่มีเครื่องหมายเน้นเสียง ( diacritics ) ตัวอักษรกรีก ไอคอน และ สัญลักษณ์วาดเส้น บางครั้งเรียกว่า " แบบอักษร OEM " หรือ " ASCII สูง " หรือ " ASCII ขยาย " [ 4 ] (หนึ่งในส่วนขยาย ASCII ที่ไม่เข้ากันหลายอย่าง)
ชุดอักขระนี้ยังคงเป็นชุดหลักในแกนหลักของ การ์ดกราฟิกที่เข้ากันได้กับ EGAและVGAดังนั้น ข้อความที่แสดงเมื่อพีซีเริ่มต้นใหม่ ก่อนที่ฟอนต์จะถูกโหลดและแสดงผล มักจะแสดงผลโดยใช้ชุดอักขระนี้[หมายเหตุ 1 ]รูปแบบไฟล์จำนวนมากที่พัฒนาขึ้นในช่วงเวลาของ IBM PC ก็ใช้รหัสหน้า 437 เป็นพื้นฐานเช่นกัน
อะแดปเตอร์แสดงผล
คอมพิวเตอร์ IBM PC รุ่นดั้งเดิมมีฟอนต์นี้เป็นฟอนต์ขนาด 9×14 พิกเซลต่อตัวอักษรที่จัดเก็บไว้ในROMของIBM Monochrome Display Adapter (MDA)และฟอนต์ขนาด 8×8 พิกเซลต่อตัวอักษรของ การ์ด Color Graphics Adapter ( CGA ) IBM Enhanced Graphics Adapter (EGA)มีเวอร์ชันขนาด 8×14 พิกเซลต่อตัวอักษร[ 6 ]และสำหรับโหมดที่เข้ากันได้กับ CGA จะมีเวอร์ชันขนาด 8x8 พิกเซลต่อตัวอักษร[ 7 ]ส่วน VGAมีเวอร์ชันขนาด 9×16 พิกเซล
อะแดปเตอร์แสดงผลทั้งหมดเหล่านี้มีโหมดข้อความที่แต่ละเซลล์อักขระประกอบด้วยจุดรหัสอักขระ8 บิต (ดูรายละเอียด ) ทำให้มีค่าที่เป็นไปได้ 256 ค่าสำหรับอักขระกราฟิก รหัสทั้ง 256 รหัสได้รับการกำหนดเป็นอักขระกราฟิกใน ROM รวมถึงรหัสตั้งแต่ 0 ถึง 31 ที่สงวนไว้ใน ASCII สำหรับอักขระควบคุมที่ไม่ใช่กราฟิก
คอมพิวเตอร์ส่วนบุคคล (PC) จากประเทศในยุโรปตะวันออกหลายรุ่นใช้ชุดอักขระที่แตกต่างกัน บางครั้งผู้ใช้สามารถเลือกได้ผ่านจัมเปอร์หรือการตั้งค่า CMOS ชุดอักขระเหล่านี้ได้รับการออกแบบให้ตรงกับมาตรฐาน 437 ให้มากที่สุดเท่าที่จะเป็นไปได้ เช่น ใช้รหัสจุดร่วมกันสำหรับอักขระวาดเส้นหลายตัว ในขณะเดียวกันก็ยังอนุญาตให้แสดงข้อความในภาษาท้องถิ่นได้
รหัส Alt
มรดกของโค้ดเพจ 437 คือชุดตัวเลขที่ใช้ในรหัส Alt ของ Windows [ 8 ] [ 9 ] [ 10 ]ผู้ใช้ DOS สามารถป้อนอักขระได้โดยการกดปุ่ม Alt ค้างไว้ และป้อนรหัสอักขระบนแป้นตัวเลข[ 8 ]และผู้ใช้หลายคนจดจำตัวเลขที่จำเป็นสำหรับ CP437 (หรือสำหรับCP850 ที่คล้ายกัน ) แม้ว่า Microsoft Windows จะใช้ชุดอักขระที่แตกต่างกัน เช่นCP1252แต่ตัวเลขดั้งเดิมก็ถูกจำลองขึ้นเพื่อให้ผู้ใช้สามารถใช้งานต่อไปได้ Microsoft เพิ่มความสามารถในการพิมพ์รหัสจากชุดอักขระของ Windows โดยการพิมพ์ 0 ก่อนตัวเลข[ 8 ] [ 11 ]
ชุดอักขระ
ตารางต่อไปนี้แสดงรหัสหน้า 437 แต่ละอักขระจะแสดงพร้อมกับ รหัสจุด Unicode ที่เทียบเท่า (เมื่อรหัสจุด Unicode ไม่เท่ากับรหัสของอักขระนั้น) คำแนะนำ (tooltip ) ซึ่งโดยทั่วไปจะปรากฏเฉพาะเมื่อชี้เมาส์ไปทางซ้ายของอักขระ จะแสดงชื่อรหัสจุด Unicode และรหัส Alt ในระบบเลขฐานสิบ โปรดดูหมายเหตุเพิ่มเติมด้านล่าง เนื่องจากมีอักขระ Unicode ที่เทียบเท่าหลายตัวสำหรับรหัสจุดบางรหัส
แม้ว่า ROM จะมีกราฟิกสำหรับรหัส 8 บิตที่แตกต่างกันทั้งหมด 256 รหัส แต่API บางตัว จะไม่พิมพ์จุดรหัสบางจุด โดยเฉพาะช่วง 0-31 และรหัสที่ 127 [ 12 ]แต่จะตีความว่าเป็นอักขระควบคุมแทน ตัวอย่างเช่น วิธีการแสดงผลข้อความหลายวิธีบน IBM PC รุ่นแรกจะตีความ รหัสเลขฐาน สิบหก 07, 08, 0A และ 0D เป็นBEL , BS , LFและCRตามลำดับ เครื่องพิมพ์หลายเครื่องก็ไม่สามารถพิมพ์อักขระเหล่านี้ได้เช่นกัน
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | เอ | บี | ซี | ดี | อี | เอฟ | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0x 0 | นูแอล[ก] | ☺︎ 263A | ☻ 263บี | ♥︎ 2665 | ♦︎ 2666 | ♣︎ 2663 | ♠︎ 2660 | • 2022 | ◘ 25D8 | ○ 25CB | ◙ 25D9 | ♂︎ 2642 | ♀︎ 2640 | ♪ 266A | ♫ [ b ] 266บี | ☼ 263C |
| 1x 16 | ► 25BA | ◄ 25C4 | ↕︎ 2195 | ‼︎ 203C | ¶ 00B6 | § 00A7 | ▬ 25AC | ↨ 21A8 | ↑ 2191 | ↓ 2193 | → 2192 | ← 2190 | ∟ 221F | ↔︎ 2194 | ▲ 25B2 | ▼ 25 ปีก่อนคริสตกาล |
| 2x 32 | เอสพี | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3x 48 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x 64 | @ | เอ | บี | ซี | ดี | อี | เอฟ | จี | ชม | ฉัน | เจ | เค | แอล | เอ็ม | เอ็น | โอ |
| 5x 80 | พี | คิว | อาร์ | เอส | ที | ยู | วี | ว | X | วาย | ซ | [ | \ | ] | ^ | _ |
| 6x 96 | ` | เอ | ข | ค | ง | อี | เอฟ | จี | ชม. | ฉัน | เจ | เค | ล | ม | n | โอ |
| 7x 112 | พี | q | ร | ส | ที | คุณ | วี | ว | x | y | z | { | | [ c ] | } | ~ | ⌂ [ d ] 2302 |
| 8x 128 | Ç 00C7 | ü 00FC | เอ 00E9 | â 00E2 | เอ 00E4 | à 00E0 | å 00E5 | ç 00E7 | ê 00EA | ë 00EB | เอ 00E8 | ฉัน 00EF | ฉัน 00EE | ฉัน 00EC | Ä 00C4 | Å 00C5 |
| 9x 144 | เอ 00C9 | æ 00E6 | Æ 00C6 | โอ 00F4 | ö 00F6 | ò 00F2 | û 00FB | ù 00F9 | ÿ 00FF | โอ 00D6 | Ü 00DC | ¢ 00A2 | ปอนด์ 00A3 | ¥ 00A5 | ₧ 20A7 | ƒ 0192 |
| แอ็ก160 | อา 00E1 | ฉัน 00ED | โอ 00F3 | อู 00FA | ñ 00F1 | Ñ 00D1 | ª 00AA | º 00BA | ¿ 00BF | ⌐ 2310 | ¬ 00AC | ½ 00BD | ¼ 00 ปีก่อนคริสตกาล | ¡ 00A1 | « 00AB | » 00บีบี |
| บีเอ็กซ์176 | ░ 2591 | ▒ 2592 | ▓ 2593 | │ [ e ] 2502 | ┤ 2524 | ╡ 2561 | ╢ 2562 | ╖ 2556 | ╕ 2555 | ╣ 2563 | ║ 2551 | ╗ 2557 | ╝ 255D | ╜ 255 องศาเซลเซียส | ╛ 255บี | ┐ 2510 |
| ซีเอ็กซ์192 | └ 2514 | ┴ 2534 | ┬ 252 องศาเซลเซียส | ├ 251C | ─ 2500 | ┼ 253 องศาเซลเซียส | ╞ 255E | ╟ 255 องศาฟาเรนไฮต์ | ╚ 255A | ╔ 2554 | ╩ 2569 | ╦ 2566 | ╠ 2560 | ═ 2550 | ╬ 256 องศาเซลเซียส | ╧ 2567 |
| ด็อก208 | ╨ 2568 | ╤ 2564 | ╥ 2565 | ╙ 2559 | ╘ 2558 | ╒ 2552 | ╓ 2553 | ╫ 256บี | ╪ 256A | ┘ 2518 | ┌ 250 องศาเซลเซียส | █ 2588 | ▄ 2584 | ▌ 258 องศาเซลเซียส | ▐ 2590 | ▀ 2580 |
| เอก224 | α 03B1 | ß [ f ] 00DF | Γ 0393 | π [ g ] 03C0 | Σ [ h ] 03A3 | σ 03C3 | µ [ i ] 00B5 | τ 03C4 | Φ 03A6 | Θ [ j ] 0398 | Ω [ k ] 03A9 | δ [ l ] 03B4 | ∞ 221E | φ [ m ] 03C6 | ε [ n ] 03B5 | ∩ 2229 |
| เอฟเอ็กซ์240 | ≡ 2261 | ± 00B1 | ≥ 2265 | ≤ 2264 | ⌠ [ o ] 2320 | ⌡ 2321 | ÷ 00F7 | ≈ 2248 | ° 00B0 | ∙ [ p ] 2219 | · 00B7 | √ [ q ] 221A | ⁿ 207F | ² 00B2 | ■ 25A0 | เอ็นบีเอสพี[ r ] 00A0 |
เมื่อแปลงเป็น Unicode รหัสบางรหัสไม่มีค่าเทียบเท่า Unicode ที่เฉพาะเจาะจงเพียงค่าเดียว การเลือกค่าที่ถูกต้องอาจขึ้นอยู่กับบริบท
- ^ 0 วาดช่องว่าง แต่การใช้งานเป็น ตัวจบ สตริง Cหมายความว่ามันถูกแปลอย่างแม่นยำยิ่งขึ้นเป็น NUL ในการใช้งานกราฟิก C0-region ที่ใช้โค้ดเพจ 437 เครื่องพิมพ์ Star Micronicsจะนำโค้ดนี้มาใช้ใหม่เป็นที่มีขีดทับ[ 17 ]
- ^ 14 (E hex ) การแมปตามที่แสดงไว้สำหรับโน้ตตัวที่แปด ที่เชื่อมด้วยเส้น [U+266B, ♫] เป็นไปตามข้อมูลที่จัดทำโดยUnicode Consortium [ 18 ]ในระบบ GCGID (Graphic Character Global IDentifier) ของ IBM สำหรับรหัสอักขระ นี่คือ SM910000 ซึ่งระบุเพียงว่า "โน้ตดนตรีสองตัว" [ 14 ] [ 15 ]อย่างไรก็ตาม สัญลักษณ์อ้างอิงแสดงโน้ตตัวที่สิบหก ที่เชื่อมด้วยเส้นสองตัว [U+266C, ♬] [ 14 ]ในข้อกำหนดสำหรับรหัสโฮสต์ภาษาญี่ปุ่นของ IBM SM910080 (เช่น SM910000 ที่ตั้งค่าคุณลักษณะ ความกว้างเต็ม ) ถูกแมปอย่างชัดเจนไปยัง U+266C และแสดงโน้ตตัวที่สี่สองตัวตามนั้น [ 19 ]
- ^ 124 (7C hex ) สัญลักษณ์ที่แท้จริงในตำแหน่งนี้คือเส้นประ [U+00A6, ¦] ในแบบอักษรดั้งเดิมของ IBM PCและ คอมพิวเตอร์ ที่เข้ากันได้ซึ่งแสดงผลโดย MDA ดั้งเดิม การแสดงผลนี้ถูกนำมาใช้ในภายหลังสำหรับ CGA , EGAและ VGA (ดูภาพที่ต้นบทความ) อย่างไรก็ตาม ซอฟต์แวร์เกือบทั้งหมดถือว่ารหัสนี้เป็นอักขระ ASCII [U+007C, |]; ตัวอย่างเช่น ภาษาโปรแกรมใช้เป็น "หรือ" ในช่วงต้นทศวรรษ 1990 มีการชี้แจงว่ามีเส้นแนวตั้งใน ASCIIในตำแหน่งนี้ และสัญลักษณ์เส้นประไม่ใช่ส่วนหนึ่งของ ASCII
- ^ 127 (7F hex ) เป็น "บ้าน" แต่บางครั้งก็ใช้เป็นเดลต้า เมืองหลวงของกรีก [U+0394, Δ]
- ^ 179 (B3 hex ) สามารถใช้เป็นส่วนขยายแบบอินทิกรัล [U+23AE, ⎮] ในฟอนต์ของ IBM ได้เช่นกัน
- ^
225 (E1 hex ) ถูกระบุโดย IBM ว่าเป็นอักษรละติน " Sharp s Small" [ 15 ] [U+00DF, ß] แต่บางครั้งก็ถูกแสดงในแบบอักษร OEMเป็นอักษรกรีกเบต้า เล็ก [U+03B2, β] การวางอักษรละตินนี้ไว้ท่ามกลางอักษรกรีกแสดงให้เห็นถึงการใช้งานหลายอย่างที่ตั้งใจไว้
การเปรียบเทียบอักขระในช่วง E0 ถึง EF ในผลิตภัณฑ์ต่างๆ ของ IBM - ^ 227 (E3 hex ) ถูกระบุโดย IBM ว่าเป็น " Piตัวเล็ก" ของกรีก [U+03C0, π] แต่บางครั้งก็ถูกแสดงในแบบอักษร OEM เป็น Pi ตัวใหญ่ของกรีก [U+03A0, Π] หรือ เครื่องหมาย ผลคูณn-ary [U+220F, ∏]
- ^ 228 (E4 hex ) ถูกระบุโดย IBM ว่าเป็น "ซิกมาตัวใหญ่" ของกรีก [U+03A3, Σ] แต่ยังใช้เป็น เครื่องหมาย ผลรวมแบบn-ary [U+2211, ∑]
- ^ 230 (E6 hex ) ถูกระบุโดย IBM ว่าเป็น " Mu Small" ของกรีก [U+03BC, μ] แต่ยังใช้เป็นสัญลักษณ์ไมโคร [U+00B5, µ] ตาราง GCGID ของกรีกของ IBM [ 20 ]แมปอักขระในหน้าโค้ดนี้กับตัวอักษรกรีก แต่ตาราง cp437_DOSLatinUS เป็น Unicode [ 13 ]แมปกับสัญลักษณ์ไมโคร
- ^ 233 (E9 hex ) ถูกระบุโดย IBM ว่าเป็น " Theta Capital" ของกรีก [U+0398, Θ] [ 14 ] [ 15 ]อย่างไรก็ตาม สัญลักษณ์เหล่านี้ใช้สำหรับคณิตศาสตร์และฟิสิกส์ ซึ่งตัวอักษร theta ตัวเล็กถูกใช้บ่อยกว่ามาก (เช่น สำหรับพิกัดเชิงขั้ว)
- ^ 234 (EA hex ) ถูกระบุโดย IBM ว่าเป็น "โอเมก้าตัวพิมพ์ใหญ่" ของกรีก [U+03A9, Ω] แต่ก็ยังใช้เป็น สัญลักษณ์ โอห์ม [U+2126, Ω] ด้วย Unicode ถือว่าอักขระเหล่านี้เทียบเท่ากันและแนะนำให้ใช้ U+03A9 ในทั้งสองบริบท [ 21 ]
- ^ 235 (EB hex ) ถูกระบุโดย IBM ว่าเป็น "เดลต้าเล็ก" ของกรีก [U+03B4, δ] นอกจากนี้ยังถูกใช้แบบไม่เป็นทางการสำหรับเอธ เล็ก [U+00F0, ð] และ เครื่องหมาย อนุพันธ์ย่อย [U+2202, ∂]
- ^ 237 (ED hex ) ถูกระบุโดย IBM ว่าเป็น " Phi Small (Closed Form)" ของกรีก [U+03D5, ϕ; หรือจากชุดคณิตศาสตร์ที่เป็นตัวเอียง U+1D719, 𝜙] แต่ Unicode แมปไปยังรูปแบบเปิด (หรือ "loopy") [U+03C6, φ] ในตาราง cp437_DOSLatinUS [ 13 ]การเปรียบเทียบตาราง GCGID ของกรีกของ IBM [ 20 ]กับแผนภูมิรหัสกรีกของ Unicode [ 22 ]แสดงให้เห็นว่า IBM สลับรูปแบบเปิดและปิดเมื่อแมปไปยัง Unicode อักขระนี้ยังใช้เป็น เครื่องหมาย เซตว่าง [U+2205, ∅], เครื่องหมาย เส้นผ่านศูนย์กลาง [U+2300, ⌀] และตัวอักษรละติน O ที่มีขีด [U+00D8, Ø; และ U+00F8, ø]
- ^ 238 (EE hex ) ถูกระบุโดย IBM ว่าเป็น "เอปซิลอนเล็ก" ของกรีก [U+03B5, ε] แต่บางครั้งก็แสดงในฟอนต์ OEM เป็น สัญลักษณ์ องค์ประกอบของ [U+2208, ∈] และมักใช้เป็นสัญลักษณ์ยูโร [U+20AC, €]
- ^ 244 (F4 hex ) และ 245 (F5 hex ) คือส่วนบนและส่วนล่างของสัญลักษณ์อินทิกรัล (∫) และสามารถขยายได้ด้วยอักขระ 179 (B3 hex ) ซึ่งเป็นเส้นแนวตั้งของบล็อกวาดกล่อง 244 ยังสามารถใช้สำหรับ อักขระ s ยาว [U+017F, ſ]
- ^ 249 (F9 hex ) และ 250 (FA hex ) แทบจะแยกไม่ออก: ตัวแรกเป็นจุดที่ใหญ่กว่าตัวที่สองเล็กน้อย ทั้งสองตัวถูกใช้เป็นจุดหัวเรื่องจุดกลางและจุดคูณ [U+2219, ∙]
- ^ 251 (FB hex ) บางครั้งก็ใช้เป็นเครื่องหมายถูก [U+2713, ✓]
- ^ 255 (FF hex ) จะสร้างช่องว่าง; การใช้งานเป็นช่องว่างที่ไม่เว้นวรรค (NBSP) มีตัวอย่างมาก่อนในโปรแกรมประมวลผลคำที่ออกแบบมาสำหรับ IBM PC
ประวัติศาสตร์
ตามที่บิล เกตส์ กล่าวไว้ ในการสัมภาษณ์กับบิล เกตส์และพอล อัลเลน ซึ่งตีพิมพ์ใน นิตยสารฟอร์จูนฉบับวันที่ 2 ตุลาคม 1995 ชุดอักขระของรหัสหน้า 437 นั้น นำมาจากชุดอักขระของเครื่องประมวลผลคำ Wang (WISCII ) บางส่วน
"...เรายังรู้สึกทึ่งกับโปรแกรมประมวลผลคำเฉพาะทางของ Wang ด้วย เพราะเราเชื่อว่าเครื่องคอมพิวเตอร์ทั่วไปก็สามารถทำได้ดีไม่แพ้กัน นั่นเป็นเหตุผลว่าทำไม เมื่อถึงเวลาออกแบบแป้นพิมพ์สำหรับ IBM PC เราจึงใส่ชุดตัวอักษรแปลกๆ ของ Wang ลงไปในเครื่อง—คุณก็รู้ พวกหน้ายิ้ม กล่อง สามเหลี่ยม และอื่นๆ เราคิดว่าสักวันเราอยากจะสร้างโปรแกรมประมวลผลคำแบบเดียวกับของ Wang"
อย่างไรก็ตาม บัญชีของเกตส์ถูกโต้แย้งว่าไม่ถูกต้องบางส่วน เนื่องจากชุดอักขระ WISCII ไม่รวมหน้ายิ้มหรืออักขระวาดกล่อง[ 23 ]
จากการสัมภาษณ์กับเดวิด เจ. แบรดลีย์ (ผู้พัฒนา ROM-BIOSของพีซี) พบว่าตัวอักษรได้รับการตัดสินใจในระหว่างการประชุมสี่ชั่วโมงบนเครื่องบินระหว่างเดินทางจากซีแอตเติลไปแอตแลนตา โดยแอนดี้ ซาเอนซ์ (ผู้รับผิดชอบการ์ดแสดงผล) ลิว เอ็กเกเบรชต์ (หัวหน้าวิศวกรของพีซี) และตัวเขาเอง[ 24 ]
การเลือกใช้ตัวอักษรกราฟิกนั้นมีตรรกะภายในบางอย่าง:
- แถวที่ 0 และ 1 ของตาราง รหัส 0 ถึง 31 (00 hexถึง 1F hex ) คืออักขระ พิเศษ (อักขระเสริมและอักขระตกแต่ง) ที่หลากหลาย อักขระเดี่ยวหมายเลข 127 (7F hex ) ก็อยู่ในกลุ่มนี้ด้วย
- แถวที่ 2 ถึง 7 ของตาราง รหัส 32 ถึง 126 ( เลขฐานสิบหก 20 ถึง 7E ) คือ อักขระ ASCII มาตรฐาน ที่สามารถพิมพ์ได้
- แถวที่ 8 ถึง 10 ของตาราง รหัส 128 ถึง 175 (80 hexถึง AF hex ) คือชุดอักขระข้อความสากล
- แถวตารางที่ 11 ถึง 13 รหัส 176 ถึง 223 ( เลขฐานสิบหก B0 ถึงเลขฐานสิบหก DF ) เป็น อักขระ สำหรับวาดกล่องและบล็อกบล็อกนี้จัดเรียงเพื่อให้ตัวอักขระ 192 ถึง 223 ( เลขฐานสิบหก C0 ถึงเลขฐานสิบหก DF ) มีแขนขวาและพื้นที่ที่เติมด้านขวาทั้งหมด อะแดปเตอร์แสดงผล IBM PC MDA ดั้งเดิมจัดเก็บ อักขระหน้าโค้ด 437 เป็น บิตแมปที่มีความกว้าง แปดพิกเซลแต่เพื่อเพิ่มประสิทธิภาพการมองเห็นจึงแสดงผลทุกๆ เก้าพิกเซลบนหน้าจอ ช่วงของอักขระนี้มีคอลัมน์พิกเซลที่แปดที่ทำซ้ำโดยวงจรฮาร์ดแวร์พิเศษ[ 25 ]จึงเติมช่องว่างในเส้นและพื้นที่ที่เติม อะแดปเตอร์ VGA อนุญาตให้เปิดหรือปิดพฤติกรรมนี้ได้[ 26 ]
- แถวที่ 14 และ 15 ของตาราง รหัส 224 ถึง 254 (E0 hexถึง FE hex ) เป็นส่วนที่ใช้สำหรับสัญลักษณ์ทางคณิตศาสตร์ โดยสิบสองตัวแรกเป็นตัวอักษรกรีกที่ใช้กันทั่วไปในวิชาฟิสิกส์
ฟอนต์ส่วนใหญ่สำหรับMicrosoft Windowsประกอบด้วยอักขระกราฟิกพิเศษที่ดัชนี Unicode ที่แสดงไว้ เนื่องจากเป็นส่วนหนึ่งของ ชุด WGL4ที่ Microsoft สนับสนุนให้นักออกแบบฟอนต์รองรับ (ตระกูลฟอนต์แรสเตอร์แบบ monospaced ชื่อTerminalเป็นฟอนต์รุ่นแรกๆ ที่จำลองอักขระทั้งหมดของโค้ดเพจ 437 อย่างน้อยก็ในบางความละเอียด) เพื่อวาดอักขระเหล่านี้โดยตรงจากจุดรหัสเหล่านี้ ฟอนต์ ของ Microsoft Windowsที่เรียกว่า MS Linedraw [ 27 ]จะจำลองอักขระทั้งหมดของโค้ดเพจ 437 จึงทำให้มีวิธีหนึ่งในการแสดงข้อความ DOS บนเครื่อง Windows รุ่นใหม่ให้เหมือนกับที่แสดงใน DOS โดยมีข้อจำกัด[ 28 ]
รหัสหน้า 1055หรือที่รู้จักกันในชื่อชุดสัญลักษณ์ HP 0L [ 29 ]เป็นชุดย่อยที่ประกอบด้วยการวาดกล่อง ครึ่งบล็อก วงกลมสีดำ (วงกลมสีดำแทนที่จุดนำหน้า ซึ่งแทนที่จุดตรงกลางในรหัสหน้าชุดนี้) และสี่เหลี่ยมสีดำ และย้ายพวกมันไปยังครึ่งบน นอกจากนี้ยังรวมถึงช่องว่างด้วย[ 30 ]
การทำให้เป็นสากล
รหัสหน้า 437 มีชุดอักขระสากล โดยส่วนใหญ่มีค่าตั้งแต่ 128 ถึง 175 (80 hexถึง AF hex ) อย่างไรก็ตาม ครอบคลุมเฉพาะภาษาหลักๆ ในยุโรปตะวันตกเพียงไม่กี่ภาษาเท่านั้น รวมถึงภาษาอังกฤษภาษาเยอรมัน[หมายเหตุ 2 ]และภาษาสวีเดน[หมายเหตุ 3 ]ดังนั้นจึงขาดอักขระหลายตัว (ส่วนใหญ่เป็นตัวพิมพ์ใหญ่) ที่สำคัญสำหรับภาษาหลักๆ ในยุโรปตะวันตกหลายภาษา
- ภาษาสเปน : Á, Í, Ó และ Ú
- ภาษาฝรั่งเศส : À, Â, È, ê, Ë, Î, Ï, Ô, Œ, OE, Ù, Û และ Ÿ
- ภาษาโปรตุเกส : Á, À, Â, Ã, ã, ê, Í, Ó, Ô, Õ, õ และ Ú
- ภาษาคาตาลัน : À, È, Í, Ï, Ò, Ó และ Ú
- ภาษาอิตาลี : À, È, Ì, Ò และ Ù
- ภาษาไอซ์แลนด์ : Á, Ð, ð, Í, Ó, Ú, Ý, ý, Þ และ þ
- ภาษาเดนมาร์ก / นอร์เวย์ : Ø และ ø อักขระหมายเลข 237 (ED hex ) คือ phi ตัวเล็ก (แบบปิด) สามารถใช้แทนได้แม้ว่าจะแสดงผลได้ไม่ดีนัก (ยิ่งไปกว่านั้น มันมักจะถูกแปลงเป็น Unicode และ/หรือแสดงผลในฟอนต์ Unicode เป็น phi แบบเปิดหรือ phi แบบปิดแนวตั้ง ซึ่งแตกต่างจาก O ที่มีขีดมากยิ่งขึ้น) เพื่อเป็นการชดเชยชุดรหัสภาษาเดนมาร์ก / นอร์เวย์และ ไอ ซ์แลนด์ ( 865และ861 ) จึงแทนที่เครื่องหมายเซนต์ (¢) ด้วย ø และเครื่องหมายเยน (¥) ด้วย Ø
- สัญลักษณ์ อักษรกรีกส่วนใหญ่ถูกละเว้น ยกเว้นสัญลักษณ์ทางคณิตศาสตร์พื้นฐาน (สัญลักษณ์เหล่านั้นรวมอยู่ในหน้าโค้ดภาษากรีก737และ869แล้ว สัญลักษณ์กรีกบางส่วนที่อยู่ในหน้าโค้ด 437 อยู่แล้ว ได้ถูกเปลี่ยนรูปจากรูปแบบทางคณิตศาสตร์หรือวิทยาศาสตร์ให้ตรงกับการใช้งานจริงในภาษากรีก)
นอกจาก สัญลักษณ์สกุลเงิน เซนต์ (¢), ปอนด์สเตอร์ลิง (£) และเยน / หยวน (¥) แล้ว ยังมีสัญลักษณ์สกุลเงินของอดีตประเทศในยุโรปอีกสองสัญลักษณ์ ได้แก่ฟลอริน (ƒ, เนเธอร์แลนด์) และเปเซตา (₧, สเปน) การมีสัญลักษณ์เปเซตาถือเป็นเรื่องผิดปกติ เนื่องจากเปเซตาของสเปนไม่เคยเป็นสกุลเงินที่มีความสำคัญในระดับสากล และไม่เคยมีสัญลักษณ์เป็นของตัวเอง โดยใช้ตัวย่อว่า "Pt", "Pta", "Pts" หรือ "Ptas" เท่านั้น อย่างไรก็ตาม เครื่องพิมพ์ดีดไฟฟ้า IBM รุ่นของสเปน ก็มีตำแหน่งสำหรับสัญลักษณ์เปเซตาอยู่หนึ่งตำแหน่งด้วย
ชุดอักขระ DOS รุ่นต่อมา เช่นรหัสหน้า 850 (DOS Latin-1), รหัสหน้า 852 (DOS Central-European) และรหัสหน้า 737 (DOS Greek) ได้เติมเต็มช่องว่างสำหรับการใช้งานในระดับสากล โดยมีความเข้ากันได้กับรหัสหน้า 437 ในระดับหนึ่ง ด้วยการคงอักขระวาดกรอบเดี่ยวและคู่ไว้ ในขณะที่ตัดอักขระแบบผสมออกไป ( เช่นกรอบคู่แนวนอน/กรอบเดี่ยวแนวตั้ง) อักขระทั้งหมดในรหัสหน้า 437 มีสัญลักษณ์ที่คล้ายกันในUnicode และในชุดอักขระ WGL4ของ Microsoft ดังนั้นจึงมีอยู่ในฟอนต์ส่วนใหญ่ในMicrosoft Windowsและในฟอนต์ VGA เริ่มต้นของ เคอร์เนล Linuxและ ฟอนต์ ISO 10646สำหรับX11ด้วย
ดูเพิ่มเติม
- รหัส Alt
- ANSI
- เอเอสซีไอ
- อักขระกึ่งกราฟิก
- ชุดอักขระ Atari STที่ได้มาจากรหัสหน้า 437
หมายเหตุ
- ^ระบบที่มีจำหน่ายในประเทศแถบยุโรปตะวันออก อาหรับ และเอเชีย มักใช้ชุดอุปกรณ์ที่แตกต่างกัน อย่างไรก็ตาม ชุดอุปกรณ์เหล่านี้ได้รับการออกแบบให้ตรงกับมาตรฐาน 437 ให้มากที่สุดเท่าที่จะเป็นไปได้ คำว่า "OEM" ซึ่งย่อมาจาก "Original Equipment Manufacturer" บ่งชี้ว่าผู้ผลิตอาจเปลี่ยนแปลงชุดอุปกรณ์เพื่อให้ตรงกับความต้องการของตลาดต่างๆ
- ^ยกเว้น ẞ ซึ่งเพิ่งนำมาใช้ในปี 2017 และใช้เฉพาะในข้อความที่เป็นตัวพิมพ์ใหญ่ทั้งหมดเท่านั้น
- ^นอกจากนี้ยังครอบคลุมภาษาสำคัญรองๆ ของยุโรปตะวันตกบางภาษา รวมถึงภาษาอื่นๆ อีกบางภาษาอย่างครบถ้วน เช่น ภาษา บาสก์ภาษามาเลย์ และ อักษรละตินเติร์กเมนิสถาน ก่อนปี 1999แต่สาเหตุน่าจะมาจากการสร้างอักษรขึ้นโดยอิงจากอักษรเหล่านั้น มากกว่าที่จะเป็นในทางกลับกัน
ลิงก์ภายนอก
- แปลงกราฟิกวิดีโอแบบแมปหน่วยความจำของ IBM PC เป็น Unicodeบนเว็บไซต์ Unicode อย่างเป็นทางการ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ รหัสหน้า 437
รหัสหน้า 437 ( CCSID 437 ) คือ ชุดอักขระ ของ IBM PC (คอมพิวเตอร์ส่วนบุคคล) รุ่นดั้งเดิม [ 2 ] เรียกอีกอย่างว่า CP437 , OEM-US , OEM 437 [ 3 ] PC -8 [ 4 ] หรือ MS-DOS Latin US [ 5...
อะแดปเตอร์แสดงผล
คอมพิวเตอร์ IBM PC รุ่นดั้งเดิมมีฟอนต์นี้เป็นฟอนต์ขนาด 9×14 พิกเซลต่อตัวอักษรที่จัดเก็บไว้ใน ROM ของ IBM Monochrome Display Adapter (MDA) และฟอนต์ขนาด 8×8 พิกเซลต่อตัวอักษรของ การ์ด Color Graphics Adapter ( CGA ) IBM Enhanced Graphics Adapter (EGA)...
รหัส Alt
มรดกของโค้ดเพจ 437 คือชุดตัวเลขที่ใช้ในรหัส Alt ของ Windows [ 8 ] [ 9 ] [ 10 ] ผู้ ใช้ DOS สามารถป้อนอักขระได้โดยการกด ปุ่ม Alt ค้างไว้ และป้อนรหัสอักขระบน แป้นตัวเลข [ 8 ] และผู้ใช้หลายคนจดจำตัวเลขที่จำเป็นสำหรับ CP437 (หรือสำหรับ CP850 ที่คล้ายกัน ) แม้ว่า...
ชุดอักขระ
ตารางต่อไปนี้แสดงรหัสหน้า 437 แต่ละอักขระจะแสดงพร้อมกับ รหัสจุด Unicode ที่เทียบเท่า (เมื่อรหัสจุด Unicode ไม่เท่ากับรหัสของอักขระนั้น) คำแนะนำ (tooltip ) ซึ่งโดยทั่วไปจะปรากฏเฉพาะเมื่อชี้เมาส์ไปทางซ้ายของอักขระ จะแสดงชื่อรหัสจุด Unicode และ รหัส Alt...
