อ่าน 3 นาที
รหัสอักษรอินเดียสำหรับการแลกเปลี่ยนข้อมูล
รหัส ISCII ( Indian Script Code for Information Interchange ) เป็น ระบบการเข้ารหัส สำหรับแสดงระบบการเขียนต่างๆ ของ อินเดีย โดยเข้ารหัส อักษรหลักของภาษาอินเดีย...
รหัสอักษรอินเดียสำหรับการแลกเปลี่ยนข้อมูล
รหัส ISCII ( Indian Script Code for Information Interchange ) เป็นระบบการเข้ารหัสสำหรับแสดงระบบการเขียนต่างๆ ของอินเดียโดยเข้ารหัสอักษรหลักของภาษาอินเดียและการถอดเสียงเป็นอักษรโรมัน อักษรที่รองรับได้แก่เบงกาลี-อัสสัมเทวนาครีคุชราตีกูรมุขี กันนา ดา มาลายาลัมโอเดีย ทมิฬและเตลูกู ISCII ไม่เข้ารหัสระบบการเขียนของอินเดียที่ใช้ภาษาเปอร์เซีย เป็นพื้นฐาน แต่รหัสการสลับระบบการเขียนของ ISCII ก็รองรับภาษาแคชเมียร์สินธี อู ร์ดูเปอร์เซียปัชโตและอาหรับต่อมา ระบบการเขียนที่ใช้ภาษาเปอร์เซียเป็นพื้นฐานได้รับการเข้ารหัสในระบบ PASCII
ISCII ไม่ได้ถูกนำมาใช้อย่างแพร่หลายนอกเหนือจากสถาบันของรัฐบางแห่ง แม้ว่าจะมีการใช้รูปแบบที่ไม่มีกลไกATR บน Mac OS รุ่นคลาสสิก Mac OS Devanagari [ 1 ] และปัจจุบันก็ล้าสมัยไปแล้วโดยUnicode Unicode ใช้บล็อกแยกต่างหากสำหรับแต่ละระบบการเขียนภาษาอินเดีย และส่วนใหญ่ยังคงรักษาเค้าโครง ISCII ไว้ภายในแต่ละบล็อก[ 2 ] : 462
พื้นหลัง
ระบบการเขียนที่ได้มาจากอักษรพราห์มีมีโครงสร้างที่คล้ายคลึงกัน[ 2 ] : 462 ดังนั้น ISCII จึงเข้ารหัสตัวอักษรที่มีค่าเสียงเดียวกันที่จุดรหัสเดียวกัน โดยซ้อนทับสคริปต์ต่างๆ ตัวอย่างเช่น รหัส ISCII 0xB3 0xDB แทน [ki] ซึ่งจะแสดงเป็น കി ในภาษามาลายาลัม, कि ในอักษรเทวนาครี, ਕਿ ในอักษรคุรมุขี และ கி ในภาษาทมิฬ สามารถเลือกระบบการเขียนได้ในข้อความแบบ Rich Text โดยใช้มาร์กอัป หรือในข้อความธรรมดาโดยใช้ รหัส ATRที่อธิบายไว้ด้านล่าง
แรงจูงใจประการหนึ่งในการใช้การเข้ารหัสแบบเดียวคือแนวคิดที่ว่าจะช่วยให้การถอดเสียงจากระบบการเขียนหนึ่งไปยังอีกระบบหนึ่งทำได้ ง่าย [ 2 ] : 462 อย่างไรก็ตาม มีความไม่เข้ากันมากพอที่จะทำให้แนวคิดนี้ไม่สามารถนำไปใช้ได้จริง
ISCII เป็นการเข้ารหัส 8 บิต[ 3 ] : 4 รหัสจุด 128 รหัสล่างเป็นASCII ธรรมดา รหัสจุด 128 รหัสบนเป็นรหัสเฉพาะของ ISCII นอกจากรหัสจุดที่ใช้แทนอักขระแล้ว ISCII ยังใช้รหัสจุดที่มีตัวย่อATRซึ่งระบุว่าไบต์ถัดไปมีข้อมูลสองประเภท ชุดค่าหนึ่งจะเปลี่ยนระบบการเขียนจนกว่าจะถึงตัวบ่งชี้ระบบการเขียนถัดไปหรือสิ้นสุดบรรทัด ชุดค่าอีกชุดหนึ่งจะเลือกโหมดการแสดงผล เช่น ตัวหนาและตัวเอียง ISCII ไม่มีวิธีการระบุระบบการเขียนเริ่มต้น
เค้าโครงหน้าโค้ด
ตารางต่อไปนี้แสดงชุดอักขระสำหรับเทวนาครีชุดรหัสสำหรับอัสสัม เบงกาลี คุชราตี กูรมุขี กันนาดา มาลายาลัม โอริยา ทมิฬ และเตลูกู มีความคล้ายคลึงกัน โดยแต่ละรูปแบบของเทวนาครีจะถูกแทนที่ด้วยรูปแบบที่เทียบเท่ากันในแต่ละระบบการเขียน[ 2 ] : 462 อักขระแต่ละตัวแสดงด้วยรหัสทศนิยมและรหัสยูนิโค้ดที่เทียบเท่ากัน
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | เอ | บี | ซี | ดี | อี | เอฟ | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0x | นูแอล | เอสโอเอช | เอสทีเอ็กซ์ | อีทีเอ็กซ์ | อีโอที | เอ็นคิว | แอก | เบล | ปริญญาตรี | เอชที | แอลเอฟ | วีที | เอฟเอฟ | ซีอาร์ | ดังนั้น | ไอเอส |
| 1x | ดีแอลอี | ดีซี1 | ดีซี2 | ดีซี3 | ดีซี4 | นาค | ซิน | อีทีบี | สามารถ | อีเอ็ม | ซับ | เอสเอส | เอฟเอส | จีเอส | อาร์เอส | เรา |
| 2x | เอสพี | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | เอ | บี | ซี | ดี | อี | เอฟ | จี | ชม | ฉัน | เจ | เค | แอล | เอ็ม | เอ็น | โอ |
| 5x | พี | คิว | อาร์ | เอส | ที | ยู | วี | ว | X | วาย | ซ | [ | \ | ] | ^ | _ |
| 6x | ' | เอ | ข | ค | ง | อี | เอฟ | จี | ชม. | ฉัน | เจ | เค | ล | ม | n | โอ |
| 7x | พี | q | ร | ส | ที | คุณ | วี | ว | x | y | z | { | | | } | ~ | เดล |
| 8x | ||||||||||||||||
| 9x | ||||||||||||||||
| ขวาน | อุ | ม | ः | อ | อา | อิ | อี | उ | อุ | ऋ | เอ | เอ | ऐ | ऍ | ऒ | |
| บีเอ็กซ์ | โอ | औ | ऑ | क | ข | ग | घ | ङ | च | छ | จ | झ | ञ | ต | ठ | ด |
| ซีเอ็กซ์ | ढ | ण | ต | थ | ด | ध | น | ऩ | ป | ฟ | บ | भ | ม | ย | य़ | ร |
| ดีเอ็กซ์ | ऱ | ล | ळ | ऴ | ว | श | ष | ส | ह | อินวี | ा | ि | ी | ु | ू | ृ |
| อดีต | ॆ | े | ै | ॅ | ॊ | ो | ौ | ॉ | ् | ़ | । | เอทีอาร์ | ||||
| เอฟเอ็กซ์ | ภายนอก | 0 | 1 | 2 | 3 | 4 | 5 | 6 | ७ | 8 | 9 |
รหัสพิเศษ
- อักขระ INV—รหัสจุด D9 (217)
- อักขระ INV (พยัญชนะที่มองไม่เห็น) ถูกใช้เป็นพยัญชนะเสมือนเพื่อแสดงองค์ประกอบที่รวมกันในลักษณะแยกเดี่ยว ตัวอย่างเช่น क (ka) + ् (halant) + INV = क् (ครึ่ง ka) เทียบเท่าใน Unicode คือU+200D ZERO WIDTH JOINER ( ZWJ ) อย่างไรก็ตาม ดังที่กล่าวไว้ด้านล่างอักขระ halant ของ ISCII สามารถทำซ้ำหรือรวมกับ nukta ของ ISCII เพื่อให้ได้เอฟเฟกต์ที่สร้างโดยZWNJหรือ ZWJ ใน Unicode ด้วยเหตุนี้Appleจึงแมปอักขระ INV ของ ISCII ไปยังเครื่องหมายซ้ายไปขวา ของ Unicode เพื่อรับประกันการแปลงไปกลับ[ 1 ]
- อักขระ ATR—รหัสจุด EF (239)
- อักขระ ATR (แอตทริบิวต์) ตามด้วยไบต์โค้ด ใช้สำหรับสลับไปยังแอตทริบิวต์ของฟอนต์อื่น (เช่น ตัวหนา) หรือไปยังภาษา ISCII หรือPASCII อื่น (เช่น ภาษาเบงกาลี) จนถึงลำดับ ATR ถัดไปหรือจนถึงท้ายบรรทัด ไม่มีอักขระที่เทียบเท่าโดยตรงใน Unicode เนื่องจากแอตทริบิวต์ของฟอนต์ไม่ได้เป็นส่วนหนึ่งของ Unicode และแต่ละสคริปต์มีชุดจุดรหัสที่แตกต่างกัน
| เอทีอาร์ + ไบต์ | ตัวช่วยจำ | ตัวเลือกการจัดรูปแบบ |
|---|---|---|
| 0x30 | บลัด | ตัวหนา |
| 0x31 | อิตาลี | ตัวเอียง |
| 0x32 | ยูแอล | ขีดเส้นใต้ |
| 0x33 | เอ็กซ์พี | ขยาย |
| 0x34 | เอชแอลที | ไฮไลท์ |
| 0x35 | OTL | โครงร่าง |
| 0x36 | เอสเอชดี | เงา |
| 0x37 | สูงสุด | ครึ่งบนของตัวละคร (ใช้ร่วมกับ LOW เพื่อสร้างตัวละครที่มีความสูงสองเท่า) |
| 0x38 | ต่ำ | ครึ่งล่างของตัวละคร (ใช้ร่วมกับ TOP เพื่อสร้างตัวละครที่มีความสูงสองเท่า) |
| 0x39 | ดีบีแอล | ทั้งแถวมีความกว้างและความสูงเป็นสองเท่า |
| เอทีอาร์ + ไบต์ | ตัวช่วยจำ | สคริปต์ ISCII |
|---|---|---|
| 0x40 | ดีเอฟ | สคริปต์เริ่มต้น (เช่น สคริปต์ที่จะถูกสลับกลับไปใช้หลังจากขึ้นบรรทัดใหม่) |
| 0x41 | อาร์เอ็มเอ็น | การถอดเสียงเป็นอักษรโรมัน |
| 0x42 | นักพัฒนา | เทวนาครี |
| 0x43 | บีเอ็นจี | อักษรเบงกาลี |
| 0x44 | ทีเอ็มแอล | อักษรทมิฬ |
| 0x45 | ทีแอลจี | อักษรเตลูกู |
| 0x46 | เอเอสเอ็ม | อักษรอัสสัม |
| 0x47 | โอริ | อักษรโอเดีย |
| 0x48 | เคเอ็นดี | อักษรกันนาดา |
| 0x49 | MLM | อักษรมาลายาลัม |
| 0x4A | จีเจอาร์ | อักษรคุชราตี |
| 0x4B | พีเอ็นเจ | กูร์มุคี |
| เอทีอาร์ + ไบต์ | ตัวช่วยจำ | ภาษา PASCII |
|---|---|---|
| 0x71 | อาร์บี | อักษรอาหรับ |
| 0x72 | พีเอส | อักษรเปอร์เซีย |
| 0x73 | ยูอาร์ดี | อักษรภาษาอูร์ดู |
| 0x74 | เอสเอ็นดี | อักษรสินธี |
| 0x75 | เคเอสเอ็ม | อักษรแคชเมียร์ |
| 0x76 | PST | อักษรปัชโต |
- อักขระ EXT—รหัสจุด F0 (240)
- อักขระ EXT (ส่วนขยายสำหรับอักษรเวท) ที่ตามด้วยไบต์โค้ด แสดงถึงเครื่องหมายเน้นเสียงในอักษรเวท ซึ่งไม่มีตัวเทียบเท่าโดยตรงในยูนิโค้ด เนื่องจากเครื่องหมายเน้นเสียงในอักษรเวทถูกกำหนดให้กับจุดรหัสที่แตกต่างกัน
- อักขระ Halant ्—รหัสจุด E8 (232)
- อักขระฮาลันต์ (halant) จะลบสระแฝงออกจากพยัญชนะ และใช้ระหว่างพยัญชนะเพื่อแสดงพยัญชนะควบ ตัวอย่างเช่น ก (ka) + ् (halant) + ต (ta) = กต (kta) ลำดับ ् (halant) + ् (halant) แสดงพยัญชนะควบที่มีฮาลันต์ชัดเจน ตัวอย่างเช่น ก (ka) + ् (halant) + ् (halant) + ต (ta) = กต ลำดับ ् (halant) + ़ (nukta) แสดงพยัญชนะควบที่มีพยัญชนะครึ่งเสียง หากมี ตัวอย่างเช่น ก (ka) + ् (halant) + ़ (nukta) + ต (ta) = กต
| ไอเอสไอไอ | ยูนิโค้ด | ||
|---|---|---|---|
| ฮาลันต์เดี่ยว | E8 | ฮาลันต์ | 094D |
| ฮาลันต์ + ฮาลันต์ | E8 E8 | ฮาลันท์ + ZWNJ | 094D 200C |
| ฮาลันต์ + นุกตะ | E8 E9 | ฮาลันท์ + ZWJ | 094D 200D |
- อักขระนุกตะ ़—รหัสจุด E9 (233)
- อักขระ นุ กตะที่อยู่หลังอักขระ ISCII ตัวอื่น ใช้สำหรับอักขระหายากจำนวนหนึ่งที่ไม่มีอยู่ในชุดอักขระ ISCII หลัก ตัวอย่างเช่น ก (ka) + ़ (นุกตะ) = ก (qa) อักขระเหล่านี้มีรูปแบบที่ประกอบขึ้นแล้วใน Unicode ดังแสดงในตารางต่อไปนี้
| รหัสISCII | ตัวละครดั้งเดิม | ตัวละครที่มีนุกตะ | รหัสจุด ยูนิโค้ด |
|---|---|---|---|
| A1 (161) | อุ | ॐ | 0950 |
| A6 (166) | อิ | ऌ | 090C |
| A7 (167) | อี | ॡ | 0961 |
| AA (176) | ऋ | ॠ | 0960 |
| บี3 (179) | क | क़ | 0958 |
| บี4 (180) | ข | ख़ | 0959 |
| บี5 (181) | ग | ग़ | 095A |
| BA (186) | จ | จ | 095บี |
| บีเอฟ (191) | ด | ड़ | 095C |
| C0 (192) | ढ | ढ़ | 095D |
| ซี9 (201) | ฟ | ฟ | 095E |
| DB (219) | ि | ॢ | 0962 |
| ดีซี (220) | ी | ॣ | 0963 |
| DF (223) | ृ | ॄ | 0944 |
| อีเอ (234) | । | ऽ | 093D |
รหัสหน้าสำหรับการแปลง ISCII
ในการแปลงจาก Unicode (UTF-8) ไปเป็นการเข้ารหัส ISCII / ANSI สามารถใช้ชุดรหัสต่อไปนี้ได้:
- 57002: เทวนาครี (ฮินดี มราฐี สันสกฤต กอนกานี)
- 57003: ภาษาเบงกาลี
- 57004: ทมิฬ
- 57005: เตลูกู
- 57006: ภาษาอัสสัม
- 57007: โอเดีย
- 57008: กันนาดา
- 57009: มาลายาลัม
- 57010: คุชราตี
- 57011: ภาษาปัญจาบ (อักษรคุรมุขี)
รหัสจุดสำหรับทุกภาษา
| เฮกซ์ | รายชื่ออย่างเป็นทางการ | ไอโอเอส 15919 | เทวนาครี | เบงกาลี | ชาวอัสสัม | กูรมุขี | กุจาราติ | โอริยา | ทมิฬ | เตลูกู | กันนาดา | มาลายาลัม | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| เอ0 | เซ็นต์โอเอ็ม | Ōm̐ | ॐ | 0950 | ૐ | 0AD0 | ||||||||||||||||
| เอ1 | ตัวปรับสระCHANDRABINDU | ม̐ | อุ | 0901 | อุ | 0981 | อุ | 0981 | ਁ | 0A01 | ઁ | 0A81 | ଁ | 0B01 | ఁ | 0C01 | ||||||
| เอ2 | ตัวปรับเสียงสระANUSWARAM | ṁ | ม | 0902 | ง | 0982 | ง | 0982 | ਂ | 0A02 | อุ | 0A82 | อุ | 0B02 | ஂ | 0B82 | ం | 0C02 | ಂ | 0C82 | ം | 0D02 |
| เอ3 | ตัวปรับสระVISARGAM | ชม | ः | 0903 | ঃ | 0983 | ঃ | 0983 | ਃ | 0A03 | ઃ | 0A83 | ଃ | 0B03 | ஃ | 0B83 | ః | 0C03 | ಃ | 0C83 | ഃ | 0D03 |
| เอ4 | สระ A | เอ | อ | 0905 | อ | 0985 | อ | 0985 | อ | 0A05 | อ | 0A85 | อ | 0B05 | อ | 0B85 | అ | 0C05 | อ | 0C85 | อ | 0D05 |
| เอ5 | สระ AA | อา | อา | 0906 | อา | 0986 | อา | 0986 | ਆ | 0A06 | આ | 0A86 | ଆ | 0B06 | ஆ | 0B86 | ఆ | 0C06 | ಆ | 0C86 | ആ | 0D06 |
| เอ6 | สระ I | ฉัน | อิ | 0907 | อิ | 0987 | อิ | 0987 | ਇ | 0A07 | ઇ | 0A87 | ଇ | 0B07 | இ | 0B87 | ఇ | 0C07 | ಇ | 0C87 | ഇ | 0D07 |
| เอ6* | สระ LI (ภาษาสันสกฤต) | ḷ | ऌ | 090C | ঌ | 098ซี | ঌ | 098ซี | ઌ | 0A8C | ଌ | 0B0C | ఌ | 0C0C | ಌ | 0C8C | ഌ | 0D0C | ||||
| เอ7 | สระ II | ฉัน | อี | 0908 | อี | 0988 | อี | 0988 | ਈ | 0A08 | ઈ | 0A88 | ଈ | 0B08 | ஈ | 0B88 | ఈ | 0C08 | ಈ | 0C88 | ഈ | 0D08 |
| เอ7* | สระที่ 52 (ภาษาสันสกฤต) | ḹ | ॡ | 0961 | ৡ | 09E1 | ৡ | 09E1 | ૡ | 0AE1 | ୡ | 0B61 | ౡ | 0C61 | ೡ | 0CE1 | ൡ | 0D61 | ||||
| เอ8 | สระ U | คุณ | उ | 0909 | อุ | 0989 | อุ | 0989 | ਉ | 0A09 | ઉ | 0A89 | ଉ | 0B09 | உ | 0B89 | ఉ | 0C09 | ಉ | 0C89 | ഉ | 0D09 |
| เอ9 | สระ UU | ū | อุ | 090เอ | อุ | 098A | อุ | 098A | ਊ | 0A0A | ઊ | 0A8A | ଊ | 0B0A | ஊ | 0B8A | ఊ | 0C0A | ಊ | 0C8A | ഊ | 0D0A |
| เอเอ | สระ RI | ร̥ | ऋ | 090บี | ঋ | 098B | ঋ | 098B | ઋ | 0A8B | ଋ | 0B0B | ఋ | 0C0B | ಋ | 0C8B | ഋ | 0D0B | ||||
| เอเอ* | สระ RII (ภาษาสันสกฤต) | ṝ | ॠ | 0960 | ৠ | 09E0 | ৠ | 09E0 | ૠ | 0AE0 | ୠ | 0B60 | ౠ | 0C60 | ೠ | 0CE0 | ൠ | 0D60 | ||||
| เอบี | สระ E (อักษรทางใต้) | อี | เอ | 090E | எ | 0B8E | ఎ | 0C0E | ಎ | 0C8E | എ | 0D0E | ||||||||||
| เอซี | สระ EY | เอ | เอ | 090F | เอ | 098F | เอ | 098F | ਏ | 0A0F | એ | 0A8F | ଏ | 0B0F | ஏ | 0B8F | ఏ | 0C0F | ಏ | 0C8F | ഏ | 0D0F |
| โฆษณา | สระ AI | AI | ऐ | 0910 | ঐ | 0990 | ঐ | 0990 | ਐ | 0A10 | ઐ | 0A90 | ଐ | 0B10 | ஐ | 0B90 | ఐ | 0C10 | ಐ | 0C90 | ഐ | 0D10 |
| เออี | สระ เอเย (อักษรเทวนาครี) | ê | ऍ | 090D | ઍ | 0A8D | ||||||||||||||||
| เอเอฟ | สระ O (อักษรทางใต้) | โอ | ऒ | 0912 | ஒ | 0B92 | ఒ | 0C12 | ಒ | 0C92 | ഒ | 0D12 | ||||||||||
| บี0 | สระ OW | โอ | โอ | 0913 | โอ | 0993 | โอ | 0993 | โอ | 0A13 | โอ | 0A93 | โอ | 0B13 | โอ | 0B93 | โอ | 0C13 | โอ | 0C93 | โอ | 0D13 |
| บี1 | สระ AU | au | औ | 0914 | อุ | 0994 | อุ | 0994 | ਔ | 0A14 | ઔ | 0A94 | ଔ | 0B14 | ஔ | 0B94 | ఔ | 0C14 | ಔ | 0C94 | ഔ | 0D14 |
| บี2 | สระ AWE (อักษรเทวนาครี) | โอ | ऑ | 0911 | ઑ | 0A91 | ||||||||||||||||
| บี3 | พยัญชนะ KA | เค | क | 09:15 น. | ก | 0995 | ก | 0995 | ਕ | 0A15 | ક | 0A95 | କ | 0B15 | க | 0B95 | క | 0C15 | ಕ | 0C95 | ക | 0D15 |
| บี3* | พยัญชนะ QA (ภาษาอูร์ดู) | q | क़ | 0958 | ||||||||||||||||||
| บี4 | พยัญชนะ KHA | kh | ข | 0916 | ข | 0996 | ข | 0996 | ਖ | 0A16 | ખ | 0A96 | ଖ | 0B16 | ఖ | 0C16 | ಖ | 0C96 | ഖ | 0D16 | ||
| บี4* | พยัญชนะ KHHA (ภาษาอูร์ดู) | kh | ख़ | 0959 | ਖ਼ | 0A59 | ||||||||||||||||
| บี5 | พยัญชนะ GA | จี | ग | 0917 | গ | 0997 | গ | 0997 | ਗ | 0A17 | ગ | 0A97 | ଗ | 0B17 | గ | 0C17 | ಗ | 0C97 | ഗ | 0D17 | ||
| บี5* | พยัญชนะ GHHA (ภาษาอูร์ดู) | ġ | ग़ | 095A | ਗ਼ | 0A5A | ||||||||||||||||
| บี6 | พยัญชนะ GHA | gh | घ | 0918 | ঘ | 0998 | ঘ | 0998 | ਘ | 0A18 | ઘ | 0A98 | ଘ | 0B18 | ఘ | 0C18 | ಘ | 0C98 | ഘ | 0D18 | ||
| บี7 | พยัญชนะ NGA | ṅ | ङ | 0919 | ง | 0999 | ง | 0999 | ਙ | 0A19 | ઙ | 0A99 | ଙ | 0B19 | ங | 0B99 | ఙ | 0C19 | ಙ | 0C99 | ങ | 0D19 |
| บี8 | พยัญชนะ CHA | ค | च | 091A | চ | 099A | চ | 099A | ਚ | 0A1A | ચ | 0A9A | ଚ | 0B1A | ச | 0B9A | చ | 0C1A | ಚ | 0C9A | ച | 0D1A |
| บี9 | พยัญชนะ CHHA | ช | छ | 091บี | ছ | 099บี | ছ | 099บี | ਛ | 0A1B | છ | 0A9B | ଛ | 0B1B | ఛ | 0C1B | ಛ | 0C9B | ഛ | 0D1B | ||
| บีเอ | พยัญชนะ JA | เจ | จ | 091ซี | จ | 099ซี | จ | 099ซี | ਜ | 0A1C | જ | 0A9C | ଜ | 0B1C | ஜ | 0B9C | జ | 0C1C | ಜ | 0C9C | ജ | 0D1C |
| ปริญญาตรี* | พยัญชนะ ZA (ภาษาอูร์ดู) | z | จ | 095บี | ਜ਼ | 0A5B | ||||||||||||||||
| BB | พยัญชนะ JHA | เจเอช | झ | 091D | ঝ | 099D | ঝ | 099D | ਝ | 0A1D | ઝ | 0A9D | ଝ | 0B1D | ఝ | 0C1D | ಝ | 0C9D | ഝ | 0D1D | ||
| บีซี | พยัญชนะ JNA | ñ | ञ | 091E | ঞ | 099E | ঞ | 099E | ਞ | 0A1E | ઞ | 0A9E | ଞ | 0B1E | ஞ | 0B9E | ఞ | 0C1E | ಞ | 0C9E | ഞ | 0D1E |
| บีดี | พยัญชนะแข็ง TA | ṭ | ต | 091F | ต | 099F | ต | 099F | ਟ | 0A1F | ટ | 0A9F | ଟ | 0B1F | ட | 0B9F | ట | 0C1F | ಟ | 0C9F | ട | 0D1F |
| เป็น | พยัญชนะแข็ง THA | ไทย | ठ | 0920 | ঠ | 09A0 | ঠ | 09A0 | ਠ | 0A20 | ઠ | 0AA0 | ଠ | 0B20 | ఠ | 0C20 | ಠ | 0CA0 | ഠ | 0D20 | ||
| บีเอฟ | พยัญชนะแข็ง DA | ḍ | ด | 0921 | ด | 09A1 | ด | 09A1 | ਡ | 0A21 | ડ | 0AA1 | ଡ | 0B21 | డ | 0C21 | ಡ | 0CA1 | ഡ | 0D21 | ||
| บีเอฟ* | พยัญชนะกระพือ DA | ṛ | ड़ | 095C | ด | 09ดีซี | ด | 09ดีซี | ੜ | 0A5C | ଡ଼ | 0B5C | ||||||||||
| C0 | พยัญชนะแข็ง DHA | ḍh | ढ | 0922 | ঢ | 09A2 | ঢ | 09A2 | ਢ | 0A22 | ઢ | 0AA2 | ଢ | 0B22 | ఢ | 0C22 | ಢ | 0CA2 | ഢ | 0D22 | ||
| C0* | พยัญชนะกระพือ DHA | ṛh | ढ़ | 095D | ঢ় | 09DD | ঢ় | 09DD | ଢ଼ | 0B5D | ||||||||||||
| ซี1 | พยัญชนะแข็ง NA | ṇ | ण | 0923 | ণ | 09A3 | ণ | 09A3 | ਣ | 0A23 | ણ | 0AA3 | ଣ | 0B23 | ண | 0BA3 | ణ | 0C23 | ಣ | 0CA3 | ണ | 0D23 |
| ซี2 | พยัญชนะอ่อน TA | ที | ต | 0924 | ต | 09A4 | ต | 09A4 | ต | 0A24 | ต | 0AA4 | ତ | 0B24 | த | 0BA4 | త | 0C24 | ತ | 0CA4 | ต | 0D24 |
| ซี3 | พยัญชนะอ่อน THA | ไทย | थ | 0925 | থ | 09A5 | থ | 09A5 | ਥ | 0A25 | થ | 0AA5 | ଥ | 0B25 | థ | 0C25 | ಥ | 0CA5 | ഥ | 0D25 | ||
| ซี4 | พยัญชนะอ่อน DA | ง | ด | 0926 | ด | 09A6 | ด | 09A6 | ด | 0A26 | ด | 0AA6 | ด | 0B26 | ద | 0C26 | ด | 0CA6 | ด | 0D26 | ||
| ซี5 | พยัญชนะอ่อน DHA | dh | ध | 0927 | ধ | 09A7 | ধ | 09A7 | ਧ | 0A27 | ધ | 0AA7 | ଧ | 0B27 | ధ | 0C27 | ಧ | 0CA7 | ധ | 0D27 | ||
| ซี6 | พยัญชนะอ่อน NA | n | น | 0928 | น | 09A8 | น | 09A8 | ਨ | 0A28 | ન | 0AA8 | ନ | 0B28 | ந | 0BA8 | న | 0C28 | ನ | 0CA8 | ന | 0D28 |
| ซี7 | พยัญชนะ NA (ภาษาทมิฬ) | ṉ | ऩ | 0929 | ன | 0BA9 | ||||||||||||||||
| ซี8 | พยัญชนะ PA | พี | ป | 092A | ป | 09AA | ป | 09AA | ਪ | 0A2A | પ | 0AAA | ପ | 0B2A | ப | 0BAA | ప | 0C2A | ಪ | 0CAA | പ | 0D2A |
| ซี9 | พยัญชนะ PHA | ph | ฟ | 092บี | ฟ | 09AB | ฟ | 09AB | ਫ | 0A2B | ફ | 0AAB | ଫ | 0B2B | ఫ | 0C2B | ಫ | 0CAB | ഫ | 0D2B | ||
| ซี9* | พยัญชนะ FA (ภาษาอูร์ดู) | เอฟ | ฟ | 095E | ਫ਼ | 0A5E | ೞ | 0CDE | ||||||||||||||
| ซีเอ | พยัญชนะ BA | ข | บ | 092ซี | บ | 09AC | บ | 09AC | ਬ | 0A2C | บ | 0AAC | ବ | 0B2C | బ | 0C2C | ಬ | 0CAC | บ | 0D2C | ||
| ซีบี | พยัญชนะ BHA | บีเอช | भ | 092D | ভ | 09AD | ভ | 09AD | ਭ | 0A2D | ભ | 0AAD | ଭ | 0B2D | భ | 0C2D | ಭ | 0CAD | ഭ | 0D2D | ||
| ซีซี | พยัญชนะ MA | ม | ม | 092E | ม | 09AE | ม | 09AE | ਮ | 0A2E | ม | 0AAE | ม | 0B2E | ม | 0BAE | ม | 0C2E | ม | 0CAE | ม | 0D2E |
| ซีดี | พยัญชนะ YA | y | ย | 092F | ย | 09AF | ย | 09AF | ਯ | 0A2F | ય | 0AAF | ଯ | 0B2F | ய | 0BAF | య | 0C2F | ಯ | 0CAF | യ | 0D2F |
| ซีอี | พยัญชนะ JYA (เบงกาลี อัสสัม และโอริยา) | ẏ | य़ | 095F | য় | 09DF | য় | 09DF | ୟ | 0B5F | ||||||||||||
| ซีเอฟ | พยัญชนะ RA | ร̥ | ร | 09:30 น. | ร | 09B0 | ৰ︎ | 09F0 | ਰ | 0A30 | ร | 0AB0 | ର | 0B30 | ர | 0BB0 | ర | 0C30 | ರ | 0CB0 | ര | 0D30 |
| ดี0 | พยัญชนะแข็ง RA (อักษรทางใต้) | ṟ | ऱ | 0931 | ற | 0BB1 | ఱ | 0C31 | ಱ | 0CB1 | റ | 0D31 | ||||||||||
| ดี1 | พยัญชนะ LA | ล | ล | 0932 | ล | 09B2 | ล | 09B2 | ล | 0A32 | ล | 0AB2 | ล | 0B32 | ล | 0BB2 | ల | 0C32 | ล | 0CB2 | ล | 0D32 |
| ดี2 | พยัญชนะแข็ง LA | ḷ | ळ | 0933 | ਲ਼ | 0A33 | ળ | 0AB3 | ଳ | 0B33 | ள | 0BB3 | ళ | 0C33 | ಳ | 0CB3 | ള | 0D33 | ||||
| ดี3 | พยัญชนะ ZHA (ทมิฬและมาลายาลัม) | ḻ | ऴ | 0934 | ழ | 0BB4 | ഴ | 0D34 | ||||||||||||||
| ดี4 | พยัญชนะ VA | วี | ว | 0935 | บ | 09AC | ৱ | 09F1 | ਵ | 0A35 | વ | 0AB5 | ଵ | 0B35 | வ | 0BB5 | వ | 0C35 | ವ | 0CB5 | വ | 0D35 |
| ดี5 | พยัญชนะ SHA | ś | श | 0936 | শ | 09B6 | শ | 09B6 | ਸ਼ | 0A36 | શ | 0AB6 | ଶ | 0B36 | ஶ | 0BB6 | శ | 0C36 | ಶ | 0CB6 | ശ | 0D36 |
| ดี6 | พยัญชนะแข็ง SHA | ṣ | ष | 0937 | ষ | 09B7 | ষ | 09B7 | ષ | 0AB7 | ଷ | 0B37 | ஷ | 0BB7 | ష | 0C37 | ಷ | 0CB7 | ഷ | 0D37 | ||
| ดี7 | พยัญชนะ SA | ส | ส | 0938 | ส | 09B8 | ส | 09B8 | ਸ | 0A38 | સ | 0AB8 | ସ | 0B38 | ஸ | 0BB8 | స | 0C38 | ಸ | 0CB8 | സ | 0D38 |
| ดี8 | พยัญชนะ HA | ชม. | ह | 0939 | হ | 09B9 | হ | 09B9 | ਹ | 0A39 | હ | 0AB9 | ହ | 0B39 | ஹ | 0BB9 | హ | 0C39 | ಹ | 0CB9 | ഹ | 0D39 |
| ดี9 | พยัญชนะที่มองไม่เห็น | |||||||||||||||||||||
| ดีเอ | สระ AA | อา | ा | 093E | อา | 09BE | อา | 09BE | ਾ | 0A3E | ા | 0ABE | ା | 0B3E | ா | 0BBE | ా | 0C3E | ಾ | 0CBE | ാ | 0D3E |
| ฐานข้อมูล | สระ 1 | ฉัน | ि | 093F | ি | 09บีเอฟ | ি | 09บีเอฟ | ਿ | 0A3F | િ | 0ABF | ି | 0B3F | ி | 0BBF | ి | 0C3F | ಿ | 0CBF | ി | 0D3F |
| DB* | สระ LI (ภาษาสันสกฤต) | ḷ | ॢ | 0962 | ৢ | 09E2 | ৢ | 09E2 | ૢ | 0AE2 | ୢ | 0B62 | ౢ | 0C62 | ೢ | 0CE2 | ൢ | 0D62 | ||||
| ดีซี | สระสัญลักษณ์ II | ฉัน | ी | 0940 | ী | 09C0 | ী | 09C0 | ੀ | 0A40 | ી | 0AC0 | ୀ | 0B40 | ீ | 0BC0 | ీ | 0C40 | ೀ | 0CC0 | ീ | 0D40 |
| ดีซี* | สระที่ 52 (ภาษาสันสกฤต) | ḹ | ॣ | 0963 | ৣ | 09E3 | ৣ | 09E3 | ૣ | 0AE3 | ୣ | 0B63 | ౣ | 0C63 | ೣ | 0CE3 | ൣ | 0D63 | ||||
| ดีดี | สระ U | คุณ | ु | 0941 | ু | 09C1 | ু | 09C1 | ੁ | 0A41 | ુ | 0AC1 | ୁ | 0B41 | ு | 0BC1 | ు | 0C41 | ು | 0CC1 | ു | 0D41 |
| ดีอี | สระ เครื่องหมาย UU | ū | ू | 0942 | ূ | 09C2 | ূ | 09C2 | ੂ | 0A42 | ૂ | 0AC2 | ୂ | 0B42 | ூ | 0BC2 | ూ | 0C42 | ೂ | 0CC2 | ൂ | 0D42 |
| ดีเอฟ | สระ RI | ร̥ | ृ | 0943 | ৃ | 09C3 | ৃ | 09C3 | ૃ | 0AC3 | ୃ | 0B43 | ృ | 0C43 | ೃ | 0CC3 | ൃ | 0D43 | ||||
| ดีเอฟ* | สระ RII (ภาษาสันสกฤต) | ṝ | ॄ | 0944 | ৄ | 09C4 | ৄ | 09C4 | ૄ | 0AC4 | ୄ | 0B44 | ౄ | 0C44 | ೄ | 0CC4 | ൄ | 0D44 | ||||
| อี0 | สระ E (อักษรทางใต้) | อี | ॆ | 0946 | ெ | 0BC6 | ె | 0C46 | ೆ | 0CC6 | െ | 0D46 | ||||||||||
| อี1 | สระ EY | เอ | े | 0947 | ে | 09C7 | ে | 09C7 | ੇ | 0A47 | ે | 0AC7 | େ | 0B47 | ே | 0BC7 | ే | 0C47 | ೇ | 0CC7 | േ | 0D47 |
| อี2 | สระสัญลักษณ์ AI | AI | ै | 0948 | ৈ | 09C8 | ৈ | 09C8 | ੈ | 0A48 | ૈ | 0AC8 | ୈ | 0B48 | ை | 0BC8 | ై | 0C48 | ೈ | 0CC8 | ൈ | 0D48 |
| อี3 | สระลงชื่อ AYE (อักษรเทวนาครี) | ê | ॅ | 0945 | ૅ | 0AC5 | ||||||||||||||||
| อี4 | สระ O (อักษรทางใต้) | โอ | ॊ | 094A | ொ | 0BCA | ొ | 0C4A | ೊ | 0CCA | ൊ | 0D4A | ||||||||||
| อี5 | สระ OW | โอ | ो | 094บี | ো | 09CB | ো | 09CB | ੋ | 0A4B | ો | 0ACB | ୋ | 0B4B | ோ | 0BCB | ో | 0C4B | ೋ | 0CCB | ോ | 0D4B |
| อี6 | สระสัญลักษณ์ AU | au | ौ | 094ซี | ৌ | 09ซีซี | ৌ | 09ซีซี | ੌ | 0A4C | ૌ | 0ACC | ୌ | 0B4C | ௌ | 0BCC | ౌ | 0C4C | ೌ | 0CCC | ൌ | 0D4C |
| อี7 | สระ AWE (อักษรเทวนาครี) | โอ | ॉ | 0949 | ૉ | 0AC9 | ||||||||||||||||
| อี8 | เครื่องหมายละสระ (ฮาลันต์) | ् | 094D | ্ | 09CD | ্ | 09CD | ੍ | 0A4D | ્ | 0ACD | ୍ | 0B4D | ் | 0BCD | ్ | 0C4D | ್ | 0CCD | ് | 0D4D | |
| อี9 | เครื่องหมายกำกับเสียง (นุกตัม) | ़ | 093ซี | ় | 09บีซี | ় | 09บีซี | ਼ | 0A3C | ઼ | 0ABC | ଼ | 0B3C | ಼ | 0ซีบีซี | |||||||
| อีเอ | จุดเต็ม (Viram, Northern Scripts) | । | 0964 | |||||||||||||||||||
| อีเอ* | เครื่องหมายเน้นเสียงสระอาวักร | ऽ | 093D | ঽ | 09BD | ঽ | 09BD | ઽ | 0ABD | ଽ | 0B3D | ఽ | 0C3D | ಽ | 0CBD | ഽ | 0D3D | |||||
| อีบี | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| อีซี | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| อีดี | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| อีอี | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| อีเอฟ | รหัสคุณลักษณะ | |||||||||||||||||||||
| เอฟ0 | รหัสต่อขยาย | |||||||||||||||||||||
| เอฟ1 | เลข 0 | 0 | 0966 | 0 | 09E6 | 0 | 09E6 | ੦ | 0A66 | ૦ | 0AE6 | ୦ | 0B66 | ௦ | 0BE6 | ౦ | 0C66 | ೦ | 0CE6 | ൦ | 0D66 | |
| เอฟ2 | เลขหลักที่ 1 | 1 | 0967 | 1 | 09E7 | 1 | 09E7 | ੧ | 0A67 | 1 | 0AE7 | ୧ | 0B67 | 1 | 0BE7 | ౧ | 0C67 | ೧ | 0CE7 | 1 | 0D67 | |
| เอฟ3 | เลข 2 | 2 | 0968 | 2 | 09E8 | 2 | 09E8 | ੨ | 0A68 | ૨ | 0AE8 | ୨ | 0B68 | ௨ | 0BE8 | ౨ | 0C68 | ೨ | 0CE8 | ൨ | 0D68 | |
| เอฟ4 | เลข 3 | 3 | 0969 | 3 | 09E9 | 3 | 09E9 | ੩ | 0A69 | ૩ | 0AE9 | ୩ | 0B69 | ௩ | 0BE9 | ౩ | 0C69 | ೩ | 0CE9 | ൩ | 0D69 | |
| เอฟ5 | เลข 4 | 4 | 096A | 4 | 09EA | 4 | 09EA | ੪ | 0A6A | ૪ | 0AEA | ୪ | 0B6A | ௪ | 0BEA | ౪ | 0C6A | ೪ | 0CEA | ൪ | 0D6A | |
| เอฟ6 | เลข 5 | 5 | 096บี | 5 | 09EB | 5 | 09EB | ੫ | 0A6B | ૫ | 0AEB | ୫ | 0B6B | ௫ | 0BEB | ౫ | 0C6B | ೫ | 0CEB | ൫ | 0D6B | |
| เอฟ7 | เลข 6 | 6 | 096ซี | 6 | 09EC | 6 | 09EC | ੬ | 0A6C | ૬ | 0AEC | ୬ | 0B6C | ௬ | 0BEC | ౬ | 0C6C | ೬ | 0ซีซี | ൬ | 0D6C | |
| เอฟ8 | เลข 7 | ७ | 096D | 7 | 09ED | 7 | 09ED | ੭ | 0A6D | ૭ | 0AED | ୭ | 0B6D | ௭ | 0 เตียง | ౭ | 0C6D | ೭ | 0ซีดี | ൭ | 0D6D | |
| เอฟ9 | เลข 8 | 8 | 096E | 8 | 09EE | 8 | 09EE | ੮ | 0A6E | ૮ | 0AEE | ୮ | 0B6E | ௮ | 0BEE | ౮ | 0C6E | ೮ | 0CEE | ൮ | 0D6E | |
| เอฟเอ | เลข 9 | 9 | 096F | 9 | 09EF | 9 | 09EF | ੯ | 0A6F | ૯ | 0AEF | ୯ | 0B6F | ௯ | 0BEF | ౯ | 0C6F | ೯ | 0CEF | ൯ | 0D6F | |
| FB | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| เอฟซี | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| เอฟดี | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| เอฟอี | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
| เอฟเอฟ | ยังไม่ได้ใช้งาน | |||||||||||||||||||||
ลิงก์ภายนอก
- โปรแกรมแปลงไฟล์จาก/เป็น ISCII และจาก/ไปยังฟอนต์ต่างๆ
- Padma – ส่วนเสริมของ Mozilla สำหรับแปลง ISCII เป็น Unicode เก็บถาวรเมื่อ 2019-10-01 ที่Wayback Machine
- Padma – ตัวแปลงจาก ISCII เป็น Unicode สำหรับภาษาเตลูกู
- สคริปต์ PHP สำหรับแปลง ISCII เป็น Unicode
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ รหัสอักษรอินเดียสำหรับการแลกเปลี่ยนข้อมูล
รหัส ISCII ( Indian Script Code for Information Interchange ) เป็น ระบบการเข้ารหัส สำหรับแสดงระบบการเขียนต่างๆ ของ อินเดีย โดยเข้ารหัส อักษรหลักของภาษาอินเดีย...
พื้นหลัง
ระบบการเขียนที่ได้มาจากอักษรพราห์มีมีโครงสร้างที่คล้ายคลึงกัน [ 2 ] : 462 ดังนั้น ISCII จึงเข้ารหัสตัวอักษรที่มีค่าเสียงเดียวกันที่จุดรหัสเดียวกัน โดยซ้อนทับสคริปต์ต่างๆ ตัวอย่างเช่น รหัส ISCII 0xB3 0xDB แทน [ki] ซึ่งจะแสดงเป็น കി ใน ภาษามาลายา ลัม, कि...
เค้าโครงหน้าโค้ด
ตารางต่อไปนี้แสดงชุดอักขระสำหรับ เทวนาครี ชุดรหัสสำหรับอัสสัม เบงกาลี คุชราตี กูรมุขี กันนาดา มาลายาลัม โอริยา ทมิฬ และเตลูกู มีความคล้ายคลึงกัน โดยแต่ละรูปแบบของเทวนาครีจะถูกแทนที่ด้วย รูปแบบที่เทียบเท่ากันในแต่ละระบบการเขียน [ 2 ] : 462...
รหัสพิเศษ
อักขระ INV—รหัสจุด D9 (217) อักขระ INV (พยัญชนะที่มองไม่เห็น) ถูกใช้เป็นพยัญชนะเสมือนเพื่อแสดงองค์ประกอบที่รวมกันในลักษณะแยกเดี่ยว ตัวอย่างเช่น क (ka) + ् (halant) + INV = क् (ครึ่ง ka) เทียบเท่าใน Unicode คือ U+200D ZERO WIDTH JOINER ( ZWJ ) อย่างไรก็ตาม...