กลับไปหน้าบทความ

อ่าน 4 นาที

ตัวเลขในยูนิโค้ด

ตัวเลข(มักเรียกว่าnumberในUnicode ) คืออักขระที่ใช้แทนจำนวนตัวเลขทศนิยม 0–9ถูกใช้กันอย่างแพร่หลายในระบบการเขียนต่างๆ ทั่วโลก อย่างไรก็ตามตัวอักษร ที่ใช้แทนตัวเลขทศนิยม...

ตัวเลขในยูนิโค้ด

ตัวเลข(มักเรียกว่าnumberในUnicode ) คืออักขระที่ใช้แทนจำนวนตัวเลขทศนิยม 0–9ถูกใช้กันอย่างแพร่หลายในระบบการเขียนต่างๆ ทั่วโลก อย่างไรก็ตามตัวอักษร ที่ใช้แทนตัวเลขทศนิยม นั้นแตกต่างกันอย่างมาก ดังนั้น Unicode จึงมีชุดตัวอักษรสำหรับตัวเลขทศนิยมถึง 22 ชุด รวมถึงจุดทศนิยม เครื่องหมายคั่นหลักพัน เครื่องหมายลบ ฯลฯ Unicode ยังมี ตัวเลข ที่ไม่ใช่ทศนิยม อีกหลายตัว เช่นตัวเลขอีเจียนตัวเลขโรมัน ตัวเลขแท่งนับ ตัวเลขมายา ตัวเลข คู นิฟอร์มและตัวเลขกรีกโบราณ นอกจากนี้ยังมี ตัวเลขอาหรับตะวันตกหลายแบบที่ใช้สำหรับการพิมพ์ เพื่อใช้ในทางคณิตศาสตร์โดยเฉพาะ และเพื่อให้เข้ากันได้กับชุดอักขระรุ่นก่อนหน้า เช่น²หรือ ② และอักขระผสม เช่น ½

ตัวเลขตามคุณสมบัติเชิงตัวเลข

ตามคุณสมบัติเชิงตัวเลขที่ใช้ในข้อความ Unicode มีค่าสำหรับประเภทตัวเลขอยู่สี่ค่า ค่าแรกคือ "ไม่ใช่ตัวเลข" ค่าถัดมาคือ ตัวเลข ฐานสิบซึ่งใช้กันทั่วไปในระบบเลขฐานสิบแบบตะวันตก (0-9) ค่าที่สามคือตัวเลขที่ไม่ใช่ส่วนหนึ่งของระบบเลขฐานสิบ เช่น เลขโรมัน และค่าสุดท้ายคือตัวเลขฐานสิบในบริบทการพิมพ์ เช่น ตัวเลขที่อยู่ในวงกลม ส่วนการกำหนดหมายเลขแบบ "ABC" สำหรับการกำหนดหมายเลขบทนั้น ไม่ได้ถูกกล่าวถึงไว้ใน Unicode

ประเภทตัวเลข[a] [b]  ( คุณสมบัติอักขระยูนิโค้ด )
ประเภทตัวเลขรหัสมีค่าเป็นตัวเลขตัวอย่างหมายเหตุ
ไม่ใช่ตัวเลข<none>เลขที่
  • เอ
  • X  (ละติน)
  • !
  • μ
ค่าตัวเลข="NaN"
ทศนิยมDeใช่
  • 0
  • 1
  • 9
  • 6  (เทวนาครี 6)
  •  (กันนาดา 6)
  • 6  (แบบอักษรคณิตศาสตร์ sans serif)
ตัวเลขตรง ( ฐาน สิบ ) สอดคล้องทั้งสองทางกับหมวดหมู่ทั่วไป = Nd [a]
ตัวเลขDiใช่
  • ¹  (ตัวยก)
  •  (ตัวเลขที่มีจุด)
ทศนิยม แต่ในบริบทของการพิมพ์
ตัวเลขNuใช่
  • ¾
  •  (เลขสิบในภาษาทมิฬ)
  •  (เลขโรมัน)
  •  (ฮั่นหมายเลข 6)
ค่าตัวเลข แต่ไม่ใช่ค่าฐานสิบ
ก. ^ "ส่วนที่ 4.6: ค่าตัวเลข" . มาตรฐานยูนิโค้ด . สมาคมยูนิโค้ด . กันยายน 2025.
b. ^ "ประเภทตัวเลขที่ได้มาจากยูนิโค้ด"ฐานข้อมูลอักขระยูนิโค้ดสมาคมยูนิโค้ด 30 มิถุนายน 2025

เลขฐานสิบหก

ตัวเลขฐานสิบหกในยูนิโค้ดไม่ใช่ตัวอักษรแยกต่างหาก แต่ใช้ตัวอักษรและตัวเลขที่มีอยู่แล้ว ตัวอักษรเหล่านี้มีคุณสมบัติเฉพาะ (Character properties)Hex_digit=Yes ที่ระบุไว้ และASCII_Hex_digit=Yesเมื่อเหมาะสมก็จะมีข้อมูล เพิ่มเติมด้วย

อักขระใน Unicode ที่มีเครื่องหมาย[a]Hex_Digit=Yes
0123456789ABCDEFภาษาละตินพื้นฐาน ตัวพิมพ์ใหญ่อีกด้วยASCII_Hex_Digit=Yes
0123456789abcdefภาษาละตินพื้นฐาน ตัวอักษรเล็กอีกด้วยASCII_Hex_Digit=Yes
0123456789ABCDEFแบบฟอร์มเต็มความกว้างตัวพิมพ์ใหญ่
0123456789abcdefแบบฟอร์มเต็มความกว้าง ตัวอักษรขนาดเล็ก
a. ^ "Unicode 17.0 UCD: PropList.txt" . 2025-06-30 . เรียกดูเมื่อ2025-09-11 .

ตัวเลขโดยการเขียน

ตัวเลขฮินดู-อารบิก

ระบบตัวเลขฮินดู-อารบิกประกอบด้วยตัวเลขสิบหลักแทนค่า 0-9 ยูนิโค้ดรวมตัวเลขอารบิกตะวันตก ไว้ ในบล็อก Basic Latin (หรือที่ได้มาจาก ASCII) ตัวเลขเหล่านี้ถูกใช้ซ้ำในอักษรอื่นๆ อีกหลายภาษา ได้แก่อารบิกตะวันออกบาหลี เบงกาลี เทวนาครี เอธิโอเปีย คุชราตี กูรมุขี เตลูกู เขมร ลาว ลิมบู มาลายาลัม มองโกล เมียนมาร์ นิวไทลึง นโก โอริยา เตลูกู ไทย ทิเบต และออตโตมันยา ยูนิโค้ดมีคุณสมบัติค่าตัวเลขสำหรับแต่ละหลักเพื่อช่วยในการเรียงลำดับและการประมวลผลข้อความอื่นๆ อย่างไรก็ตาม ไม่มีแผนที่เชื่อมโยงระหว่างตัวเลขต่างๆ ที่เกี่ยวข้องกัน

แม้ว่าภาษาอาหรับจะเขียนจากขวาไปซ้าย ในขณะที่ภาษาอังกฤษเขียนจากซ้ายไปขวา แต่ในทั้งสองภาษา ตัวเลขจะเขียนโดยวางหลักที่มีค่ามากที่สุดไว้ทางซ้าย และหลักที่มีค่าน้อยที่สุดไว้ทางขวา

เศษส่วน

เครื่องหมายU+2044FRACTION SLASHอนุญาตให้ผู้เขียนที่ใช้ Unicode สามารถประกอบเศษส่วนใดๆ ก็ได้เข้ากับตัวเลขทศนิยม เดิมทีตั้งใจไว้ว่าเครื่องหมายนี้จะสั่งให้การแสดงผลฟอนต์ทำให้ตัวเลขโดยรอบเล็กลง และยกขึ้นทางซ้ายและลดลงทางขวา แต่ในทางปฏิบัติแล้วไม่ค่อยมีการนำไปใช้ (วิธีแก้ปัญหาคือการใช้ตัวยก/ตัวห้อยที่อธิบายไว้ด้านล่าง แต่มีเฉพาะตัวเลขอาหรับเท่านั้นที่ใช้งานได้) Unicode ยังมีเศษส่วนแบบไม่เป็นทางการ จำนวนหนึ่ง เป็นอักขระที่ใช้งานร่วมกันได้ แต่ไม่แนะนำให้ใช้

เศษส่วนทศนิยม

อักขระหลายตัวใน Unicode สามารถใช้เป็นตัวคั่นทศนิยมได้ ขึ้นอยู่กับภาษาท้องถิ่น เศษส่วนทศนิยมจะแสดงในข้อความเป็นลำดับของตัวเลขทศนิยม โดยมีตัวคั่นทศนิยมคั่นระหว่างส่วนจำนวนเต็มกับส่วนทศนิยม ตัวอย่างเช่น เศษส่วนทศนิยมสำหรับ ¼ จะแสดงเป็นศูนย์จุดสองห้า ("0.25") Unicode ไม่มีตัวคั่นทศนิยมทั่วไปโดยเฉพาะ แต่รวมฟังก์ชันตัวคั่นทศนิยมเข้ากับอักขระเครื่องหมายวรรคตอนอื่นๆ ดังนั้น "." ที่ใช้ใน "0.25" จึงเป็นอักขระจุด (U+002E) เดียวกันกับที่ใช้จบประโยค อย่างไรก็ตาม วัฒนธรรมต่างๆ แตกต่างกันในสัญลักษณ์หรือกราฟีมที่ใช้สำหรับตัวคั่นทศนิยม ดังนั้นในบางภาษาท้องถิ่น อาจใช้เครื่องหมายจุลภาค (U+002C) แทน เช่น "0,25" ในขณะที่บางภาษาท้องถิ่นอาจใช้ช่องว่าง (หรือช่องว่างที่ไม่เว้นวรรค) สำหรับ "0 25" ระบบการเขียนภาษาอาหรับมีอักขระเฉพาะสำหรับตัวคั่นทศนิยมซึ่งมีลักษณะคล้ายเครื่องหมายจุลภาคU+066B ٫ ARABIC DECIMAL SEPARATORซึ่งเมื่อรวมกับตัวเลขอาหรับเพื่อแสดงหนึ่งในสี่ จะปรากฏเป็น "٠٫٢٥"

อักขระสำหรับค่าคงที่ทางคณิตศาสตร์

ปัจจุบัน อักขระ Unicode สามตัวแทนค่าคงที่ทางคณิตศาสตร์ในเชิงความหมาย ได้แก่U+210Eค่าคงที่แพลงค์ , U+210Fค่าคงที่แพลงค์เหนือสองพายและU+2107ค่าคงที่ออยเลอร์ (ซึ่งยังไม่ทราบความหมาย[ 1 ] ) ค่าคงที่ทางคณิตศาสตร์อื่นๆ สามารถแทนได้โดยใช้อักขระที่มีการใช้งานเชิงความหมายหลายอย่าง ตัวอย่างเช่น แม้ว่า Unicode จะมีอักขระสำหรับเลขชี้กำลังธรรมชาติ ℯ (U+212F) แต่ชื่อมาตรฐาน UCS ของมันมาจากสัญลักษณ์ของมัน: U+212Fอักษรย่อ Eและค่าคงที่ทางคณิตศาสตร์π , 3.141592 .. , แทนด้วยU+03C0 π อักษรย่อพายกรีก

ข้อความแบบ Rich Text และตัวเลขความเข้ากันได้อื่นๆ

ตัวเลขอาหรับแบบตะวันตกก็ปรากฏอยู่ในกลุ่มอักขระที่ใช้งานร่วมกันได้เช่นกัน โดยมีรูปแบบตัวอักษรที่หลากหลาย เช่น ตัวหนา ตัวขีดสองขีด ตัวอักษรคงที่ ตัวอักษรไม่มีเชิง และตัวอักษรไม่มีเชิงแบบหนา รวมถึงรูปแบบเต็มความกว้างเพื่อรองรับข้อความแนวตั้งแบบดั้งเดิม

ข้อความที่มีรูปแบบหลากหลาย เช่น ข้อความที่อยู่ในวงเล็บ วงกลม และรูปแบบอื่นๆ ก็รวมอยู่ในบล็อกต่างๆ ด้วย ได้แก่ตัวอักษรและเดือนภาษาจีน ญี่ปุ่น และเกาหลี ที่อยู่ในกรอบ ; ตัวอักษรและตัวเลขที่อยู่ในกรอบ ; ตัวอักษร และตัวเลขเสริมที่อยู่ในกรอบ ; ตัวยกและตัวห้อย ; รูปแบบตัวเลข ; และสัญลักษณ์พิเศษ (Dingbats )

ตัวเลขซูโจว (huāmǎ/Sūzhōu mǎzi)

ระบบ ตัวเลขฮวาหม่า จื่อ ( ภาษาจีนตัวย่อ :花码; ภาษาจีนตัวเต็ม :花碼) / ซูโจวหม่าจื่อ ( ภาษาจีนตัวย่อ :苏州码子; ภาษาจีนตัวเต็ม :蘇州碼字) เป็นรูปแบบหนึ่งของระบบตัวเลขแท่ง ตัวเลขแท่งมีความเกี่ยวข้องอย่างใกล้ชิดกับแท่งนับและลูกคิดซึ่งเป็นเหตุผลว่าทำไมสัญลักษณ์ตัวเลขสำหรับ 1, 2, 3, 6, 7 และ 8 ใน ระบบ ฮวาหม่าจื่อจึงแสดงในลักษณะที่คล้ายคลึงกับบนลูกคิด ปัจจุบัน ระบบ ฮวาหม่าจื่อใช้สำหรับการแสดงราคาในตลาดจีนหรือในใบแจ้งหนี้ที่เขียนด้วยลายมือแบบดั้งเดิมเท่านั้น

ตัวเลขของตัวเลขซูโจวอยู่ใน บล็อก สัญลักษณ์และเครื่องหมายวรรคตอน CJKที่ U+3021—U+3029, U+3007, U+5341, U+5344 และ U+5345 ใน Unicode 3.0 อักขระเหล่านี้ถูกเรียกว่า ตัวเลขแบบหาง โจว อย่างไม่ถูกต้อง ใน Unicode 4.0 มีการเพิ่มคำแก้ไขซึ่งระบุว่า: [ 2 ]

ตัวเลขซูโจว (ภาษาจีนsu1zhou1ma3zi ) เป็นรูปแบบตัวเลขพิเศษที่พ่อค้าใช้แสดงราคาสินค้า การใช้คำว่า "หางโจว" ในชื่อนั้นเป็นการใช้คำที่ไม่ถูกต้อง

การอ้างอิงทั้งหมดถึง "หางโจว" ในมาตรฐาน Unicode ได้รับการแก้ไขเป็น "ซูโจว" ยกเว้นชื่อตัวอักษรเอง ซึ่งไม่สามารถเปลี่ยนแปลงได้เมื่อกำหนดแล้ว ตามนโยบายความเสถียรของ Unicode [ 3 ] (นโยบายนี้อนุญาตให้ซอฟต์แวร์ใช้ชื่อเป็นตัวระบุที่ไม่ซ้ำกัน)

ตัวเลขญี่ปุ่นและเกาหลี

ตัวเลขกรีกโบราณ

Unicode ให้การสนับสนุนตัวเลขกรีก หลายรูปแบบ ซึ่งกำหนดให้กับระนาบหลายภาษาเสริมตั้งแต่ U+10140 ถึง U+1018F [ 4 ]

ตัวเลขแอทติกถูกใช้โดยชาวกรีกโบราณอาจจะตั้งแต่ศตวรรษที่ 7 ก่อนคริสต์ศักราชตัวเลขเหล่านี้ยังเป็นที่รู้จักในชื่อตัวเลขเฮโรเดียนเนื่องจากมีการกล่าวถึงครั้งแรกในต้นฉบับในศตวรรษที่ 2 โดยเฮโรเดียนนอกจากนี้ยังเป็นที่รู้จักในชื่อตัวเลขอะโครโฟนิกเนื่องจากสัญลักษณ์ทั้งหมดที่ใช้มาจากอักษรตัวแรกของคำที่สัญลักษณ์นั้นแทน ได้แก่ 'หนึ่ง', 'ห้า', 'สิบ', 'ร้อย', 'พัน' และ 'หมื่น' ดูเพิ่มเติมที่ตัวเลขกรีกและอะโครโฟนิ

ทศนิยม เครื่องหมาย เลขกรีก
1ไอ ἴοςหรือ ἰός ( ios )
5Π πέντε (' pente )
10Δ δέκα ( deka )
100เอช ἑκατόν (' hekaton )
1000Χ χίλιοι ( khilioi )
10000เอ็ม μύριοι ( myrioi )
ตัวเลขกรีกโบราณ[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+1014x 𐅀 𐅁 𐅂 𐅃 𐅄 𐅅 𐅆 𐅇 𐅈 𐅉 𐅊 𐅋 𐅌 𐅍 𐅎 𐅏
ยู+1015x 𐅐 𐅑 𐅒 𐅓 𐅔 𐅕 𐅖 𐅗 𐅘 𐅙 𐅚 𐅛 𐅜 𐅝 𐅞 𐅟
ยู+1016x 𐅠 𐅡 𐅢 𐅣 𐅤 𐅥 𐅦 𐅧 𐅨 𐅩 𐅪 𐅫 𐅬 𐅭 𐅮 𐅯
ยู+1017x 𐅰 𐅱 𐅲 𐅳 𐅴 𐅵 𐅶 𐅷 𐅸 𐅹 𐅺 𐅻 𐅼 𐅽 𐅾 𐅿
ยู+1018x 𐆀 𐆁 𐆂 𐆃 𐆄 𐆅 𐆆 𐆇 𐆈 𐆉 𐆊 𐆋 𐆌 𐆍 𐆎
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

เลขโรมัน

ตัวเลขโรมันมีต้นกำเนิดในกรุงโรม โบราณ โดยดัดแปลงมาจากตัวเลขของชาวเอตรัสกัน ระบบที่ใช้ในสมัยโบราณคลาสสิกได้รับการปรับเปลี่ยนเล็กน้อยในยุคกลางจนกลายเป็นระบบที่เราใช้ในปัจจุบัน ระบบนี้มีพื้นฐานมาจากตัวอักษรบางตัวที่กำหนดค่าเป็นตัวเลข

ในปัจจุบัน เลขโรมันมักใช้กันในรายการลำดับ (ในรูปแบบโครงร่าง) หน้าปัดนาฬิกา หน้าก่อนเนื้อหาหลักของหนังสือ กลุ่มเสียงในดนตรี ( การวิเคราะห์ด้วยเลขโรมัน ) การกำหนดหมายเลขภาคต่อของภาพยนตร์และวิดีโอเกม วันที่ตีพิมพ์หนังสือ ผู้นำทางการเมืองที่สืบทอดตำแหน่งต่อกัน หรือบุตรที่มีชื่อเดียวกัน และการกำหนดหมายเลขของการแข่งขันกีฬาบางรายการ เช่นโอลิมปิกหรือซูเปอร์โบวล์

Unicode มีอักขระจำนวนหนึ่งที่กำหนดไว้โดยเฉพาะว่าเป็นเลขโรมัน ซึ่งเป็นส่วนหนึ่งของรูปแบบตัวเลข[ 5 ]ช่วงตั้งแต่ U+2160 ถึง U+2188 ช่วงนี้รวมถึงตัวเลขทั้งตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก รวมถึงอักขระที่รวมกันไว้ล่วงหน้าสำหรับตัวเลขถึง 12 (XII) เหตุผลหนึ่งสำหรับการมีอยู่ของตัวเลขที่รวมกันไว้ล่วงหน้าคือเพื่ออำนวยความสะดวกในการจัดวางตัวเลขหลายตัวอักษร (เช่น VIII) บนบรรทัดแนวนอนเดียวในข้อความแนวตั้งของเอเชีย อย่างไรก็ตาม มาตรฐาน Unicode มีรหัสจุดเลขโรมันพิเศษเพื่อความเข้ากันได้เท่านั้น โดยระบุว่า "[สำหรับวัตถุประสงค์ส่วนใหญ่ เป็นการดีกว่าที่จะประกอบเลขโรมันจากลำดับของตัวอักษรละตินที่เหมาะสม" [ 6 ]

นอกจากนี้ ยังมีอักขระสำหรับรูปแบบโบราณ[ 5 ]ของ 1000, 5000, 10,000, C กลับหัวขนาดใหญ่ (Ɔ) , 6 ตอนปลาย (ↅ คล้ายกับStigma ของกรีก : Ϛ), 50 ตอนต้น (ↆ คล้ายกับลูกศรลง ↓⫝⊥ [ 7 ] ), 50,000 และ 100,000 C กลับหัวขนาดเล็ก ↄ ไม่ได้มีไว้ใช้ในเลขโรมัน แต่ใช้เป็นอักษรคลอเดียนตัวเล็ก

ตารางแสดงเลขโรมันในรูปแบบยูนิโค้ด
0123456789เอบีซีดีอีเอฟ
ค่า[ 8 ]123456789101112501005001,000
ยู+216x
ยู+217x
012345678
ค่า 1000500010,00010010065050,000100,000
ยู+218x

หากใช้ แบบ อักษรแบล็กเล็ต เตอร์ หรือ แบบอักษร เขียนหวัดตัวเลขโรมันจะถูกจัดวางในรูปแบบตัวพิมพ์โรมันแบบอักษรดังกล่าวอาจมีตัวเลขโรมันที่ตรงกับรูปแบบของแบบอักษรในช่วง Unicode U+2160–217F หากไม่มี จะใช้แบบอักษร Antiqua ที่ตรงกันสำหรับตัวเลขโรมัน

Unicode มีอักขระสำหรับเศษส่วนโรมันใน บล็อก Ancient Symbols [ 9 ]ได้แก่ sextans, uncia, semuncia, sextula, dimidia sextula, siliqua และ as

ตัวเลขแท่งนับ

ตัวเลขแท่งนับถูกรวมอยู่ในบล็อกของตัวเองในระนาบหลายภาษาเสริม (SMP) ตั้งแต่ Unicode 5.0 มีตัวเลข "แนวนอน" เก้าตัว (U+1D360 ถึง U+1D368) และตัวเลข "แนวตั้ง" เก้าตัว (U+1D369 ถึง U+1D371) ตัวเลขแนวนอนใช้สำหรับกำลังคี่ของสิบ และตัวเลขแนวตั้งใช้สำหรับกำลังคู่ของสิบ ศูนย์ควรแทนด้วย U+3007 (〇, ตัวเลขภาพศูนย์) และเครื่องหมายลบควรแทนด้วย U+20E5 (การรวมทับซ้อน solidus กลับด้าน) [ 10 ]บล็อกนี้ยังมีสัญลักษณ์คล้ายแท่งนับอื่นๆ เช่น เครื่องหมายนับ 5 |||| ที่รู้จักกันดี เนื่องจากสัญลักษณ์เหล่านี้เพิ่งถูกเพิ่มเข้าไปในชุดอักขระและไม่ได้อยู่ใน BMP การรองรับฟอนต์อาจยังคงมีจำกัด

ตัวเลขแท่งนับ[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
U+1D36x 𝍠𝍡𝍢𝍣𝍤𝍥𝍦𝍧𝍨𝍩𝍪𝍫𝍬𝍭𝍮𝍯
ยู+1D37x 𝍰𝍱𝍲𝍳𝍵𝍶𝍷𝍸
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Numerals_in_Unicode&oldid=1356020761 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ตัวเลขในยูนิโค้ด

ตัวเลข(มักเรียกว่าnumberในUnicode ) คืออักขระที่ใช้แทนจำนวนตัวเลขทศนิยม 0–9ถูกใช้กันอย่างแพร่หลายในระบบการเขียนต่างๆ ทั่วโลก อย่างไรก็ตามตัวอักษร ที่ใช้แทนตัวเลขทศนิยม...

ตัวเลขตามคุณสมบัติเชิงตัวเลข

ตามคุณสมบัติเชิงตัวเลขที่ใช้ในข้อความ Unicode มีค่าสำหรับประเภทตัวเลขอยู่สี่ค่า ค่าแรกคือ "ไม่ใช่ตัวเลข" ค่าถัดมาคือ ตัวเลข ฐานสิบ ซึ่งใช้กันทั่วไปในระบบเลขฐานสิบแบบตะวันตก (0-9) ค่าที่สามคือตัวเลขที่ไม่ใช่ส่วนหนึ่งของระบบเลขฐานสิบ เช่น เลขโรมัน...

เลขฐานสิบหก

ตัวเลขฐานสิบหก ในยูนิโค้ดไม่ใช่ตัวอักษรแยกต่างหาก แต่ใช้ตัวอักษรและตัวเลขที่มีอยู่แล้ว ตัวอักษรเหล่านี้มี คุณสมบัติเฉพาะ (Character properties) Hex_digit=Yes ที่ระบุไว้ และ ASCII_Hex_digit=Yes เมื่อเหมาะสมก็จะมีข้อมูล เพิ่มเติมด้วย

ตัวเลขฮินดู-อารบิก

ระบบตัวเลขฮินดู-อารบิก ประกอบด้วยตัวเลขสิบหลักแทนค่า 0-9 ยูนิโค้ดรวม ตัวเลขอารบิกตะวันตก ไว้ ในบล็อก Basic Latin (หรือที่ได้มาจาก ASCII) ตัวเลขเหล่านี้ถูกใช้ซ้ำในอักษรอื่นๆ อีกหลายภาษา ได้แก่ อารบิกตะวันออก บาหลี เบงกาลี เทวนาครี เอธิโอเปีย คุชราตี กูรมุขี...