กลับไปหน้าบทความ

อ่าน 2 นาที

บล็อกยูนิโค้ด

บล็อกยูนิโค้ด (Unicode block ) คือช่วงรหัสตัวเลข ( code points ) ที่ต่อเนื่องกันหลายช่วงของ ชุดอักขระ ยูนิโค้ด (Unicode character set) ซึ่งกำหนดโดยสมาคมยูนิโค้ด (Unicode

บล็อกยูนิโค้ด

บล็อกยูนิโค้ด (Unicode block ) คือช่วงรหัสตัวเลข ( code points ) ที่ต่อเนื่องกันหลายช่วงของ ชุดอักขระ ยูนิโค้ด (Unicode character set) ซึ่งกำหนดโดยสมาคมยูนิโค้ด (Unicode Consortium)เพื่อวัตถุประสงค์ด้านการบริหารจัดการและการจัดทำเอกสาร โดยทั่วไป ข้อเสนอต่างๆ เช่น การเพิ่มสัญลักษณ์ใหม่ จะได้รับการพิจารณาและประเมินโดยคำนึงถึงบล็อกหรือบล็อกที่เกี่ยวข้องทั้งหมด

โดยทั่วไปแล้ว แต่ละบล็อกมีไว้เพื่อจัดหาตัวอักษรที่ใช้ในภาษาเฉพาะภาษาหนึ่งภาษาหรือมากกว่า หรือในสาขาการใช้งานทั่วไป เช่นคณิตศาสตร์การสำรวจการจัดเรียงตัวอักษรเพื่อการ ตกแต่ง สื่อสังคมออนไลน์ เป็นต้น แต่ก็ไม่เสมอไป

การออกแบบและการดำเนินการ

บล็อก Unicode จะถูกระบุด้วยชื่อเฉพาะ ซึ่งใช้เฉพาะอักขระ ASCII และมักจะอธิบายลักษณะของสัญลักษณ์ เช่น "Tibetan" หรือ "Supplemental Arrows-A" เมื่อเปรียบเทียบชื่อบล็อก ควรเทียบตัวพิมพ์ใหญ่กับตัวพิมพ์ เล็กและไม่สนใจช่องว่าง เครื่องหมายยัติภังค์ และขีดเส้นใต้ ดังนั้นชื่อสุดท้ายจึงเทียบเท่ากับ "supplemental_arrows_a", "SupplementalArrowsA" และ "SUPPLEMENTALARROWSA" [ 1 ]

บล็อกแต่ละคู่จะไม่ทับซ้อนกัน กล่าวคือ จะไม่มีส่วนที่ทับซ้อนกัน จุดเริ่มต้นและขนาด (จำนวนจุดรหัส) ของแต่ละบล็อกจะเป็นพหุคูณของ 16 เสมอ ดังนั้น ใน สัญกรณ์ เลขฐานสิบหก จุดเริ่มต้น (เล็กที่สุด) คือ U+ xxx 0 และจุดสิ้นสุด (ใหญ่ที่สุด) คือ U+ yyy F โดยที่xxxและyyyคือตัวเลขฐานสิบหกสามหลักขึ้นไป (ข้อจำกัดเหล่านี้มีจุดประสงค์เพื่อลดความซับซ้อนในการแสดงสัญลักษณ์ในเอกสาร Unicode Consortium โดยแสดงเป็นตารางที่มี 16 แถวซึ่งระบุด้วยตัวเลขฐานสิบหกหลักสุดท้ายของจุดรหัส[ 1 ] ) ขนาดของบล็อกอาจมีตั้งแต่ขั้นต่ำ 16 ถึงสูงสุด 65,536 จุดรหัส

จุดรหัสที่กำหนดแต่ละจุดมีคุณสมบัติของสัญลักษณ์ที่เรียกว่า "บล็อก" ซึ่งค่าของมันคือสตริงอักขระที่ระบุชื่อบล็อกที่ไม่ซ้ำกันซึ่งเป็นเจ้าของจุดนั้น[ 2 ]อย่างไรก็ตาม บล็อกอาจมีจุดรหัสที่ไม่ได้กำหนดไว้ ซึ่งโดยปกติจะสงวนไว้สำหรับการเพิ่มอักขระในอนาคตที่ "ตามตรรกะ" ควรเป็นของบล็อกนั้น จุดรหัสที่ไม่เป็นของบล็อกที่ระบุชื่อใด ๆ เช่น ในระนาบ ที่ไม่ได้กำหนด 4–13 จะมีค่าเป็น block="No_Block" [ 1 ]

การเป็นส่วนหนึ่งของบล็อก Unicode เฉพาะเจาะจงไม่ได้เป็นการรับประกันคุณสมบัติเฉพาะใดๆ ของอักขระที่คาดว่าจะบรรจุหรืออาจบรรจุในอนาคต เอกลักษณ์ของอักขระใดๆ จะถูกกำหนดโดยคุณสมบัติที่ระบุไว้ในฐานข้อมูลอักขระ Unicode ตัวอย่างเช่น ช่วงต่อเนื่องของจุดรหัสที่ไม่ใช่อักขระ 32 จุด U+FDD0..U+FDEF ไม่มีคุณสมบัติใดๆ ร่วมกันกับอักขระอื่นๆ ใน บล็อก Arabic Presentation Forms-Aซึ่งแน่นอนว่าไม่ใช่ตัวอักขระอักษรอาหรับหรือ "อักขระที่ไม่ใช่อักขระจากขวาไปซ้าย" และถูกกำหนดให้เป็นตัวเติมในบล็อกนี้ เนื่องจากมีการตกลงกันแล้วว่าจะไม่มีการเข้ารหัสอักขระความเข้ากันได้ของภาษาอาหรับเพิ่มเติม[ 3 ]

การจำแนกประเภทอื่นๆ

จุด Unicode แต่ละจุดยังมีคุณสมบัติที่เรียกว่า " หมวดหมู่ทั่วไป " ซึ่งพยายามอธิบายบทบาทของสัญลักษณ์ที่เกี่ยวข้องในภาษาหรือแอปพลิเคชันที่รวมไว้ในระบบ ตัวอย่างของหมวดหมู่ทั่วไป ได้แก่ "Lu" (หมายถึงตัวอักษรพิมพ์ใหญ่), "Nd" (ตัวเลขทศนิยม), "Pi" (เครื่องหมายวรรคตอนแบบเปิดอัญประกาศ) และ "Mn" (เครื่องหมายที่ไม่เว้นวรรค เช่น เครื่องหมายกำกับเสียงสำหรับอักษรที่อยู่ข้างหน้า) การแบ่งนี้เป็นอิสระจากบล็อกโค้ดโดยสิ้นเชิง: จุดโค้ดที่มีหมวดหมู่ทั่วไปที่กำหนดโดยทั่วไปจะครอบคลุมหลายบล็อก และไม่จำเป็นต้องต่อเนื่องกัน แม้แต่ภายในแต่ละบล็อกก็ตาม[ 4 ]

แต่ละจุดรหัสยังมีคุณสมบัติสคริปต์ ซึ่งระบุว่ามีไว้สำหรับ ระบบการเขียนใดหรือมีไว้สำหรับหลายระบบการเขียน คุณสมบัตินี้ก็เป็นอิสระจากบล็อกเช่นกัน

ในการอธิบายระบบยูนิโค้ด บล็อกหนึ่งอาจถูกแบ่งย่อยออกเป็นกลุ่มย่อยที่เฉพาะเจาะจงมากขึ้น เช่น " สัญลักษณ์หมากรุก " ใน บล็อก สัญลักษณ์เบ็ดเตล็ด (อย่าสับสนกับ บล็อก สัญลักษณ์หมากรุก ที่แยกต่างหาก ) กลุ่มย่อยเหล่านั้นไม่ใช่ "บล็อก" ในความหมายทางเทคนิคที่ใช้โดยกลุ่มพันธมิตรยูนิโค้ด และตั้งชื่อไว้เพื่อความสะดวกของผู้ใช้เท่านั้น

รายการบล็อก

Unicode 17.0 กำหนดบล็อกไว้ 346 บล็อก: [ 1 ]

  • 164 ในระนาบ 0 ซึ่งเป็นระนาบหลายภาษาพื้นฐาน (ในตารางด้านล่าง: § BMP )
  • 168 ในระนาบที่ 1 ระนาบเสริมหลายภาษา ( § SMP )
  • 7 ในระนาบที่ 2 ระนาบอักษรภาพเสริม ( § SIP )
  • 3 ในระนาบที่ 3 ระนาบอักษรอุดมคติขั้นที่สาม ( § TIP )
  • 2 ในระนาบ 14 (E ในเลขฐานสิบหก ) ระนาบพิเศษเสริม ( § SSP )
  • หนึ่งแห่งในระนาบ 15 (F hex ) และ 16 (10 hex ) เรียกว่า พื้นที่ใช้งานส่วนตัวเสริม-A และ -B ( § PUA-A )
เครื่องบินช่วงบล็อก ชื่อบล็อก รหัสจุด[ a ]ตัวละครที่ได้รับมอบหมาย สคริปต์[ b ] [ c ] [ d ] [ e ] [ f ]
 0 บีเอ็มพีU+0000..U+007Fภาษาละตินพื้นฐาน[ g ]128 128 ภาษาละติน (52 ตัวอักษร), ภาษาทั่วไป (76 ตัวอักษร)
 0 บีเอ็มพี U+0080..U+00FFส่วนเสริมละติน-1 [ h ]128 128 ภาษาละติน (64 ตัวอักษร), ภาษาทั่วไป (64 ตัวอักษร)
 0 บีเอ็มพี U+0100..U+017Fละตินแบบขยายเอ128 128 ละติน
 0 บีเอ็มพี U+0180..U+024Fละตินขยาย-บี208 208 ละติน
 0 บีเอ็มพี U+0250..U+02AFส่วนขยาย IPA96 96 ละติน
 0 บีเอ็มพี U+02B0..U+02FFตัวอักษรปรับระยะห่าง80 80 โบโปโมโฟ (2 ตัวอักษร), ละติน (14 ตัวอักษร), สามัญ (64 ตัวอักษร)
 0 บีเอ็มพี U+0300..U+036Fการรวมเครื่องหมายกำกับเสียง112 112 สืบทอดมา
 0 บีเอ็มพี U+0370..U+03FFกรีกและคอปติก144 135 ภาษาคอปติก (14 ตัวอักษร), ภาษากรีก (117 ตัวอักษร), ภาษาคอมมอน (4 ตัวอักษร)
 0 บีเอ็มพี U+0400..U+04FFอักษรซีริลลิก256 256 อักษรซีริลลิก (254 ตัวอักษร), อักษรที่สืบทอดมา (2 ตัวอักษร)
 0 บีเอ็มพี U+0500..U+052Fส่วนเสริมอักษรซีริลลิก48 48 อักษรซีริลลิก
 0 บีเอ็มพี U+0530..U+058Fอาร์เมเนีย96 91 อาร์เมเนีย
 0 บีเอ็มพี U+0590..U+05FFภาษาฮีบรู112 88 ภาษาฮีบรู
 0 บีเอ็มพี U+0600..U+06FFภาษาอาหรับ256 256 ภาษาอาหรับ (238 ตัวอักษร), ภาษาทั่วไป (6 ตัวอักษร), ภาษาที่สืบทอดมา (12 ตัวอักษร)
 0 บีเอ็มพี U+0700..U+074Fซีเรียค80 77 ซีเรียค
 0 บีเอ็มพี U+0750..U+077Fภาคผนวกภาษาอาหรับ48 48 ภาษาอาหรับ
 0 บีเอ็มพี U+0780..U+07BFทานา64 50 ทานา
 0 บีเอ็มพี U+07C0..U+07FFเอ็นโก64 62 เอ็นโค
 0 บีเอ็มพี U+0800..U+083Fชาวสะมาเรีย64 61 ชาวสะมาเรีย
 0 บีเอ็มพี U+0840..U+085Fแมนดาอิก32 29 แมนดาอิก
 0 บีเอ็มพี U+0860..U+086Fอาหารเสริมซีเรียค16 11 ซีเรียค
 0 บีเอ็มพี U+0870..U+089Fภาษาอาหรับแบบขยาย-บี48 43 ภาษาอาหรับ
 0 บีเอ็มพี U+08A0..U+08FFภาษาอาหรับแบบขยาย-เอ96 96 ภาษาอาหรับ (95 ตัวอักษร), ภาษาทั่วไป (1 ตัวอักษร)
 0 บีเอ็มพี U+0900..U+097Fเทวนาครี128 128 อักษรเทวนาครี (122 ตัวอักษร), อักษรทั่วไป (2 ตัวอักษร), อักษรที่สืบทอดมา (4 ตัวอักษร)
 0 บีเอ็มพี U+0980..U+09FFเบงกาลี128 96 เบงกาลี
 0 บีเอ็มพี U+0A00..U+0A7Fกูรมุขี128 80 กูรมุขี
 0 บีเอ็มพี U+0A80..U+0AFFกุจาราติ128 91 กุจาราติ
 0 บีเอ็มพี U+0B00..U+0B7Fโอริยา128 91 โอริยา
 0 บีเอ็มพี U+0B80..U+0BFFทมิฬ128 72 ทมิฬ
 0 บีเอ็มพี U+0C00..U+0C7Fเตลูกู128 101 เตลูกู
 0 บีเอ็มพี U+0C80..U+0CFFกันนาดา128 92 กันนาดา
 0 บีเอ็มพี U+0D00..U+0D7Fมาลายาลัม128 118 มาลายาลัม
 0 บีเอ็มพี U+0D80..U+0DFFสิงหล128 91 สิงหล
 0 บีเอ็มพี U+0E00..U+0E7Fแบบไทย128 87 ภาษาไทย (86 ตัวอักษร), ภาษาทั่วไป (1 ตัวอักษร)
 0 บีเอ็มพี U+0E80..U+0EFFลาว128 83 ลาว
 0 บีเอ็มพี U+0F00..U+0FFFทิเบต256 211 ภาษาทิเบต (207 ตัวอักษร), ภาษาทั่วไป (4 ตัวอักษร)
 0 บีเอ็มพี U+1000..U+109Fพม่า160 160 พม่า
 0 บีเอ็มพี U+10A0..U+10FFจอร์เจีย96 88 ภาษาจอร์เจีย (87 ตัวอักษร), ภาษาทั่วไป (1 ตัวอักษร)
 0 บีเอ็มพี U+1100..U+11FFฮันกุล จาโม256 256 ฮันกุล
 0 บีเอ็มพี U+1200..U+137Fเอธิโอปิก384 358 เอธิโอปิก
 0 บีเอ็มพี U+1380..U+139Fอาหารเสริมเอธิโอปิก32 26 เอธิโอปิก
 0 บีเอ็มพี U+13A0..U+13FFเชอโรคี96 92 เชอโรคี
 0 บีเอ็มพี U+1400..U+167Fอักษรพยางค์รวมของชนพื้นเมืองแคนาดา640 640 ชนพื้นเมืองแคนาดา
 0 บีเอ็มพี U+1680..U+169Fอ็อกแฮม32 29 อ็อกแฮม
 0 บีเอ็มพี U+16A0..U+16FFรูนิก96 89 อักษรรูน (86 ตัวอักษร), อักษรสามัญ (3 ตัวอักษร)
 0 บีเอ็มพี U+1700..U+171Fตากาล็อก32 23 ตากาล็อก
 0 บีเอ็มพี U+1720..U+173Fฮานูนู32 23 ฮานูนู (21 ตัวอักษร), สามัญ (2 ตัวอักษร)
 0 บีเอ็มพี U+1740..U+175Fบูฮิด32 20 บูฮิด
 0 บีเอ็มพี U+1760..U+177Fทากบันวา32 18 ทากบันวา
 0 บีเอ็มพี U+1780..U+17FFเขมร128 114 เขมร
 0 บีเอ็มพี U+1800..U+18AFมองโกล176 158 มองโกล (155 ตัวอักษร), สามัญ (3 ตัวอักษร)
 0 บีเอ็มพี U+18B0..U+18FFอักษรพยางค์รวมของชนพื้นเมืองแคนาดาแบบขยาย80 70 ชนพื้นเมืองแคนาดา
 0 บีเอ็มพี U+1900..U+194Fลิมบู80 68 ลิมบู
 0 บีเอ็มพี U+1950..U+197Fไท่เล่อ48 35 ไท่เล่อ
 0 บีเอ็มพี U+1980..U+19DFนิวไท่ลือ96 83 นิวไท่ลือ
 0 บีเอ็มพี U+19E0..U+19FFสัญลักษณ์เขมร32 32 เขมร
 0 บีเอ็มพี U+1A00..U+1A1Fบูกิเนเซ32 30 บูกิเนเซ
 0 บีเอ็มพี U+1A20..U+1AAFไท่ถัม144 127 ไท่ถัม
 0 บีเอ็มพี U+1AB0..U+1AFFการรวมเครื่องหมายกำกับเสียงแบบขยาย80 58 สืบทอดมา
 0 บีเอ็มพี U+1B00..U+1B7Fชาวบาหลี128 127 ชาวบาหลี
 0 บีเอ็มพี U+1B80..U+1BBFชาวซุนดาน64 64 ชาวซุนดาน
 0 บีเอ็มพี U+1BC0..U+1BFFบาตัก64 56 บาตัก
 0 บีเอ็มพี U+1C00..U+1C4Fเลปชา80 74 เลปชา
 0 บีเอ็มพี U+1C50..U+1C7Fโอล ชิกิ48 48 โอล ชิกิ
 0 บีเอ็มพี U+1C80..U+1C8Fซีริลลิกแบบขยาย16 11 อักษรซีริลลิก
 0 บีเอ็มพี U+1C90..U+1CBFจอร์เจียนขยาย48 46 จอร์เจีย
 0 บีเอ็มพี U+1CC0..U+1CCFอาหารเสริมซุนดานีส16 8 ชาวซุนดาน
 0 บีเอ็มพี U+1CD0..U+1CFFส่วนขยายเวทิก48 43 ทั่วไป (16 ตัวอักษร), สืบทอด (27 ตัวอักษร)
 0 บีเอ็มพี U+1D00..U+1D7Fส่วนขยายทางสัทศาสตร์128 128 อักษรซีริลลิก (2 ตัวอักษร), อักษรกรีก (15 ตัวอักษร), อักษรละติน (111 ตัวอักษร)
 0 บีเอ็มพี U+1D80..U+1DBFส่วนเสริมส่วนขยายด้านสัทศาสตร์64 64 กรีก (1 ตัวอักษร), ละติน (63 ตัวอักษร)
 0 บีเอ็มพี U+1DC0..U+1DFFเอกสารเพิ่มเติมเกี่ยวกับการใช้เครื่องหมายกำกับเสียง64 64 สืบทอดมา
 0 บีเอ็มพี U+1E00..U+1EFFภาษาละตินขยายเพิ่มเติม256 256 ละติน
 0 บีเอ็มพี U+1F00..U+1FFFกรีกขยาย256 233 กรีก
 0 บีเอ็มพี U+2000..U+206Fเครื่องหมายวรรคตอนทั่วไป112 111 ทั่วไป (109 ตัวอักษร), สืบทอด (2 ตัวอักษร)
 0 บีเอ็มพี U+2070..U+209Fตัวยกและตัวห้อย48 42 ภาษาละติน (15 ตัวอักษร), ภาษาทั่วไป (27 ตัวอักษร)
 0 บีเอ็มพี U+20A0..U+20CFสัญลักษณ์สกุลเงิน48 34 ทั่วไป
 0 บีเอ็มพี U+20D0..U+20FFการรวมเครื่องหมายกำกับเสียงสำหรับสัญลักษณ์48 33 สืบทอดมา
 0 บีเอ็มพี U+2100..U+214Fสัญลักษณ์คล้ายตัวอักษร80 80 กรีก (1 ตัวอักษร), ละติน (4 ตัวอักษร), สามัญ (75 ตัวอักษร)
 0 บีเอ็มพี U+2150..U+218Fรูปแบบตัวเลข64 60 ภาษาละติน (41 ตัวอักษร), ภาษาทั่วไป (19 ตัวอักษร)
 0 บีเอ็มพี U+2190..U+21FFลูกศร112 112 ทั่วไป
 0 บีเอ็มพี U+2200..U+22FFตัวดำเนินการทางคณิตศาสตร์256 256 ทั่วไป
 0 บีเอ็มพี U+2300..U+23FFข้อมูลทางเทคนิคเบ็ดเตล็ด256 256 ทั่วไป
 0 บีเอ็มพี U+2400..U+243Fภาพควบคุม64 42 ทั่วไป
 0 บีเอ็มพี U+2440..U+245Fการรู้จำอักขระด้วยแสง32 11 ทั่วไป
 0 บีเอ็มพี U+2460..U+24FFตัวอักษรและตัวเลขที่ล้อมรอบ160 160 ทั่วไป
 0 บีเอ็มพี U+2500..U+257Fภาพวาดกล่อง128 128 ทั่วไป
 0 บีเอ็มพี U+2580..U+259Fองค์ประกอบบล็อก32 32 ทั่วไป
 0 บีเอ็มพี U+25A0..U+25FFรูปทรงเรขาคณิต96 96 ทั่วไป
 0 บีเอ็มพี U+2600..U+26FFสัญลักษณ์เบ็ดเตล็ด256 256 ทั่วไป
 0 บีเอ็มพี U+2700..U+27BFดิงแบตส์192 192 ทั่วไป
 0 บีเอ็มพี U+27C0..U+27EFสัญลักษณ์ทางคณิตศาสตร์เบ็ดเตล็ด - ก48 48 ทั่วไป
 0 บีเอ็มพี U+27F0..U+27FFลูกศรเสริม-เอ16 16 ทั่วไป
 0 บีเอ็มพี U+2800..U+28FFรูปแบบอักษรเบรลล์256 256 อักษรเบรลล์
 0 บีเอ็มพี U+2900..U+297Fลูกศรเสริม-บี128 128 ทั่วไป
 0 บีเอ็มพี U+2980..U+29FFสัญลักษณ์ทางคณิตศาสตร์เบ็ดเตล็ด-B128 128 ทั่วไป
 0 บีเอ็มพี U+2A00..U+2AFFตัวดำเนินการทางคณิตศาสตร์เสริม256 256 ทั่วไป
 0 บีเอ็มพี U+2B00..U+2BFFสัญลักษณ์และลูกศรเบ็ดเตล็ด256 254 ทั่วไป
 0 บีเอ็มพี U+2C00..U+2C5Fกลาโกไลต์96 96 กลาโกไลต์
 0 บีเอ็มพี U+2C60..U+2C7Fละตินเอ็กซ์เอนดิเจนซี32 32 ละติน
 0 บีเอ็มพี U+2C80..U+2CFFคอปติก128 123 คอปติก
 0 บีเอ็มพี U+2D00..U+2D2Fภาคผนวกจอร์เจีย48 40 จอร์เจีย
 0 บีเอ็มพี U+2D30..U+2D7Fทิฟินาห์80 59 ทิฟินาห์
 0 บีเอ็มพี U+2D80..U+2DDFเอธิโอปิก ฉบับขยาย96 79 เอธิโอปิก
 0 บีเอ็มพี U+2DE0..U+2DFFซีริลลิก เอ็กซ์เทนเดด เอ32 32 อักษรซีริลลิก
 0 บีเอ็มพี U+2E00..U+2E7Fเครื่องหมายวรรคตอนเพิ่มเติม128 94 ทั่วไป
 0 บีเอ็มพี U+2E80..U+2EFFผลิตภัณฑ์เสริมอาหาร CJK Radicals128 115 ฮัน
 0 บีเอ็มพี U+2F00..U+2FDFกลุ่มหัวรุนแรงคังซี224 214 ฮัน
 0 บีเอ็มพี U+2FF0..U+2FFFอักขระพรรณนาเชิงอุดมคติ16 16 ทั่วไป
 0 บีเอ็มพี U+3000..U+303Fสัญลักษณ์และเครื่องหมายวรรคตอน CJK64 64 ฮัน (15 ตัวอักษร), ฮันกุล (2 ตัวอักษร), สามัญ (43 ตัวอักษร), สืบทอด (4 ตัวอักษร)
 0 บีเอ็มพี U+3040..U+309Fฮิรากานะ96 93 ฮิรากานะ (89 ตัวอักษร), ตัวอักษรทั่วไป (2 ตัวอักษร), ตัวอักษรที่สืบทอดมา (2 ตัวอักษร)
 0 บีเอ็มพี U+30A0..U+30FFคาตาคานะ96 96 คาตาคานะ (93 ตัวอักษร), อักษรทั่วไป (3 ตัวอักษร)
 0 บีเอ็มพี U+3100..U+312Fโบโปโมโฟ48 43 โบโปโมโฟ
 0 บีเอ็มพี U+3130..U+318Fความเข้ากันได้ของภาษาเกาหลี Jamo96 94 ฮันกุล
 0 บีเอ็มพี U+3190..U+319Fคันบุน16 16 ทั่วไป
 0 บีเอ็มพี U+31A0..U+31BFโบโปโมโฟ ขยาย32 32 โบโปโมโฟ
 0 บีเอ็มพี U+31C0..U+31EFซีเจเค สโตรกส์48 39 ทั่วไป
 0 บีเอ็มพี U+31F0..U+31FFส่วนขยายเสียงคาตาคานา16 16 คาตาคานะ
 0 บีเอ็มพี U+3200..U+32FFจดหมายและเดือนภาษาจีน-ญี่ปุ่นที่แนบมาด้วย256 255 อักษรฮันกุล (62 ตัว), อักษรคาตาคานะ (47 ตัว), อักษรทั่วไป (146 ตัว)
 0 บีเอ็มพี U+3300..U+33FFความเข้ากันได้ของ CJK256 256 คาตาคานะ (88 ตัวอักษร), อักษรทั่วไป (168 ตัวอักษร)
 0 บีเอ็มพี U+3400..U+4DBFอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย A6,592 6,592 ฮัน
 0 บีเอ็มพี U+4DC0..U+4DFFสัญลักษณ์หกเหลี่ยมของอี้จิง64 64 ทั่วไป
 0 บีเอ็มพี U+4E00..U+9FFFอักษรจีน ญี่ปุ่น และเกาหลี (CJK)20,992 20,992 ฮัน
 0 บีเอ็มพี U+A000..U+A48Fพยางค์อี1,168 1,165 ยี่
 0 บีเอ็มพี U+A490..U+A4CFอี้ราดิคัล64 55 ยี่
 0 บีเอ็มพี U+A4D0..U+A4FFลีซู48 48 ลีซู
 0 บีเอ็มพี U+A500..U+A63Fไว320 300 ไว
 0 บีเอ็มพี U+A640..U+A69Fซีริลลิก เอ็กซ์เทนเดด บี96 96 อักษรซีริลลิก
 0 บีเอ็มพี U+A6A0..U+A6FFบามัม96 88 บามัม
 0 บีเอ็มพี U+A700..U+A71Fตัวอักษรแสดงระดับเสียงที่ปรับเปลี่ยน32 32 ทั่วไป
 0 บีเอ็มพี U+A720..U+A7FFลาติน เอ็กซ์เอนดิกต์-ดี224 204 ภาษาละติน (199 ตัวอักษร), ภาษาทั่วไป (5 ตัวอักษร)
 0 บีเอ็มพี U+A800..U+A82Fซิลโลติ นากรี48 45 ซิลโลติ นากรี
 0 บีเอ็มพี U+A830..U+A83Fรูปแบบตัวเลขอินเดียทั่วไป16 10 ทั่วไป
 0 บีเอ็มพี U+A840..U+A87Fแฟกส์-ปา64 56 พักส์ ปา
 0 บีเอ็มพี U+A880..U+A8DFซอราษฏระ96 82 ซอราษฏระ
 0 บีเอ็มพี U+A8E0..U+A8FFเทวนาครีแบบขยาย32 32 เทวนาครี
 0 บีเอ็มพี U+A900..U+A92Fคายาห์ ลี48 48 Kayah Li (47 ตัวอักษร), Common (1 ตัวอักษร)
 0 บีเอ็มพี U+A930..U+A95Fเรจัง48 37 เรจัง
 0 บีเอ็มพี U+A960..U+A97Fฮันกุล จาโม ฉบับขยาย A32 29 ฮันกุล
 0 บีเอ็มพี U+A980..U+A9DFชาวชวา96 91 ภาษาชวา (90 ตัวอักษร), ภาษาทั่วไป (1 ตัวอักษร)
 0 บีเอ็มพี U+A9E0..U+A9FFเมียนมาร์ ฉบับขยาย บี32 31 พม่า
 0 บีเอ็มพี U+AA00..U+AA5Fชาม96 83 ชาม
 0 บีเอ็มพี U+AA60..U+AA7Fเมียนมาร์ ฉบับขยาย-เอ32 32 พม่า
 0 บีเอ็มพี U+AA80..U+AADFไทเวียด96 72 ไทเวียด
 0 บีเอ็มพี U+AAE0..U+AAFFMeetei Mayek Extensions32 23 มีเตอี มาเยก
 0 บีเอ็มพี U+AB00..U+AB2Fเอธิโอปิก เอ็กซ์เทนเดด เอ48 32 เอธิโอปิก
 0 บีเอ็มพี U+AB30..U+AB6Fละตินแบบขยายอี64 60 ละติน (56 ตัวอักษร), กรีก (1 ตัวอักษร), สามัญ (3 ตัวอักษร)
 0 บีเอ็มพี ยู+เอบี70..ยู+เอบีบีเอฟเชอโรคี เสริม80 80 เชอโรคี
 0 บีเอ็มพี U+ABC0..U+ABFFมีเตอี มาเยก64 56 มีเตอี มาเยก
 0 บีเอ็มพี U+AC00..U+D7AFพยางค์ฮันกุล11,184 11,172 ฮันกุล
 0 บีเอ็มพี U+D7B0..U+D7FFฮันกุล จาโม ฉบับขยาย บี80 72 ฮันกุล
 0 บีเอ็มพี ยู+ดี800..ยู+ดีบี7เอฟตัวแทนระดับสูง896 0 ไม่ทราบ
 0 บีเอ็มพี U+DB80..U+DBFFตัวแทนการใช้งานส่วนตัวระดับสูง128 0 ไม่ทราบ
 0 บีเอ็มพี U+DC00..U+DFFFตัวแทนระดับต่ำ1,024 0 ไม่ทราบ
 0 บีเอ็มพี U+E000..U+F8FFพื้นที่ใช้งานส่วนตัว6,400 6,400 ไม่ทราบ
 0 บีเอ็มพี ยู+เอฟ900..ยู+เอฟเอฟความเข้ากันได้ของอักษรจีน ญี่ปุ่น และเกาหลี (CJK)512 472 ฮัน
 0 บีเอ็มพี U+FB00..U+FB4Fรูปแบบการนำเสนอเรียงตามตัวอักษร80 58 อาร์เมเนีย (5 ตัวอักษร), ฮิบรู (46 ตัวอักษร), ละติน (7 ตัวอักษร)
 0 บีเอ็มพี U+FB50..U+FDFFแบบฟอร์มการนำเสนอภาษาอาหรับ - A688 656 ภาษาอาหรับ (654 ตัวอักษร), ภาษาทั่วไป (2 ตัวอักษร)
 0 บีเอ็มพี U+FE00..U+FE0Fตัวเลือกการเปลี่ยนแปลง16 16 สืบทอดมา
 0 บีเอ็มพี U+FE10..U+FE1Fรูปทรงแนวตั้ง16 10 ทั่วไป
 0 บีเอ็มพี U+FE20..U+FE2Fการรวมคะแนนครึ่ง16 16 อักษรซีริลลิก (2 ตัวอักษร), สืบทอด (14 ตัวอักษร)
 0 บีเอ็มพี U+FE30..U+FE4Fแบบฟอร์มความเข้ากันได้ของภาษาจีน ญี่ปุ่น และเกาหลี (CJK)32 32 ทั่วไป
 0 บีเอ็มพี ยู+FE50..ยู+FE6Fรูปแบบขนาดเล็ก32 26 ทั่วไป
 0 บีเอ็มพี ยู+FE70..ยู+FEFFแบบฟอร์มการนำเสนอภาษาอาหรับ-B144 141 ภาษาอาหรับ (140 ตัวอักษร), ภาษาทั่วไป (1 ตัวอักษร)
 0 บีเอ็มพี U+FF00..U+FFEFแบบฟอร์มครึ่งความกว้างและแบบเต็มความกว้าง240 225 อักษรฮันกุล (52 ตัว), อักษรคาตาคานะ (55 ตัว), อักษรละติน (52 ตัว), อักษรทั่วไป (66 ตัว)
 0 บีเอ็มพี U+FFF0..U+FFFFรายการพิเศษ16 5 ทั่วไป
 1 ส.ม.U+10000..U+1007Fระบบอักษรพยางค์ลิเนียร์บี128 88 ลิเนียร์ บี
 1 ส.ม. U+10080..U+100FFอักษรภาพลิเนียร์บี128 123 ลิเนียร์ บี
 1 ส.ม. U+10100..U+1013Fตัวเลขแห่งทะเลอีเจียน64 57 ทั่วไป
 1 ส.ม. U+10140..U+1018Fตัวเลขกรีกโบราณ80 79 กรีก
 1 ส.ม. U+10190..U+101CFสัญลักษณ์โบราณ64 14 ภาษากรีก (1 ตัวอักษร), ภาษาทั่วไป (13 ตัวอักษร)
 1 ส.ม. U+101D0..U+101FFแผ่นดิสก์ฟาอิสโตส48 46 ทั่วไป (45 ตัวอักษร), สืบทอด (1 ตัวอักษร)
 1 ส.ม. U+10280..U+1029Fลิเซียน32 29 ลิเซียน
 1 ส.ม. U+102A0..U+102DFคาริอัน64 49 คาริอัน
 1 ส.ม. U+102E0..U+102FFเลขเอแพ็กต์คอปติก32 28 ทั่วไป (27 ตัวอักษร), สืบทอด (1 ตัวอักษร)
 1 ส.ม. U+10300..U+1032Fตัวเอียงแบบเก่า48 39 ตัวเอียงแบบเก่า
 1 ส.ม. U+10330..U+1034Fโกธิค32 27 โกธิค
 1 ส.ม. U+10350..U+1037Fโอลด์ เพอร์มิค48 43 โอลด์ เพอร์มิค
 1 ส.ม. U+10380..U+1039Fอูการิติก32 31 อูการิติก
 1 ส.ม. U+103A0..U+103DFภาษาเปอร์เซียโบราณ64 50 ภาษาเปอร์เซียโบราณ
 1 ส.ม. U+10400..U+1044Fเดเซเร็ต80 80 เดเซเร็ต
 1 ส.ม. U+10450..U+1047Fชาวชาเวียน48 48 ชาวชาเวียน
 1 ส.ม. U+10480..U+104AFออสมานยา48 40 ออสมานยา
 1 ส.ม. U+104B0..U+104FFโอเซจ80 72 โอเซจ
 1 ส.ม. U+10500..U+1052Fเอลบาซาน48 40 เอลบาซาน
 1 ส.ม. U+10530..U+1056Fชาวคอเคเซียนแอลเบเนีย64 53 ชาวคอเคเซียนแอลเบเนีย
 1 ส.ม. U+10570..U+105BFวิทคูฉี80 70 วิทคูฉี
 1 ส.ม. U+105C0..U+105FFโทดรี64 52 โทดรี
 1 ส.ม. U+10600..U+1077Fเชิงเส้น เอ384 341 เชิงเส้น เอ
 1 ส.ม. U+10780..U+107BFละตินเอ็กซ์เอนดิเจนด์เอฟ64 57 ละติน
 1 ส.ม. U+10800..U+1083Fอักษรพยางค์ไซปรัส64 55 ชาวไซปรัส
 1 ส.ม. U+10840..U+1085Fอราเมอิกจักรวรรดิ32 31 อราเมอิกจักรวรรดิ
 1 ส.ม. U+10860..U+1087Fปาลมีรีน32 32 ปาลมีรีน
 1 ส.ม. U+10880..U+108AFนาบาเทียน48 40 นาบาเทียน
 1 ส.ม. U+108E0..U+108FFฮาตรัน32 26 ฮาตรัน
 1 ส.ม. U+10900..U+1091Fชาวฟินิเชียน32 29 ชาวฟินิเชียน
 1 ส.ม. U+10920..U+1093Fลิเดียน32 27 ลิเดียน
 1 ส.ม. U+10940..U+1095Fไซดิก32 26 ไซดิก
 1 ส.ม. U+10980..U+1099Fอักษรภาพเมโรอิติก32 32 อักษรภาพเมโรอิติก
 1 ส.ม. U+109A0..U+109FFลายมือเขียนหวัดแบบเมโรอิติก96 90 ลายมือเขียนหวัดแบบเมโรอิติก
 1 ส.ม. U+10A00..U+10A5Fคาโรชธี96 68 คาโรชธี
 1 ส.ม. U+10A60..U+10A7Fอาหรับใต้เก่า32 32 อาหรับใต้เก่า
 1 ส.ม. U+10A80..U+10A9Fอาหรับเหนือเก่า32 32 อาหรับเหนือเก่า
 1 ส.ม. U+10AC0..U+10AFFมานิเคียน64 51 มานิเคียน
 1 ส.ม. U+10B00..U+10B3Fอเวสตัน64 61 อเวสตัน
 1 ส.ม. U+10B40..U+10B5Fจารึกพาร์เธียน32 30 จารึกพาร์เธียน
 1 ส.ม. U+10B60..U+10B7Fจารึกภาษาปาห์ลาวี32 27 จารึกภาษาปาห์ลาวี
 1 ส.ม. U+10B80..U+10BAFบทเพลงสดุดีของปาห์ลาวี48 29 บทเพลงสดุดีของปาห์ลาวี
 1 ส.ม. U+10C00..U+10C4Fภาษาเตอร์กิกโบราณ80 73 ภาษาเตอร์กิกโบราณ
 1 ส.ม. U+10C80..U+10CFFชาวฮังการีโบราณ128 108 ชาวฮังการีโบราณ
 1 ส.ม. U+10D00..U+10D3Fฮานิฟี โรฮิงยา64 50 ฮานิฟี โรฮิงยา
 1 ส.ม. U+10D40..U+10D8Fการาย80 69 การาย
 1 ส.ม. U+10E60..U+10E7Fสัญลักษณ์ตัวเลขของรูมิ32 31 ภาษาอาหรับ
 1 ส.ม. U+10E80..U+10EBFเยซิดี64 47 เยซิดี
 1 ส.ม. U+10EC0..U+10EFFภาษาอาหรับแบบขยายซี64 21 ภาษาอาหรับ
 1 ส.ม. U+10F00..U+10F2Fโซกเดียนโบราณ48 40 โซกเดียนโบราณ
 1 ส.ม. U+10F30..U+10F6Fซอกเดียน64 42 ซอกเดียน
 1 ส.ม. U+10F70..U+10FAFอุยกูร์โบราณ64 26 อุยกูร์โบราณ
 1 ส.ม. U+10FB0..U+10FDFโคราสเมียน48 28 โคราสเมียน
 1 ส.ม. U+10FE0..U+10FFFเอลิไมค์32 23 เอลิไมค์
 1 ส.ม. U+11000..U+1107Fพราห์มี128 115 พราห์มี
 1 ส.ม. U+11080..U+110CFไคธิ80 68 ไคธิ
 1 ส.ม. U+110D0..U+110FFโซรา สมเพ็ง48 35 โซรา สมเพ็ง
 1 ส.ม. U+11100..U+1114Fจักมา80 71 จักมา
 1 ส.ม. U+11150..U+1117Fมหาจานี48 39 มหาจานี
 1 ส.ม. U+11180..U+111DFชาราดา96 96 ชาราดา
 1 ส.ม. U+111E0..U+111FFตัวเลขโบราณของสิงหล32 20 สิงหล
 1 ส.ม. U+11200..U+1124Fโคจกี80 65 โคจกี
 1 ส.ม. U+11280..U+112AFมุลตานี48 38 มุลตานี
 1 ส.ม. U+112B0..U+112FFคุดาวาดี80 69 คุดาวาดี
 1 ส.ม. U+11300..U+1137Fกรานธา128 86 กรานธา (85 ตัวอักษร), มรดก (1 ตัวอักษร)
 1 ส.ม. U+11380..U+113FFตูลู-ทิกาลารี128 80 ตูลู ทิกาลาลี
 1 ส.ม. U+11400..U+1147Fนิวา128 97 นิวา
 1 ส.ม. U+11480..U+114DFติรหุตะ96 82 ติรหุตะ
 1 ส.ม. U+11580..U+115FFสิทธัม128 92 สิทธัม
 1 ส.ม. U+11600..U+1165Fโมดี96 79 โมดี
 1 ส.ม. U+11660..U+1167Fอาหารเสริมมองโกเลีย32 13 มองโกล
 1 ส.ม. U+11680..U+116CFตักรี80 68 ตักรี
 1 ส.ม. U+116D0..U+116FFเมียนมาร์ เอ็กซ์เทนเดดซี48 20 พม่า
 1 ส.ม. U+11700..U+1174Fอาโหม80 65 อาโหม
 1 ส.ม. U+11800..U+1184Fโดกรา80 60 โดกรา
 1 ส.ม. U+118A0..U+118FFวารังซิตี้96 84 วารังซิตี้
 1 ส.ม. U+11900..U+1195Fดำน้ำอาคุรุ96 72 ดำน้ำอาคุรุ
 1 ส.ม. U+119A0..U+119FFนันดินาการี96 65 นันดินาการี
 1 ส.ม. U+11A00..U+11A4Fจัตุรัสซานาบาซาร์80 72 จัตุรัสซานาบาซาร์
 1 ส.ม. U+11A50..U+11AAFโซยัมโบ96 83 โซยัมโบ
 1 ส.ม. U+11AB0..U+11ABFอักษรพยางค์รวมของชนพื้นเมืองแคนาดาแบบขยาย A16 16 ชนพื้นเมืองแคนาดา
 1 ส.ม. U+11AC0..U+11AFFปอ ซิน เฮา64 57 ปอ ซิน เฮา
 1 ส.ม. U+11B00..U+11B5Fเทวนาครีแบบขยาย-เอ96 10 เทวนาครี
 1 ส.ม. U+11B60..U+11B7Fอาหารเสริมชาราดา32 8 ชาราดา
 1 ส.ม. U+11BC0..U+11BFFสุนูวาร์64 44 สุนูวาร์
 1 ส.ม. U+11C00..U+11C6Fไบกสุกิ112 97 ไบกสุกิ
 1 ส.ม. U+11C70..U+11CBFมาร์เชน80 68 มาร์เชน
 1 ส.ม. U+11D00..U+11D5Fมาซารัม กอนดี96 75 มาซารัม กอนดี
 1 ส.ม. U+11D60..U+11DAFกุนจาลา กอนดี80 63 กุนจาลา กอนดี
 1 ส.ม. U+11DB0..U+11DEFโทลอง ซิกิ64 54 โทลอง ซิกิ
 1 ส.ม. U+11EE0..U+11EFFมาคาซาร์32 25 มาคาซาร์
 1 ส.ม. U+11F00..U+11F5Fคาวาอิ96 87 คาวาอิ
 1 ส.ม. U+11FB0..U+11FBFอาหารเสริมลิซู16 1 ลีซู
 1 ส.ม. U+11FC0..U+11FFFภาคผนวกภาษาทมิฬ64 51 ทมิฬ
 1 ส.ม. U+12000..U+123FFอักษรลิ่ม1,024 922 อักษรลิ่ม
 1 ส.ม. U+12400..U+1247Fตัวเลขและเครื่องหมายวรรคตอนในอักษรลิ่ม128 116 อักษรลิ่ม
 1 ส.ม. U+12480..U+1254Fอักษรลิ่มสมัยราชวงศ์แรก208 196 อักษรลิ่ม
 1 ส.ม. U+12F90..U+12FFFไซโปร-มิโนอัน112 99 ไซปรัส มิโนอัน
 1 ส.ม. U+13000..U+1342Fอักษรภาพอียิปต์1,072 1,072 อักษรภาพอียิปต์
 1 ส.ม. U+13430..U+1345Fการควบคุมรูปแบบอักษรฮีโรกลิฟอียิปต์48 38 อักษรภาพอียิปต์
 1 ส.ม. U+13460..U+143FFอักษรฮีโรกลิฟอียิปต์แบบขยาย-เอ4,000 3,995 อักษรภาพอียิปต์
 1 ส.ม. U+14400..U+1467Fอักษรภาพอนาโตเลีย640 583 อักษรภาพอนาโตเลีย
 1 ส.ม. U+16100..U+1613Fกูรุง เคมา64 58 กูรุง เคมา
 1 ส.ม. U+16800..U+16A3Fอาหารเสริมบามัม576 569 บามัม
 1 ส.ม. U+16A40..U+16A6Fมโร48 43 มโร
 1 ส.ม. U+16A70..U+16ACFถังซ่า96 89 ถังซ่า
 1 ส.ม. U+16AD0..U+16AFFบัสซา วาห์48 36 บัสซา วาห์
 1 ส.ม. U+16B00..U+16B8Fปาฮาวห์ ม้ง144 127 ปาฮาวห์ ม้ง
 1 ส.ม. U+16D40..U+16D7Fคิรัต ไร64 58 คิรัต ไร
 1 ส.ม. U+16E40..U+16E9Fเมเดไฟดริน96 91 เมเดไฟดริน
 1 ส.ม. U+16EA0..U+16EDFเบเรีย เออร์เฟ64 50 เบเรีย เออร์เฟ
 1 ส.ม. U+16F00..U+16F9Fเหมียว160 149 เหมียว
 1 ส.ม. U+16FE0..U+16FFFอักษรภาพและเครื่องหมายวรรคตอน32 12 ฮั่น (9 ตัวอักษร), อักษรคิตันขนาดเล็ก (1 ตัวอักษร), นูซู (1 ตัวอักษร), ถังอุต (1 ตัวอักษร)
 1 ส.ม. U+17000..U+187FFตังกุต6,144 6,144 ตังกุต
 1 ส.ม. U+18800..U+18AFFส่วนประกอบ Tangut768 768 ตังกุต
 1 ส.ม. U+18B00..U+18CFFอักษรคิตันขนาดเล็ก512 471 อักษรคิตันขนาดเล็ก
 1 ส.ม. U+18D00..U+18D7Fอาหารเสริม Tangut128 31 ตังกุต
 1 ส.ม. U+18D80..U+18DFFผลิตภัณฑ์เสริมอาหาร Tangut Components128 115 ตังกุต
 1 ส.ม. U+1AFF0..U+1AFFFคานะ เอ็กซ์ตร้าบี16 13 คาตาคานะ
 1 ส.ม. U+1B000..U+1B0FFอาหารเสริมคานา256 256 ฮิรากานะ (255 ตัวอักษร), คาตาคานะ (1 ตัวอักษร)
 1 ส.ม. U+1B100..U+1B12Fคานะ เอ็กซ์ตร้าเอ48 35 ฮิรากานะ (32 ตัวอักษร), คาตาคานะ (3 ตัวอักษร)
 1 ส.ม. U+1B130..U+1B16Fส่วนขยายคานะขนาดเล็ก64 9 ฮิรากานะ (4 ตัวอักษร), คาตาคานะ (5 ตัวอักษร)
 1 ส.ม. U+1B170..U+1B2FFนูชู400 396 นูชู
 1 ส.ม. U+1BC00..U+1BC9Fดูพลียาน160 143 ดูพลียาน
 1 ส.ม. U+1BCA0..U+1BCAFการควบคุมรูปแบบย่อ16 4 ทั่วไป
 1 ส.ม. U+1CC00..U+1CEBFสัญลักษณ์สำหรับส่วนเสริมการประมวลผลแบบดั้งเดิม704 695 ทั่วไป
 1 ส.ม. U+1CEC0..U+1CEFFเอกสารเสริมเกี่ยวกับสัญลักษณ์เบ็ดเตล็ด64 34 ทั่วไป
 1 ส.ม. U+1CF00..U+1CFCFสัญกรณ์ดนตรีซนาเมนนี208 185 ทั่วไป (116 ตัวอักษร), สืบทอด (69 ตัวอักษร)
 1 ส.ม. U+1D000..U+1D0FFสัญลักษณ์ดนตรีไบแซนไทน์256 246 ทั่วไป
 1 ส.ม. U+1D100..U+1D1FFสัญลักษณ์ทางดนตรี256 233 ทั่วไป (211 ตัวอักษร), สืบทอด (22 ตัวอักษร)
 1 ส.ม. U+1D200..U+1D24Fระบบโน้ตดนตรีของกรีกโบราณ80 70 กรีก
 1 ส.ม. U+1D2C0..U+1D2DFตัวเลข Kaktovik32 20 ทั่วไป
 1 ส.ม. U+1D2E0..U+1D2FFตัวเลขมายัน32 20 ทั่วไป
 1 ส.ม. U+1D300..U+1D35Fสัญลักษณ์ไท่ซวนจิง96 87 ทั่วไป
 1 ส.ม. U+1D360..U+1D37Fตัวเลขแท่งนับ32 25 ทั่วไป
 1 ส.ม. U+1D400..U+1D7FFสัญลักษณ์ตัวอักษรและตัวเลขทางคณิตศาสตร์1,024 996 ทั่วไป
 1 ส.ม. U+1D800..U+1DAAFการเขียนป้ายซัตตัน688 672 การเขียนป้าย
 1 ส.ม. U+1DF00..U+1DFFFลาติน เอ็กซ์เอนดิเจนท์-จี256 37 ละติน
 1 ส.ม. U+1E000..U+1E02Fส่วนเสริมกลาโกไลติก48 38 กลาโกไลต์
 1 ส.ม. U+1E030..U+1E08Fซีริลลิก ดี (Cyrillic Extended-D)96 63 อักษรซีริลลิก
 1 ส.ม. U+1E100..U+1E14FNyiakeng Puachue Hmong80 71 Nyiakeng Puachue Hmong
 1 ส.ม. U+1E290..U+1E2BFโตโต้48 31 โตโต้
 1 ส.ม. U+1E2C0..U+1E2FFวันโช64 59 วันโช
 1 ส.ม. U+1E4D0..U+1E4FFนาค มุนดารี48 42 มุนดารี
 1 ส.ม. U+1E5D0..U+1E5FFโอล โอนัล48 44 โอล โอนัล
 1 ส.ม. U+1E6C0..U+1E6FFไทโย64 55 ไทโย
 1 ส.ม. U+1E7E0..U+1E7FFเอธิโอปิก เอ็กซ์เทนเดด บี32 28 เอธิโอปิก
 1 ส.ม. U+1E800..U+1E8DFเมนเด้ คิคาคุอิ224 213 เมนเด้ คิคาคุอิ
 1 ส.ม. U+1E900..U+1E95Fแอดลัม96 88 แอดลัม
 1 ส.ม. U+1EC70..U+1ECBFหมายเลข Siyaq ของอินเดีย80 68 ทั่วไป
 1 ส.ม. U+1ED00..U+1ED4Fหมายเลข Siyaq ของออตโตมัน80 61 ทั่วไป
 1 ส.ม. U+1EE00..U+1EEFFสัญลักษณ์ตัวอักษรทางคณิตศาสตร์ของภาษาอาหรับ256 143 ภาษาอาหรับ
 1 ส.ม. U+1F000..U+1F02Fไพ่นกกระจอก48 44 ทั่วไป
 1 ส.ม. U+1F030..U+1F09Fกระเบื้องโดมิโน112 100 ทั่วไป
 1 ส.ม. U+1F0A0..U+1F0FFไพ่เล่น96 82 ทั่วไป
 1 ส.ม. U+1F100..U+1F1FFเอกสารเสริมตัวอักษรและตัวเลขที่แนบมาด้วย256 200 ทั่วไป
 1 ส.ม. U+1F200..U+1F2FFเอกสารเสริมเกี่ยวกับอักษรภาพที่แนบมาด้วย256 64 ฮิรากานะ (1 ตัวอักษร), สามัญ (63 ตัวอักษร)
 1 ส.ม. U+1F300..U+1F5FFสัญลักษณ์และภาพสัญลักษณ์เบ็ดเตล็ด768 768 ทั่วไป
 1 ส.ม. U+1F600..U+1F64Fอิโมติคอน80 80 ทั่วไป
 1 ส.ม. U+1F650..U+1F67Fดิงแบตประดับ48 48 ทั่วไป
 1 ส.ม. U+1F680..U+1F6FFสัญลักษณ์การขนส่งและแผนที่128 119 ทั่วไป
 1 ส.ม. U+1F700..U+1F77Fสัญลักษณ์เล่นแร่แปรธาตุ128 128 ทั่วไป
 1 ส.ม. U+1F780..U+1F7FFรูปทรงเรขาคณิตแบบขยาย128 103 ทั่วไป
 1 ส.ม. U+1F800..U+1F8FFลูกศรเสริม-C256 171 ทั่วไป
 1 ส.ม. U+1F900..U+1F9FFสัญลักษณ์และภาพสัญลักษณ์เพิ่มเติม256 256 ทั่วไป
 1 ส.ม. U+1FA00..U+1FA6Fสัญลักษณ์หมากรุก112 102 ทั่วไป
 1 ส.ม. U+1FA70..U+1FAFFสัญลักษณ์และภาพสัญลักษณ์แบบขยาย-เอ144 120 ทั่วไป
 1 ส.ม. U+1FB00..U+1FBFFสัญลักษณ์สำหรับการประมวลผลแบบดั้งเดิม256 250 ทั่วไป
 2 SIPU+20000..U+2A6DFอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย B42,720 42,720 ฮัน
 2 SIP U+2A700..U+2B73Fอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย C4,160 4,160 ฮัน
 2 SIP U+2B740..U+2B81Fอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย D224 222 ฮัน
 2 SIP U+2B820..U+2CEAFอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย E5,776 5,774 ฮัน
 2 SIP U+2CEB0..U+2EBEFอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยายอักษรจีน-ญี่ปุ่น (F)7,488 7,473 ฮัน
 2 SIP U+2EBF0..U+2EE5Fอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยายที่ 1624 622 ฮัน
 2 SIP U+2F800..U+2FA1Fเอกสารเสริมเกี่ยวกับอักษรภาพที่ใช้ได้ทั้งภาษาจีน ญี่ปุ่น และเกาหลี (CJK Compatibility Ideographs Supplement)544 542 ฮัน
 เคล็ดลับ 3 ข้อU+30000..U+3134Fอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย G4,944 4,939 ฮัน
 เคล็ดลับ 3 ข้อ U+31350..U+323AFอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย H4,192 4,192 ฮัน
 เคล็ดลับ 3 ข้อ U+323B0..U+3347Fอักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยายอักษรจีน J4,304 4,298 ฮัน
14 เอสเอสพีU+E0000..U+E007Fแท็ก128 97 ทั่วไป
14 เอสเอสพี U+E0100..U+E01EFส่วนเสริมตัวเลือกการเปลี่ยนแปลง240 240 สืบทอดมา
15 พัว-เอU+F0000..U+FFFFFพื้นที่ใช้งานส่วนบุคคลเพิ่มเติม-A65,536 65,534 ไม่ทราบ
16 พียูเอ-บีU+100000..U+10FFFFพื้นที่ใช้งานส่วนตัวเพิ่มเติม-B65,536 65,534 ไม่ทราบ
  1. ^จำนวนรหัสอักขระรวมถึงรหัสอักขระที่ไม่ได้กำหนดไว้ด้วย เช่น อักขระที่ไม่ใช่ตัวอักษรอักขระสงวนเป็นต้น
  2. ^สคริปต์มีอักขระหนึ่งตัวหรือหลายตัวในบล็อก ตามที่กำหนดโดยคุณสมบัติสคริปต์ ซึ่งเป็นอิสระจากชื่อบล็อก
  3. ^ "ทั่วไป" และ "ไม่ทราบ" (Zyyy) และ "สืบทอด" (Zinh หรือ Qaai) หมายถึงอักษรในมาตรฐาน ISO 15924
  4. ^ไฟล์ข้อมูลบล็อก Unicodeตั้งแต่เวอร์ชัน Unicode 17.0 เป็นต้นไป
  5. ^ UAX 24: คุณสมบัติสคริปต์ยูนิโค้ด (รหัสตัวอักษร 4 ตัว)
  6. ^ UAX 24: ไฟล์ข้อมูลสคริปต์
  7. ^เรียกว่า "C0 Controls and Basic Latin" ในมาตรฐาน ISO/IEC 10646
  8. ^เรียกว่า "C1 Controls and Latin-1 Supplement" ในมาตรฐาน ISO/IEC 10646

บล็อกที่เคลื่อนย้าย

นโยบายความเสถียรของยูนิโค้ดกำหนดว่า เมื่อกำหนดอักขระแล้ว จะไม่สามารถย้ายหรือลบออกได้ แม้ว่าอักขระนั้นจะถูกยกเลิกการใช้งานแล้วก็ตาม นโยบายนี้ใช้กับยูนิโค้ด 2.0 และเวอร์ชันต่อๆ ไปทั้งหมด

ก่อนหน้านี้ มีการเคลื่อนย้ายบล็อกเดิมดังต่อไปนี้:

บล็อก Unicode เดิมจากก่อน Unicode 2.0
ช่วงบล็อก ชื่อบล็อก ทางประวัติศาสตร์เวอร์ชันเมื่อเพิ่ม เวอร์ชันเมื่อถูกลบออก พื้นที่ซึ่งปัจจุบันถูกครอบครองโดย ถูกแทนที่ด้วยบล็อก รหัสจุด ตัวละครที่ได้รับมอบหมาย สคริปต์
U+1000..U+105F ทิเบต[ 5 ]1.0.0 1.0.1 พม่าทิเบต96 71 ทิเบต
ยู+3400..ยู+3D2D ฮันกุล[ 6 ]1.0.0 2.0 อักษรจีน ญี่ปุ่น และเกาหลี (CJK) ส่วนขยาย Aพยางค์ฮันกุล2350 2350 ฮันกุล
U+3D2E..U+44B7 ฮันกุล เสริม-A [ 6 ]1.1 2.0 1930 1930
U+44B8..U+4DFF ฮันกุล เสริม-บี[ 6 ]อักษรจีน-ญี่ปุ่น-เกาหลี (ส่วนขยาย A)และสัญลักษณ์เฮกซาแกรมอี้จิง2376 2376
  • เว็บไซต์อย่างเป็นทางการของ Unicode Consortium(ภาษาอังกฤษ)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Unicode_block&oldid=1341798295 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ บล็อกยูนิโค้ด

บล็อกยูนิโค้ด (Unicode block ) คือช่วงรหัสตัวเลข ( code points ) ที่ต่อเนื่องกันหลายช่วงของ ชุดอักขระ ยูนิโค้ด (Unicode character set) ซึ่งกำหนดโดยสมาคมยูนิโค้ด (Unicode

การออกแบบและการดำเนินการ

บล็อก Unicode จะถูกระบุด้วยชื่อเฉพาะ ซึ่งใช้เฉพาะอักขระ ASCII และมักจะอธิบายลักษณะของสัญลักษณ์ เช่น "Tibetan" หรือ "Supplemental Arrows-A" เมื่อเปรียบเทียบชื่อบล็อก ควรเทียบตัวพิมพ์ใหญ่กับตัวพิมพ์ เล็ก และไม่สนใจช่องว่าง เครื่องหมายยัติภังค์ และขีดเส้นใต้...

การจำแนกประเภทอื่นๆ

จุด Unicode แต่ละจุดยังมีคุณสมบัติที่เรียกว่า " หมวดหมู่ทั่วไป " ซึ่งพยายามอธิบายบทบาทของสัญลักษณ์ที่เกี่ยวข้องในภาษาหรือแอปพลิเคชันที่รวมไว้ในระบบ ตัวอย่างของหมวดหมู่ทั่วไป ได้แก่ "Lu" (หมายถึงตัวอักษรพิมพ์ใหญ่), "Nd" (ตัวเลขทศนิยม), "Pi"...

รายการบล็อก

Unicode 17.0 กำหนดบล็อกไว้ 346 บล็อก: [ 1 ]