กลับไปหน้าบทความ

อ่าน 3 นาที

อักษรอาหรับในยูนิโค้ด

สคริปต์ จำนวนมาก ใน Unicode เช่นภาษาอาหรับมีกฎการเขียน พิเศษ ที่กำหนดให้ต้องรวมตัวอักษรบางรูปแบบเข้าด้วยกันเพื่อสร้างรูปแบบตัวเชื่อม พิเศษ ในภาษาอังกฤษ เครื่องหมายแอมเปอร์แซนด์ (&)

อักษรอาหรับในยูนิโค้ด

สคริปต์ จำนวนมาก ใน Unicode เช่นภาษาอาหรับมีกฎการเขียน พิเศษ ที่กำหนดให้ต้องรวมตัวอักษรบางรูปแบบเข้าด้วยกันเพื่อสร้างรูปแบบตัวเชื่อม พิเศษ ในภาษาอังกฤษ เครื่องหมายแอมเปอร์แซนด์ (&) ทั่วไปพัฒนามาจากตัวเชื่อมที่รวมตัวอักษรละตินที่เขียนด้วยมือeและt (สะกดว่าetซึ่งเป็นภาษาละตินแปลว่าและ ) เข้าด้วยกัน[ 1 ]

ตามUnicode 17.0 สคริปต์ภาษาอาหรับจะบรรจุอยู่ในบล็อก ต่อไปนี้ : [ 2 ]

ชุดรหัสภาษาอาหรับพื้นฐานเข้ารหัสตัวอักษรและเครื่องหมายกำกับเสียงมาตรฐาน แต่ไม่ได้เข้ารหัสรูปแบบตามบริบท (U+0621–U+0652 อิงโดยตรงจากISO 8859-6 ) และยังรวมถึงเครื่องหมายกำกับเสียงและ ตัวเลขอาหรับ-อินเดียที่ใช้กันทั่วไปด้วยชุดรหัสภาษาอาหรับเสริมเข้ารหัสตัวอักษรแบบต่างๆ ที่ส่วนใหญ่ใช้ในการเขียนภาษาแอฟริกัน (ที่ไม่ใช่ภาษาอาหรับ) ชุดรหัสภาษาอาหรับขยาย-B และภาษาอาหรับขยาย-A เข้ารหัสคำอธิบายประกอบอัลกุรอานเพิ่มเติมและตัวอักษรแบบต่างๆ ที่ใช้สำหรับภาษาที่ไม่ใช่ภาษาอาหรับต่างๆ ชุดรหัสรูปแบบการนำเสนอภาษาอาหรับ-A เข้ารหัสรูปแบบตามบริบทและการเชื่อมตัวอักษรแบบต่างๆ ที่จำเป็นสำหรับภาษาเปอร์เซีย อูร์ดู สินธี และภาษาเอเชียกลาง ชุดรหัสรูปแบบการนำเสนอภาษาอาหรับ-B เข้ารหัสรูปแบบการเว้นวรรคของเครื่องหมายกำกับเสียงภาษาอาหรับ และรูปแบบตัวอักษรตามบริบทเพิ่มเติม รูปแบบการนำเสนอมีอยู่เพื่อความเข้ากันได้กับมาตรฐานเก่าเท่านั้น และปัจจุบันยังไม่จำเป็นสำหรับการเข้ารหัสข้อความ[ 3 ] บล็อกสัญลักษณ์ตัวอักษรคณิตศาสตร์ภาษาอาหรับเข้ารหัสอักขระที่ใช้ในนิพจน์คณิตศาสตร์ภาษาอาหรับ บล็อกตัวเลข Siyaq ของอินเดียประกอบด้วยชุดย่อยเฉพาะของอักษรอาหรับที่ใช้สำหรับการบัญชีในอินเดียภายใต้จักรวรรดิมุกลในศตวรรษที่ 17 จนถึงกลางศตวรรษที่ 20 [ 4 ] [ 5 ] บล็อกตัวเลข Siyaq ของออตโตมันประกอบด้วยชุดย่อยเฉพาะของอักษรอาหรับ หรือที่รู้จักกันในชื่อ ตัวเลข Siyakatซึ่งใช้สำหรับการบัญชีในเอกสารตุรกีออตโตมัน[ 5 ]

รูปแบบตามบริบท

ด้านล่างนี้คือการสาธิตตัวอักษรพื้นฐานที่ใช้ในภาษาอาหรับมาตรฐานสมัยใหม่ซึ่งแสดงให้เห็นว่าตัวอักษรอาหรับควรปรากฏในบริบทต่างๆ อย่างไร รหัสที่ระบุว่าเป็นรูปแบบตามบริบท " ไม่ ควร ใช้ในการแลกเปลี่ยนทั่วไป" [ 3 ] Unicode มีวิธีการเข้ารหัสความแตกต่างอื่นๆ หากจำเป็น เช่นZero-width joiner

ยูนิโค้ด ทั่วไปรูปแบบตามบริบท ชื่อ
โดดเดี่ยว สุดท้าย (จบ) ตรงกลาง (มีเดียล) เบื้องต้น (เริ่มต้น)
0627 اFE8D FE8E อะลิฟ
0628 FE8F FE90 FE92 FE91 bāʾ
062A تFE95 FE96 FE98 FE97 tāʾ
062B ثFE99 FE9A FE9C FE9B ṯāʾ
062C جFE9D FE9E FEA0 FE9F ǧīm
062D حFEA1 FEA2 FEA4 FEA3 ḥāʾ
062E خFEA5 FEA6 FEA8 FEA7 ḫāʾ
062F FEA9 FEAA ดาล
0630 น.FEAB FEAC ḏāl
0631 FEAD FEAE ราอ์
0632 زFEAF 0ก.พ.zayn/zāy
0633 1ก.พ.2ก.พ.4ก.พ.3ก.พ.บาป
0634 น.5 ก.พ. 6 ก.พ. 8 ก.พ.7 ก.พ. บาป
0635 น.9 ก.พ.FEBA FEBC กุมภาพันธ์ṣād
0636 ضFEBD เฟเบFEC0 กุมภาพันธ์ﺿพ่อ
0637 ต.FEC1 FEC2 FEC4 FEC3 ṭāʾ
0638 ظเอฟอีซี5 FEC6 FEC8 FEC7 ẓāʾ
0639 عFEC9 เฟกาFECC FECB ʿayn
063A غFECD FECE FED0 เอฟอีซีเอฟไกน์
0641 เอฟดี1 เอฟดี2 เอฟอีดี4 เอฟดี3 ฟาอ์
0642 قเอฟดี5 เอฟดี6 เอฟดี8 เอฟอีดี7 qāf
0643 كเอฟดี9 เฟดาFEDC FEDB kāf
0644 لเฟดดีเฟเดค่าธรรมเนียม0 ﻠFEDF ลัม
06:45 น.ค่าธรรมเนียม 1 ค่าธรรมเนียม 2 ค่าธรรมเนียม 4 ค่าธรรมเนียม 3
0646 ค่าธรรมเนียม 5 ค่าธรรมเนียม 6 ค่าธรรมเนียม 8 ค่าธรรมเนียม 7 นูน
0647 هค่าธรรมเนียม 9 FEEA FEEC FEEB hāʾ
0648 และฟีดค่าธรรมเนียมว้าว
064A يFEF1 FEF2 FEF4 เอฟเอฟ3 yāʾ
0622 آFE81 FE82 อะลิฟ มัดดาห์
0629 ةFE93 FE94 Tāʾ marbūṭah
0649 ىค่าธรรมเนียมFEF0 ʾalif maqṣūrah

เครื่องหมายวรรคตอนและเครื่องประดับ

ในการพิมพ์ตัวเลขภาษาอาหรับทั่วไป จะใช้เพียงเครื่องหมายคำถาม ⟨ ؟ ⟩ และเครื่องหมายจุลภาค ⟨ ، ⟩ เท่านั้น และเครื่องหมายจุลภาคนี้มักถูกใช้แทนเครื่องหมายจุลภาคในอักษรละติน ⟨ , ⟩ ซึ่งใช้เป็นตัวคั่นทศนิยมเมื่อใช้ตัวเลขอาหรับแบบตะวันออก (เช่น ⟨100.6⟩ เมื่อเทียบกับ ⟨ ١٠٠,٦ ⟩)

  • U+060C ، ‎ ARABIC COMMA
  • U+060D ؍ ‎ ตัวคั่นวันที่ แบบอาหรับ
  • U+060E ؎ ‎ สัญลักษณ์บทกวี อาหรับ
  • U+060F ؏ ‎ ARABIC SIGN MISRA
  • U+061B ؛ ‎ ARABIC SEMICOLON
  • U+061E ؞ ‎ เครื่องหมายวรรคตอนจุดสามจุด ภาษาอาหรับ
  • U+061F ؟ ‎ เครื่องหมายคำถาม ภาษาอาหรับ
  • U+066D ٭ ดาวห้าแฉกอาหรับ
  • U+06D4 ۔ ‎ ARABIC FULL STOP
  • U+06DD ۝ ‎ ภาษาอาหรับ จบอายะห์
  • U+06DE ۞ ‎ ARABIC START OF RUB EL HIZB
  • U+06E9 ۩ ‎ สถานที่แห่งการสุญูดในภาษา อาหรับ
  • U+06FD ۽ ‎ เครื่องหมาย อาหรับ
  • U+FD3E วงเล็บซ้ายประดับประดาแบบอาหรับ
  • U+FD3F ﴿ วงเล็บขวาประดับประดาแบบอาหรับ

การเชื่อมคำ

รูปแบบการนำเสนอภาษาอาหรับ-A มีอักขระบางตัวที่กำหนดให้เป็น "ตัวเชื่อมคำ" สำหรับคำที่ใช้บ่อยในสำนวนสำเร็จรูปในภาษาอาหรับ อักขระเหล่านี้ไม่ค่อยได้ใช้ในงานพิมพ์นอกเหนือจากงานพิมพ์ทางศาสนาโดยเฉพาะ และโดยปกติแล้วอักษร Rial จะเขียนแบบเต็ม ไม่ได้ใช้ตัวเชื่อมคำ

  • U+FDF0 ‎ อักษร อาหรับ ( صلى , เขียนเป็น صلے )
  • U+FDF1 ‎ อักษร อาหรับ ( قلى , เขียนเป็น قلے )
  • U+FDF2 ‎ อักษรมัด ตัวอัล ( الله )
  • U+FDF3 ‎ ARABIC LIGATURE AKBAR รูปแบบแยก ( اكبر ) ดังในวลี الله اكبر Allāhu akbar
  • U+FDF4 ‎ อักษรมัด อาหรับ ( محمد )
  • U+FDF5 ‎ ARABIC LIGATURE SALAM ISOLATED FORM ( صلعم , ตัวย่อของ صلى الله عليه وسلم "สันติภาพจงมีแด่เขา")
  • U+FDF6 ‎ มัด อาหรับ ( رسول )
  • U+FDF7 ‎ มัด อาหรับ ( عليه )
  • U+FDF8 ‎ อักษรมัด อาหรับ ( وسلم )
  • U+FDF9 ‎ อักษรมัด อาหรับ ( صلى )
  • U+FDFA ‎ อักษร อาหรับ ( صلى الله عليه وسلم "ขอความสันติสุขจงมีแด่พระองค์")
  • U+FDFB ‎ มัด อาหรับ JALLAJALOUHOU ( جل جلاله )
  • U+FDFC ‎ RIAL SIGN ( ريال )
  • U+FDFD ‎ อักษรอาหรับ บิส มิ ( بسم الله الرحمن الرحيم บิสม์-อิ ลลาห์-อิ ร-เราะห์มาน-อิ ร-เราะฮีม )

บล็อกโค้ด

ภาษาอาหรับ

ตารางตัวละคร

รหัส ผลลัพธ์ ชื่อยูนิโค้ด
ยู+0600 ؀   เครื่องหมายตัวเลข อาหรับ
ยู+0601 ؁   ป้ายภาษาอาหรับ ซานาห์
ยู+0602 ؂   เครื่องหมายเชิงอรรถภาษาอาหรับ
ยู+0603 ؃   อักษรอาหรับซาฟฮา
ยู+0604 ؄   อักษรอาหรับ Samvat

ใช้สำหรับเขียนวันที่ในคริสต์ศักราชสัมวัตในภาษาอูร์ดู

ยู+0605 ؅   เครื่องหมายตัวเลขอาหรับด้านบน

อาจใช้ร่วมกับหมายเลข Epact ของคอปติกได้

ยู+0606 ؆   รากที่สามของภาษาอาหรับ-อินเดีย

→ U+221B ∛ รากที่สาม

ยู+0607 ؇   รากที่สี่ของภาษาอาหรับ-อินเดีย

→ U+221C ∜ รากที่สี่

ยู+0608 ؈   รังสีอาหรับ
ยู+0609 ؉   สัญลักษณ์ Per Mille ภาษาอาหรับ-อินเดีย

→ U+2030 ‰ Per Mille Sign

ยู+060เอ ؊   ภาษาอาหรับ-อินเดีย ต่อหมื่น สัญลักษณ์

→ U+2031‱ ต่อหมื่นป้าย

ยู+060บี ؋   สัญลักษณ์อัฟกานี
ยู+060ซี ،   เครื่องหมายจุลภาคภาษาอาหรับ

นอกจากนี้ยังใช้ร่วมกับภาษาธาอานาและภาษาซีเรียคในข้อความสมัยใหม่ด้วย

→ U+002C , คอมมา

→ U+2E32 ⸲ Turned Comma

→ U+2E41 ⹁ เครื่องหมายจุลภาคกลับหัว

ยู+060ดี ؍   ตัวคั่นวันที่แบบอาหรับ
ยู+060อี ؎   สัญลักษณ์บทกวีภาษาอาหรับ
ยู+060เอฟ ؏   ป้ายภาษาอาหรับมิสรา
ยู+0610 ؐ   เครื่องหมายภาษาอาหรับ ศ็อลลัลลอฮุอะลัยฮิ วัสสัลลัม

หมายถึง ศ็อลลัลลอฮุ อะลัยฮิ วะซัลลัม "ขอความสันติและพรจากอัลลอฮ์จงมีแด่ท่าน"

ยู+0611 ؑ   อักษรอาหรับ อะลัยฮ์ อัสซาลาม

หมายถึง "ขอความสันติสุขจงมีแด่ท่าน"

ยู+0612 ؒ   เครื่องหมายภาษาอาหรับ เราะห์มาตุลลอฮฺ อะลัยฮี

เป็นตัวแทนของ rahmatullah alayhe "ขออัลลอฮ์ทรงเมตตาเขา"

ยู+0613 ؓ   อักษรอาหรับ Radi Allahou Anhu

เป็นตัวแทนของ radi allahu 'anhu "ขออัลลอฮ์ทรงพอพระทัยเขา"

ยู+0614 ؔ   ป้ายภาษาอาหรับ Takhallus

เครื่องหมายที่วางไว้เหนือชื่อหรือนามปากกาของกวี หรือในงานเขียนบางประเภทใช้เพื่อระบุชื่อเฉพาะทั้งหมด

ยู+0615 ؕ   ภาษาอาหรับ เล็ก สูง ทาห์

เครื่องหมายนี้เป็นตำแหน่งหยุดพักที่แนะนำในคัมภีร์อัลกุรอานบางเล่มที่ตีพิมพ์ในอิหร่านและปากีสถาน ไม่ควรสับสนกับเครื่องหมาย TAH ขนาดเล็กที่ใช้เป็นเครื่องหมายกำกับเสียงสำหรับตัวอักษรบางตัว เช่น 0679

ยู+0616 ؖ   อักษรอาหรับตัวเล็กสูงเชื่อมติดกัน อเลฟ กับ ลาม กับ เยห์

เปอร์เซียยุคต้น

อักษรอาหรับตัวเล็กแบบเชื่อมติดกัน Alef พร้อม Yeh Barree

ยู+0617 ؗ   ภาษาอาหรับ เล็ก สูง ซาอิน
ยู+0618 ؘ   ภาษาอาหรับ ฟัตฮะฮ์เล็ก

ไม่ควรสับสนกับ 064E Fatha

ยู+0619 ؙ   ดัมมาเล็กภาษาอาหรับ

ไม่ควรสับสนกับ 064F Damma

ยู+061เอ ؚ   คาสราเล็กแบบอาหรับ

ไม่ควรสับสนกับ 0650 กัสรา

ยู+061บี ؛   เครื่องหมายอัฒภาคภาษาอาหรับ

นอกจากนี้ยังใช้กับ Thaana และ Syriac ในข้อความสมัยใหม่ → U+003B ; เครื่องหมายอัฒภาค → U+204F ⁏ เครื่องหมายอัฒภาคกลับด้าน → U+2E35 ⸵ เครื่องหมายอัฒภาคกลับด้าน

ยู+061ซี ؜   เครื่องหมายอักษรอาหรับ (อัลม)
ยู+061D ؝   เครื่องหมายสิ้นสุดข้อความภาษาอาหรับ
ยู+061E ؞   เครื่องหมายวรรคตอนจุดสามจุดในภาษาอาหรับ
ยู+061เอฟ ؟   เครื่องหมายคำถามภาษาอาหรับ

นอกจากนี้ยังใช้กับภาษาธาอานาและภาษาซีเรียคในข้อความสมัยใหม่ → U+003F ? เครื่องหมายคำถาม → U+2E2E ⸮ เครื่องหมายคำถามกลับด้าน

ยู+0620 ؠ   อักษรอาหรับ Kashmiri Yeh
ยู+0621 ء   อักษรอาหรับฮัมซา

→ U+02BE ʾ อักษรดัดแปลง วงแหวนครึ่งวงขวา

ยู+0622 آ   อักษรอาหรับ อเลฟ พร้อมมัดดะอยู่ด้านบน

≡ آ U+0627 U+0653

ยู+0623 أ   อักษรอาหรับ อเลฟ พร้อมฮัมซาอยู่ด้านบน

≡ أ U+0627 U+0654

ยู+0624 ؤ   อักษรอาหรับ วาว พร้อมฮัมซาอยู่ด้านบน

≡ ؤ U+0648 U+0654

ยู+0625 إ   อักษรอาหรับ อเลฟ พร้อมฮัมซาอยู่ด้านล่าง

≡ إ U+0627 U+0655

ยู+0626 ئ   อักษรอาหรับ Yeh พร้อม Hamza อยู่ด้านบน

ในภาษาคีร์กีซ ฮัมซาจะอยู่ทางด้านบนขวาเสมอ ทั้งในรูปแบบแยกเดี่ยวและรูปแบบสุดท้าย ≡ ئ U+064A U+0654

ยู+0627 ا   อักษรอาหรับ อเลฟ
ยู+0628 ب   อักษรอาหรับ เบห์
ยู+0629 ة   อักษรอาหรับ Teh Marbuta
ยู+062เอ   อักษรอาหรับ Teh
ยู+062บี ث   อักษรอาหรับ
ยู+062ซี ج   อักษรอาหรับ Jeem
ยู+062D ح   อักษรอาหรับ ฮา
ยู+062อี خ   อักษรอาหรับ คาห์
ยู+062เอฟ   อักษรอาหรับ Dal
U+0630 ذ   อักษรอาหรับ Thal
ยู+0631   อักษรอาหรับ เรห์
ยู+0632 ز   อักษรอาหรับ Zain
ยู+0633   ตัวอักษรอาหรับที่เห็น
ยู+0634   อักษรอาหรับ ชีน
ยู+0635 ص   อักษรอาหรับเศร้า
ยู+0636 ض   อักษรอาหรับ พ่อ
ยู+0637 ط   อักษรอาหรับ ทาห์
ยู+0638 ظ   อักษรอาหรับ Zah
ยู+0639 ع   อักษรอาหรับ Ain

→ U+01B9 ƹ อักษรละตินตัวเล็ก Ezh กลับด้าน → U+02BF ʿ อักษรดัดแปลง วงแหวนครึ่งซ้าย

ยู+063เอ غ   อักษรอาหรับ Ghain
ยู+063บี ػ   อักษรอาหรับ เคเฮะ มีจุดสองจุดอยู่ด้านบน
ยู+063ซี ؼ   อักษรอาหรับ เคเฮะห์ มีจุดสามจุดอยู่ด้านล่าง
ยู+063D ؽ   อักษรอาหรับ Farsi Yeh รูปตัววีคว่ำ

อาเซอร์ไบจาน

ยู+063อี ؾ   อักษรอาหรับ (ภาษาเปอร์เซีย) เยห์ มีจุดสองจุดอยู่ด้านบน
ยู+063เอฟ ؿ   อักษรอาหรับ (ฟาร์ซี) เยห์ มีจุดสามจุดอยู่ด้านบน
ยู+0640 ـ   ทัตวีลภาษาอาหรับ

แทรกเพื่อยืดตัวอักษรหรือเพื่อใส่เครื่องหมายทาชกิลโดยไม่มีตัวอักษรพื้นฐาน ใช้กับภาษาอาดลัม ฮานิฟี โรฮิงยา มันไดก์ มานิเคียน พซาลเตอร์ ปาห์ลาวี โซกเดียน และซีเรียค = คาชิดา

ยู+0641   อักษรอาหรับ เฟห์
ยู+0642 ق   อักษรอาหรับ Qaf
ยู+0643 ك   อักษรอาหรับ Kaf
ยู+0644 ل   อักษรอาหรับ Lam
ยู+0645   อักษรอาหรับ Meem

ชาวสินธีใช้รูปทรงที่มีหางสั้น

ยู+0646   อักษรอาหรับ เที่ยง
ยู+0647 ه   อักษรอาหรับ เฮ
ยู+0648 และ   อักษรอาหรับ วาว
ยู+0649 ى   อักษรอาหรับ อเลฟ มักซูรา

แสดงถึงอักษรเยห์ (YEH) ที่เชื่อมต่อกันสองทางโดยไม่มีจุดในรูปแบบตำแหน่งใดๆ ไม่ได้มีไว้สำหรับใช้ร่วมกับ 0654 → U+0626 ئ อักษรอาหรับ เยห์ พร้อมฮัมซา (Hamza) อยู่ด้านบน

ยู+064เอ ي   อักษรอาหรับ เยห์

จะไม่มีจุดเมื่อใช้ร่วมกับ 0654 และจะมีจุดเมื่อใช้ร่วมกับเครื่องหมายรวมอื่นๆ → U+08A8 ࢨ อักษรอาหรับ Yeh มีจุดสองจุดด้านล่างและ Hamza ด้านบน

ยู+064บี ً   ภาษาอาหรับ ฟาธาตัน
ยู+064ซี ٌ   ดัมมาตันอาหรับ

→ รูปแบบลายมือ / คัมภีร์อัลกุรอาน: U+08F1  

รูปแบบอื่นเขียนได้เป็นดัมมาสองตัวที่พันกัน โดยตัวหนึ่งหมุนไป 180 องศา U+08E8  

ยู+064ดี     ٍอาหรับ กัสราตัน
ยู+064อี َ   ฟัตฮาภาษาอาหรับ
ยู+064เอฟ ُ   ดัมมาอาหรับ
ยู+0650     ِกัศราอาหรับ
ยู+0651     ّชะดดาอาหรับ
ยู+0652 ْ   ภาษาอาหรับ สุกุน

เครื่องหมายที่ไม่มีสระหลังพยัญชนะฐานสามารถมีรูปร่างได้หลากหลาย รวมถึงรูปวงกลมและรูปร่างที่ดูเหมือน '06E1' → U+06E1   ۡ   ‎ Arabic Small High Dotless Head Of Khah

ยู+0653 ٓ     มัดดะห์อาหรับด้านบน

ใช้สำหรับ madd jaa'iz ในระบบการเขียนของเอเชียใต้และชาวอินโดนีเซีย

→ U+089C   ࢜   ‎ ภาษาอาหรับ มัดดา วาจิบ

→ U+089E   ࢞   ‎ มัดดา คู่ภาษาอาหรับ

→ U+089F   ࢟   ‎ ภาษาอาหรับ ครึ่ง Madda เหนือ Madda

ยู+0654 ٔ   ฮัมซาอาหรับด้านบน

ความหมายจำกัดเฉพาะฮัมซาและอีซาเฟ ไม่ได้ใช้เป็นเครื่องหมายกำกับเสียงเพื่อสร้างตัวอักษรใหม่

ยู+0655 ٕ   ฮัมซาอาหรับด้านล่าง
ยู+0656 ٖ   อักษรอาหรับตัวห้อยอะเลฟ
ยู+0657 ٗ   ดัมมากลับหัวแบบอาหรับ

แคชเมียร์, อูรดู, สวาฮีลี, โซมาเลีย

ยู+0658 ٘   มาร์คอาหรับ นูน กุนนา

บาลูชี หมายถึงการออกเสียงขึ้นจมูกในภาษาอูร์ดู

ยู+0659 ٙ   อาหรับ ซวารากาย

ปัชโต

ยู+065เอ ٚ   เครื่องหมายสระภาษาอาหรับ ตัว V เล็ก ด้านบน

ภาษาแอฟริกัน

ยู+065บี ٛ   เครื่องหมายสระภาษาอาหรับ ตัววีเล็กกลับหัวอยู่ด้านบน

ภาษาแอฟริกัน

ยู+065ซี ٜ   จุดใต้เครื่องหมายสระภาษาอาหรับ

ภาษาแอฟริกันก็ถูกนำมาใช้ในคัมภีร์อัลกุรอานทั้งในรูปแบบการเขียนของชาวแอฟริกันและภาษาอื่นๆ ด้วย

ยู+065ดี ٝ   ดัมมาแบบกลับด้านภาษาอาหรับ

ภาษาแอฟริกัน

ยู+065อี ٞ   อักษรฟัตฮาภาษาอาหรับที่มีจุดสองจุด

คาลามิ

ยู+065F     ٟฮัมซาชาวอาหรับหยักศกด้านล่าง

แคชเมียร์

ยู+0660 ٠   เลขศูนย์ภาษาอาหรับ-อินเดีย
ยู+0661 1   เลขหนึ่งภาษาอาหรับ-อินเดีย
ยู+0662 2   เลขสองภาษาอาหรับ-อินเดีย
ยู+0663 3   เลขสามภาษาอาหรับ-อินเดีย
ยู+0664 4   เลขสี่ภาษาอาหรับ-อินเดีย
ยู+0665 5   เลขห้าแบบอาหรับ-อินเดีย
ยู+0666 6   เลขหกภาษาอาหรับ-อินเดีย
ยู+0667 ٧   เลขเจ็ดภาษาอาหรับ-อินเดีย
U+0668 ٨   เลขแปดภาษาอาหรับ-อินเดีย
ยู+0669 ٩   เลขเก้าแบบอาหรับ-อินเดีย
ยู+066เอ ٪   เครื่องหมายเปอร์เซ็นต์ภาษาอาหรับ

→ U+0025 % เครื่องหมายเปอร์เซ็นต์

ยู+066บี ٫   ตัวคั่นทศนิยมภาษาอาหรับ

โดยทั่วไปมักใช้เครื่องหมายจุลภาคแทน

→ U+002C , คอมมา

ยู+066ซี ٬   ตัวคั่นหลักพันภาษาอาหรับ

โดยทั่วไปแล้วจะใช้เครื่องหมายจุลภาคในภาษาอาหรับแทน

→ U+060C ، Arabic Comma

→ U+0027 ' เครื่องหมายอะพอสโทรฟี

→ U+2019 ' เครื่องหมายอัญประกาศเดี่ยวขวา

ยู+066ดี   ٭   ดาวห้าแฉกภาษาอาหรับ

ลักษณะที่ปรากฏค่อนข้างแปรผันได้

→ U+002A * เครื่องหมายดอกจัน

ยู+066อี ٮ   อักษรอาหรับไม่มีจุด Beh
ยู+066เอฟ ٯ   อักษรอาหรับไร้จุด Qaf
ยู+0670 ٰ   อักษรอาหรับตัวยก อเลฟ
U+0671 ٱ   อักษรอาหรับ อเลฟ วัสลา

ภาษาอาหรับในคัมภีร์อัลกุรอาน

ยู+0672 ٲ   อักษรอาหรับ อเลฟ พร้อมอักษรฮัมซาแบบหยักอยู่ด้านบน

บาลูชี, แคชเมียร์

ยู+0673 ٳ   อักษรอาหรับ อเลฟ พร้อมฮัมซาหยักด้านล่าง (เลิกใช้แล้ว) [ 6 ]แคชเมียร์

อักขระนี้เลิกใช้แล้วและไม่แนะนำให้ใช้อย่างยิ่ง ควรใช้ลำดับ 0627 065F เป็นวิธีการเข้ารหัสอักขระที่แนะนำมากกว่า

ยู+0674 ٴ   อักษรอาหรับ ฮัมซา สูง

ภาษาคาซัคและภาษาจาวีสร้างอักษรคู่

ยู+0675 ٵ   อักษรอาหรับสูง ฮัมซา อเลฟ

การสะกดที่ถูกต้องคือ‏ ٴا ‎‏ U+0674 U+0627

ยู+0676 ٶ   อักษรอาหรับสูง ฮัมซา วาว

การสะกดที่ถูกต้องคือ‏ ٴو ‎‏ U+0674 U+0648

ยู+0677 ٷ   อักษรอาหรับตัว U พร้อมฮัมซาอยู่ด้านบน

การสะกดที่ถูกต้องคือ‏ ٴۇ ‎‏ U+0674 U+06C7

U+0678 ٸ   อักษรอาหรับ ฮัมซา เยห์

การสะกดที่ถูกต้องคือ‏ ٴی ‎‏ U+0674 06CC

ยู+0679 ٹ   อักษรอาหรับ Tteh

ภาษาอูร์ดู

ยู+067เอ ٺ   อักษรอาหรับ Tteheh

สินธี

ยู+067บี ٻ   อักษรอาหรับ บีห์

สินธี

ยู+067ซี ټ   อักษรอาหรับ Teh พร้อมแหวน

ปัชโต

ยู+067ดี ٽ   อักษรอาหรับ Teh ที่มีจุดสามจุดอยู่ด้านบนและชี้ลงด้านล่าง

สินธี

ยู+067อี   อักษรอาหรับ Peh

ภาษาเปอร์เซีย ภาษาอูร์ดู ...

U+067F ٿ   อักษรอาหรับ Teheh

สินธี

ยู+0680 ڀ   อักษรอาหรับ เบเฮห์

สินธี

U+0681 ځ   อักษรอาหรับ ฮาห์ พร้อมฮัมซาอยู่ด้านบน

Pashto, Sarikoli แทนหน่วยเสียง /dz/

U+0682 ڂ   อักษรอาหรับ ฮา มีจุดสองจุดแนวตั้งอยู่ด้านบน

ไม่ได้ใช้ในภาษาปัชโตสมัยใหม่

U+0683 ڃ   อักษรอาหรับ Nyeh

สินธี

ยู+0684 ڄ   อักษรอาหรับ Dyeh

สินธี ซึ่งในอดีตมีเชื้อสายบอสเนีย

ยู+0685 څ   อักษรอาหรับ ฮาห์ มีจุดสามจุดอยู่ด้านบน

ภาษา Pashto, Khwarazmian, Sarikoli แทนหน่วยเสียง /ts/ ในภาษา Pashto

ยู+0686 چ   อักษรอาหรับ Tcheh

ภาษาเปอร์เซีย ภาษาอูร์ดู ...

U+0687 ڇ   อักษรอาหรับ Tcheheh

สินธี

U+0688 ڈ   อักษรอาหรับ ดดัล

ภาษาอูร์ดู

ยู+0689 ډ   อักษรอาหรับ Dal พร้อมแหวน

ปัชโต

ยู+068เอ ڊ   อักษรอาหรับ Dal ที่มีจุดอยู่ด้านล่าง

ซินธี, เปอร์เซียตอนต้น, เปกอน, มาลากาซี

ยู+068บี ڋ   อักษรอาหรับ Dal มีจุดอยู่ด้านล่างและตัวอักษร Tah เล็ก

ลาห์นดา

ยู+068ซี ڌ   อักษรอาหรับ ดาฮาล

สินธี

ยู+068ดี ڍ   อักษรอาหรับ ดดาฮาล

สินธี

ยู+068อี ڎ   อักษรอาหรับ ดุล

รูปแบบเก่าของ DUL ซึ่งปัจจุบันล้าสมัยแล้วในภาษาสินธี Burushaski

U+068F ڏ   อักษรอาหรับ Dal ที่มีจุดสามจุดอยู่ด้านบนและชี้ลงด้านล่าง

รูปทรงปัจจุบันของชาวสินธีที่ใช้สำหรับ DUL

ยู+0690 ڐ   อักษรอาหรับ Dal ที่มีจุดสี่จุดอยู่ด้านบน

ภาษาอูร์ดูโบราณ ซึ่งไม่ได้ใช้ในปัจจุบันแล้ว

ยู+0691 ڑ   อักษรอาหรับ รเรห์

ภาษาอูร์ดู

ยู+0692 ڒ   อักษรอาหรับ Reh ที่มีตัว V เล็ก

ชาวเคิร์ด

ยู+0693 ړ   อักษรอาหรับ Reh พร้อมห่วง

ปัชโต

ยู+0694 ڔ   อักษรอาหรับ Reh มีจุดอยู่ด้านล่าง

ชาวเคิร์ด, เปอร์เซียยุคต้น

ยู+0695 ڕ   อักษรอาหรับ Reh ที่มีตัว V เล็กอยู่ด้านล่าง

ชาวเคิร์ด

ยู+0696 ږ   อักษรอาหรับ Reh ที่มีจุดอยู่ด้านล่างและจุดอยู่ด้านบน

ปัชโต

ยู+0697 ڗ   อักษรอาหรับ เรห์ มีจุดสองจุดอยู่ด้านบน

ดาร์กวา

ยู+0698 ژ   อักษรอาหรับ Jeh

ภาษาเปอร์เซีย ภาษาอูร์ดู ...

ยู+0699 ڙ   อักษรอาหรับ เรห์ มีจุดสี่จุดอยู่ด้านบน

สินธี

ยู+069เอ ښ   อักษรอาหรับที่มีจุดอยู่ด้านล่างและจุดอยู่ด้านบน

ปัชโต

ยู+069บี ڛ   อักษรอาหรับที่มีจุดสามจุดอยู่ด้านล่าง

เปอร์เซียยุคต้น

ยู+069ซี ڜ   อักษรอาหรับที่มีจุดสามจุดอยู่ด้านล่างและสามจุดอยู่ด้านบน

ภาษาอาหรับโมร็อกโก

ยู+069ดี ڝ   อักษรอาหรับ "เศร้า" ที่มีจุดสองจุดอยู่ด้านล่าง

ชาวเติร์ก

ยู+069อี ڞ   อักษรอาหรับ "ซาด" ที่มีจุดสามจุดอยู่ด้านบน

เบอร์เบอร์, บูรูชาสกี

ยู+069เอฟ ڟ   อักษรอาหรับ "ทาห์" ที่มีจุดสามจุดอยู่ด้านบน

เฮาซ่าเก่า

ยู+06เอ0 ڠ   อักษรอาหรับ "Ain" มีจุดสามจุดอยู่ด้านบน

จาวี

ยู+06เอ1 ڡ   อักษรอาหรับไม่มีจุด Feh

อาดิเก

ยู+06เอ2 ڢ   อักษรอาหรับ เฟห์ ที่มีจุดเลื่อนลงมาด้านล่าง

ภาษาอาหรับมัฆริบ

ยู+06เอ3 ڣ   อักษรอาหรับ เฟห์ มีจุดอยู่ด้านล่าง

อิงกุช

ยู+06เอ4 ڤ   อักษรอาหรับ เวห์

ภาษาอาหรับตะวันออกกลางสำหรับคำต่างประเทศ เช่น ภาษาเคิร์ด ภาษาคาวาเรซเมียน ภาษาเปอร์เซียโบราณ และอักษรยาวี

ยู+06เอ5 ڥ   อักษรอาหรับ เฟห์ มีจุดสามจุดอยู่ด้านล่าง

ภาษาอาหรับแอฟริกาเหนือสำหรับคำต่างประเทศ

U+06A6 ڦ   อักษรอาหรับ Peheh

สินธี

U+06A7 ڧ   อักษรอาหรับ Qaf มีจุดอยู่ด้านบน

ภาษาอาหรับมาฆริบ, อุยกูร์

U+06A8 ڨ   อักษรอาหรับ Qaf มีจุดสามจุดอยู่ด้านบน

ภาษาอาหรับตูนิเซียและแอลจีเรีย

ยู+06A9 ک   อักษรอาหรับ เคเฮ

เปอร์เซีย, อูรดู, ซินธี, ...= คาฟ มาชกุลา

ยู+06เอเอ ڪ   ตัวอักษรอาหรับแบบสวอช คาฟ

แสดงถึงตัวอักษรที่แตกต่างจากตัวอักษร KAF (0643) ในภาษาอาหรับในภาษาสินธี

ยู+06เอบี ګ   อักษรอาหรับ Kaf พร้อมแหวน

ตัวอักษรปัชโตอาจปรากฏคล้ายกับตัวอักษรอาหรับ KAF (0643) ที่มีวงแหวนอยู่ใต้ฐาน

ยู+06เอซี   อักษรอาหรับ Kaf มีจุดอยู่ด้านบน

ไม่แนะนำให้ใช้ตัวอักษรจาวีแกฟ (Jawi gaf) แม้ว่าอาจจะพบได้ในข้อมูลข้อความบางส่วนก็ตาม ตัวอักษรที่แนะนำสำหรับจาวีแกฟคือ 0762 → U+0762 ݢ อักษรอาหรับ เคเฮะ มีจุดอยู่ด้านบน

U+06AD ڭ   อักษรอาหรับ Ng

ภาษาอุยกูร์ ภาษาคาซัค ภาษาอาหรับโมร็อกโก อักษรยาวีโบราณ ภาษาเปอร์เซียโบราณ ...

U+06AE ڮ   อักษรอาหรับ Kaf พร้อมจุดสามจุดด้านล่าง

เบอร์เบอร์, เพกอนเปอร์เซียยุคต้น ทางเลือกสำหรับ 08B4

U+06AF   อักษรอาหรับ Gaf

ภาษาเปอร์เซีย ภาษาอูร์ดู ...

ยู+06บี0 ڰ   อักษรอาหรับ Gaf พร้อมแหวน

ลาห์นดา

ยู+06บี1 ڱ   อักษรอาหรับ Ngoeh

สินธี

ยู+06บี2 ڲ   อักษรอาหรับ Gaf ที่มีจุดสองจุดอยู่ด้านล่าง

ไม่ได้ใช้ในภาษาสินธี

ยู+06บี3 ڳ   อักษรอาหรับ Gueh

สินธี, ซาราอิกิ

ยู+06บี4 ڴ   อักษรอาหรับ Gaf ที่มีจุดสามจุดอยู่ด้านบน

ไม่ได้ใช้ในภาษาสินธี, คารากัลปัก

ยู+06บี5 ڵ   อักษรอาหรับ Lam ที่มีตัว V เล็ก

ชาวเคิร์ด ในอดีตเป็นชาวบอสเนีย

U+06B6 ڶ   อักษรอาหรับ Lam มีจุดอยู่ด้านบน

ชาวเคิร์ด

ยู+06บี7 ڷ   อักษรอาหรับ Lam ที่มีจุดสามจุดอยู่ด้านบน

ชาวเคิร์ด

U+06B8 ڸ   อักษรอาหรับ Lam ที่มีจุดสามจุดอยู่ด้านล่าง

อาวาร์, โซโกตรี

ยู+06บี9 ڹ   อักษรอาหรับ เที่ยง มีจุดอยู่ด้านล่าง
ยู+06บีเอ ں   อักษรอาหรับ นูน ฆุนนา

ภาษาอูร์ดู ภาษาอาหรับโบราณที่ไม่มีจุดในบริบททั้งสี่

ยู+06บีบี ڻ   อักษรอาหรับ รนูน

ไม่มีจุดในบริบททั้งสี่ของภาษาสินธี

U+06BC ڼ   อักษรอาหรับ เที่ยง พร้อมวงแหวน

ปัชโต

U+06BD ڽ   อักษรอาหรับ เที่ยง มีจุดสามจุดอยู่ด้านบน

ในอักษรยาวี จุดสามจุดในอักษรตัวแรกและอักษรกลางจะอยู่ใต้ตัวอักษรและกลับหัว คล้ายกับ پ

ยู+06บีอี ھ   อักษรอาหรับ เฮห์ โดอาชมี

ในภาษาอูร์ดูและภาษาอื่นๆ ในเอเชียใต้ จะสร้างเสียงพยัญชนะควบที่มีลมหายใจ ซึ่งแสดงถึงเสียงเสียดแทรกเส้นเสียง /h/ ในภาษาอุยกูร์

ยู+06บีเอฟ ڿ   อักษรอาหรับ Tcheh มีจุดอยู่ด้านบน
ยู+06C0 ۀ   อักษรอาหรับ เฮ (Heh) ที่มี เย (Yeh) อยู่ด้านบน

สำหรับ ezafe ให้ใช้ 0654 เหนือตัวอักษรพื้นฐานที่เหมาะสมกับภาษา ซึ่งจริงๆ แล้วเป็นอักษรเชื่อม ไม่ใช่ตัวอักษรอิสระ ตัวอักษรอาหรับ hamzah บน ha (1.0) ≡ ۀ U+06D5 U+0654

U+06C1 ہ   อักษรอาหรับ เฮห์ เป้าหมาย

ภาษาอูร์ดู

ยู+06ซี2 ۂ   อักษรอาหรับ Heh เป้าหมายพร้อมฮัมซาอยู่ด้านบน

จริงๆ แล้ว Urdu เป็นอักษรเชื่อม ไม่ใช่อักษรเดี่ยว ≡ ۂ U+06C1 U+0654

ยู+06ซี3 ۃ   ตัวอักษรอารบิก Teh Marbuta Goal

ภาษาอูร์ดู

ยู+06ซี4 ۄ   อักษรอาหรับ วาว พร้อมแหวน

แคชเมียร์

U+06C5 ۅ   อักษรอาหรับ Kirghiz Oe

ภาษาคีร์กีซมีรูปแบบอักษรที่แตกต่างออกไป โดยส่วนหางที่เป็นห่วงจะถูกแทนที่ด้วยเส้นแนวนอนที่ลากผ่านส่วนหาง

U+06C6 ۆ   อักษรอาหรับ Oe

ชาวอุยกูร์ ชาวเคิร์ด ชาวคาซัค ชาวอาเซอร์ไบจาน และในอดีตเคยเป็นชาวบอสเนีย

U+06C7 ۇ   อักษรอาหรับ U

อาเซอร์ไบจาน, คาซัค, คีร์กีซ, อุยกูร์

U+06C8 ۈ   อักษรอาหรับ ยู

อุยกูร์

ยู+06ซี9 ۉ   อักษรอาหรับ Kirghiz Yu

ชาวคาซัคสถาน ชาวคีร์กีซ และในอดีตเคยเป็นชาวบอสเนีย

ยู+06ซีเอ ۊ   อักษรอาหรับ วาว มีจุดสองจุดอยู่ด้านบน

ชาวเคิร์ด

U+06CB ۋ   อักษรอาหรับ Ve

อุยกูร์, คาซัค

ยู+06ซีซี ی   อักษรอาหรับ ฟาร์ซี เยห์

ภาษาอาหรับ เปอร์เซีย อูร์ดู แคชเมียร์ ... รูปแบบเริ่มต้นและตรงกลางของตัวอักษรนี้มีจุด → U+0649 ى อักษรอาหรับ อเลฟ มักซูรา → U+064A ي อักษรอาหรับ เยห์

ยู+06ซีดี ۍ   อักษรอาหรับ Yeh ที่มีหาง

ปัชโต, สินธี

U+06CE ێ   อักษรอาหรับ Yeh ที่มีตัว V เล็ก

ชาวเคิร์ด

ยู+06ซีเอฟ ۏ   อักษรอาหรับ วาว มีจุดอยู่ด้านบน

จาวี

ยู+06D0 ې   อักษรอาหรับ E

ภาษาปัชโตและภาษาอุยกูร์ถูกใช้เป็นตัวอักษร bbeh ในภาษาสินธี

U+06D1 ۑ   อักษรอาหรับ "เยห์" ที่มีจุดสามจุดอยู่ด้านล่าง

ภาษาเมนเด, ภาษาเฮาซา

U+06D2 ے   อักษรอาหรับ Yeh Barree

ภาษาอูร์ดู

ยู+06D3 ۓ   อักษรอาหรับ Yeh Barree พร้อม Hamza อยู่ด้านบน

ภาษาอูร์ดู

U+06D4 ۔   จุดภาษาอาหรับ

ภาษาอูร์ดู

U+06D5 ە   อักษรอาหรับ เอ

อุยกูร์, คาซัค, คีร์กีซ

U+06D6 ۖ   อักษรอาหรับตัวเล็กแบบเชื่อมติดกัน (Sad) พร้อมตัวอักษร Lam และ Alef Maksura
U+06D7 ۗ   อักษรอาหรับตัวเล็กสูง Qaf พร้อม Lam พร้อม Alef Maksura
U+06D8 ۘ   แบบฟอร์มเริ่มต้นภาษาอาหรับขนาดเล็กสูง
U+06D9 ۙ   ภาษาอาหรับ เล็ก สูง แกะ อเลฟ
ยู+06ดา ۚ   อาหรับ เล็ก ไฮ จีม
U+06DB ۛ   ภาษาอาหรับ จุดสามจุดเล็กสูง
ยู+06ดีซี ۜ   ภาษาอาหรับ ขนาดเล็ก สูง มองเห็นได้
ยู+06ดีดี ۝   จบอายะ ห์ภาษาอาหรับ
U+06DE ۞   ภาษาอาหรับ จุดเริ่มต้นของRub El Hizb
U+06DF ۟   เลขศูนย์กลมเล็กสูงแบบอาหรับ

เล็กกว่ารูปวงกลมทั่วไปที่ใช้สำหรับ 0652 ใช้ในคัมภีร์อัลกุรอานบางเล่มเพื่อทำเครื่องหมายสระเสียงยาวที่ถูกละเว้น

U+06E0 ۠   เลขศูนย์ อาหรับ เล็ก สูง ตั้งตรง สี่เหลี่ยมผืนผ้า

คำว่า "เลขศูนย์สี่เหลี่ยมผืนผ้า" เป็นคำแปลจากชื่อภาษาอาหรับของสัญลักษณ์นี้

U+06E1 ۡ   แบบอักษรภาษาอาหรับขนาดเล็กสูงไม่มีจุดหัวตัวอักษร Khahรูปแบบการนำเสนอ 0652 โดยใช้เทคโนโลยีแบบอักษรในการเลือกรูปแบบที่ต้องการ

ใช้ในคัมภีร์อัลกุรอานบางเล่มเพื่อบ่งบอกว่าไม่มีสระ = ภาษาอาหรับ jazm → U+0652 ْ ภาษาอาหรับ Sukun

ยู+06E2 ۢ   รูปแบบแยกเดี่ยวขนาดเล็กภาษาอาหรับที่มีคุณธรรมสูง
U+06E3 ۣ   ภาษาอาหรับ ขนาดเล็ก มองเห็นได้ต่ำ
U+06E4 ۤ   ภาษาอาหรับ ขนาดเล็ก สูง มัดดา

โดยทั่วไปจะใช้ร่วมกับ 06E5, 06E6, 06E7 และ 08F3

U+06E5 ۥ   ภาษาอาหรับ เล็ก ๆ วาว

→ U+08D3 ࣓ ภาษาอาหรับ ตัวเล็ก ต่ำ → U+08F3 ࣳ ภาษาอาหรับ ตัวเล็ก สูง

U+06E6 ۦ   เยห์เล็ก ๆ ภาษาอาหรับ
U+06E7 ۧ   ภาษาอาหรับ เล็ก สูง เยห์
U+06E8 ۨ   อาหรับ เล็ก เที่ยงวัน
U+06E9 ۩   สถานที่ สุญูดในภาษาอาหรับ

มีสัญลักษณ์หลายแบบที่ยอมรับได้สำหรับตัวอักษรนี้

U+06EA ۪   ภาษาอาหรับ ศูนย์กลางว่างเปล่า หยุดต่ำ
U+06EB ۫   ภาษาอาหรับ ศูนย์กลางว่างเปล่า หยุดสูง
ยู+06อีซี ۬   จุดหยุดสูงแบบกลมสไตล์อาหรับที่มีจุดศูนย์กลางเติมเต็ม

นอกจากนี้ยังใช้ในข้อความอัลกุรอานในระบบการเขียนของแอฟริกาและระบบการเขียนอื่นๆ เพื่อแทนคำว่า wasla, ikhtilas เป็นต้น

ยู+06เอ็ด ۭ   ภาษาอาหรับ เล็ก ต่ำ มีม
U+06EE ۮ   อักษรอาหรับ Dal ที่มีลักษณะเป็นตัววีคว่ำ
U+06EF ۯ   อักษรอาหรับ Reh ที่มีรูปตัว V กลับหัว

นอกจากนี้ยังใช้ในภาษาเปอร์เซียยุคต้นด้วย

ยู+06F0 ۰   เลขศูนย์แบบขยายของภาษาอาหรับ-อินเดีย
ยู+06F1 ۱   เลขหนึ่งภาษาอาหรับ-อินเดียแบบขยาย
ยู+06F2 2   เลขสองภาษาอาหรับ-อินเดียแบบขยาย
ยู+06F3 ۳   เลขสามแบบขยายภาษาอาหรับ-อินเดีย
ยู+06เอฟ4 ۴   เลขสี่แบบขยายภาษาอาหรับ-อินเดีย

ภาษาเปอร์เซียมีอักษรที่แตกต่างจากภาษาสินธีและภาษาอูร์ดู

ยู+06F5 ۵   เลขห้าแบบขยายภาษาอาหรับ-อินเดีย

ภาษาเปอร์เซีย ภาษาสินธี และภาษาอูร์ดู มีอักษรที่แตกต่างจากภาษาอาหรับ

ยู+06เอฟ6 ۶   เลขหกแบบขยายภาษาอาหรับ-อินเดีย

ภาษาเปอร์เซีย ภาษาสินธี และภาษาอูร์ดู มีอักษรภาพที่แตกต่างจากภาษาอาหรับ

ยู+06เอฟ7 ۷   เลขเจ็ดแบบขยายภาษาอาหรับ-อินเดีย

ภาษาอูร์ดูและภาษาสินธีมีอักษรที่แตกต่างจากภาษาอาหรับ

ยู+06F8 8   เลขแปดภาษาอาหรับ-อินเดียแบบขยาย
ยู+06เอฟ9 9   เลขเก้าแบบขยายภาษาอาหรับ-อินเดีย
ยู+06เอฟเอ ۺ   ตัวอักษรอาหรับแวววาวพร้อมจุดด้านล่าง
U+06FB ۻ   อักษรอาหรับ "พ่อ" มีจุดอยู่ด้านล่าง
ยู+06เอฟซี ۼ   อักษรอาหรับ Ghain ที่มีจุดอยู่ด้านล่าง
U+06FD ۽   เครื่องหมายภาษาอาหรับ เครื่องหมายแอมเปอร์แซนด์แบบสินธี
U+06FE ۾   ป้ายภาษาอาหรับ สินธี บุพบทผู้ชาย
U+06FF ۿ   อักษรอาหรับ เฮ (Heh) รูปตัววีคว่ำ

โต๊ะขนาดกะทัดรัด

ภาษาอาหรับ[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+060x  ؀  ؁  ؂  ؃  ؄  ؅ ؆ ؇ ؈ ؉ ؊ ؋ ، ؍ ؎ ؏
ยู+061x ؐ ؑ ؒ ؓ ؔ ؕ ؖ ؗ ؘ ؙ ؚ ؛ เอแอลเอ็ม ؝ ؞ ?
ยู+062x ؠ ء آ أ ؤ إ ئ อะ บี ة ث ج ح خ
ยู+063x ذ ز ص ض ط ظ ع غ ػ ؼ ؽ ؾ ؿ
ยู+064x ـ ق ك ه และ ى ي ً ٌ ٍ َ ُ
ยู+065x ِ ّ ْ ٓ ٔ ٕ ٖ ٗ ٘ ٙ ٚ ٛ ٜ ٝ ٞ ٟ
ยู+066x ٠ 1 2 3 4 5 6 ٧ ٨ ٩ ٪ ٫ ٬ ٭ٮ ٯ
ยู+067x ٰ ٱ ٲ ٳ ٴ ٵ ٶ ٷ ٸ ٹ ٺ ٻ ټ ٽ ٿ
ยู+068x ڀ ځ ڂ ڃ ڄ څ چ ڇ ڈ ډ ڊ ڋ ڌ ڍ ڎ ڏ
ยู+069x ڐ ڑ ړ ڔ ڕ ږ ڗ ژ ڙ ښ ڛ ڜ ڝ ڞ
ยู+06แอกซ์ ڠ ڡ ڢ ڣ ڤ ڥ ڦ ڧ ڨ ک ڪ ګ ڭ ڮ
ยู+06บีเอ็กซ์ ڰ ڱ ڲ ڳ ڴ ڵ ڶ ڷ ڸ ڹ ں ڻ ڼ ڽ ھ ڿ
U+06Cx ۀ ہ ۂ ۃ ۄ ۅ ۆ ۇ ۈ ۉ ۊ ۋ ی ۍ ێ ۏ
ยู+06Dx ې ۑ ے ۓ ۔ ە ۖ ۗ ۘ ۙ ۚ ۛ ۜ  ۝ ۞ ۟
ยู+06เอ็กซ์ ۠ ۡ ۢ ۣ ۤ ۥ ۦ ۧ ۨ ۩ ۪ ۫ ۬ ۭ ۮ ۯ
ยู+06เอฟเอ็กซ์ ۰ 1 2 ۳ 4 ۵ ۶ ۷ 8 9 ۺ ۻ ۼ ۽ ۾ ۿ
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^รหัสยูนิโค้ด U+0673 ถูกยกเลิกการใช้งานแล้วตั้งแต่ยูนิโค้ดเวอร์ชัน 6.0

ภาคผนวกภาษาอาหรับ

ภาคผนวกภาษาอาหรับ[1]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+075x ݐ ݑ ݒ ݓ ݔ ݕ ݖ ݗ ݘ ݙ ݚ ݛ ݜ ݝ ݞ ݟ
ยู+076x ݠ ݡ ݢ ݣ ݤ ݥ ݦ ݧ ݨ ݩ ݪ ݫ ݬ ݭ ݮ ݯ
ยู+077x ݰ ݱ ݲ ݳ ݴ ݵ ݶ ݷ ݸ ݹ ݺ ݻ ݼ ݽ ݾ ݿ
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป

ภาษาอาหรับแบบขยาย-บี

แผนภูมิรหัส Arabic Extended-B [1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+087x
ยู+088x
ยู+089x  ࢐  ࢑ 
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

ภาษาอาหรับแบบขยาย-เอ

แผนภูมิรหัสArabic Extended-A [1] อย่างเป็นทางการของ Unicode Consortium (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+08แอกซ์
ยู+08บีเอ็กซ์
ยู+08ซีเอ็กซ์
ยู+08Dx
ยู+08เอ็กซ์  ࣢ 
ยู+08เอฟเอ็กซ์
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป

แบบฟอร์มการนำเสนอภาษาอาหรับ A

ส่วนใหญ่เป็นอักษรเชื่อมที่สามารถสร้างได้จากตัวอักษรในแผนภูมิก่อนหน้า ยกเว้นอักษรที่คล้ายวงเล็บ﴾ ﴿และบางส่วนเป็นอักษรเชื่อมของวลีทางศาสนาทั่วไป

รูปแบบการนำเสนอภาษาอาหรับ-A [1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+เอฟบี5เอ็กซ์
ยู+เอฟบี6เอ็กซ์
ยู+เอฟบี7เอ็กซ์ ﭿ
ยู+เอฟบี8เอ็กซ์
ยู+เอฟบี9เอ็กซ์
ยู+เอฟบีเอเอ็กซ์
ยู+เอฟบีบีเอ็กซ์ ﮿
ยู+เอฟบีซีเอ็กซ์
ยู+เอฟบีดีเอ็กซ์
ยู+เอฟบีเอ็กซ์
ยู+เอฟบีเอฟเอ็กซ์ ﯿ
ยู+เอฟซี0เอ็กซ์ พี
ยู+เอฟซี1เอ็กซ์ 0 0 2 3 4 5 6 7 0 0 0
ยู+เอฟซี2เอ็กซ์ อะ เย 1 2 3
ยู+เอฟซี3เอ็กซ์ พี 2 3 4 8 0 3 พี ﰿ
ยู+เอฟซี4เอ็กซ์
ยู+เอฟซี5เอ็กซ์ 1 3 3 5 6 1 1 1
ยู+เอฟซี6เอ็กซ์ อะ
ยู+เอฟซี7เอ็กซ์ 1 ﱿ
ยู+เอฟซี8เอ็กซ์
ยู+เอฟซี9เอ็กซ์ 2 3 3 5 6 7
ยู+เอฟซีเอเอ็กซ์ ม.
ยู+เอฟซีบีเอ็กซ์ วี ﲿ
ยู+เอฟซีซีเอ็กซ์ 3 3 3
ยู+เอฟซีดีเอ็กซ์ 3 3 3 4 4 6 6 9 3 3 3 4
ยู+เอฟซีเอ็กซ์ อะ s 3 3 วี
ยู+เอฟซีเอฟเอ็กซ์ 3 3 3 3 3 6 ซ. 3 3 3 3 3 3 ﳿ
ยู+เอฟดี0เอ็กซ์
ยู+เอฟดี1เอ็กซ์ 4
ยู+เอฟดี2เอ็กซ์
ยู+เอฟดี3เอ็กซ์ ﴿
ยู+เอฟดี4เอ็กซ์
ยู+เอฟดี5เอ็กซ์
ยู+เอฟดี6เอ็กซ์
ยู+เอฟดี7เอ็กซ์ ﵿ
ยู+เอฟดี8เอ็กซ์
ยู+เอฟดี9เอ็กซ์
ยู+เอฟดีเอ็กซ์
ยู+เอฟดีบีเอ็กซ์ ﶿ
ยู+เอฟดีซีเอ็กซ์
ยู+เอฟดีดีเอ็กซ์
ยู+เอฟดีเอ็กซ์
ยู+เอฟดีเอฟเอ็กซ์ ﷿
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีดำแสดงถึงอักขระที่ไม่ใช่ตัวอักขระ (รหัสจุดที่รับประกันว่าจะไม่ถูกกำหนดให้เป็นอักขระที่เข้ารหัสในมาตรฐานยูนิโค้ด)

แบบฟอร์มการนำเสนอภาษาอาหรับ B

สิ่งเหล่านี้ทั้งหมดสามารถสร้างขึ้นได้จากตัวอักษรในแผนภูมิพื้นฐาน

รูปแบบการนำเสนอภาษาอาหรับ-B [1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+เอฟอี7เอ็กซ์ 1 ﹿ
ยู+เอฟอี8เอ็กซ์
ยู+เอฟอี9เอ็กซ์
ยู+เอฟเอเอ็กซ์
ยู+เอฟบีเอ็กซ์ ﺿ
ยู+เอฟอีซีเอ็กซ์
ยู+เอฟดีเอ็กซ์
ยู+เอฟอีเอ็กซ์
ยู+เอฟเอฟเอ็กซ์ ZW NBSP
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

สัญลักษณ์ตัวเลขของรูมิ

สัญลักษณ์ตัวเลขรูมิ[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+10อี6เอ็กซ์ 𐹠𐹡𐹢𐹣𐹤𐹥𐹦𐹧𐹨𐹩𐹪𐹫𐹬𐹭𐹮𐹯
ยู+10E7x 𐹰𐹱𐹲𐹳𐹴𐹵𐹶𐹷𐹸𐹹𐹺𐹻𐹼𐹽𐹾
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

ภาษาอาหรับแบบขยายซี

แผนภูมิรหัส Extended-C ภาษาอาหรับ[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+10ECx 𐻂 𐻃 𐻄 𐻅 𐻆 𐻇
ยู+10อีดีเอ็กซ์ 𐻐 𐻑 𐻒 𐻓 𐻔 𐻕 𐻖 𐻗 𐻘
ยู+10อีเอ็กซ์
ยู+10เอฟเอ็กซ์ 𐻺 𐻻 𐻼 𐻽 𐻾 𐻿
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

หมายเลข Siyaq ของอินเดีย

หมายเลข Siyaq ของอินเดีย[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+1EC7x 𞱱 𞱲 𞱳 𞱴 𞱵 𞱶 𞱷 𞱸 𞱹 𞱺 𞱻 𞱼 𞱽 𞱾 𞱿
ยู+1EC8x 𞲀 𞲁 𞲂 𞲃 𞲄 𞲅 𞲆 𞲇 𞲈 𞲉 𞲊 𞲋 𞲌 𞲍 𞲎 𞲏
ยู+1EC9x 𞲐 𞲑 𞲒 𞲓 𞲔 𞲕 𞲖 𞲗 𞲘 𞲙 𞲚 𞲛 𞲜 𞲝 𞲞 𞲟
ยู+1อีซีเอเอ็กซ์ 𞲠 𞲡 𞲢 𞲣 𞲤 𞲥 𞲦 𞲧 𞲨 𞲩 𞲪 𞲫 𞲬 𞲭 𞲮 𞲯
ยู+1อีซีบีเอ็กซ์ 𞲰 𞲱 𞲲 𞲳 𞲴
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

หมายเลข Siyaq ของออตโตมัน

หมายเลข Siyaq ของออตโตมัน[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+1ED0x 𞴁 𞴂 𞴃 𞴄 𞴅 𞴆 𞴇 𞴈 𞴉 𞴊 𞴋 𞴌 𞴍 𞴎 𞴏
ยู+1อีดี1เอ็กซ์ 𞴐 𞴑 𞴒 𞴓 𞴔 𞴕 𞴖 𞴗 𞴘 𞴙 𞴚 𞴛 𞴜 𞴝 𞴞 𞴟
ยู+1ED2x 𞴠 𞴡 𞴢 𞴣 𞴤 𞴥 𞴦 𞴧 𞴨 𞴩 𞴪 𞴫 𞴬 𞴭 𞴮 𞴯
ยู+1ED3x 𞴰 𞴱 𞴲 𞴳 𞴴 𞴵 𞴶 𞴷 𞴸 𞴹 𞴺 𞴻 𞴼 𞴽
ยู+1อีดี4เอ็กซ์
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด

สัญลักษณ์ตัวอักษรทางคณิตศาสตร์ของภาษาอาหรับ

สัญลักษณ์ตัวอักษรคณิตศาสตร์ภาษาอาหรับ[1] [2]แผนภูมิรหัส Unicode Consortium อย่างเป็นทางการ (PDF)
 0123456789เอบีซีดีอีเอฟ
ยู+1อี0x 𞸀 𞸁 𞸂 𞸃 𞸅 𞸆 𞸇 𞸈 𞸉 𞸊 𞸋 𞸌 𞸍 𞸎 𞸏
U+1EE1x 𞸐 𞸑 𞸒 𞸓 𞸔 𞸕 𞸖 𞸗 𞸘 𞸙 𞸚 𞸛 𞸜 𞸝 𞸞 𞸟
ยู+1อี2เอ็กซ์ 𞸡 𞸢 𞸤 𞸧 𞸩 𞸪 𞸫 𞸬 𞸭 𞸮 𞸯
U+1EE3x 𞸰 𞸱 𞸲 𞸴 𞸵 𞸶 𞸷 𞸹 𞸻
ยู+1อีอี4x 𞹂 𞹇 𞹉 𞹋 𞹍 𞹎 𞹏
U+1EE5x 𞹑 𞹒 𞹔 𞹗 𞹙 𞹛 𞹝 𞹟
U+1EE6x 𞹡 𞹢 𞹤 𞹧 𞹨 𞹩 𞹪 𞹬 𞹭 𞹮 𞹯
U+1EE7x 𞹰 𞹱 𞹲 𞹴 𞹵 𞹶 𞹷 𞹹 𞹺 𞹻 𞹼 𞹾
U+1EE8x 𞺀 𞺁 𞺂 𞺃 𞺄 𞺅 𞺆 𞺇 𞺈 𞺉 𞺋 𞺌 𞺍 𞺎 𞺏
ยู+1อี9x 𞺐 𞺑 𞺒 𞺓 𞺔 𞺕 𞺖 𞺗 𞺘 𞺙 𞺚 𞺛
U+1EEAx 𞺡 𞺢 𞺣 𞺥 𞺦 𞺧 𞺨 𞺩 𞺫 𞺬 𞺭 𞺮 𞺯
ยู+1อีบีเอ็กซ์ 𞺰 𞺱 𞺲 𞺳 𞺴 𞺵 𞺶 𞺷 𞺸 𞺹 𞺺 𞺻
U+1EECx
U+1EEDx
U+1EEEx
ยู+1อีเอฟเอ็กซ์ 𞻰 𞻱
หมายเหตุ
1. ^นับตั้งแต่ Unicode เวอร์ชัน 17.0 เป็นต้นไป
2. ^พื้นที่สีเทาแสดงถึงรหัสจุดที่ยังไม่ได้กำหนด
  • Oibane. "ปัญหาเกี่ยวกับ Unicode" . ภาษาอาหรับบน Linux . เก็บถาวรจากต้นฉบับเมื่อ 2008-02-03.
  • Arabunic. "Arabunic : unicode <-> glyphs, ตัวแปลงสองทาง"แอปเพล็ต Java ที่แปลง glyphs เป็น unicode (และ unicode เป็น glyphs) โดยคำนึงถึงการเชื่อมตัวอักษร, lam-alif, เครื่องหมายกำกับเสียงฯลฯ
  • ScheherazadeหรือScheherazade Newเป็นแบบอักษรอาหรับแบบขยายที่ออกแบบโดยSIL Internationalและเผยแพร่ภายใต้ใบอนุญาตแบบอักษรเปิดของ SIL (OFL)
  • Harmattanเป็นแบบอักษรภาษาอาหรับแบบขยายที่ออกแบบโดยSIL Internationalสำหรับแอฟริกาตะวันตก และเผยแพร่ภายใต้ใบอนุญาตแบบอักษรเปิดของ SIL (OFL)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Arabic_script_in_Unicode&oldid=1358102248 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ อักษรอาหรับในยูนิโค้ด

สคริปต์ จำนวนมาก ใน Unicode เช่นภาษาอาหรับมีกฎการเขียน พิเศษ ที่กำหนดให้ต้องรวมตัวอักษรบางรูปแบบเข้าด้วยกันเพื่อสร้างรูปแบบตัวเชื่อม พิเศษ ในภาษาอังกฤษ เครื่องหมายแอมเปอร์แซนด์ (&)

รูปแบบตามบริบท

ด้านล่างนี้คือการสาธิตตัวอักษรพื้นฐานที่ใช้ใน ภาษาอาหรับมาตรฐานสมัยใหม่ ซึ่งแสดงให้เห็นว่าตัวอักษรอาหรับควรปรากฏในบริบทต่างๆ อย่างไร รหัสที่ระบุว่าเป็นรูปแบบตามบริบท " ไม่ ควร ใช้ในการแลกเปลี่ยนทั่วไป" [ 3 ] Unicode มีวิธีการเข้ารหัสความแตกต่างอื่นๆ หากจำเป็น...

เครื่องหมายวรรคตอนและเครื่องประดับ

ในการพิมพ์ตัวเลขภาษาอาหรับทั่วไป จะใช้เพียงเครื่องหมายคำถาม ⟨ ؟ ⟩ และเครื่องหมายจุลภาค ⟨ ، ⟩ เท่านั้น และเครื่องหมายจุลภาคนี้มักถูกใช้แทนเครื่องหมายจุลภาคในอักษรละติน ⟨ , ⟩ ซึ่งใช้เป็น ตัวคั่นทศนิยม เมื่อใช้ ตัวเลขอาหรับแบบตะวันออก (เช่น ⟨100.

การเชื่อมคำ

รูปแบบการนำเสนอภาษาอาหรับ-A มีอักขระบางตัวที่กำหนดให้เป็น "ตัวเชื่อมคำ" สำหรับคำที่ใช้บ่อยในสำนวนสำเร็จรูปในภาษาอาหรับ อักขระเหล่านี้ไม่ค่อยได้ใช้ในงานพิมพ์นอกเหนือจากงานพิมพ์ทางศาสนาโดยเฉพาะ และโดยปกติแล้วอักษร Rial จะเขียนแบบเต็ม ไม่ได้ใช้ตัวเชื่อมคำ