กลับไปหน้าบทความ

อ่าน 2 นาที

ชุดอักขระพกพา

ชุดอักขระพกพา (Portable Character Set ) คือชุดอักขระ 103 ตัว ซึ่งตาม มาตรฐาน POSIXจะต้องมีอยู่ในชุดอักขระใดๆ ก็ตาม เมื่อเปรียบเทียบกับASCIIชุดอักขระพกพาจะขาดอักขระควบคุม บางตัว...

ชุดอักขระพกพา

ชุดอักขระพกพา (Portable Character Set ) คือชุดอักขระ 103 ตัว ซึ่งตาม มาตรฐาน POSIXจะต้องมีอยู่ในชุดอักขระใดๆ ก็ตาม เมื่อเปรียบเทียบกับASCIIชุดอักขระพกพาจะขาดอักขระควบคุม บางตัว และไม่ได้กำหนดการเข้ารหัสค่าใดๆ เป็นพิเศษ[ 1 ] [ 2 ] ชุดอักขระพกพาเป็นซูเปอร์เซตของชุดอักขระการดำเนินการพื้นฐาน (Basic Execution Character Set)ตามที่กำหนดโดยANSI C [ 3 ]

ชื่อ อักษรภาพ สาย ซียูนิโค้ดชื่อยูนิโค้ด
นูแอล   0 ยู+0000 NULL (NUL)
เตือน   \a ยู+0007 แจ้งเตือน (BEL)
ลบ   \b ยู+0008 แบ็คสเปซ (BS)
แท็บ   \t ยู+0009 ตารางแสดงค่าตัวละคร (HT)
ขึ้นบรรทัดใหม่   \n ยู+000เอ ระบบป้อนสาย (LF)
แท็บแนวตั้ง   \v ยู+000บี ตารางเส้น (VT)
แบบฟอร์มฟีด   \f ยู+000ซี แบบฟอร์มป้อนกระดาษ (FF)
การขึ้นบรรทัดใหม่   \r ยู+000D ค่าขนส่งคืน (CR)
ช่องว่าง     ยู+0020 ช่องว่าง
เครื่องหมายอัศเจรีย์ ! ! ยู+0021 เครื่องหมายอัศเจรีย์
เครื่องหมายอัญประกาศ " " ยู+0022 เครื่องหมายอัญประกาศ
เครื่องหมายตัวเลข # # ยู+0023 ป้ายหมายเลข
เครื่องหมายดอลลาร์ $ $ ยู+0024 เครื่องหมายดอลลาร์
เครื่องหมายเปอร์เซ็นต์ % % ยู+0025 เครื่องหมายเปอร์เซ็นต์
แอมเปอร์แซนด์ & & ยู+0026 แอมเปอร์แซนด์
เครื่องหมายอะพอสโทรฟี ' ' ยู+0027 อะพอสโทรฟี
วงเล็บซ้าย ( ( ยู+0028 วงเล็บซ้าย
วงเล็บขวา ) ) ยู+0029 วงเล็บขวา
เครื่องหมายดอกจัน * * ยู+002เอ เครื่องหมายดอกจัน
เครื่องหมายบวก + + ยู+002บี เครื่องหมายบวก
เครื่องหมายจุลภาค , , ยู+002ซี คอมมา
ยัติภังค์ - - ยู+002D ไฮเฟน-ลบ
ระยะเวลา . . ยู+002E จุดเต็ม
สแลช / / ยู+002เอฟ โซลิดัส
ศูนย์ 0 0 ยู+0030 เลขศูนย์
หนึ่ง 1 1 ยู+0031 หลักที่หนึ่ง
สอง 2 2 ยู+0032 เลขสอง
สาม 3 3 ยู+0033 เลขสาม
สี่ 4 4 ยู+0034 เลขสี่
ห้า 5 5 ยู+0035 เลขห้า
หก 6 6 ยู+0036 เลขหก
เจ็ด 7 7 ยู+0037 เลขเจ็ด
แปด 8 8 ยู+0038 เลขแปด
เก้า 9 9 ยู+0039 เลขเก้า
ลำไส้ใหญ่ : : ยู+003เอ พันเอก
อัฒภาค ; ; ยู+003บี อัฒภาค
เครื่องหมายน้อยกว่า < < ยู+003ซี เครื่องหมายน้อยกว่า
เครื่องหมายเท่ากับ = = ยู+003D เครื่องหมายเท่ากับ
เครื่องหมายมากกว่า > > U+003E เครื่องหมายมากกว่า
เครื่องหมายคำถาม ? ? ยู+003เอฟ เครื่องหมายคำถาม
เชิงพาณิชย์ที่ @ @ ยู+0040 เชิงพาณิชย์ที่
เอ เอ เอ ยู+0041 อักษรละตินตัวพิมพ์ใหญ่ A
บี บี บี ยู+0042 อักษรละตินตัวพิมพ์ใหญ่ B
ซี ซี ซี ยู+0043 อักษรละตินตัวพิมพ์ใหญ่ C
ดี ดี ดี ยู+0044 อักษรละตินตัวพิมพ์ใหญ่ D
อี อี อี ยู+0045 อักษรละตินตัวพิมพ์ใหญ่ E
เอฟ เอฟ เอฟ ยู+0046 อักษรละตินตัวพิมพ์ใหญ่ F
จี จี จี ยู+0047 อักษรละตินตัวพิมพ์ใหญ่ G
ชม ชม ชม ยู+0048 อักษรละตินตัวพิมพ์ใหญ่ H
ฉัน ฉัน ฉัน ยู+0049 อักษรละตินตัวพิมพ์ใหญ่ I
เจ เจ เจ ยู+004เอ อักษรตัวพิมพ์ใหญ่ละติน J
เค เค เค ยู+004บี อักษรละตินตัวพิมพ์ใหญ่ K
แอล แอล แอล ยู+004ซี อักษรละตินตัวพิมพ์ใหญ่ L
เอ็ม เอ็ม เอ็ม ยู+004D อักษรละตินตัวพิมพ์ใหญ่ M
เอ็น เอ็น เอ็น ยู+004E อักษรละตินตัวพิมพ์ใหญ่ N
โอ โอ โอ ยู+004เอฟ อักษรละตินตัวพิมพ์ใหญ่ O
พี พี พี ยู+0050 อักษรละตินตัวพิมพ์ใหญ่ P
คิว คิว คิว ยู+0051 อักษรตัวพิมพ์ใหญ่ภาษาละติน Q
อาร์ อาร์ อาร์ ยู+0052 อักษรละตินตัวพิมพ์ใหญ่ R
เอส เอส เอส ยู+0053 อักษรละตินตัวพิมพ์ใหญ่ S
ที ที ที ยู+0054 อักษรละตินตัวพิมพ์ใหญ่ T
ยู ยู ยู ยู+0055 อักษรละตินตัวพิมพ์ใหญ่ U
วี วี วี ยู+0056 อักษรละตินตัวพิมพ์ใหญ่ V
ยู+0057 อักษรละตินตัวพิมพ์ใหญ่ W
X X X ยู+0058 อักษรละตินตัวพิมพ์ใหญ่ X
วาย วาย วาย ยู+0059 อักษรละตินตัวพิมพ์ใหญ่ Y
ยู+005เอ อักษรละตินตัวพิมพ์ใหญ่ Z
วงเล็บเหลี่ยมซ้าย [ [ ยู+005บี วงเล็บเหลี่ยมซ้าย
แบ็กสแลช \ \\ ยู+005ซี โซลิดัสกลับด้าน
วงเล็บเหลี่ยมขวา ] ] ยู+005D วงเล็บเหลี่ยมขวา
เซอร์คัมเฟล็กซ์ ^ ^ ยู+005E เซอร์คัมเฟล็กซ์ แอคเซนท์
ขีดล่าง _ _ ยู+005เอฟ เส้นล่าง
เน้นเสียงหนัก ` ` ยู+0060 สำเนียงเคร่งขรึม
เอ เอ เอ ยู+0061 อักษรละตินตัวเล็ก A
ยู+0062 อักษรละตินตัวเล็ก B
ยู+0063 อักษรละตินตัวเล็ก C
ยู+0064 อักษรละตินตัวเล็ก ดี
อี อี อี ยู+0065 อักษรละตินตัวเล็ก E
เอฟ เอฟ เอฟ ยู+0066 อักษรละตินตัวเล็ก F
จี จี จี ยู+0067 อักษรละตินตัวเล็ก G
ชม. ชม. ชม. ยู+0068 อักษรละตินตัวเล็ก H
ฉัน ฉัน ฉัน ยู+0069 อักษรละตินตัวเล็ก I
เจ เจ เจ ยู+006เอ อักษรละตินตัวเล็ก J
เค เค เค ยู+006บี อักษรละตินตัวเล็ก K
ยู+006ซี อักษรละตินตัวเล็ก L
ยู+006D อักษรละตินตัวเล็ก M
n n n ยู+006อี อักษรละตินตัวเล็ก N
โอ โอ โอ ยู+006เอฟ อักษรละตินตัวเล็ก O
พี พี พี ยู+0070 อักษรละตินตัวเล็ก P
q q q ยู+0071 ตัวอักษรเล็ก Q ในภาษาละติน
ยู+0072 อักษรละตินตัวเล็ก R
ยู+0073 อักษรละตินตัวเล็ก S
ที ที ที ยู+0074 อักษรละตินตัวเล็ก T
คุณ คุณ คุณ ยู+0075 อักษรละตินตัวเล็ก U
วี วี วี ยู+0076 ละติน ตัวเล็ก วี
ยู+0077 อักษรละตินตัวเล็ก w
x x x ยู+0078 อักษรละตินตัวเล็ก X
y y y ยู+0079 อักษรละตินตัวเล็ก Y
z z z ยู+007เอ อักษรละตินตัวเล็ก Z
ตัวยึดด้านซ้าย { { ยู+007บี วงเล็บปีกกาซ้าย
เส้นแนวตั้ง | | ยู+007ซี เส้นแนวตั้ง
สายรัดขวา } } ยู+007ดี วงเล็บปีกกาขวา
เครื่องหมายทิลเด ~ ~ ยู+007อี ทิลเด

คลาสตัวละคร

ตัวละครถูกจัดกลุ่มตามคลาส[ 4 ]

ช่วงยูนิโค้ด คลาสตัวละคร มาตรฐาน POSIX.1-2017
ยู+0000 ควบคุม พกพาได้
U+0001 ถึง U+0006 ควบคุม ไม่สามารถพกพาได้
U+0007 ถึง U+0008 ควบคุม พกพาได้
U+0009 ถึง U+000D พื้นที่ว่าง พกพาได้
U+0010 ถึง U+001F ควบคุม ไม่สามารถพกพาได้
ยู+0020 พื้นที่ว่าง พกพาได้
U+0021 ถึง U+002F เครื่องหมายวรรคตอน พกพาได้
U+0030 ถึง U+0039 ตัวเลข พกพาได้
U+003A ถึง U+0040 เครื่องหมายวรรคตอน พกพาได้
U+0041 ถึง U+005A ตัวอักษรพิมพ์ใหญ่ พกพาได้
U+005B ถึง U+0060 เครื่องหมายวรรคตอน พกพาได้
U+0061 ถึง U+007A ตัวอักษรพิมพ์เล็ก พกพาได้
U+007B ถึง U+007E เครื่องหมายวรรคตอน พกพาได้
ยู+007เอฟ ควบคุม ไม่สามารถพกพาได้

ชุดอักขระชื่อไฟล์แบบพกพา

POSIX ยังกำหนดมาตรฐานชุดอักขระชื่อไฟล์แบบพกพาซึ่งเป็นชุดย่อยที่เล็กกว่ามากของอักขระ 65 ตัวข้างต้น: [ 5 ] ตัวอักษรพิมพ์ใหญ่ 26 ตัว ตัวอักษรพิมพ์เล็ก 26 ตัว ตัวเลขทศนิยม 10 ตัว และอักขระเครื่องหมายวรรคตอนสามตัว ได้แก่ "จุด" "ขีดล่าง" และ "เครื่องหมายยัติภังค์"

เพื่อให้สามารถใช้งานได้ในทุกภาษา POSIX เส้นทางควรประกอบด้วยอักขระจากชุดอักขระชื่อไฟล์แบบพกพาเท่านั้น อักขระ "สแลช" และอักขระ "NUL" ตัวสุดท้ายเพียงตัวเดียว[ 6 ] เช่นเดียวกับชุดอักขระแบบพกพาที่นำอักขระเหล่านี้มาใช้ การเข้ารหัสของชุดอักขระชื่อไฟล์แบบพกพาไม่ได้ระบุไว้[ 7 ]

เพื่อให้สามารถใช้งานได้ในทุกภาษาของ POSIX ชื่อผู้ใช้ ชื่อกลุ่มชื่อไฟล์และชื่อไดเร็กทอรีควรประกอบด้วยอักขระจากชุดอักขระชื่อไฟล์แบบพกพาเท่านั้น และไม่ควรใช้เครื่องหมาย "ยัติภังค์" (-) เป็นอักขระตัวแรกของชื่อเหล่านั้น

หลายคนแนะนำให้ใช้ชุดอักขระชื่อไฟล์แบบพกพานี้เท่านั้นสำหรับชื่อไฟล์และชื่อไดเร็กทอรี แม้แต่ในระบบที่สามารถใช้ตัวอักษรและสัญลักษณ์อื่นๆ ได้ก็ตาม อาจใช้ยูทิลิตี้เช่นdetox , convmvและGlindraเพื่อแก้ไขชื่อไฟล์ที่ "ไม่ดี" [ 8 ] [ 9 ] [ 10 ] [ 11 ]

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Portable_character_set&oldid=1326740494 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ชุดอักขระพกพา

ชุดอักขระพกพา (Portable Character Set ) คือชุดอักขระ 103 ตัว ซึ่งตาม มาตรฐาน POSIXจะต้องมีอยู่ในชุดอักขระใดๆ ก็ตาม เมื่อเปรียบเทียบกับASCIIชุดอักขระพกพาจะขาดอักขระควบคุม บางตัว...

ชุดอักขระชื่อไฟล์แบบพกพา

POSIX ยังกำหนดมาตรฐาน ชุดอักขระชื่อไฟล์แบบพกพา ซึ่งเป็นชุดย่อยที่เล็กกว่ามากของอักขระ 65 ตัวข้างต้น: [ 5 ] ตัวอักษรพิมพ์ใหญ่ 26 ตัว ตัวอักษรพิมพ์เล็ก 26 ตัว ตัวเลขทศนิยม 10 ตัว และอักขระเครื่องหมายวรรคตอนสามตัว ได้แก่ "จุด" "ขีดล่าง" และ "เครื่องหมายยัติภังค์"