อ่าน 2 นาที
ชุดอักขระพกพา
ชุดอักขระพกพา (Portable Character Set ) คือชุดอักขระ 103 ตัว ซึ่งตาม มาตรฐาน POSIXจะต้องมีอยู่ในชุดอักขระใดๆ ก็ตาม เมื่อเปรียบเทียบกับASCIIชุดอักขระพกพาจะขาดอักขระควบคุม บางตัว...
ชุดอักขระพกพา
ชุดอักขระพกพา (Portable Character Set ) คือชุดอักขระ 103 ตัว ซึ่งตาม มาตรฐาน POSIXจะต้องมีอยู่ในชุดอักขระใดๆ ก็ตาม เมื่อเปรียบเทียบกับASCIIชุดอักขระพกพาจะขาดอักขระควบคุม บางตัว และไม่ได้กำหนดการเข้ารหัสค่าใดๆ เป็นพิเศษ[ 1 ] [ 2 ] ชุดอักขระพกพาเป็นซูเปอร์เซตของชุดอักขระการดำเนินการพื้นฐาน (Basic Execution Character Set)ตามที่กำหนดโดยANSI C [ 3 ]
| ชื่อ | อักษรภาพ | สาย ซี | ยูนิโค้ด | ชื่อยูนิโค้ด |
|---|---|---|---|---|
| นูแอล | 0 | ยู+0000 | NULL (NUL) | |
| เตือน | \a | ยู+0007 | แจ้งเตือน (BEL) | |
| ลบ | \b | ยู+0008 | แบ็คสเปซ (BS) | |
| แท็บ | \t | ยู+0009 | ตารางแสดงค่าตัวละคร (HT) | |
| ขึ้นบรรทัดใหม่ | \n | ยู+000เอ | ระบบป้อนสาย (LF) | |
| แท็บแนวตั้ง | \v | ยู+000บี | ตารางเส้น (VT) | |
| แบบฟอร์มฟีด | \f | ยู+000ซี | แบบฟอร์มป้อนกระดาษ (FF) | |
| การขึ้นบรรทัดใหม่ | \r | ยู+000D | ค่าขนส่งคืน (CR) | |
| ช่องว่าง | ยู+0020 | ช่องว่าง | ||
| เครื่องหมายอัศเจรีย์ | ! | ! | ยู+0021 | เครื่องหมายอัศเจรีย์ |
| เครื่องหมายอัญประกาศ | " | " | ยู+0022 | เครื่องหมายอัญประกาศ |
| เครื่องหมายตัวเลข | # | # | ยู+0023 | ป้ายหมายเลข |
| เครื่องหมายดอลลาร์ | $ | $ | ยู+0024 | เครื่องหมายดอลลาร์ |
| เครื่องหมายเปอร์เซ็นต์ | % | % | ยู+0025 | เครื่องหมายเปอร์เซ็นต์ |
| แอมเปอร์แซนด์ | & | & | ยู+0026 | แอมเปอร์แซนด์ |
| เครื่องหมายอะพอสโทรฟี | ' | ' | ยู+0027 | อะพอสโทรฟี |
| วงเล็บซ้าย | ( | ( | ยู+0028 | วงเล็บซ้าย |
| วงเล็บขวา | ) | ) | ยู+0029 | วงเล็บขวา |
| เครื่องหมายดอกจัน | * | * | ยู+002เอ | เครื่องหมายดอกจัน |
| เครื่องหมายบวก | + | + | ยู+002บี | เครื่องหมายบวก |
| เครื่องหมายจุลภาค | , | , | ยู+002ซี | คอมมา |
| ยัติภังค์ | - | - | ยู+002D | ไฮเฟน-ลบ |
| ระยะเวลา | . | . | ยู+002E | จุดเต็ม |
| สแลช | / | / | ยู+002เอฟ | โซลิดัส |
| ศูนย์ | 0 | 0 | ยู+0030 | เลขศูนย์ |
| หนึ่ง | 1 | 1 | ยู+0031 | หลักที่หนึ่ง |
| สอง | 2 | 2 | ยู+0032 | เลขสอง |
| สาม | 3 | 3 | ยู+0033 | เลขสาม |
| สี่ | 4 | 4 | ยู+0034 | เลขสี่ |
| ห้า | 5 | 5 | ยู+0035 | เลขห้า |
| หก | 6 | 6 | ยู+0036 | เลขหก |
| เจ็ด | 7 | 7 | ยู+0037 | เลขเจ็ด |
| แปด | 8 | 8 | ยู+0038 | เลขแปด |
| เก้า | 9 | 9 | ยู+0039 | เลขเก้า |
| ลำไส้ใหญ่ | : | : | ยู+003เอ | พันเอก |
| อัฒภาค | ; | ; | ยู+003บี | อัฒภาค |
| เครื่องหมายน้อยกว่า | < | < | ยู+003ซี | เครื่องหมายน้อยกว่า |
| เครื่องหมายเท่ากับ | = | = | ยู+003D | เครื่องหมายเท่ากับ |
| เครื่องหมายมากกว่า | > | > | U+003E | เครื่องหมายมากกว่า |
| เครื่องหมายคำถาม | ? | ? | ยู+003เอฟ | เครื่องหมายคำถาม |
| เชิงพาณิชย์ที่ | @ | @ | ยู+0040 | เชิงพาณิชย์ที่ |
| เอ | เอ | เอ | ยู+0041 | อักษรละตินตัวพิมพ์ใหญ่ A |
| บี | บี | บี | ยู+0042 | อักษรละตินตัวพิมพ์ใหญ่ B |
| ซี | ซี | ซี | ยู+0043 | อักษรละตินตัวพิมพ์ใหญ่ C |
| ดี | ดี | ดี | ยู+0044 | อักษรละตินตัวพิมพ์ใหญ่ D |
| อี | อี | อี | ยู+0045 | อักษรละตินตัวพิมพ์ใหญ่ E |
| เอฟ | เอฟ | เอฟ | ยู+0046 | อักษรละตินตัวพิมพ์ใหญ่ F |
| จี | จี | จี | ยู+0047 | อักษรละตินตัวพิมพ์ใหญ่ G |
| ชม | ชม | ชม | ยู+0048 | อักษรละตินตัวพิมพ์ใหญ่ H |
| ฉัน | ฉัน | ฉัน | ยู+0049 | อักษรละตินตัวพิมพ์ใหญ่ I |
| เจ | เจ | เจ | ยู+004เอ | อักษรตัวพิมพ์ใหญ่ละติน J |
| เค | เค | เค | ยู+004บี | อักษรละตินตัวพิมพ์ใหญ่ K |
| แอล | แอล | แอล | ยู+004ซี | อักษรละตินตัวพิมพ์ใหญ่ L |
| เอ็ม | เอ็ม | เอ็ม | ยู+004D | อักษรละตินตัวพิมพ์ใหญ่ M |
| เอ็น | เอ็น | เอ็น | ยู+004E | อักษรละตินตัวพิมพ์ใหญ่ N |
| โอ | โอ | โอ | ยู+004เอฟ | อักษรละตินตัวพิมพ์ใหญ่ O |
| พี | พี | พี | ยู+0050 | อักษรละตินตัวพิมพ์ใหญ่ P |
| คิว | คิว | คิว | ยู+0051 | อักษรตัวพิมพ์ใหญ่ภาษาละติน Q |
| อาร์ | อาร์ | อาร์ | ยู+0052 | อักษรละตินตัวพิมพ์ใหญ่ R |
| เอส | เอส | เอส | ยู+0053 | อักษรละตินตัวพิมพ์ใหญ่ S |
| ที | ที | ที | ยู+0054 | อักษรละตินตัวพิมพ์ใหญ่ T |
| ยู | ยู | ยู | ยู+0055 | อักษรละตินตัวพิมพ์ใหญ่ U |
| วี | วี | วี | ยู+0056 | อักษรละตินตัวพิมพ์ใหญ่ V |
| ว | ว | ว | ยู+0057 | อักษรละตินตัวพิมพ์ใหญ่ W |
| X | X | X | ยู+0058 | อักษรละตินตัวพิมพ์ใหญ่ X |
| วาย | วาย | วาย | ยู+0059 | อักษรละตินตัวพิมพ์ใหญ่ Y |
| ซ | ซ | ซ | ยู+005เอ | อักษรละตินตัวพิมพ์ใหญ่ Z |
| วงเล็บเหลี่ยมซ้าย | [ | [ | ยู+005บี | วงเล็บเหลี่ยมซ้าย |
| แบ็กสแลช | \ | \\ | ยู+005ซี | โซลิดัสกลับด้าน |
| วงเล็บเหลี่ยมขวา | ] | ] | ยู+005D | วงเล็บเหลี่ยมขวา |
| เซอร์คัมเฟล็กซ์ | ^ | ^ | ยู+005E | เซอร์คัมเฟล็กซ์ แอคเซนท์ |
| ขีดล่าง | _ | _ | ยู+005เอฟ | เส้นล่าง |
| เน้นเสียงหนัก | ` | ` | ยู+0060 | สำเนียงเคร่งขรึม |
| เอ | เอ | เอ | ยู+0061 | อักษรละตินตัวเล็ก A |
| ข | ข | ข | ยู+0062 | อักษรละตินตัวเล็ก B |
| ค | ค | ค | ยู+0063 | อักษรละตินตัวเล็ก C |
| ง | ง | ง | ยู+0064 | อักษรละตินตัวเล็ก ดี |
| อี | อี | อี | ยู+0065 | อักษรละตินตัวเล็ก E |
| เอฟ | เอฟ | เอฟ | ยู+0066 | อักษรละตินตัวเล็ก F |
| จี | จี | จี | ยู+0067 | อักษรละตินตัวเล็ก G |
| ชม. | ชม. | ชม. | ยู+0068 | อักษรละตินตัวเล็ก H |
| ฉัน | ฉัน | ฉัน | ยู+0069 | อักษรละตินตัวเล็ก I |
| เจ | เจ | เจ | ยู+006เอ | อักษรละตินตัวเล็ก J |
| เค | เค | เค | ยู+006บี | อักษรละตินตัวเล็ก K |
| ล | ล | ล | ยู+006ซี | อักษรละตินตัวเล็ก L |
| ม | ม | ม | ยู+006D | อักษรละตินตัวเล็ก M |
| n | n | n | ยู+006อี | อักษรละตินตัวเล็ก N |
| โอ | โอ | โอ | ยู+006เอฟ | อักษรละตินตัวเล็ก O |
| พี | พี | พี | ยู+0070 | อักษรละตินตัวเล็ก P |
| q | q | q | ยู+0071 | ตัวอักษรเล็ก Q ในภาษาละติน |
| ร | ร | ร | ยู+0072 | อักษรละตินตัวเล็ก R |
| ส | ส | ส | ยู+0073 | อักษรละตินตัวเล็ก S |
| ที | ที | ที | ยู+0074 | อักษรละตินตัวเล็ก T |
| คุณ | คุณ | คุณ | ยู+0075 | อักษรละตินตัวเล็ก U |
| วี | วี | วี | ยู+0076 | ละติน ตัวเล็ก วี |
| ว | ว | ว | ยู+0077 | อักษรละตินตัวเล็ก w |
| x | x | x | ยู+0078 | อักษรละตินตัวเล็ก X |
| y | y | y | ยู+0079 | อักษรละตินตัวเล็ก Y |
| z | z | z | ยู+007เอ | อักษรละตินตัวเล็ก Z |
| ตัวยึดด้านซ้าย | { | { | ยู+007บี | วงเล็บปีกกาซ้าย |
| เส้นแนวตั้ง | | | | | ยู+007ซี | เส้นแนวตั้ง |
| สายรัดขวา | } | } | ยู+007ดี | วงเล็บปีกกาขวา |
| เครื่องหมายทิลเด | ~ | ~ | ยู+007อี | ทิลเด |
คลาสตัวละคร
ตัวละครถูกจัดกลุ่มตามคลาส[ 4 ]
| ช่วงยูนิโค้ด | คลาสตัวละคร | มาตรฐาน POSIX.1-2017 |
|---|---|---|
| ยู+0000 | ควบคุม | พกพาได้ |
| U+0001 ถึง U+0006 | ควบคุม | ไม่สามารถพกพาได้ |
| U+0007 ถึง U+0008 | ควบคุม | พกพาได้ |
| U+0009 ถึง U+000D | พื้นที่ว่าง | พกพาได้ |
| U+0010 ถึง U+001F | ควบคุม | ไม่สามารถพกพาได้ |
| ยู+0020 | พื้นที่ว่าง | พกพาได้ |
| U+0021 ถึง U+002F | เครื่องหมายวรรคตอน | พกพาได้ |
| U+0030 ถึง U+0039 | ตัวเลข | พกพาได้ |
| U+003A ถึง U+0040 | เครื่องหมายวรรคตอน | พกพาได้ |
| U+0041 ถึง U+005A | ตัวอักษรพิมพ์ใหญ่ | พกพาได้ |
| U+005B ถึง U+0060 | เครื่องหมายวรรคตอน | พกพาได้ |
| U+0061 ถึง U+007A | ตัวอักษรพิมพ์เล็ก | พกพาได้ |
| U+007B ถึง U+007E | เครื่องหมายวรรคตอน | พกพาได้ |
| ยู+007เอฟ | ควบคุม | ไม่สามารถพกพาได้ |
ชุดอักขระชื่อไฟล์แบบพกพา
POSIX ยังกำหนดมาตรฐานชุดอักขระชื่อไฟล์แบบพกพาซึ่งเป็นชุดย่อยที่เล็กกว่ามากของอักขระ 65 ตัวข้างต้น: [ 5 ] ตัวอักษรพิมพ์ใหญ่ 26 ตัว ตัวอักษรพิมพ์เล็ก 26 ตัว ตัวเลขทศนิยม 10 ตัว และอักขระเครื่องหมายวรรคตอนสามตัว ได้แก่ "จุด" "ขีดล่าง" และ "เครื่องหมายยัติภังค์"
เพื่อให้สามารถใช้งานได้ในทุกภาษา POSIX เส้นทางควรประกอบด้วยอักขระจากชุดอักขระชื่อไฟล์แบบพกพาเท่านั้น อักขระ "สแลช" และอักขระ "NUL" ตัวสุดท้ายเพียงตัวเดียว[ 6 ] เช่นเดียวกับชุดอักขระแบบพกพาที่นำอักขระเหล่านี้มาใช้ การเข้ารหัสของชุดอักขระชื่อไฟล์แบบพกพาไม่ได้ระบุไว้[ 7 ]
เพื่อให้สามารถใช้งานได้ในทุกภาษาของ POSIX ชื่อผู้ใช้ ชื่อกลุ่มชื่อไฟล์และชื่อไดเร็กทอรีควรประกอบด้วยอักขระจากชุดอักขระชื่อไฟล์แบบพกพาเท่านั้น และไม่ควรใช้เครื่องหมาย "ยัติภังค์" (-) เป็นอักขระตัวแรกของชื่อเหล่านั้น
หลายคนแนะนำให้ใช้ชุดอักขระชื่อไฟล์แบบพกพานี้เท่านั้นสำหรับชื่อไฟล์และชื่อไดเร็กทอรี แม้แต่ในระบบที่สามารถใช้ตัวอักษรและสัญลักษณ์อื่นๆ ได้ก็ตาม อาจใช้ยูทิลิตี้เช่นdetox , convmvและGlindraเพื่อแก้ไขชื่อไฟล์ที่ "ไม่ดี" [ 8 ] [ 9 ] [ 10 ] [ 11 ]
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ชุดอักขระพกพา
ชุดอักขระพกพา (Portable Character Set ) คือชุดอักขระ 103 ตัว ซึ่งตาม มาตรฐาน POSIXจะต้องมีอยู่ในชุดอักขระใดๆ ก็ตาม เมื่อเปรียบเทียบกับASCIIชุดอักขระพกพาจะขาดอักขระควบคุม บางตัว...
ชุดอักขระชื่อไฟล์แบบพกพา
POSIX ยังกำหนดมาตรฐาน ชุดอักขระชื่อไฟล์แบบพกพา ซึ่งเป็นชุดย่อยที่เล็กกว่ามากของอักขระ 65 ตัวข้างต้น: [ 5 ] ตัวอักษรพิมพ์ใหญ่ 26 ตัว ตัวอักษรพิมพ์เล็ก 26 ตัว ตัวเลขทศนิยม 10 ตัว และอักขระเครื่องหมายวรรคตอนสามตัว ได้แก่ "จุด" "ขีดล่าง" และ "เครื่องหมายยัติภังค์"