อ่าน 7 นาที
อักขระเว้นวรรค
อักขระเว้นวรรค (whitespace character)คือ องค์ประกอบข้อมูลอักขระ ที่ใช้แทนช่องว่างเมื่อข้อความถูก แสดงผลโดยคอมพิวเตอร์
อักขระเว้นวรรค
อักขระเว้นวรรค (whitespace character)คือ องค์ประกอบข้อมูลอักขระ ที่ใช้แทนช่องว่างเมื่อข้อความถูก แสดงผลโดยคอมพิวเตอร์
ตัวอย่างเช่น อักขระ เว้นวรรค ( U+0020 SPACE , ASCII 32) แทนช่องว่าง เช่นตัวแบ่งคำในอักษรตะวันตก
อักขระที่พิมพ์ได้จะแสดงผลเมื่อถูกแสดงผล แต่ตัวเว้นวรรคจะไม่แสดงผล ตัวเว้นวรรคจะกำหนดเค้าโครงของข้อความในระดับจำกัด โดยขัดจังหวะลำดับการแสดงผลของอักขระที่อยู่ติดกันตามปกติ การแสดงผลของอักขระถัดไปมักจะเลื่อนไปทางขวา (หรือไปทางซ้ายสำหรับตัวเขียนจากขวาไปซ้าย ) หรือไปที่ต้นบรรทัดถัดไป ผลกระทบของตัวเว้นวรรคหลายตัวที่อยู่ติดกันจะสะสมกัน ดังนั้นอักขระที่พิมพ์ได้ตัวถัดไปจะถูกแสดงผลในตำแหน่งที่ขึ้นอยู่กับผลสะสมของตัวเว้นวรรคที่อยู่ก่อนหน้า
ที่มาของคำว่า"ช่องว่าง" (whitespace)มาจากการปฏิบัติทั่วไปในการเขียนข้อความบนกระดาษ สีขาว โดยปกติแล้ว อักขระช่องว่างจะไม่ถูกแสดงเป็นสีขาว มันส่งผลต่อการแสดงผล แต่ตัวมันเองไม่ได้ถูกแสดงผล
ภาพรวม

อักขระเว้นวรรคโดยทั่วไปจะแทรกช่องว่างแนวนอนที่มีความกว้างประมาณเท่ากับตัวอักษร สำหรับแบบอักษรที่มีความกว้างคงที่ ความกว้างจะเท่ากับความกว้างของตัวอักษร และสำหรับแบบอักษรที่มีความกว้างแปรผัน ความกว้างจะขึ้นอยู่กับแบบอักษรนั้นๆ แบบอักษรบางแบบรองรับอักขระเว้นวรรคหลายตัวที่มีความกว้างแตกต่างกัน
โดยทั่วไป อักขระแท็บจะแทรกช่องว่างแนวนอนซึ่งอิงตามจุดหยุดแท็บซึ่งแตกต่างกันไปตามแต่ละ โปรแกรม
โดยทั่วไปแล้ว ลำดับอักขระขึ้น บรรทัดใหม่จะย้ายตำแหน่งการแสดงผลไปยังจุดเริ่มต้นของบรรทัดถัดไป หากมีอักขระขึ้นบรรทัดใหม่หนึ่งตัวตามหลังข้อความ จะไม่ทำให้เกิดช่องว่าง แต่หากมีลำดับอักขระขึ้นบรรทัดใหม่สองตัวติดกันระหว่างบล็อกข้อความ จะทำให้เกิดบรรทัดว่างระหว่างบล็อกเหล่านั้น ความสูงของบรรทัดว่างจะแตกต่างกันไปตามแอปพลิเคชัน
การใช้ช่องว่างในการจัดวางข้อความถือเป็นธรรมเนียมปฏิบัติ แอปพลิเคชันบางตัวอาจแสดงช่องว่างเหล่านั้นเป็นมาร์กอัปที่มองเห็นได้ เพื่อให้ผู้ใช้สามารถเห็นสิ่งที่ปกติแล้วมองไม่เห็น
โดยทั่วไปผู้ใช้จะพิมพ์เว้นวรรคโดยการกดปุ่ม Enter spacebar, พิมพ์แท็บโดยการกดปุ่ม Tab และพิมพ์ขึ้นบรรทัดใหม่โดยการกดปุ่มEnter Tab ↹↵ Enter
ยูนิโค้ด
ตารางด้านล่างแสดงรายการอักขระยี่สิบห้าตัวที่กำหนดเป็นอักขระช่องว่าง ("WSpace=Y", "WS") ในฐานข้อมูลอักขระยูนิโค้ด[ 1 ]สิบเจ็ดตัวใช้คำจำกัดความของช่องว่างที่สอดคล้องกับอัลกอริทึมสำหรับการเขียนแบบสองทิศทาง ("Bidirectional Character Type=WS") และเรียกว่าอักขระ "Bidi-WS" อักขระที่เหลืออาจใช้ได้เช่นกัน แต่ไม่ใช่ประเภท "Bidi" นี้
หมายเหตุ: ขึ้นอยู่กับเบราว์เซอร์และแบบอักษรที่ใช้ในการดูตารางต่อไปนี้ ช่องว่างบางช่องอาจแสดงผลไม่ถูกต้อง
| ชื่อ | รหัสจุด | กล่องความกว้าง | อาจแตกหักได้ ? | ในIDNใช่ไหม? | สคริปต์ | ปิดกั้น | หมวดหมู่ ทั่วไป | หมายเหตุ | |
|---|---|---|---|---|---|---|---|---|---|
| ตารางอักขระ | ยู+0009 | 9 | ใช่ | เลขที่ | ทั่วไป | ภาษาละตินพื้นฐาน | อื่นๆการควบคุม | HT, แท็บแนวนอน เอนทิตีชื่อ HTML/XML : 	, LaTeX : \tab, การหลีกเลี่ยงอักขระ C :\t | |
| สายป้อน | ยู+000เอ | 10 | เป็นการขึ้นบรรทัดใหม่หรือไม่ | ทั่วไป | ภาษาละตินพื้นฐาน | อื่นๆการควบคุม | LF, การขึ้นบรรทัดใหม่ เอนทิตีชื่อ HTML/XML: 
, การหลีกเลี่ยงอักขระ C:\n | ||
| การจัดตารางบรรทัด | ยู+000บี | 11 | เป็นการขึ้นบรรทัดใหม่หรือไม่ | ทั่วไป | ภาษาละตินพื้นฐาน | อื่นๆการควบคุม | VT, แท็บแนวตั้ง . C escape:\v | ||
| ฟีดฟอร์ม | ยู+000ซี | 12 | เป็นการขึ้นบรรทัดใหม่หรือไม่ | ทั่วไป | ภาษาละตินพื้นฐาน | อื่นๆการควบคุม | FF, ขึ้นฟอร์ม . C escape:\f | ||
| การขึ้นบรรทัดใหม่ | ยู+000D | 13 | เป็นการขึ้นบรรทัดใหม่หรือไม่ | ทั่วไป | ภาษาละตินพื้นฐาน | อื่นๆการควบคุม | CR, การขึ้นบรรทัดใหม่ (Carriage return ) C escape:\r | ||
| ช่องว่าง | ยู+0020 | 32 | ใช่ | เลขที่ | ทั่วไป | ภาษาละตินพื้นฐาน | ตัวคั่น, ช่องว่าง | รูปแบบที่พบมากที่สุด (ช่องว่าง ASCII ปกติ) LaTeX:\ | |
| บรรทัดถัดไป | ยู+0085 | 133 | เป็นการขึ้นบรรทัดใหม่หรือไม่ | ทั่วไป | ลาติน-1 เสริม | อื่นๆการควบคุม | NEL, บรรทัดถัดไป . LaTeX:\\ | ||
| พื้นที่ห้ามหยุดพัก | ยู+00เอ0 | 160 | เลขที่ | เลขที่ | ทั่วไป | ลาติน-1 เสริม | ตัวคั่น, ช่องว่าง | ช่องว่างที่ไม่เว้นวรรค : เหมือนกับ U+0020 แต่ไม่ใช่จุดที่สามารถขึ้นบรรทัดใหม่ได้เอนทิตีชื่อใน HTML/XML: ,  , LaTeX:~ | |
| เครื่องหมายอ็อกแฮม | ยู+1680 | 5760 | ใช่ | เลขที่ | อ็อกแฮม | อ็อกแฮม | ตัวคั่น, ช่องว่าง | ใช้สำหรับคั่นคำใน อักษร โอแกมโดยปกติจะเป็นเส้นแนวตั้งในข้อความแนวตั้ง หรือเส้นแนวนอนในข้อความแนวนอน แต่ก็อาจเป็นช่องว่างเปล่าในแบบอักษรที่ไม่มีก้านคำได้ ต้องใช้แบบอักษรโอแกม | |
| เอน ควอด | ยู+2000 | 8192 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | ความกว้างหนึ่งen . U+2002 เทียบเท่ากับอักขระนี้ในเชิงมาตรฐาน; U+2002 เป็นที่นิยมมากกว่า | |
| เอ็ม ควอด | ยู+2001 | 8193 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | เรียกอีกอย่างว่า "mutton quad" ความกว้าง 1 em U+2003 เทียบเท่ากับอักขระนี้ตามหลักการ U+2003 เป็นที่นิยมมากกว่า | |
| อวกาศ | ยู+2002 | 8194 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | เรียกอีกอย่างว่า "nut" ความกว้างเท่ากับหนึ่งen U+2000 En Quad เทียบเท่ากับอักขระนี้ตามหลักการ แต่ U+2002 เป็นที่นิยมมากกว่าเอนทิตีชื่อใน HTML/XML:  , LaTeX: \enspace(ช่องว่าง en ใน LaTeX เป็นช่องว่างที่ไม่ขึ้นบรรทัดใหม่) | |
| พื้นที่ | ยู+2003 | 8195 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | เรียกอีกอย่างว่า "เนื้อแกะ" ความกว้าง 1 em U+2001 Em Quad เทียบเท่ากับอักขระนี้ตามหลักการ แต่ U+2003 เป็นที่นิยมมากกว่าเอนทิตีชื่อใน HTML/XML:  , LaTeX:\quad | |
| พื้นที่สามต่อหนึ่ง | ยู+2004 | 8196 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | เรียกอีกอย่างว่า "ช่องว่างหนา" (thick space) มีความกว้างหนึ่งในสามของหน่วย em ใน HTML/XML ใช้ nameline entity:  , ใน LaTeX ใช้ nameline space: \;(ช่องว่างหนาใน LaTeX เป็นช่องว่างที่ไม่ขึ้นบรรทัดใหม่) | |
| พื้นที่สี่ต่อหนึ่ง | ยู+2005 | 8197 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | เรียกอีกอย่างว่า "mid space" มีความกว้างหนึ่งในสี่ของ em เป็น nameent name ใน HTML/XML:  | |
| พื้นที่หกต่อเอ็ม | ยู+2006 | 8198 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | ความกว้างหนึ่งในหกของหน่วย em ในงานพิมพ์คอมพิวเตอร์ บางครั้งเทียบเท่ากับ U+2009 | |
| พื้นที่รูปภาพ | ยู+2007 | 8199 | เลขที่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | ช่องว่างสำหรับตัวเลข ในแบบอักษรที่มีตัวเลขแบบคงที่ ช่องว่างนี้จะมีขนาดเท่ากับความกว้างของตัวเลขหนึ่งหลัก(ชื่อเอนทิตีใน HTML/XML:)  | |
| เครื่องหมายวรรคตอน ช่องว่าง | ยู+2008 | 8200 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | กว้างเท่ากับเครื่องหมายวรรคตอนแคบในแบบอักษร เช่น ความกว้างล่วงหน้าของจุดหรือจุลภาค[ 2 ] เอนทิตีชื่อ HTML/XML:  | |
| พื้นที่บาง ๆ | ยู+2009 | 8201 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | ช่องว่างบาง ; กว้างหนึ่งในห้า (บางครั้งหนึ่งในหก) ของ em แนะนำให้ใช้เป็นตัวคั่นหลักพันสำหรับการวัดที่ใช้หน่วย SIต่างจาก U+2002 ถึง U+2008 ความกว้างอาจถูกปรับในการจัดพิมพ์[ 3 ] เอนทิตีชื่อ HTML/XML:  ,  , LaTeX: \,(ช่องว่างบางของ LaTeX เป็นช่องว่างที่ไม่เว้นวรรค) | |
| พื้นที่ผม | ยู+200เอ | 8202 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | บางกว่าช่องว่างบาง ๆ เอนทิตีชื่อ HTML/XML:  ,  | |
| ตัวคั่นบรรทัด | ยู+2028 | 8232 | เป็นการขึ้นบรรทัดใหม่หรือไม่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, เส้น | |||
| ตัวคั่นย่อหน้า | ยู+2029 | 8233 | เป็นการขึ้นบรรทัดใหม่หรือไม่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ย่อหน้า | |||
| พื้นที่แคบๆ ที่ไม่มีช่องว่าง | U+202F | 8239 | เลขที่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | ช่องว่างแคบที่ไม่เว้นวรรคมีฟังก์ชันคล้ายกับช่องว่างที่ไม่เว้นวรรค U+00A0 เมื่อใช้กับภาษามองโกล ความกว้างมักจะเป็นหนึ่งในสามของช่องว่างปกติ ในบริบทอื่น ความกว้างของมันบางครั้งอาจคล้ายกับช่องว่างบาง (U+2009) LaTeX:\, | |
| พื้นที่ทางคณิตศาสตร์ขนาดกลาง | U+205F | 8287 | ใช่ | เลขที่ | ทั่วไป | เครื่องหมายวรรคตอนทั่วไป | ตัวคั่น, ช่องว่าง | MMSP ใช้ในสูตรทางคณิตศาสตร์ สี่ในสิบแปดของ em [ 4 ]ในการพิมพ์ทางคณิตศาสตร์ ความกว้างของช่องว่างมักจะกำหนดเป็นจำนวนเต็มทวีคูณของหนึ่งในสิบแปดของ em และ 4/18 em อาจใช้ในหลายสถานการณ์ เช่น ระหว่างaและ+และระหว่าง+และbในนิพจน์a + b [ 5 ] เอน ทิตีที่มีชื่อใน HTML/XML:  , LaTeX: \:(ช่องว่างขนาดกลางของ LaTeX เป็นช่องว่างที่ไม่ขึ้นบรรทัดใหม่) | |
| พื้นที่เชิงอักษรภาพ | ยู+3000 | 12288 | ใช่ | เลขที่ | ทั่วไป | สัญลักษณ์และเครื่องหมายวรรค ตอน CJK | ตัวคั่น, ช่องว่าง | มีความกว้างเท่ากับ ช่อง อักขระ CJK ( เต็มความกว้าง ) ใช้ใน tai tou เป็นต้น | |
| ชื่อ | รหัสจุด | กล่องความกว้าง | อาจแตกหักได้ ? | ในIDNใช่ไหม? | สคริปต์ | ปิดกั้น | หมวดหมู่ ทั่วไป | หมายเหตุ | |
|---|---|---|---|---|---|---|---|---|---|
| ตัวคั่นสระมองโกล | ยู+180อี | 6158 | | ใช่ | เลขที่ | มองโกล | มองโกล | รูปแบบ อื่นๆ | MVS อักขระเว้นวรรคแคบๆ ที่ใช้ในภาษามองโกลเพื่อทำให้อักขระสองตัวสุดท้ายของคำมีรูปร่างที่แตกต่างกัน[ 6 ]ใน Unicode 6.3.0 อักขระนี้ไม่ได้จัดอยู่ในประเภทอักขระเว้นวรรค (เช่น ในหมวด Zs) อีกต่อไป แม้ว่าจะเคยอยู่ในเวอร์ชันก่อนหน้าของมาตรฐานก็ตาม |
| พื้นที่ความกว้างเป็นศูนย์ | ยู+200บี | 8203 | | ใช่ | เลขที่ | ? | เครื่องหมายวรรคตอนทั่วไป | รูปแบบ อื่นๆ | ZWSP, ช่องว่างความกว้างศูนย์ใช้เพื่อระบุขอบเขตคำให้กับระบบประมวลผลข้อความเมื่อใช้สคริปต์ที่ไม่ใช้การเว้นวรรคแบบชัดเจน คล้ายกับเครื่องหมายยัติภังค์แบบอ่อนโดยมีความแตกต่างตรงที่เครื่องหมายยัติภังค์แบบอ่อนใช้เพื่อระบุขอบเขตพยางค์ และควรแสดงเครื่องหมายยัติภังค์ที่มองเห็นได้เมื่อมีการขึ้นบรรทัดใหม่ที่เครื่องหมายนั้นเอนทิตีชื่อ HTML/XML : [ 7 ] [ c ]​ |
| ความกว้างเป็นศูนย์ ไม่เชื่อมต่อ | ยู+200C | 8204 | | ใช่ | ขึ้นอยู่กับบริบท[ 12 ] | ? | เครื่องหมายวรรคตอนทั่วไป | รูปแบบ อื่นๆ | ZWNJ ( zero-width non-joiner ) คืออักขระที่ไม่เชื่อมต่อกันโดยมีความกว้างเป็นศูนย์ เมื่อวางไว้ระหว่างอักขระสองตัวที่ปกติจะเชื่อมต่อกัน ZWNJ จะทำให้ตัวอักขระเหล่านั้นถูกพิมพ์ออกมาในรูปแบบตัวพิมพ์ใหญ่และตัวพิมพ์เล็กตามลำดับ เป็นเอนทิตีที่มีชื่อใน HTML/XML‌ |
| ตัวเชื่อมต่อความกว้างศูนย์ | ยู+200ดี | 8205 | | ใช่ | ขึ้นอยู่กับบริบท[ 13 ] | ? | เครื่องหมายวรรคตอนทั่วไป | รูปแบบ อื่นๆ | ZWJ ( Zero-Width Joiner ) คือตัวเชื่อมอักขระที่มีความกว้างเป็นศูนย์ เมื่อวางไว้ระหว่างอักขระสองตัวที่ปกติจะไม่เชื่อมต่อกัน ZWJ จะทำให้ตัวอักขระเหล่านั้นถูกพิมพ์ออกมาในรูปแบบที่เชื่อมต่อกัน นอกจากนี้ยังสามารถใช้เพื่อแสดงรูปแบบการเชื่อมต่อแบบแยกเดี่ยวได้ ขึ้นอยู่กับว่าโดยค่าเริ่มต้นคาดหวังให้ใช้ตัวเชื่อมอักขระหรือตัวเชื่อมอักขระแบบใด ZWJ สามารถกระตุ้น (เช่นในอีโมจิและในภาษาสิงหล ) หรือระงับ (เช่นในภาษาเทวนาครี ) การแทนที่ด้วยอักขระตัวเดียว ในขณะที่ยังคงอนุญาตให้ใช้รูปแบบการเชื่อมต่อแบบแยกเดี่ยวได้ (ต่างจาก ZWNJ) เป็นเอนทิตีที่มีชื่อใน HTML/XML:‍ |
| ตัวเชื่อมคำ | ยู+2060 | 8288 | | เลขที่ | เลขที่ | ? | เครื่องหมายวรรคตอนทั่วไป | รูปแบบ อื่นๆ | WJ ( Word Joiner ) คือตัวเชื่อมคำ คล้ายกับ U+200B แต่ไม่ใช่จุดที่สามารถแบ่งบรรทัดได้ เป็นเอนทิตีชื่อใน HTML/XML:⁠ |
| ช่องว่างที่ไม่เว้นวรรคที่มีความกว้างเป็นศูนย์ | ยู+เอฟเอฟ | 65279 | เลขที่ | เลขที่ | ? | แบบฟอร์ม การนำเสนอภาษาอาหรับ-B | รูปแบบ อื่นๆ | ช่องว่างที่ไม่เว้นวรรคที่มีความกว้างเป็นศูนย์ใช้เป็นเครื่องหมายลำดับไบต์ เป็นหลัก การใช้งานเพื่อบ่งชี้ว่าไม่เว้นวรรคถูกยกเลิกแล้วใน Unicode 3.2 โปรดดู U+2060 แทน | |
|
แทนที่รูปภาพ
นอกจากนี้ Unicode ยังมีอักขระที่มองเห็นได้บางตัวที่สามารถใช้แทนอักขระเว้นวรรคต่างๆ ในบริบทที่จำเป็นต้องแสดงสัญลักษณ์ที่มองเห็นได้:
| รหัส | ทศนิยม | ชื่อ | ปิดกั้น | แสดง | คำอธิบาย |
|---|---|---|---|---|---|
| ยู+00บี7 | 183 | จุดกลาง | ลาติน-1 เสริม | · | เครื่องหมายวรรคตอนระบุชื่อเอนทิตี:· |
| ยู+21เอ1 | 8609 | ลูกศรสองหัวชี้ลง | ลูกศร | ↡ | สัญลักษณ์ ECMA-17 / ISO 2047สำหรับการป้อนแบบฟอร์ม (การแบ่งหน้า) [ 15 ] |
| ยู+2261 | 8810 | เหมือนกันกับ | ตัวดำเนินการ ทางคณิตศาสตร์ | ≡ | นอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับการขึ้นบรรทัดใหม่[ 15 ] |
| ยู+237ดี | 9085 | กล่องเปิดแบบมีไหล่ | ข้อมูลทางเทคนิคเบ็ดเตล็ด | ⍽ | ใช้เพื่อระบุNBSP |
| ยู+23ซีอี | 9166 | สัญลักษณ์กลับ | ข้อมูลทางเทคนิคเบ็ดเตล็ด | ⏎ | สัญลักษณ์สำหรับปุ่ม Enterซึ่งจะขึ้นบรรทัดใหม่ |
| ยู+2409 | 9225 | สัญลักษณ์สำหรับการจัดตารางแนวนอน | ภาพควบคุม | ␉ | ตัวอักษรที่ใช้แทนแท็บ |
| ยู+240เอ | 9226 | สัญลักษณ์สำหรับการขึ้นบรรทัดใหม่ | ภาพควบคุม | ␊ | ตัวเลือกทดแทนสำหรับการป้อนสาย |
| ยู+240บี | 9227 | สัญลักษณ์สำหรับการจัดตารางแนวตั้ง | ภาพควบคุม | ␋ | ตัวเลือกทดแทนสำหรับแถบแนวตั้ง (แถบเส้น) |
| ยู+240C | 9228 | สัญลักษณ์สำหรับการป้อนแบบฟอร์ม | ภาพควบคุม | ␌ | ตัวเลือกอื่นแทนการขึ้นหน้าใหม่ (form feed) |
| ยู+240ดี | 9229 | สัญลักษณ์สำหรับการขึ้นบรรทัดใหม่ | ภาพควบคุม | ␍ | คำที่ใช้แทนการขึ้นบรรทัดใหม่ |
| ยู+2420 | 9248 | สัญลักษณ์แทนอวกาศ | ภาพควบคุม | ␠ | ตัวเลือกทดแทนสำหรับช่องว่าง ASCII |
| ยู+2422 | 9250 | สัญลักษณ์ว่างเปล่า | ภาพควบคุม | ␢ | หรือ เรียกอีกอย่างว่า "แทนที่ช่องว่าง" [ 16 ]ใช้ในBCDIC [ 16 ] EBCDIC [ 16 ] ASCII-1963 [ 16 ] [ 17 ]เป็นต้น เป็นสัญลักษณ์แทนตัวคั่นคำ |
| ยู+2423 | 9251 | เปิดกล่อง | ภาพควบคุม | ␣ | ใช้ใน การเขียนด้วย ลายมือแบบบล็อกอย่างน้อยตั้งแต่ทศวรรษ 1980 เมื่อจำเป็นต้องระบุจำนวนอักขระเว้นวรรคอย่างชัดเจน (เช่น เมื่อเขียนโปรแกรมด้วยปากกาและกระดาษ) ใช้ในตำราเรียน (ตีพิมพ์ในปี 1982, 1984, 1985, 1988 โดย Springer-Verlag) เกี่ยวกับModula-2 [ 18 ] ซึ่ง เป็นภาษาโปรแกรมที่รหัสเว้นวรรคต้องระบุอย่างชัดเจน นอกจากนี้ยังใช้ในแป้นพิมพ์[ n 1 ]ของเครื่องคิดเลขกราฟิก TI-8 x seriesของTexas Instrumentsเอนทิตีที่มีชื่อ:␣ |
| ยู+2424 | 9252 | สัญลักษณ์สำหรับขึ้นบรรทัดใหม่ | ภาพควบคุม |  | ตัวเลือกทดแทนการขึ้นบรรทัดใหม่ |
| ยู+25บี3 | 9651 | สามเหลี่ยมสีขาวชี้ขึ้น | รูปทรงเรขาคณิต | △ | นอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับพื้นที่ ASCII [ 15 ] |
| ยู+2เอ5บี | 10843 | ตรรกะ OR ที่มีแกนกลาง | ตัวดำเนินการ ทางคณิตศาสตร์เสริม | ⩛ | นอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับแท็บแนวตั้ง (แท็บเส้น) [ 15 ] |
| ยู+2เอเอ | 10922 | เล็กกว่า | ตัวดำเนินการ ทางคณิตศาสตร์เสริม | ⪪ | นอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับการขึ้นบรรทัดใหม่[ 15 ] |
| ยู+2เอเอบี | 10923 | ใหญ่กว่า | ตัวดำเนินการ ทางคณิตศาสตร์เสริม | ⪫ | นอกเหนือจากการใช้งานอื่นๆ แล้ว ยังใช้เป็นสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับอักขระแท็บ[ 15 ] |
| ยู+2บี1เอ | 11034 | สี่เหลี่ยมจุดไข่ปลา | สัญลักษณ์และลูกศร เบ็ดเตล็ด | ⬚ | |
| ยู+3037 | 12343 | สัญลักษณ์ตัวคั่นบรรทัดโทรเลขเชิงอุดมคติ | สัญลักษณ์และเครื่องหมายวรรค ตอน CJK | 〷 | ภาพกราฟิกที่ใช้สำหรับรหัส 9999 ในรหัสโทรเลขของจีนแสดงถึงการขึ้นบรรทัดใหม่ |
- ^เหนือปุ่มเลขศูนย์ "0" หรือเครื่องหมายลบ "(‒)"
- พื้นที่ที่แน่นอน
- Cambridge Z88ให้ "ช่องว่างที่แน่นอน" พิเศษ (รหัสจุด 160 หรือ 0xA0) (เรียกใช้ได้โดยใช้ปุ่มลัด+ [ 19 ] ) ซึ่งแสดงเป็น "..." โดยไดรเวอร์แสดงผลของระบบปฏิบัติการ[ 20 ] [ 21 ]ดังนั้นจึงเรียกอีกอย่างว่า "ช่องว่างจุด" เมื่อใช้ร่วมกับBBC BASIC [ 20 ] [ 21 ]⌑SPACE
- ภายใต้รหัสจุด 224 (0xE0) คอมพิวเตอร์ยังจัดเตรียมสัญลักษณ์ SPACE พิเศษที่มีความกว้างสามเซลล์อักขระ
"SPC"(คล้ายกับ U+2420 ของ Unicode ที่มีความกว้างเซลล์เดียว) [ 20 ] [ 21 ]
ช่องว่างที่ไม่ใช่ช่องว่าง
- บล็อก Unicode รูปแบบอักษรเบรลล์ประกอบด้วยU+2800 ⠀ BRAILLE PATTERN BLANKซึ่งเป็น รูปแบบ อักษรเบรลล์ที่ไม่มีจุดนูน บางแบบอักษรแสดงอักขระนี้เป็นช่องว่างที่มีความกว้างคงที่ อย่างไรก็ตาม มาตรฐาน Unicode ระบุไว้อย่างชัดเจนว่าอักขระนี้ไม่ทำหน้าที่เป็นช่องว่าง[ 22 ]
- ระบบยูนิโคดครอบคลุมอักษรเกาหลีหลายจุดรหัสที่แสดงถึงการไม่มีตัวอักษรเขียน ดังนั้นจึงไม่แสดงสัญลักษณ์ใดๆ:
- Unicode มี อักขระ Hangul Filler อยู่ ใน บล็อก Hangul Compatibility Jamo ( U+3164 ㅤ HANGUL FILLER ) ซึ่งจัดเป็นอักขระประเภทตัวอักษร แต่แสดงผลเป็นช่องว่าง เหมือนกับบล็อก Hangul ที่ไม่มี jamo มีการใช้ใน ลำดับการรวม Hangul KS X 1001เพื่อแนะนำหรือระบุการไม่มีตัวอักษรในตำแหน่งนั้น แต่ไม่ได้ใช้ในระบบ jamo การรวมของ Unicode [ 23 ]
- ระบบ jamo ของ Unicode ใช้ตัวอักษร Hangul Choseong Filler และ Hangul Jungseong Filler ที่คล้ายกันเพื่อแสดงถึงการไม่มีตัวอักษรในตำแหน่งเริ่มต้นหรือตำแหน่งกลางภายในบล็อกพยางค์ ซึ่งรวมอยู่ในบล็อก Hangul Jamo ( U+115F ᅟ HANGUL CHOSEONG FILLER , U+1160 ᅠ HANGUL JUNGSEONG FILLER ) [ 24 ]
- นอกจากนี้ ยัง มี Halfwidth Hangul Fillerรวมอยู่ในHalfwidth และ Fullwidth Forms ( U+FFA0ᅠHALFWIDTH HANGUL FILLER ) ซึ่งใช้เมื่อทำการแมปจากการเข้ารหัสที่มีอักขระจากทั้งJohab (หรือWansung ) และN-byte Hangul (หรือEBCDICที่เทียบเท่า) เช่น IBM-933 ซึ่งมีทั้ง Johab และ EBCDIC fillers [ 25 ] [ 26 ]
พื้นที่ว่างและการจัดวางตัวอักษรดิจิทัล

การแสดงผลบนหน้าจอ
โปรแกรมแก้ไขข้อความโปรแกรมประมวลผลคำและ ซอฟต์แวร์จัดพิมพ์เอกสารบนเดสก์ท็อป มีวิธีการแสดงช่องว่างบนหน้าจอที่แตกต่างกัน รวมถึงวิธีการแสดงช่องว่างที่ปลายบรรทัดที่ยาวเกินความกว้างของหน้าจอหรือคอลัมน์ ในบางกรณี ช่องว่างจะแสดงเป็นช่องว่างเปล่าๆ ในขณะที่บางกรณีอาจแสดงด้วยเครื่องหมายวรรคตอนหรือสัญลักษณ์อื่นๆ อักขระต่างๆ มากมาย (อธิบายไว้ด้านล่าง) สามารถใช้สร้างช่องว่างได้ และฟังก์ชันที่ไม่ใช่อักขระ (เช่น การตั้งค่าระยะขอบและแท็บ) ก็สามารถส่งผลต่อช่องว่างได้เช่นกัน
อักขระเว้นวรรค Unicode จำนวนมากถูกสร้างขึ้นเพื่อให้เข้ากันได้กับการพิมพ์ตัวอักษรแบบคลาสสิก[ 27 ]
แม้ว่าการจัดพิมพ์ตัวอักษรดิจิทัลจะมีอัลกอริทึมในการจัดระยะห่างระหว่างตัวอักษรและการจัดเรียงข้อความ แต่ตัวอักษรเว้นวรรคเหล่านั้นก็สามารถนำมาใช้เสริมการจัดรูปแบบอิเล็กทรอนิกส์ได้เมื่อจำเป็น
พื้นที่อเนกประสงค์ที่มีความกว้างปรับเปลี่ยนได้
ใน การเข้ารหัสอักขระคอมพิวเตอร์จะมีช่องว่างทั่วไป มาตรฐาน (อักขระยูนิโค้ด U+0020) ซึ่งความกว้างจะแตกต่างกันไปตามการออกแบบของแบบอักษร ค่าทั่วไปจะอยู่ระหว่าง 1/5 em ถึง 1/3 em (ในการพิมพ์ดิจิทัลemเท่ากับขนาดระบุของแบบอักษร ดังนั้นสำหรับแบบอักษรขนาด 10 พอยต์ ช่องว่างอาจอยู่ระหว่าง 2 ถึง 3.3 พอยต์) แบบอักษรที่ซับซ้อนอาจมีช่องว่างขนาดต่างกันสำหรับตัวหนา ตัวเอียง และตัวพิมพ์เล็ก และบ่อยครั้งที่ผู้จัดพิมพ์จะปรับความกว้างของช่องว่างด้วยตนเองขึ้นอยู่กับขนาดและความโดดเด่นของข้อความ
นอกเหนือจากพื้นที่ใช้งานทั่วไปนี้แล้ว ยังสามารถเข้ารหัสพื้นที่ที่มีความกว้างเฉพาะได้อีกด้วย ดูตารางด้านบนสำหรับรายการทั้งหมด
ช่องว่างผมรอบขีด
ขีดกลางยาวที่ใช้เป็นตัวแบ่งวงเล็บ และขีดกลางสั้นเมื่อใช้เป็นตัวเชื่อมคำ มักจะถูกตั้งค่าให้ต่อเนื่องกับข้อความ[ 28 ]อย่างไรก็ตาม ขีดดังกล่าวสามารถล้อมรอบด้วย ช่องว่างเล็ก (hair space ) U+200A หรือช่องว่างเล็ก (thin space ) U+2009 ได้ ช่องว่างเล็กสามารถเขียนใน HTML ได้โดยใช้การอ้างอิงอักขระตัวเลข หรือ หรือเอนทิตีที่มีชื่อ ช่องว่างเล็กเป็นเอนทิตีที่มีชื่อ และการอ้างอิงตัวเลข หรือ ช่องว่างเหล่านี้บางกว่าช่องว่างปกติมาก (ยกเว้นในฟอนต์แบบ monospaced (ไม่เป็นสัดส่วน) ) โดยเฉพาะอย่างยิ่งช่องว่างเล็กเป็นช่องว่างแนวนอนที่บางที่สุด
| เว้นวรรคปกติด้วยขีดกลางยาว | ซ้าย — ขวา |
|---|---|
| ช่องว่างบางๆ ที่มีขีดกลางยาว | ซ้าย— ขวา |
| เว้นวรรคผมด้วยขีดกลางยาว | ซ้าย — ขวา |
| ไม่มีช่องว่างกับเครื่องหมายขีดกลางยาว (em dash) | ซ้าย—ขวา |
การประยุกต์ใช้คอมพิวเตอร์
ภาษาโปรแกรม
ในไวยากรณ์ของภาษาโปรแกรม ส่วนใหญ่ อักขระเว้นวรรคสามารถใช้เพื่อแยกโทเค็นได้ สำหรับภาษาที่มีรูปแบบอิสระ ตัวประมวลผลโค้ด (เช่น คอมไพเลอร์ ) จะไม่สนใจอักขระเว้นวรรคแม้ว่าไวยากรณ์ของภาษาจะกำหนดให้มีเว้นวรรค แต่บ่อยครั้งที่อักขระเว้นวรรคหลายตัวจะถูกมองว่าเหมือนกับตัวเดียว ในภาษาที่มีกฎเกณฑ์ที่แตกต่างออกไปเว้นวรรค ในการเยื้อง มีความสำคัญทางไวยากรณ์ ใน ภาษา เสียดสีและต่อต้านกระแสหลักที่เรียกว่าWhitespaceอักขระเว้นวรรคเป็นอักขระที่มีความสำคัญเพียงอย่างเดียว และข้อความปกติจะถูกละเลย
การใช้ช่องว่างในโค้ด อย่างเหมาะสม สามารถจัดกลุ่มตรรกะที่เกี่ยวข้องกันและทำให้โค้ดเข้าใจง่ายขึ้น แต่การใช้ช่องว่างมากเกินไป รวมถึงการใช้ช่องว่างที่ท้ายบรรทัดซึ่งไม่มีผลต่อการแสดงผล ถือเป็นสิ่งที่ไม่พึงประสงค์
ภาษาส่วนใหญ่รู้จักเฉพาะอักขระช่องว่างที่มีรหัส ASCII เท่านั้น และไม่อนุญาตรหัส Unicode ส่วนใหญ่หรือทั้งหมดที่ระบุไว้ข้างต้นภาษา Cกำหนดอักขระช่องว่างเป็น "ช่องว่าง, แท็บแนวนอน, ขึ้นบรรทัดใหม่, แท็บแนวตั้ง และฟอร์มฟีด" [ 29 ]โปรโตคอล เครือข่าย HTTPกำหนดให้ใช้ช่องว่างประเภทต่างๆ ในส่วนต่างๆ ของโปรโตคอล โดยกำหนดให้มีอักขระช่องว่างเดี่ยวระหว่างรายการใน บรรทัด สถานะคู่ CR/LF ที่ท้ายบรรทัด และ "ช่องว่างเชิงเส้น" ในค่าส่วนหัว[ 30 ]
การแยกวิเคราะห์บรรทัดคำสั่ง
โดยทั่วไป โปรแกรมแยก วิเคราะห์คำสั่งบรรทัดจะใช้ช่องว่างเป็นตัว คั่น อาร์กิวเมนต์ค่าที่มีช่องว่างอยู่ภายในจะทำให้เกิดปัญหา เนื่องจากจะทำให้ค่านั้นถูกแยกวิเคราะห์เป็นอาร์กิวเมนต์หลายตัว โดยปกติแล้ว โปรแกรมแยกวิเคราะห์จะอนุญาตให้หลีกเลี่ยงการแยกวิเคราะห์อาร์กิวเมนต์แบบปกติโดยการใส่เครื่องหมายอัญประกาศครอบข้อความนั้นไว้
ตัวอย่างเช่น หากผู้ใช้ต้องการดูเนื้อหาของไดเร็กทอรีที่ระบุชื่อfoo barโดยใช้lsคำสั่ง (list) และทำเช่นนั้นโดยป้อนคำสั่งดังนี้:
ls foo bar คำสั่งดังกล่าวจะพยายามแสดงรายการไฟล์หรือไดเร็กทอรีที่มีชื่อว่าfooและ แทน barไวยากรณ์ที่ถูกต้องจะต้องระบุอาร์กิวเมนต์เพียงตัวเดียวโดยใส่เครื่องหมายคำพูดคู่ล้อมรอบ:
ls "foo bar"หรืออีกทางเลือกหนึ่ง พวกเขาสามารถเลือกที่จะไม่ใส่เครื่องหมายอัญประกาศคู่ และใช้ เครื่องหมาย แบ็กสแลช แทน เพื่อเว้น วรรคได้ :
ls foo \ bar ภาษามาร์กอัป
ภาษามาร์กอัปบาง ภาษา เช่นSGMLจะคงช่องว่างไว้ตามที่เขียนไว้
ภาษามาร์กอัปเว็บ เช่นXMLและHTMLจัดการกับอักขระช่องว่างเป็นพิเศษ รวมถึงอักขระช่องว่าง เพื่อความสะดวกของโปรแกรมเมอร์ อักขระช่องว่างหนึ่งตัวหรือมากกว่านั้นที่อ่านโดยตัวประมวลผลการแสดงผลของภาษามาร์กอัปเหล่านั้นจะถูกยุบเหลือ 0 หรือ 1 ช่องว่าง ขึ้นอยู่กับบริบททางความหมาย ตัวอย่างเช่น ช่องว่างสองช่อง (หรือมากกว่า) ในข้อความจะถูกยุบเหลือช่องว่างเดียว และช่องว่างที่ปรากฏอยู่ด้านใดด้านหนึ่งของเครื่องหมาย " =" ที่คั่นชื่อแอตทริบิวต์จากค่าของมันจะไม่มีผลต่อการตีความเอกสาร แท็กปิดขององค์ประกอบสามารถมีช่องว่างต่อท้ายได้ และแท็กองค์ประกอบว่างใน XML สามารถมีช่องว่างก่อนเครื่องหมาย " />" ได้ ในภาษาเหล่านี้ ช่องว่างที่ไม่จำเป็นจะเพิ่มขนาดไฟล์ และอาจทำให้การถ่ายโอนผ่านเครือข่ายช้าลง ในทางกลับกัน ช่องว่างที่ไม่จำเป็นยังสามารถใช้เพื่อระบุโค้ดได้อย่างแนบเนียน ในลักษณะที่คล้ายกับแต่ไม่ชัดเจนเท่ากับวิธีที่ใส่ความคิดเห็นในโค้ด ซึ่งอาจเป็นประโยชน์ในการพิสูจน์การละเมิดลิขสิทธิ์หรือการอ้างสิทธิ์ในลิขสิทธิ์หากโค้ดนั้นถูกคัดลอกและวาง อย่าง โจ่งแจ้ง
การรักษาระยะห่าง
ในค่าแอตทริบิวต์ XML ลำดับของอักขระเว้นวรรคจะถูกถือว่าเป็นช่องว่างเดียวเมื่อตัวแยกวิเคราะห์อ่านเอกสาร[ 31 ]ตัวแยกวิเคราะห์จะไม่เปลี่ยนแปลงเว้นวรรคในเนื้อหาขององค์ประกอบ XML ด้วยวิธีนี้ แต่แอปพลิเคชันที่รับข้อมูลจากตัวแยกวิเคราะห์อาจเลือกที่จะใช้กฎที่คล้ายกันกับเนื้อหาขององค์ประกอบ ผู้เขียนเอกสาร XML สามารถใช้xml:space="preserve"แอตทริบิวต์บนองค์ประกอบเพื่อสั่งให้ตัวแยกวิเคราะห์ไม่สนับสนุนให้แอปพลิเคชันปลายทางเปลี่ยนแปลงเว้นวรรคในเนื้อหาขององค์ประกอบนั้น
ในองค์ประกอบ HTML ส่วนใหญ่ ลำดับของอักขระช่องว่างจะถูกถือว่าเป็นตัวคั่นระหว่างคำ เพียงตัวเดียว ซึ่งอาจปรากฏเป็นอักขระช่องว่างเพียงตัวเดียวเมื่อแสดงผลข้อความในภาษาที่ปกติจะแทรกช่องว่างดังกล่าวระหว่างคำ[ 32 ] ตัวแสดงผล HTML ที่สอดคล้องจะใช้พฤติกรรมช่องว่างตามตัวอักษรกับองค์ประกอบบางอย่าง ได้แก่ องค์ประกอบที่อยู่ภายใน<pre>...</pre>แท็ก และองค์ประกอบที่ ตั้งค่า คุณสมบัติCSSwhite-spaceเป็นpreหรือpre-wrapในองค์ประกอบเหล่านี้ อักขระช่องว่างจะไม่ถูก "ยุบ" ให้เป็นตัวคั่นระหว่างคำ
ใน มาร์กอัป MediaWikiนอกจากแท็ กเสริมแล้ว ยัง <pre>...</pre>มี<poem>...</poem>แท็กเสริมที่ช่วยรักษาช่องว่างไว้ด้วย โดยต้องมี Extension:Poem [ 33 ]
ทั้งใน XML และ HTML อักขระเว้น วรรคที่ไม่เว้นวรรค (non-breaking space)รวมถึงช่องว่าง "ที่ไม่เป็นมาตรฐาน" อื่นๆ จะไม่ถูกนับรวมเป็นช่องว่างที่ยุบได้ (collapsible whitespace)
ชื่อไฟล์
การใช้งานลักษณะนี้คล้ายกับการตั้งชื่อไฟล์หลายคำสำหรับระบบปฏิบัติการและแอปพลิเคชันที่อาจสับสนกับรหัสช่องว่างที่ฝังอยู่ โดยชื่อไฟล์เหล่านั้นจะใช้เครื่องหมายขีดล่าง (_) เป็นตัวคั่นคำแทน เช่น as_in_this_phrase
สัญลักษณ์อีกแบบหนึ่งคือU+2422 ␢ สัญลักษณ์ว่างเปล่า สัญลักษณ์นี้ถูกใช้ในช่วงแรกๆ ของการเขียนโปรแกรมคอมพิวเตอร์เมื่อเขียนลงบนแบบฟอร์มการเข้ารหัส ผู้ปฏิบัติงาน เครื่องเจาะบัตร จะ จดจำสัญลักษณ์นี้ได้ทันทีว่าเป็น "ช่องว่างที่ชัดเจน" [ 16 ] มันถูก ใช้ในBCDIC [ 16 ] EBCDIC [ 16 ]และASCII- 1963 [ 16 ]
ดูเพิ่มเติม
- รถกลับ
- เอ็ม (การพิมพ์)
- เอ็น (การจัดพิมพ์)
- ป้อนแบบฟอร์ม
- รูปแบบการเยื้อง
- สายป้อน
- ขึ้นบรรทัดใหม่
- สไตล์การเขียนโปรแกรม
- สัญลักษณ์สำหรับรหัสมอร์ส
- นิพจน์ปกติ § คลาสอักขระสำหรับคลาสอักขระช่องว่าง
- เว้นวรรค
- เว้นวรรค (เครื่องหมายวรรคตอน)
- ปุ่มแท็บ
- การตัดแต่ง (การเขียนโปรแกรมคอมพิวเตอร์)
- ช่องว่าง (ภาษาโปรแกรม)
- พื้นที่ว่างศูนย์ความกว้าง
ลิงก์ภายนอก
- รายการคุณสมบัติของฐานข้อมูลอักขระยูนิโค้ด
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ อักขระเว้นวรรค
อักขระเว้นวรรค (whitespace character)คือ องค์ประกอบข้อมูลอักขระ ที่ใช้แทนช่องว่างเมื่อข้อความถูก แสดงผลโดยคอมพิวเตอร์
ภาพรวม
อักขระเว้นวรรคโดยทั่วไปจะแทรกช่องว่างแนวนอนที่มีความกว้างประมาณเท่ากับตัวอักษร สำหรับ แบบอักษรที่มี ความกว้างคงที่ ความกว้างจะเท่ากับความกว้างของตัวอักษร และสำหรับ แบบอักษรที่มีความกว้าง แปรผัน ความกว้างจะขึ้นอยู่กับแบบอักษรนั้นๆ...
ยูนิโค้ด
ตารางด้านล่างแสดงรายการอักขระยี่สิบห้าตัวที่กำหนดเป็นอักขระช่องว่าง ("WSpace=Y", "WS") ในฐานข้อมูลอักขระ ยูนิโค้ด [ 1 ] สิบเจ็ดตัวใช้คำจำกัดความของช่องว่างที่สอดคล้องกับอัลกอริทึมสำหรับ การเขียนแบบสองทิศทาง ("Bidirectional Character Type=WS")...
แทนที่รูปภาพ
นอกจากนี้ Unicode ยังมีอักขระที่มองเห็นได้บางตัวที่สามารถใช้แทนอักขระเว้นวรรคต่างๆ ในบริบทที่จำเป็นต้องแสดงสัญลักษณ์ที่มองเห็นได้: