กลับไปหน้าบทความ

อ่าน 7 นาที

อักขระเว้นวรรค

อักขระเว้นวรรค (whitespace character)คือ องค์ประกอบข้อมูลอักขระ ที่ใช้แทนช่องว่างเมื่อข้อความถูก แสดงผลโดยคอมพิวเตอร์

อักขระเว้นวรรค

อักขระเว้นวรรค (whitespace character)คือ องค์ประกอบข้อมูลอักขระ ที่ใช้แทนช่องว่างเมื่อข้อความถูก แสดงผลโดยคอมพิวเตอร์

ตัวอย่างเช่น อักขระ เว้นวรรค ( U+0020 SPACE , ASCII 32) แทนช่องว่าง เช่นตัวแบ่งคำในอักษรตะวันตก  

อักขระที่พิมพ์ได้จะแสดงผลเมื่อถูกแสดงผล แต่ตัวเว้นวรรคจะไม่แสดงผล ตัวเว้นวรรคจะกำหนดเค้าโครงของข้อความในระดับจำกัด โดยขัดจังหวะลำดับการแสดงผลของอักขระที่อยู่ติดกันตามปกติ การแสดงผลของอักขระถัดไปมักจะเลื่อนไปทางขวา (หรือไปทางซ้ายสำหรับตัวเขียนจากขวาไปซ้าย ) หรือไปที่ต้นบรรทัดถัดไป ผลกระทบของตัวเว้นวรรคหลายตัวที่อยู่ติดกันจะสะสมกัน ดังนั้นอักขระที่พิมพ์ได้ตัวถัดไปจะถูกแสดงผลในตำแหน่งที่ขึ้นอยู่กับผลสะสมของตัวเว้นวรรคที่อยู่ก่อนหน้า

ที่มาของคำว่า"ช่องว่าง" (whitespace)มาจากการปฏิบัติทั่วไปในการเขียนข้อความบนกระดาษ สีขาว โดยปกติแล้ว อักขระช่องว่างจะไม่ถูกแสดงเป็นสีขาว มันส่งผลต่อการแสดงผล แต่ตัวมันเองไม่ได้ถูกแสดงผล

ภาพรวม

ความกว้างของอักขระเว้นวรรคUnicode ต่างๆ

อักขระเว้นวรรคโดยทั่วไปจะแทรกช่องว่างแนวนอนที่มีความกว้างประมาณเท่ากับตัวอักษร สำหรับแบบอักษรที่มีความกว้างคงที่ ความกว้างจะเท่ากับความกว้างของตัวอักษร และสำหรับแบบอักษรที่มีความกว้างแปรผัน ความกว้างจะขึ้นอยู่กับแบบอักษรนั้นๆ แบบอักษรบางแบบรองรับอักขระเว้นวรรคหลายตัวที่มีความกว้างแตกต่างกัน

โดยทั่วไป อักขระแท็บจะแทรกช่องว่างแนวนอนซึ่งอิงตามจุดหยุดแท็บซึ่งแตกต่างกันไปตามแต่ละ โปรแกรม

โดยทั่วไปแล้ว ลำดับอักขระขึ้น บรรทัดใหม่จะย้ายตำแหน่งการแสดงผลไปยังจุดเริ่มต้นของบรรทัดถัดไป หากมีอักขระขึ้นบรรทัดใหม่หนึ่งตัวตามหลังข้อความ จะไม่ทำให้เกิดช่องว่าง แต่หากมีลำดับอักขระขึ้นบรรทัดใหม่สองตัวติดกันระหว่างบล็อกข้อความ จะทำให้เกิดบรรทัดว่างระหว่างบล็อกเหล่านั้น ความสูงของบรรทัดว่างจะแตกต่างกันไปตามแอปพลิเคชัน

การใช้ช่องว่างในการจัดวางข้อความถือเป็นธรรมเนียมปฏิบัติ แอปพลิเคชันบางตัวอาจแสดงช่องว่างเหล่านั้นเป็นมาร์กอัปที่มองเห็นได้ เพื่อให้ผู้ใช้สามารถเห็นสิ่งที่ปกติแล้วมองไม่เห็น

โดยทั่วไปผู้ใช้จะพิมพ์เว้นวรรคโดยการกดปุ่ม Enter spacebar, พิมพ์แท็บโดยการกดปุ่ม Tab และพิมพ์ขึ้นบรรทัดใหม่โดยการกดปุ่มEnter Tab ↹↵ Enter

ยูนิโค้ด

ตารางด้านล่างแสดงรายการอักขระยี่สิบห้าตัวที่กำหนดเป็นอักขระช่องว่าง ("WSpace=Y", "WS") ในฐานข้อมูลอักขระยูนิโค้ด[ 1 ]สิบเจ็ดตัวใช้คำจำกัดความของช่องว่างที่สอดคล้องกับอัลกอริทึมสำหรับการเขียนแบบสองทิศทาง ("Bidirectional Character Type=WS") และเรียกว่าอักขระ "Bidi-WS" อักขระที่เหลืออาจใช้ได้เช่นกัน แต่ไม่ใช่ประเภท "Bidi" นี้

หมายเหตุ: ขึ้นอยู่กับเบราว์เซอร์และแบบอักษรที่ใช้ในการดูตารางต่อไปนี้ ช่องว่างบางช่องอาจแสดงผลไม่ถูกต้อง

ชื่อ รหัสจุดกล่องความกว้าง อาจแตกหักได้ ? ในIDNใช่ไหม? สคริปต์ปิดกั้นหมวดหมู่ ทั่วไปหมายเหตุ
ตารางอักขระยู+00099 ใช่เลขที่ ทั่วไปภาษาละตินพื้นฐานอื่นๆการควบคุม HT, แท็บแนวนอน เอนทิตีชื่อ HTML/XML : 	, LaTeX : \tab, การหลีกเลี่ยงอักขระ C :\t
สายป้อนยู+000เอ10 เป็นการขึ้นบรรทัดใหม่หรือไม่ ทั่วไปภาษาละตินพื้นฐานอื่นๆการควบคุม LF, การขึ้นบรรทัดใหม่ เอนทิตีชื่อ HTML/XML: 
, การหลีกเลี่ยงอักขระ C:\n
การจัดตารางบรรทัดยู+000บี11 เป็นการขึ้นบรรทัดใหม่หรือไม่ ทั่วไปภาษาละตินพื้นฐานอื่นๆการควบคุม VT, แท็บแนวตั้ง . C escape:\v
ฟีดฟอร์มยู+000ซี12 เป็นการขึ้นบรรทัดใหม่หรือไม่ ทั่วไปภาษาละตินพื้นฐานอื่นๆการควบคุม FF, ขึ้นฟอร์ม . C escape:\f
การขึ้นบรรทัดใหม่ยู+000D13 เป็นการขึ้นบรรทัดใหม่หรือไม่ ทั่วไปภาษาละตินพื้นฐานอื่นๆการควบคุม CR, การขึ้นบรรทัดใหม่ (Carriage return ) C escape:\r
ช่องว่างยู+002032 ใช่เลขที่ ทั่วไปภาษาละตินพื้นฐานตัวคั่น, ช่องว่าง รูปแบบที่พบมากที่สุด (ช่องว่าง ASCII ปกติ) LaTeX:
บรรทัดถัดไปยู+0085133 เป็นการขึ้นบรรทัดใหม่หรือไม่ ทั่วไปลาติน-1 เสริมอื่นๆการควบคุม NEL, บรรทัดถัดไป . LaTeX:\\
พื้นที่ห้ามหยุดพักยู+00เอ0160  เลขที่เลขที่ ทั่วไปลาติน-1 เสริมตัวคั่น, ช่องว่าง ช่องว่างที่ไม่เว้นวรรค : เหมือนกับ U+0020 แต่ไม่ใช่จุดที่สามารถขึ้นบรรทัดใหม่ได้เอนทิตีชื่อใน HTML/XML:  ,  , LaTeX:~
เครื่องหมายอ็อกแฮมยู+16805760 ใช่เลขที่ อ็อกแฮมอ็อกแฮมตัวคั่น, ช่องว่าง ใช้สำหรับคั่นคำใน อักษร โอแกมโดยปกติจะเป็นเส้นแนวตั้งในข้อความแนวตั้ง หรือเส้นแนวนอนในข้อความแนวนอน แต่ก็อาจเป็นช่องว่างเปล่าในแบบอักษรที่ไม่มีก้านคำได้ ต้องใช้แบบอักษรโอแกม
เอน ควอดยู+20008192 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง ความกว้างหนึ่งen . U+2002 เทียบเท่ากับอักขระนี้ในเชิงมาตรฐาน; U+2002 เป็นที่นิยมมากกว่า
เอ็ม ควอดยู+20018193 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง เรียกอีกอย่างว่า "mutton quad" ความกว้าง 1 em U+2003 เทียบเท่ากับอักขระนี้ตามหลักการ U+2003 เป็นที่นิยมมากกว่า
อวกาศยู+20028194 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง เรียกอีกอย่างว่า "nut" ความกว้างเท่ากับหนึ่งen U+2000 En Quad เทียบเท่ากับอักขระนี้ตามหลักการ แต่ U+2002 เป็นที่นิยมมากกว่าเอนทิตีชื่อใน HTML/XML:  , LaTeX: \enspace(ช่องว่าง en ใน LaTeX เป็นช่องว่างที่ไม่ขึ้นบรรทัดใหม่)
พื้นที่ยู+20038195 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง เรียกอีกอย่างว่า "เนื้อแกะ" ความกว้าง 1 em U+2001 Em Quad เทียบเท่ากับอักขระนี้ตามหลักการ แต่ U+2003 เป็นที่นิยมมากกว่าเอนทิตีชื่อใน HTML/XML:  , LaTeX:\quad
พื้นที่สามต่อหนึ่งยู+20048196 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง เรียกอีกอย่างว่า "ช่องว่างหนา" (thick space) มีความกว้างหนึ่งในสามของหน่วย em ใน HTML/XML ใช้ nameline entity:  , ใน LaTeX ใช้ nameline space: \;(ช่องว่างหนาใน LaTeX เป็นช่องว่างที่ไม่ขึ้นบรรทัดใหม่)
พื้นที่สี่ต่อหนึ่งยู+20058197 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง เรียกอีกอย่างว่า "mid space" มีความกว้างหนึ่งในสี่ของ em เป็น nameent name ใน HTML/XML: 
พื้นที่หกต่อเอ็มยู+20068198 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง ความกว้างหนึ่งในหกของหน่วย em ในงานพิมพ์คอมพิวเตอร์ บางครั้งเทียบเท่ากับ U+2009
พื้นที่รูปภาพยู+20078199 เลขที่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง ช่องว่างสำหรับตัวเลข ในแบบอักษรที่มีตัวเลขแบบคงที่ ช่องว่างนี้จะมีขนาดเท่ากับความกว้างของตัวเลขหนึ่งหลัก(ชื่อเอนทิตีใน HTML/XML:) 
เครื่องหมายวรรคตอน ช่องว่างยู+20088200 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง กว้างเท่ากับเครื่องหมายวรรคตอนแคบในแบบอักษร เช่น ความกว้างล่วงหน้าของจุดหรือจุลภาค[ 2 ] เอนทิตีชื่อ HTML/XML: 
พื้นที่บาง ๆยู+20098201 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง ช่องว่างบาง ; กว้างหนึ่งในห้า (บางครั้งหนึ่งในหก) ของ em แนะนำให้ใช้เป็นตัวคั่นหลักพันสำหรับการวัดที่ใช้หน่วย SIต่างจาก U+2002 ถึง U+2008 ความกว้างอาจถูกปรับในการจัดพิมพ์[ 3 ] เอนทิตีชื่อ HTML/XML:  ,  , LaTeX: \,(ช่องว่างบางของ LaTeX เป็นช่องว่างที่ไม่เว้นวรรค)
พื้นที่ผมยู+200เอ8202 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง บางกว่าช่องว่างบาง ๆ เอนทิตีชื่อ HTML/XML:  , 
ตัวคั่นบรรทัดยู+20288232 เป็นการขึ้นบรรทัดใหม่หรือไม่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, เส้น
ตัวคั่นย่อหน้ายู+20298233 เป็นการขึ้นบรรทัดใหม่หรือไม่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ย่อหน้า
พื้นที่แคบๆ ที่ไม่มีช่องว่างU+202F8239 เลขที่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง ช่องว่างแคบที่ไม่เว้นวรรคมีฟังก์ชันคล้ายกับช่องว่างที่ไม่เว้นวรรค U+00A0 เมื่อใช้กับภาษามองโกล ความกว้างมักจะเป็นหนึ่งในสามของช่องว่างปกติ ในบริบทอื่น ความกว้างของมันบางครั้งอาจคล้ายกับช่องว่างบาง (U+2009) LaTeX:\,
พื้นที่ทางคณิตศาสตร์ขนาดกลางU+205F8287 ใช่เลขที่ ทั่วไปเครื่องหมายวรรคตอนทั่วไปตัวคั่น, ช่องว่าง MMSP ใช้ในสูตรทางคณิตศาสตร์ สี่ในสิบแปดของ em [ 4 ]ในการพิมพ์ทางคณิตศาสตร์ ความกว้างของช่องว่างมักจะกำหนดเป็นจำนวนเต็มทวีคูณของหนึ่งในสิบแปดของ em และ 4/18 em อาจใช้ในหลายสถานการณ์ เช่น ระหว่างaและ+และระหว่าง+และbในนิพจน์a + b [ 5 ] เอน ทิตีที่มีชื่อใน HTML/XML:  , LaTeX: \:(ช่องว่างขนาดกลางของ LaTeX เป็นช่องว่างที่ไม่ขึ้นบรรทัดใหม่)
พื้นที่เชิงอักษรภาพยู+300012288 ใช่เลขที่ ทั่วไปสัญลักษณ์และเครื่องหมายวรรค ตอน CJKตัวคั่น, ช่องว่าง มีความกว้างเท่ากับ ช่อง อักขระ CJK ( เต็มความกว้าง ) ใช้ใน tai tou เป็นต้น
 ชื่อ  รหัสจุดกล่องความกว้าง อาจแตกหักได้ ? ในIDNใช่ไหม? สคริปต์ปิดกั้นหมวดหมู่ ทั่วไปหมายเหตุ
ตัวคั่นสระมองโกลยู+180อี6158 ใช่เลขที่ มองโกลมองโกลรูปแบบ อื่นๆMVS อักขระเว้นวรรคแคบๆ ที่ใช้ในภาษามองโกลเพื่อทำให้อักขระสองตัวสุดท้ายของคำมีรูปร่างที่แตกต่างกัน[ 6 ]ใน Unicode 6.3.0 อักขระนี้ไม่ได้จัดอยู่ในประเภทอักขระเว้นวรรค (เช่น ในหมวด Zs) อีกต่อไป แม้ว่าจะเคยอยู่ในเวอร์ชันก่อนหน้าของมาตรฐานก็ตาม
พื้นที่ความกว้างเป็นศูนย์ยู+200บี8203 ใช่เลขที่ ?เครื่องหมายวรรคตอนทั่วไปรูปแบบ อื่นๆZWSP, ช่องว่างความกว้างศูนย์ใช้เพื่อระบุขอบเขตคำให้กับระบบประมวลผลข้อความเมื่อใช้สคริปต์ที่ไม่ใช้การเว้นวรรคแบบชัดเจน คล้ายกับเครื่องหมายยัติภังค์แบบอ่อนโดยมีความแตกต่างตรงที่เครื่องหมายยัติภังค์แบบอ่อนใช้เพื่อระบุขอบเขตพยางค์ และควรแสดงเครื่องหมายยัติภังค์ที่มองเห็นได้เมื่อมีการขึ้นบรรทัดใหม่ที่เครื่องหมายนั้นเอนทิตีชื่อ HTML/XML : [ 7 ] [ c ]​
ความกว้างเป็นศูนย์ ไม่เชื่อมต่อยู+200C8204 ใช่ขึ้นอยู่กับบริบท[ 12 ]?เครื่องหมายวรรคตอนทั่วไปรูปแบบ อื่นๆZWNJ ( zero-width non-joiner ) คืออักขระที่ไม่เชื่อมต่อกันโดยมีความกว้างเป็นศูนย์ เมื่อวางไว้ระหว่างอักขระสองตัวที่ปกติจะเชื่อมต่อกัน ZWNJ จะทำให้ตัวอักขระเหล่านั้นถูกพิมพ์ออกมาในรูปแบบตัวพิมพ์ใหญ่และตัวพิมพ์เล็กตามลำดับ เป็นเอนทิตีที่มีชื่อใน HTML/XML‌
ตัวเชื่อมต่อความกว้างศูนย์ยู+200ดี8205 ใช่ขึ้นอยู่กับบริบท[ 13 ]?เครื่องหมายวรรคตอนทั่วไปรูปแบบ อื่นๆZWJ ( Zero-Width Joiner ) คือตัวเชื่อมอักขระที่มีความกว้างเป็นศูนย์ เมื่อวางไว้ระหว่างอักขระสองตัวที่ปกติจะไม่เชื่อมต่อกัน ZWJ จะทำให้ตัวอักขระเหล่านั้นถูกพิมพ์ออกมาในรูปแบบที่เชื่อมต่อกัน นอกจากนี้ยังสามารถใช้เพื่อแสดงรูปแบบการเชื่อมต่อแบบแยกเดี่ยวได้ ขึ้นอยู่กับว่าโดยค่าเริ่มต้นคาดหวังให้ใช้ตัวเชื่อมอักขระหรือตัวเชื่อมอักขระแบบใด ZWJ สามารถกระตุ้น (เช่นในอีโมจิและในภาษาสิงหล ) หรือระงับ (เช่นในภาษาเทวนาครี ) การแทนที่ด้วยอักขระตัวเดียว ในขณะที่ยังคงอนุญาตให้ใช้รูปแบบการเชื่อมต่อแบบแยกเดี่ยวได้ (ต่างจาก ZWNJ) เป็นเอนทิตีที่มีชื่อใน HTML/XML:‍
ตัวเชื่อมคำยู+20608288 เลขที่เลขที่ ?เครื่องหมายวรรคตอนทั่วไปรูปแบบ อื่นๆWJ ( Word Joiner ) คือตัวเชื่อมคำ คล้ายกับ U+200B แต่ไม่ใช่จุดที่สามารถแบ่งบรรทัดได้ เป็นเอนทิตีชื่อใน HTML/XML:⁠
ช่องว่างที่ไม่เว้นวรรคที่มีความกว้างเป็นศูนย์ยู+เอฟเอฟ65279 เลขที่เลขที่ ?แบบฟอร์ม การนำเสนอภาษาอาหรับ-Bรูปแบบ อื่นๆช่องว่างที่ไม่เว้นวรรคที่มีความกว้างเป็นศูนย์ใช้เป็นเครื่องหมายลำดับไบต์ เป็นหลัก การใช้งานเพื่อบ่งชี้ว่าไม่เว้นวรรคถูกยกเลิกแล้วใน Unicode 3.2 โปรดดู U+2060 แทน
  1. ^ White_Space เป็นคุณสมบัติ Unicode แบบไบนารี [ 14 ]
  2. ^ "Unicode PropList.txt" . Unicode . 2025-06-30 . เรียกดูเมื่อ2025-09-11 .
  3. ^แม้ว่า​U+200B จะเป็นเอนทิตีที่มีชื่อใน HTML5 เพียงรายการเดียว แต่ชื่อเพิ่มเติมNegativeMediumSpace,NegativeThickSpace,NegativeThinSpaceและNegativeVeryThinSpace(ซึ่งเป็นชื่อที่ใช้ใน Wolfram Languageสำหรับพื้นที่ที่มีการเลื่อนไปข้างหน้าแบบลบ ซึ่งแมปไปยังพื้นที่ใช้งานส่วนตัว ) [ 8 ] [ 9 ] [ 10 ] [ 11 ]ก็ถูกกำหนดโดย HTML5ให้เป็นชื่อแทนของ U+200B เช่นกัน (เช่น​) [ 7 ]

แทนที่รูปภาพ

นอกจากนี้ Unicode ยังมีอักขระที่มองเห็นได้บางตัวที่สามารถใช้แทนอักขระเว้นวรรคต่างๆ ในบริบทที่จำเป็นต้องแสดงสัญลักษณ์ที่มองเห็นได้:

อักขระแสดงช่องว่างของยูนิโค้ด (มองเห็นได้)
รหัสทศนิยมชื่อปิดกั้นแสดง คำอธิบาย
ยู+00บี7183จุดกลางลาติน-1 เสริม ·เครื่องหมายวรรคตอนระบุชื่อเอนทิตี:·
ยู+21เอ18609ลูกศรสองหัวชี้ลงลูกศร สัญลักษณ์ ECMA-17 / ISO 2047สำหรับการป้อนแบบฟอร์ม (การแบ่งหน้า) [ 15 ]
ยู+22618810เหมือนกันกับตัวดำเนินการ ทางคณิตศาสตร์นอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับการขึ้นบรรทัดใหม่[ 15 ]
ยู+237ดี9085กล่องเปิดแบบมีไหล่ข้อมูลทางเทคนิคเบ็ดเตล็ด ใช้เพื่อระบุNBSP
ยู+23ซีอี9166สัญลักษณ์กลับข้อมูลทางเทคนิคเบ็ดเตล็ด สัญลักษณ์สำหรับปุ่ม Enterซึ่งจะขึ้นบรรทัดใหม่
ยู+24099225สัญลักษณ์สำหรับการจัดตารางแนวนอนภาพควบคุม ตัวอักษรที่ใช้แทนแท็บ
ยู+240เอ9226สัญลักษณ์สำหรับการขึ้นบรรทัดใหม่ภาพควบคุม ตัวเลือกทดแทนสำหรับการป้อนสาย
ยู+240บี9227สัญลักษณ์สำหรับการจัดตารางแนวตั้งภาพควบคุม ตัวเลือกทดแทนสำหรับแถบแนวตั้ง (แถบเส้น)
ยู+240C9228สัญลักษณ์สำหรับการป้อนแบบฟอร์มภาพควบคุม ตัวเลือกอื่นแทนการขึ้นหน้าใหม่ (form feed)
ยู+240ดี9229สัญลักษณ์สำหรับการขึ้นบรรทัดใหม่ภาพควบคุม คำที่ใช้แทนการขึ้นบรรทัดใหม่
ยู+24209248สัญลักษณ์แทนอวกาศภาพควบคุม ตัวเลือกทดแทนสำหรับช่องว่าง ASCII
ยู+24229250สัญลักษณ์ว่างเปล่าภาพควบคุม หรือ เรียกอีกอย่างว่า "แทนที่ช่องว่าง" [ 16 ]ใช้ในBCDIC [ 16 ] EBCDIC [ 16 ] ASCII-1963 [ 16 ] [ 17 ]เป็นต้น เป็นสัญลักษณ์แทนตัวคั่นคำ
ยู+24239251เปิดกล่องภาพควบคุม ใช้ใน การเขียนด้วย ลายมือแบบบล็อกอย่างน้อยตั้งแต่ทศวรรษ 1980 เมื่อจำเป็นต้องระบุจำนวนอักขระเว้นวรรคอย่างชัดเจน (เช่น เมื่อเขียนโปรแกรมด้วยปากกาและกระดาษ) ใช้ในตำราเรียน (ตีพิมพ์ในปี 1982, 1984, 1985, 1988 โดย Springer-Verlag) เกี่ยวกับModula-2 [ 18 ] ซึ่ง เป็นภาษาโปรแกรมที่รหัสเว้นวรรคต้องระบุอย่างชัดเจน นอกจากนี้ยังใช้ในแป้นพิมพ์[ n 1 ]ของเครื่องคิดเลขกราฟิก TI-8 x seriesของTexas Instrumentsเอนทิตีที่มีชื่อ:␣
ยู+24249252สัญลักษณ์สำหรับขึ้นบรรทัดใหม่ภาพควบคุม ตัวเลือกทดแทนการขึ้นบรรทัดใหม่
ยู+25บี39651สามเหลี่ยมสีขาวชี้ขึ้นรูปทรงเรขาคณิต นอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับพื้นที่ ASCII [ 15 ]
ยู+2เอ5บี10843ตรรกะ OR ที่มีแกนกลางตัวดำเนินการ ทางคณิตศาสตร์เสริมนอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับแท็บแนวตั้ง (แท็บเส้น) [ 15 ]
ยู+2เอเอ10922เล็กกว่าตัวดำเนินการ ทางคณิตศาสตร์เสริมนอกเหนือจากการใช้งานอื่นๆ แล้ว ยังมีสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับการขึ้นบรรทัดใหม่[ 15 ]
ยู+2เอเอบี10923ใหญ่กว่าตัวดำเนินการ ทางคณิตศาสตร์เสริมนอกเหนือจากการใช้งานอื่นๆ แล้ว ยังใช้เป็นสัญลักษณ์ ECMA-17 / ISO 2047 สำหรับอักขระแท็บ[ 15 ]
ยู+2บี1เอ11034สี่เหลี่ยมจุดไข่ปลาสัญลักษณ์และลูกศร เบ็ดเตล็ด
ยู+303712343สัญลักษณ์ตัวคั่นบรรทัดโทรเลขเชิงอุดมคติสัญลักษณ์และเครื่องหมายวรรค ตอน CJKภาพกราฟิกที่ใช้สำหรับรหัส 9999 ในรหัสโทรเลขของจีนแสดงถึงการขึ้นบรรทัดใหม่
  1. ^เหนือปุ่มเลขศูนย์ "0" หรือเครื่องหมายลบ "(‒)"
พื้นที่ที่แน่นอน
  • Cambridge Z88ให้ "ช่องว่างที่แน่นอน" พิเศษ (รหัสจุด 160 หรือ 0xA0) (เรียกใช้ได้โดยใช้ปุ่มลัด+ [ 19 ] ) ซึ่งแสดงเป็น "..." โดยไดรเวอร์แสดงผลของระบบปฏิบัติการ[ 20 ] [ 21 ]ดังนั้นจึงเรียกอีกอย่างว่า "ช่องว่างจุด" เมื่อใช้ร่วมกับBBC BASIC [ 20 ] [ 21 ]SPACE
  • ภายใต้รหัสจุด 224 (0xE0) คอมพิวเตอร์ยังจัดเตรียมสัญลักษณ์ SPACE พิเศษที่มีความกว้างสามเซลล์อักขระ"SPC"(คล้ายกับ U+2420 ของ Unicode ที่มีความกว้างเซลล์เดียว) [ 20 ] [ 21 ]

ช่องว่างที่ไม่ใช่ช่องว่าง

  • บล็อก Unicode รูปแบบอักษรเบรลล์ประกอบด้วยU+2800BRAILLE PATTERN BLANKซึ่งเป็น รูปแบบ อักษรเบรลล์ที่ไม่มีจุดนูน บางแบบอักษรแสดงอักขระนี้เป็นช่องว่างที่มีความกว้างคงที่ อย่างไรก็ตาม มาตรฐาน Unicode ระบุไว้อย่างชัดเจนว่าอักขระนี้ไม่ทำหน้าที่เป็นช่องว่าง[ 22 ]
  • ระบบยูนิโคดครอบคลุมอักษรเกาหลีหลายจุดรหัสที่แสดงถึงการไม่มีตัวอักษรเขียน ดังนั้นจึงไม่แสดงสัญลักษณ์ใดๆ:
    • Unicode มี อักขระ Hangul Filler อยู่ ใน บล็อก Hangul Compatibility Jamo ( U+3164HANGUL FILLER ) ซึ่งจัดเป็นอักขระประเภทตัวอักษร แต่แสดงผลเป็นช่องว่าง เหมือนกับบล็อก Hangul ที่ไม่มี jamo มีการใช้ใน ลำดับการรวม Hangul KS X 1001เพื่อแนะนำหรือระบุการไม่มีตัวอักษรในตำแหน่งนั้น แต่ไม่ได้ใช้ในระบบ jamo การรวมของ Unicode [ 23 ]
    • ระบบ jamo ของ Unicode ใช้ตัวอักษร Hangul Choseong Filler และ Hangul Jungseong Filler ที่คล้ายกันเพื่อแสดงถึงการไม่มีตัวอักษรในตำแหน่งเริ่มต้นหรือตำแหน่งกลางภายในบล็อกพยางค์ ซึ่งรวมอยู่ในบล็อก Hangul Jamo ( U+115FHANGUL CHOSEONG FILLER , U+1160HANGUL JUNGSEONG FILLER ) [ 24 ]
    • นอกจากนี้ ยัง มี Halfwidth Hangul Fillerรวมอยู่ในHalfwidth และ Fullwidth Forms ( U+FFA0HALFWIDTH HANGUL FILLER ) ซึ่งใช้เมื่อทำการแมปจากการเข้ารหัสที่มีอักขระจากทั้งJohab (หรือWansung ) และN-byte Hangul (หรือEBCDICที่เทียบเท่า) เช่น IBM-933 ซึ่งมีทั้ง Johab และ EBCDIC fillers [ 25 ] [ 26 ]

พื้นที่ว่างและการจัดวางตัวอักษรดิจิทัล

คู่มือการจัดรูปแบบของชิคาโก (Chicago Manual of Style)มีกฎเกณฑ์เกี่ยวกับการใช้ช่องว่างขนาดต่างๆ

การแสดงผลบนหน้าจอ

โปรแกรมแก้ไขข้อความโปรแกรมประมวลผลคำและ ซอฟต์แวร์จัดพิมพ์เอกสารบนเดสก์ท็อป มีวิธีการแสดงช่องว่างบนหน้าจอที่แตกต่างกัน รวมถึงวิธีการแสดงช่องว่างที่ปลายบรรทัดที่ยาวเกินความกว้างของหน้าจอหรือคอลัมน์ ในบางกรณี ช่องว่างจะแสดงเป็นช่องว่างเปล่าๆ ในขณะที่บางกรณีอาจแสดงด้วยเครื่องหมายวรรคตอนหรือสัญลักษณ์อื่นๆ อักขระต่างๆ มากมาย (อธิบายไว้ด้านล่าง) สามารถใช้สร้างช่องว่างได้ และฟังก์ชันที่ไม่ใช่อักขระ (เช่น การตั้งค่าระยะขอบและแท็บ) ก็สามารถส่งผลต่อช่องว่างได้เช่นกัน

อักขระเว้นวรรค Unicode จำนวนมากถูกสร้างขึ้นเพื่อให้เข้ากันได้กับการพิมพ์ตัวอักษรแบบคลาสสิก[ 27 ]

แม้ว่าการจัดพิมพ์ตัวอักษรดิจิทัลจะมีอัลกอริทึมในการจัดระยะห่างระหว่างตัวอักษรและการจัดเรียงข้อความ แต่ตัวอักษรเว้นวรรคเหล่านั้นก็สามารถนำมาใช้เสริมการจัดรูปแบบอิเล็กทรอนิกส์ได้เมื่อจำเป็น

พื้นที่อเนกประสงค์ที่มีความกว้างปรับเปลี่ยนได้

ใน การเข้ารหัสอักขระคอมพิวเตอร์จะมีช่องว่างทั่วไป มาตรฐาน (อักขระยูนิโค้ด U+0020) ซึ่งความกว้างจะแตกต่างกันไปตามการออกแบบของแบบอักษร ค่าทั่วไปจะอยู่ระหว่าง 1/5 em ถึง 1/3 em (ในการพิมพ์ดิจิทัลemเท่ากับขนาดระบุของแบบอักษร ดังนั้นสำหรับแบบอักษรขนาด 10 พอยต์ ช่องว่างอาจอยู่ระหว่าง 2 ถึง 3.3 พอยต์) แบบอักษรที่ซับซ้อนอาจมีช่องว่างขนาดต่างกันสำหรับตัวหนา ตัวเอียง และตัวพิมพ์เล็ก และบ่อยครั้งที่ผู้จัดพิมพ์จะปรับความกว้างของช่องว่างด้วยตนเองขึ้นอยู่กับขนาดและความโดดเด่นของข้อความ

นอกเหนือจากพื้นที่ใช้งานทั่วไปนี้แล้ว ยังสามารถเข้ารหัสพื้นที่ที่มีความกว้างเฉพาะได้อีกด้วย ดูตารางด้านบนสำหรับรายการทั้งหมด

ช่องว่างผมรอบขีด

ขีดกลางยาวที่ใช้เป็นตัวแบ่งวงเล็บ และขีดกลางสั้นเมื่อใช้เป็นตัวเชื่อมคำ มักจะถูกตั้งค่าให้ต่อเนื่องกับข้อความ[ 28 ]อย่างไรก็ตาม ขีดดังกล่าวสามารถล้อมรอบด้วย ช่องว่างเล็ก (hair space ) U+200A หรือช่องว่างเล็ก (thin space ) U+2009 ได้ ช่องว่างเล็กสามารถเขียนใน HTML ได้โดยใช้การอ้างอิงอักขระตัวเลข หรือ หรือเอนทิตีที่มีชื่อ ช่องว่างเล็กเป็นเอนทิตีที่มีชื่อ และการอ้างอิงตัวเลข หรือ ช่องว่างเหล่านี้บางกว่าช่องว่างปกติมาก (ยกเว้นในฟอนต์แบบ monospaced (ไม่เป็นสัดส่วน) ) โดยเฉพาะอย่างยิ่งช่องว่างเล็กเป็นช่องว่างแนวนอนที่บางที่สุด

ระยะห่างปกติ เทียบกับ เส้นผม และ ระยะห่างบางๆ (ตามที่แสดงผลโดยเบราว์เซอร์ของคุณ)
เว้นวรรคปกติด้วยขีดกลางยาว ซ้าย — ขวา
ช่องว่างบางๆ ที่มีขีดกลางยาว ซ้ายขวา
เว้นวรรคผมด้วยขีดกลางยาว ซ้าย — ขวา
ไม่มีช่องว่างกับเครื่องหมายขีดกลางยาว (em dash) ซ้าย—ขวา

การประยุกต์ใช้คอมพิวเตอร์

ภาษาโปรแกรม

ในไวยากรณ์ของภาษาโปรแกรม ส่วนใหญ่ อักขระเว้นวรรคสามารถใช้เพื่อแยกโทเค็นได้ สำหรับภาษาที่มีรูปแบบอิสระ ตัวประมวลผลโค้ด (เช่น คอมไพเลอร์ ) จะไม่สนใจอักขระเว้นวรรคแม้ว่าไวยากรณ์ของภาษาจะกำหนดให้มีเว้นวรรค แต่บ่อยครั้งที่อักขระเว้นวรรคหลายตัวจะถูกมองว่าเหมือนกับตัวเดียว ในภาษาที่มีกฎเกณฑ์ที่แตกต่างออกไปเว้นวรรค ในการเยื้อง มีความสำคัญทางไวยากรณ์ ใน ภาษา เสียดสีและต่อต้านกระแสหลักที่เรียกว่าWhitespaceอักขระเว้นวรรคเป็นอักขระที่มีความสำคัญเพียงอย่างเดียว และข้อความปกติจะถูกละเลย

การใช้ช่องว่างในโค้ด อย่างเหมาะสม สามารถจัดกลุ่มตรรกะที่เกี่ยวข้องกันและทำให้โค้ดเข้าใจง่ายขึ้น แต่การใช้ช่องว่างมากเกินไป รวมถึงการใช้ช่องว่างที่ท้ายบรรทัดซึ่งไม่มีผลต่อการแสดงผล ถือเป็นสิ่งที่ไม่พึงประสงค์

ภาษาส่วนใหญ่รู้จักเฉพาะอักขระช่องว่างที่มีรหัส ASCII เท่านั้น และไม่อนุญาตรหัส Unicode ส่วนใหญ่หรือทั้งหมดที่ระบุไว้ข้างต้นภาษา Cกำหนดอักขระช่องว่างเป็น "ช่องว่าง, แท็บแนวนอน, ขึ้นบรรทัดใหม่, แท็บแนวตั้ง และฟอร์มฟีด" [ 29 ]โปรโตคอล เครือข่าย HTTPกำหนดให้ใช้ช่องว่างประเภทต่างๆ ในส่วนต่างๆ ของโปรโตคอล โดยกำหนดให้มีอักขระช่องว่างเดี่ยวระหว่างรายการใน บรรทัด สถานะคู่ CR/LF ที่ท้ายบรรทัด และ "ช่องว่างเชิงเส้น" ในค่าส่วนหัว[ 30 ]

การแยกวิเคราะห์บรรทัดคำสั่ง

โดยทั่วไป โปรแกรมแยก วิเคราะห์คำสั่งบรรทัดจะใช้ช่องว่างเป็นตัว คั่น อาร์กิวเมนต์ค่าที่มีช่องว่างอยู่ภายในจะทำให้เกิดปัญหา เนื่องจากจะทำให้ค่านั้นถูกแยกวิเคราะห์เป็นอาร์กิวเมนต์หลายตัว โดยปกติแล้ว โปรแกรมแยกวิเคราะห์จะอนุญาตให้หลีกเลี่ยงการแยกวิเคราะห์อาร์กิวเมนต์แบบปกติโดยการใส่เครื่องหมายอัญประกาศครอบข้อความนั้นไว้

ตัวอย่างเช่น หากผู้ใช้ต้องการดูเนื้อหาของไดเร็กทอรีที่ระบุชื่อfoo barโดยใช้lsคำสั่ง (list) และทำเช่นนั้นโดยป้อนคำสั่งดังนี้:

ls foo bar 

คำสั่งดังกล่าวจะพยายามแสดงรายการไฟล์หรือไดเร็กทอรีที่มีชื่อว่าfooและ แทน barไวยากรณ์ที่ถูกต้องจะต้องระบุอาร์กิวเมนต์เพียงตัวเดียวโดยใส่เครื่องหมายคำพูดคู่ล้อมรอบ:

ls "foo bar"

หรืออีกทางเลือกหนึ่ง พวกเขาสามารถเลือกที่จะไม่ใส่เครื่องหมายอัญประกาศคู่ และใช้ เครื่องหมาย แบ็กสแลช แทน เพื่อเว้น วรรคได้ :

ls foo \ bar 

ภาษามาร์กอัป

ภาษามาร์กอัปบาง ภาษา เช่นSGMLจะคงช่องว่างไว้ตามที่เขียนไว้

ภาษามาร์กอัปเว็บ เช่นXMLและHTMLจัดการกับอักขระช่องว่างเป็นพิเศษ รวมถึงอักขระช่องว่าง เพื่อความสะดวกของโปรแกรมเมอร์ อักขระช่องว่างหนึ่งตัวหรือมากกว่านั้นที่อ่านโดยตัวประมวลผลการแสดงผลของภาษามาร์กอัปเหล่านั้นจะถูกยุบเหลือ 0 หรือ 1 ช่องว่าง ขึ้นอยู่กับบริบททางความหมาย ตัวอย่างเช่น ช่องว่างสองช่อง (หรือมากกว่า) ในข้อความจะถูกยุบเหลือช่องว่างเดียว และช่องว่างที่ปรากฏอยู่ด้านใดด้านหนึ่งของเครื่องหมาย " =" ที่คั่นชื่อแอตทริบิวต์จากค่าของมันจะไม่มีผลต่อการตีความเอกสาร แท็กปิดขององค์ประกอบสามารถมีช่องว่างต่อท้ายได้ และแท็กองค์ประกอบว่างใน XML สามารถมีช่องว่างก่อนเครื่องหมาย " />" ได้ ในภาษาเหล่านี้ ช่องว่างที่ไม่จำเป็นจะเพิ่มขนาดไฟล์ และอาจทำให้การถ่ายโอนผ่านเครือข่ายช้าลง ในทางกลับกัน ช่องว่างที่ไม่จำเป็นยังสามารถใช้เพื่อระบุโค้ดได้อย่างแนบเนียน ในลักษณะที่คล้ายกับแต่ไม่ชัดเจนเท่ากับวิธีที่ใส่ความคิดเห็นในโค้ด ซึ่งอาจเป็นประโยชน์ในการพิสูจน์การละเมิดลิขสิทธิ์หรือการอ้างสิทธิ์ในลิขสิทธิ์หากโค้ดนั้นถูกคัดลอกและวาง อย่าง โจ่งแจ้ง

การรักษาระยะห่าง

ในค่าแอตทริบิวต์ XML ลำดับของอักขระเว้นวรรคจะถูกถือว่าเป็นช่องว่างเดียวเมื่อตัวแยกวิเคราะห์อ่านเอกสาร[ 31 ]ตัวแยกวิเคราะห์จะไม่เปลี่ยนแปลงเว้นวรรคในเนื้อหาขององค์ประกอบ XML ด้วยวิธีนี้ แต่แอปพลิเคชันที่รับข้อมูลจากตัวแยกวิเคราะห์อาจเลือกที่จะใช้กฎที่คล้ายกันกับเนื้อหาขององค์ประกอบ ผู้เขียนเอกสาร XML สามารถใช้xml:space="preserve"แอตทริบิวต์บนองค์ประกอบเพื่อสั่งให้ตัวแยกวิเคราะห์ไม่สนับสนุนให้แอปพลิเคชันปลายทางเปลี่ยนแปลงเว้นวรรคในเนื้อหาขององค์ประกอบนั้น

ในองค์ประกอบ HTML ส่วนใหญ่ ลำดับของอักขระช่องว่างจะถูกถือว่าเป็นตัวคั่นระหว่างคำ เพียงตัวเดียว ซึ่งอาจปรากฏเป็นอักขระช่องว่างเพียงตัวเดียวเมื่อแสดงผลข้อความในภาษาที่ปกติจะแทรกช่องว่างดังกล่าวระหว่างคำ[ 32 ] ตัวแสดงผล HTML ที่สอดคล้องจะใช้พฤติกรรมช่องว่างตามตัวอักษรกับองค์ประกอบบางอย่าง ได้แก่ องค์ประกอบที่อยู่ภายใน<pre>...</pre>แท็ก และองค์ประกอบที่ ตั้งค่า คุณสมบัติCSSwhite-spaceเป็นpreหรือpre-wrapในองค์ประกอบเหล่านี้ อักขระช่องว่างจะไม่ถูก "ยุบ" ให้เป็นตัวคั่นระหว่างคำ

ใน มาร์กอัป MediaWikiนอกจากแท็ กเสริมแล้ว ยัง <pre>...</pre>มี<poem>...</poem>แท็กเสริมที่ช่วยรักษาช่องว่างไว้ด้วย โดยต้องมี Extension:Poem [ 33 ]

ทั้งใน XML และ HTML อักขระเว้น วรรคที่ไม่เว้นวรรค (non-breaking space)รวมถึงช่องว่าง "ที่ไม่เป็นมาตรฐาน" อื่นๆ จะไม่ถูกนับรวมเป็นช่องว่างที่ยุบได้ (collapsible whitespace)

ชื่อไฟล์

การใช้งานลักษณะนี้คล้ายกับการตั้งชื่อไฟล์หลายคำสำหรับระบบปฏิบัติการและแอปพลิเคชันที่อาจสับสนกับรหัสช่องว่างที่ฝังอยู่ โดยชื่อไฟล์เหล่านั้นจะใช้เครื่องหมายขีดล่าง (_) เป็นตัวคั่นคำแทน เช่น as_in_this_phrase

สัญลักษณ์อีกแบบหนึ่งคือU+2422สัญลักษณ์ว่างเปล่า สัญลักษณ์นี้ถูกใช้ในช่วงแรกๆ ของการเขียนโปรแกรมคอมพิวเตอร์เมื่อเขียนลงบนแบบฟอร์มการเข้ารหัส ผู้ปฏิบัติงาน เครื่องเจาะบัตร จะ จดจำสัญลักษณ์นี้ได้ทันทีว่าเป็น "ช่องว่างที่ชัดเจน" [ 16 ] มันถูก ใช้ในBCDIC [ 16 ] EBCDIC [ 16 ]และASCII- 1963 [ 16 ]

ดูเพิ่มเติม

  • รายการคุณสมบัติของฐานข้อมูลอักขระยูนิโค้ด
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Whitespace_character&oldid=1354676006#Visible_space "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ อักขระเว้นวรรค

อักขระเว้นวรรค (whitespace character)คือ องค์ประกอบข้อมูลอักขระ ที่ใช้แทนช่องว่างเมื่อข้อความถูก แสดงผลโดยคอมพิวเตอร์

ภาพรวม

อักขระเว้นวรรคโดยทั่วไปจะแทรกช่องว่างแนวนอนที่มีความกว้างประมาณเท่ากับตัวอักษร สำหรับ แบบอักษรที่มี ความกว้างคงที่ ความกว้างจะเท่ากับความกว้างของตัวอักษร และสำหรับ แบบอักษรที่มีความกว้าง แปรผัน ความกว้างจะขึ้นอยู่กับแบบอักษรนั้นๆ...

ยูนิโค้ด

ตารางด้านล่างแสดงรายการอักขระยี่สิบห้าตัวที่กำหนดเป็นอักขระช่องว่าง ("WSpace=Y", "WS") ในฐานข้อมูลอักขระ ยูนิโค้ด [ 1 ] สิบเจ็ดตัวใช้คำจำกัดความของช่องว่างที่สอดคล้องกับอัลกอริทึมสำหรับ การเขียนแบบสองทิศทาง ("Bidirectional Character Type=WS")...

แทนที่รูปภาพ

นอกจากนี้ Unicode ยังมีอักขระที่มองเห็นได้บางตัวที่สามารถใช้แทนอักขระเว้นวรรคต่างๆ ในบริบทที่จำเป็นต้องแสดงสัญลักษณ์ที่มองเห็นได้: