อ่าน 3 นาที
เครื่องหมายยัติภังค์อ่อน
ในด้านการคำนวณและการจัดพิมพ์ เครื่องหมาย ยัติภังค์ (soft hyphen ) หรือ เครื่องหมาย ยัติภังค์ตามดุลยพินิจ ( syllable hyphen ) เป็นรหัสอักขระที่สงวนไว้ใน ชุดอักขระ บางชุด...
เครื่องหมายยัติภังค์อ่อน

ในด้านการคำนวณและการจัดพิมพ์ เครื่องหมายยัติภังค์(soft hyphen ) หรือเครื่องหมายยัติภังค์ตามดุลยพินิจ( syllable hyphen )เป็นรหัสอักขระที่สงวนไว้ในชุดอักขระ บางชุด เพื่อใช้ในการแบ่งคำข้ามบรรทัด โดยการแทรกเครื่องหมายยัติภังค์ ที่มองเห็นได้ หากคำนั้นอยู่ท้ายบรรทัด แต่จะมองไม่เห็นภายในบรรทัด
มีวิธีทางเลือกสองวิธีในการใช้อักขระยัติภังค์อ่อนเพื่อจุดประสงค์นี้ โดยขึ้นอยู่กับว่าข้อความที่เข้ารหัสจะถูกแบ่งออกเป็นบรรทัดโดยผู้รับ หรือได้รับการจัดรูปแบบไว้ล่วงหน้าโดยผู้ส่งต้นทางแล้ว[ 1 ] [ 2 ] [ 3 ]
ข้อความนี้จะต้องได้รับการจัดรูปแบบโดยผู้รับ
การใช้ตัวอักษร SHY ในข้อความที่จะถูกแบ่งขึ้นบรรทัดใหม่โดยผู้รับนั้นเป็นบริบทการใช้งานที่พิจารณาโดย ข้อกำหนด HTMLและUnicode หลังปี 1999 รวมถึงรูปแบบไฟล์ประมวลผลคำบางรูปแบบ ในบริบทนี้ เครื่องหมายยัติภังค์แบบอ่อนอาจเรียกว่าเครื่องหมายยัติภังค์แบบเลือกได้หรือเครื่องหมายยัติภังค์เสริมมันทำหน้าที่เป็นเครื่องหมายที่มองไม่เห็นซึ่งใช้เพื่อระบุตำแหน่งในข้อความที่อนุญาตให้มีการแบ่งด้วยเครื่องหมายยัติภังค์โดยไม่ต้องบังคับให้ขึ้นบรรทัดใหม่ในตำแหน่งที่ไม่สะดวกหากมีการจัดเรียงข้อความใหม่ มันจะปรากฏให้เห็นก็ต่อเมื่อมีการตัดคำที่ท้ายบรรทัด[ 4 ]ความหมายของ Unicode และการใช้งาน HTML ของเครื่องหมายยัติภังค์แบบอ่อนนั้นคล้ายคลึงกับช่องว่างความกว้างศูนย์ ของ Unicode ในหลายๆ ด้าน ยกเว้นว่าเครื่องหมายยัติภังค์แบบอ่อนจะรักษาระยะห่างระหว่างตัวอักษรทั้งสองด้านเมื่อมองไม่เห็น ในทางกลับกัน ช่องว่างความกว้างศูนย์จะไม่เป็นเช่นนั้น เนื่องจากถือว่าเป็นตัวอักษรที่มองเห็นได้แม้ว่าจะไม่ได้แสดงผล ดังนั้นจึงมีเมตริกระยะห่างของตัวเอง
เพื่อแสดงผลของเครื่องหมายยัติภังค์แบบอ่อนใน HTML คำต่างๆ ในข้อความต่อไปนี้ (จากบทกวีSpring and FallโดยGerard Manley Hopkins ) ได้ถูกคั่นด้วยเครื่องหมายยัติภังค์แบบอ่อน:
มาร์กาเร็ต เธอโศกเศร้ากับโกลเดนโกรฟไหม ใบไม้ร่วงหล่นเหมือนสิ่งต่างๆ ของมนุษย์ เธอห่วงใยด้วยความคิดสดใหม่ของเธอได้ไหม อ่า เมื่อหัวใจแก่ขึ้น มันก็จะมาถึงภาพเช่นนี้ หนาวเหน็บลงเรื่อยๆ หรือถอนหายใจ แม้ว่าโลกแห่งวานวูด ใบไม้บดโกหก และถึงกระนั้นเธอก็จะร้องไห้และรู้ว่าทำไม ตอนนี้ไม่สำคัญ เด็ก ชื่อแห่งความโศกเศร้า บ่อน้ำพุเหมือนกัน หรือปากไม่มี หรือจิตใจแสดงออกถึงสิ่งที่หัวใจได้ยินเกี่ยวกับผี เดาว่ามันคือความหายนะที่มนุษย์เกิดมาเพื่อ มันคือมาร์กาเร็ตที่เธอโศกเศร้า
ใน เบราว์เซอร์ HTMLที่รองรับเครื่องหมายยัติภังค์แบบอ่อน การปรับขนาดหน้าต่างจะแบ่งข้อความข้างต้นเฉพาะที่ขอบเขตคำ และแทรกเครื่องหมายยัติภังค์ที่ท้ายบรรทัดแต่ละบรรทัด
ข้อความที่จัดรูปแบบไว้ล่วงหน้าโดยผู้จัดทำ
อักขระ SHY ยังใช้ในข้อความที่ย่อหน้าถูกแบ่งออกเป็นบรรทัดแล้ว เช่น ไฟล์ ข้อความธรรมดา บาง ไฟล์ ข้อความที่ส่งไปยังโปรแกรมจำลองเทอร์มินัลแบบVT100หรือเครื่องพิมพ์ หรือหน้าที่แสดงในภาษาอธิบายหน้านี่คือบริบทการใช้งานที่ มาตรฐาน EBCDICและISO 8859-1 พิจารณาไว้ แต่ เดิม และนำไปใช้ในโปรแกรมจำลองเทอร์มินัลVT100 หลายตัว [ 1 ] [ 2 ]
ในที่นี้ SHY คือเครื่องหมายยัติภังค์ที่มองเห็นได้ ซึ่งโดยปกติแล้วจะแยกไม่ออกจากเครื่องหมายยัติภังค์ปกติ แต่ถูกแทรกเข้ามาเพื่อจุดประสงค์ในการขึ้นบรรทัดใหม่เท่านั้น จุดประสงค์ของเครื่องหมายยัติภังค์แบบอ่อนในที่นี้คือเพื่อแยกความแตกต่างจากเครื่องหมายยัติภังค์ปกติที่อาจเป็นส่วนหนึ่งของการสะกดคำเดิม ความแตกต่างนี้ช่วยในการนำข้อความที่จัดรูปแบบแล้วกลับมาใช้ใหม่ เมื่อต้องลบการขึ้นบรรทัดใหม่และเครื่องหมายยัติภังค์แบบอ่อนที่แทรกเข้ามาในระหว่างการจัดรูปแบบคำ เพื่อแปลงข้อความกลับไปเป็นรูปแบบที่ไม่ได้จัดรูปแบบ ตัวอย่างเช่น ฟังก์ชันคัดลอกและวางของโปรแกรมจำลองเทอร์มินัลสามารถเสนอให้แทนที่การขึ้นบรรทัดใหม่ด้วยอักขระเว้นวรรคและลบเครื่องหมายยัติภังค์แบบอ่อน รวมถึงอักขระเว้นวรรคที่ตามมา ทันที
ตัวอย่างโปรแกรมที่สร้างเครื่องหมายยัติภังค์แบบอ่อนด้วยเหตุผลนี้คือโปรแกรม จัดรูปแบบข้อความ groffซึ่งใช้ในระบบ Unix/Linux หลายระบบเพื่อแสดงหน้าคู่มือ (man page )
การเข้ารหัสและคำจำกัดความ
อักขระขีดกลางอ่อน ( SHY ) ในชุดอักขระที่เข้ารหัส เรียงตามลำดับเวลาโดยประมาณ:
- EBCDICวางอักขระ SHY (ซึ่งรู้จักกันในชื่อ "เครื่องหมายยัติภังค์") ไว้ที่ตำแหน่ง 202 ( เลขฐานสิบหก 0xCA ) [ 1 ] [ 5 ] IBM นิยามวัตถุประสงค์ของมันคือ "เครื่องหมายยัติภังค์ที่ใช้แบ่งคำที่ท้ายบรรทัด [ซึ่ง] อาจถูกลบออกเมื่อโปรแกรมปรับบรรทัด" [ 6 ]
- มาตรฐานเยอรมันDIN 31626 กำหนดชุดรหัสควบคุม C1โดยกำหนด 0x8D เป็น "การควบคุมการแบ่งพยางค์แบบเลือกได้ (OSC)" ซึ่งเป็น "อักขระควบคุมการพิมพ์" สำหรับใช้ในการทำเครื่องหมายขอบเขตพยางค์ในคำยาว ชุดควบคุม C1 นี้ได้รับการจดทะเบียนในปี 1979 [ 7 ] (หมายเหตุ: นี่ไม่ใช่รหัสควบคุม C1 คำสั่งระบบปฏิบัติการ (OSC) ของISO/IEC 6429 เหมือนกัน )
- มาตรฐาน ISO 8859-1 :1986 (ละติน 1) ได้รับสืบทอดเครื่องหมายยัติภังค์ (SHY) มาจาก EBCDIC แต่เรียกว่า "soft hyphen" วางไว้ที่ตำแหน่ง 0xAD (เลขฐานสิบหก) และระบุวัตถุประสงค์ว่า "ใช้เมื่อมีการขึ้นบรรทัดใหม่ภายในคำ" มาตรฐาน ISO 8859ส่วนอื่นๆ ก็วางไว้ที่ตำแหน่งเดียวกัน ยกเว้นISO 8859-11 (ละติน/ไทย) ที่ไม่มีเครื่องหมายนี้
- ชุดรหัสอักขระ IBM 850 ( ชุดอักขระ MS-DOSที่ครอบคลุมอักขระ ISO 8859-1 ทั้งหมด) กำหนดให้ตำแหน่งที่ 240 = 0xF0
- ชุด อักขระ "ตัวเลขและกราฟิกพิเศษ" (isonum) ของSGML (ISO 8879:1986) รวม
­ถึงเครื่องหมายยัติภังค์แบบอ่อน (soft hyphen) สำหรับมาตรฐาน ISO 8859-1 ด้วย - Unicode 1.0 (1991) และ ISO 10646 (1993) ใช้รหัสตำแหน่ง 256 ตำแหน่งแรกจาก ISO 8859-1 ส่งผลให้ SHY อยู่ที่จุดรหัส Unicode U+00AD
- HTML 2 (1995) ได้นำเอาอักขระ "" จาก SGML มาใช้ แต่ได้ระบุไว้อย่างชัดเจนว่าไม่ควรใช้
- HTML 4 (1999) ได้กำหนดนิยามใหม่ของวัตถุประสงค์ของอักขระนี้ โดยกำหนดให้เป็นเครื่องหมายสำหรับการแบ่งคำด้วยเครื่องหมายยัติภังค์ ซึ่งจะปรากฏเป็นเครื่องหมายยัติภังค์ที่ท้ายบรรทัดหลังจากจัดรูปแบบแล้วเท่านั้น
- Unicode 4.0 (2002) ได้เปลี่ยนหมวดหมู่ของอักขระ SHY จากเดิม "Pd" (เครื่องหมายวรรคตอน, ขีดกลาง) เป็น "Cf" (อื่นๆ, รูปแบบ) เพื่อให้การตีความอักขระดังกล่าวสอดคล้องกับ HTML 4
คำสั่งอื่นๆ สำหรับทำเครื่องหมายโอกาสในการแบ่งคำด้วยเครื่องหมายยัติภังค์ในภาษาการจัดรูปแบบข้อความ (คล้ายกับการตีความ SHY ใน HTML 4 และ Unicode 4.0):
ปัญหาด้านความปลอดภัย
เครื่องหมายยัติภังค์แบบอ่อน เช่นเดียวกับอักขระที่มองไม่เห็นอื่นๆ ถูกนำมาใช้เพื่อปกปิดโดเมนหรือURL ที่เป็นอันตราย ในสแปมอีเมล[ 10 ] [ 11 ]
นอกจากนี้ยังมีการใช้เครื่องหมายยัติภังค์ในอีเมลเพื่อพยายามหลอกระบบป้องกันสแปม ตัวอย่างเช่น วลี "ฉันต้องการความช่วยเหลือจากคุณอย่างรอบคอบ" มีเครื่องหมายยัติภังค์แบบอ่อนในคำว่า assistance ซึ่งอาจทำให้ระบบอีเมลตรวจไม่พบวลีนี้ในเนื้อหาอีเมล
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เครื่องหมายยัติภังค์อ่อน
ในด้านการคำนวณและการจัดพิมพ์ เครื่องหมาย ยัติภังค์ (soft hyphen ) หรือ เครื่องหมาย ยัติภังค์ตามดุลยพินิจ ( syllable hyphen ) เป็นรหัสอักขระที่สงวนไว้ใน ชุดอักขระ บางชุด...
ข้อความนี้จะต้องได้รับการจัดรูปแบบโดยผู้รับ
การใช้ตัวอักษร SHY ในข้อความที่จะถูกแบ่งขึ้นบรรทัดใหม่โดยผู้รับนั้นเป็นบริบทการใช้งานที่พิจารณาโดย ข้อกำหนด HTML และ Unicode หลังปี 1999 รวมถึงรูปแบบไฟล์ประมวลผลคำบางรูปแบบ ในบริบทนี้ เครื่องหมายยัติภังค์แบบอ่อนอาจเรียกว่า เครื่องหมายยัติภังค์แบบเลือกได้ หรือ...
ข้อความที่จัดรูปแบบไว้ล่วงหน้าโดยผู้จัดทำ
อักขระ SHY ยังใช้ในข้อความที่ย่อหน้าถูกแบ่งออกเป็นบรรทัดแล้ว เช่น ไฟล์ ข้อความธรรมดา บาง ไฟล์ ข้อความที่ส่งไปยัง โปรแกรมจำลองเทอร์มินัล แบบ VT100 หรือเครื่องพิมพ์ หรือหน้าที่แสดงใน ภาษาอธิบายหน้า นี่คือบริบทการใช้งานที่ มาตรฐาน EBCDIC และ ISO 8859-1...
การเข้ารหัสและคำจำกัดความ
อักขระขีดกลางอ่อน ( SHY ) ในชุดอักขระที่เข้ารหัส เรียงตามลำดับเวลาโดยประมาณ: