กลับไปหน้าบทความ

อ่าน 3 นาที

หนึ่งร้อน

ใน วงจรดิจิทัล และ การเรียนรู้ของเครื่อง กลุ่มบิต แบบวันฮอต (one-hot) คือกลุ่ม บิต ที่ค่าที่ถูกต้องมีเพียงค่าบิตสูง (1) เพียงค่าเดียว และค่าบิตอื่นๆ เป็นค่าต่ำ (0) [ 1 ]...

หนึ่งร้อน

ทศนิยมไบนารีเอกภาคหนึ่งร้อน
00000000000000000001
10010000000100000010
20100000001100000100
30110000011100001000
41000000111100010000
51010001111100100000
61100011111101000000
71110111111110,000,000

ในวงจรดิจิทัลและการเรียนรู้ของเครื่อง กลุ่มบิต แบบวันฮอต (one-hot)คือกลุ่มบิตที่ค่าที่ถูกต้องมีเพียงค่าบิตสูง (1) เพียงค่าเดียว และค่าบิตอื่นๆ เป็นค่าต่ำ (0) [ 1 ]การใช้งานที่คล้ายกันซึ่งบิตทั้งหมดเป็น '1' ยกเว้นบิต '0' หนึ่งบิต บางครั้งเรียกว่าวันโคลด์ (one-cold ) [ 2 ]ในทางสถิติตัวแปรดัมมี่ (dummy variables)แสดงถึงเทคนิคที่คล้ายกันในการแสดงข้อมูล เชิงหมวดหมู่

แอปพลิเคชัน

วงจรดิจิทัล

การเข้ารหัสแบบวันฮอต (One-hot encoding) มักใช้เพื่อระบุสถานะของเครื่องสถานะ (State machine ) เมื่อใช้เลขฐานสอง จำเป็นต้องมี ตัวถอดรหัส (Decoder)เพื่อกำหนดสถานะ แต่เครื่องสถานะแบบวันฮอตไม่จำเป็นต้องใช้ตัวถอดรหัส เนื่องจากเครื่องสถานะจะอยู่ใน สถานะที่ nก็ต่อเมื่อ บิตที่ nเป็นค่าสูง เท่านั้น

ตัวนับแบบวงแหวนที่มีสถานะเรียงลำดับ 15 สถานะเป็นตัวอย่างของเครื่องสถานะ การใช้งานแบบ 'one-hot' จะมีฟลิปฟลอป 15 ตัว ต่อกันเป็นอนุกรม โดยเอาต์พุต Q ของแต่ละฟลิปฟลอปเชื่อมต่อกับอินพุต D ของฟลิปฟลอปถัดไป และอินพุต D ของฟลิปฟลอปตัวแรกเชื่อมต่อกับเอาต์พุต Q ของฟลิปฟลอปตัวที่ 15 ฟลิปฟลอปตัวแรกในสายโซ่แสดงถึงสถานะแรก ฟลิปฟลอปตัวที่สองแสดงถึงสถานะที่สอง และต่อไปเรื่อยๆ จนถึงฟลิปฟลอปตัวที่ 15 ซึ่งแสดงถึงสถานะสุดท้าย เมื่อรีเซ็ตเครื่องสถานะ ฟลิปฟลอปทั้งหมดจะถูกรีเซ็ตเป็น '0' ยกเว้นฟลิปฟลอปตัวแรกในสายโซ่ซึ่งจะถูกตั้งค่าเป็น '1' ขอบสัญญาณนาฬิกาถัดไปที่มาถึงฟลิปฟลอปจะส่งค่าบิต 'hot' ไปยังฟลิปฟลอปตัวที่สอง ค่าบิต 'hot' จะส่งไปเรื่อยๆ ในลักษณะนี้จนถึงสถานะที่ 15 หลังจากนั้นเครื่องสถานะจะกลับไปยังสถานะแรก

ตัวถอดรหัสที่อยู่จะแปลงจากเลขฐานสองไปเป็นรูปแบบวันฮอต (one-hot representation) ส่วนตัวเข้ารหัสลำดับความสำคัญจะแปลงจากรูปแบบวันฮอตไปเป็นเลขฐานสอง

การเปรียบเทียบกับวิธีการเข้ารหัสอื่นๆ

ข้อดี
  • การกำหนดสถานะมีต้นทุนต่ำและคงที่ในการเข้าถึงฟลิปฟลอป หนึ่งตัว
  • การเปลี่ยนสถานะมีค่าใช้จ่ายคงที่ในการเข้าถึงฟลิปฟลอปสองตัว
  • ออกแบบและปรับแต่งได้ง่าย
  • ตรวจจับสถานะที่ผิดกฎหมายได้ง่าย
  • ใช้ประโยชน์จากฟลิปฟลอปจำนวนมากของFPGA
  • โดยทั่วไปการใช้การใช้งานแบบ one-hot จะช่วยให้เครื่องสถานะทำงานที่อัตราความเร็วสัญญาณนาฬิกาที่เร็วกว่าการเข้ารหัสเครื่องสถานะแบบอื่น[ 3 ]
ข้อเสีย
  • ต้องใช้ฟลิปฟลอปมากกว่าการเข้ารหัสแบบอื่น ทำให้ไม่เหมาะสมกับอุปกรณ์PAL
  • หลายรัฐผิดกฎหมาย[ 4 ​​]

การประมวลผลภาษาธรรมชาติ

ในการประมวลผลภาษาธรรมชาติเวกเตอร์วันฮอตคือ  เมทริกซ์ (เวกเตอร์) ขนาด 1 × N ที่ใช้เพื่อแยกแยะแต่ละคำในคำศัพท์จากคำอื่นๆ ในคำศัพท์ [ 5 ]เวกเตอร์ประกอบด้วย 0 ในทุกเซลล์ ยกเว้น 1 เพียงตัวเดียวในเซลล์ที่ใช้ระบุคำอย่างเฉพาะเจาะจง การเข้ารหัสวันฮอตทำให้มั่นใจได้ว่าการเรียนรู้ของเครื่องจะไม่ถือว่าตัวเลขที่สูงกว่ามีความสำคัญมากกว่า ตัวอย่างเช่น ค่า '8' มีค่ามากกว่าค่า '1' แต่ไม่ได้หมายความว่า '8' มีความสำคัญมากกว่า '1' เช่นเดียวกันสำหรับคำต่างๆ ค่า 'laughter' ไม่ได้สำคัญกว่า 'laugh'

การเรียนรู้ของเครื่องจักรและสถิติ

ในการเรียนรู้ของเครื่อง การเข้ารหัสแบบวันฮอตเป็นวิธีการที่ใช้บ่อยในการจัดการกับข้อมูลเชิงหมวดหมู่ เนื่องจากโมเดลการเรียนรู้ของเครื่องจำนวนมากต้องการตัวแปรอินพุตเป็นตัวเลข ตัวแปรเชิงหมวดหมู่จึงจำเป็นต้องแปลงในส่วนการประมวลผลล่วงหน้า[ 6 ]

การเข้ารหัสป้ายกำกับ
ชื่ออาหาร หมวดหมู่ # แคลอรี
แอปเปิล 1 95
ไก่ 2 231
บรอกโคลี 3 50
การเข้ารหัสแบบวันฮอต
แอปเปิล ไก่ บรอกโคลี แคลอรี
1 0 0 95
0 1 0 231
0 0 1 50

ข้อมูลเชิงหมวดหมู่สามารถเป็นได้ทั้งแบบนามหรือแบบลำดับ[ 7 ]ข้อมูลแบบลำดับมีลำดับการจัดอันดับสำหรับค่าของมัน ดังนั้นจึงสามารถแปลงเป็นข้อมูลเชิงตัวเลขได้โดยใช้การเข้ารหัสแบบลำดับ[ 8 ]ตัวอย่างของข้อมูลแบบลำดับคือคะแนนในการทดสอบตั้งแต่ A ถึง F ซึ่งสามารถจัดอันดับได้โดยใช้ตัวเลขตั้งแต่ 6 ถึง 1 เนื่องจากไม่มีความสัมพันธ์เชิงปริมาณระหว่างค่าแต่ละค่าของตัวแปรนาม การใช้การเข้ารหัสแบบลำดับอาจสร้างความสัมพันธ์แบบลำดับสมมติในข้อมูลได้[ 9 ]ดังนั้น การเข้ารหัสแบบวันฮอตจึงมักถูกนำไปใช้กับตัวแปรนาม เพื่อปรับปรุงประสิทธิภาพของอัลกอริทึม

สำหรับแต่ละค่าที่ไม่ซ้ำกันในคอลัมน์ประเภทข้อมูลดั้งเดิม จะมีการสร้างคอลัมน์ใหม่ขึ้นมาในวิธีนี้ จากนั้นตัวแปรดัมมี่เหล่านี้จะถูกเติมด้วยเลขศูนย์และเลขหนึ่ง (1 หมายถึง จริง, 0 หมายถึง เท็จ)

เนื่องจากกระบวนการนี้สร้างตัวแปรใหม่หลายตัว จึงมีแนวโน้มที่จะก่อให้เกิดปัญหา 'p ใหญ่' (ตัวทำนายมากเกินไป) หากมีค่าที่ไม่ซ้ำกันจำนวนมากในคอลัมน์เดิม ข้อเสียอีกประการหนึ่งของการเข้ารหัสแบบวันฮอตคือทำให้เกิดภาวะความสัมพันธ์เชิงเส้นระหว่างตัวแปรแต่ละตัว ซึ่งอาจลดความแม่นยำของแบบจำลองได้

นอกจากนี้ หากตัวแปรเชิงหมวดหมู่เป็นตัวแปรเอาต์พุต คุณอาจต้องการแปลงค่ากลับเป็นรูปแบบเชิงหมวดหมู่เพื่อนำเสนอในแอปพลิเคชันของคุณ[ 10 ]

ในการใช้งานจริง การแปลงนี้มักจะดำเนินการโดยตรงด้วยฟังก์ชันที่รับข้อมูลเชิงหมวดหมู่เป็นอินพุตและส่งออกตัวแปรดัมมี่ที่สอดคล้องกัน ตัวอย่างเช่น ฟังก์ชัน dummyVars ของไลบรารี Caret ใน R [ 11 ]

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=One-hot&oldid=1338330722 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ หนึ่งร้อน

ใน วงจรดิจิทัล และ การเรียนรู้ของเครื่อง กลุ่มบิต แบบวันฮอต (one-hot) คือกลุ่ม บิต ที่ค่าที่ถูกต้องมีเพียงค่าบิตสูง (1) เพียงค่าเดียว และค่าบิตอื่นๆ เป็นค่าต่ำ (0) [ 1 ]...

วงจรดิจิทัล

การเข้ารหัสแบบวันฮอต (One-hot encoding) มักใช้เพื่อระบุสถานะของ เครื่องสถานะ (State machine ) เมื่อใช้ เลขฐานสอง จำเป็นต้องมี ตัวถอดรหัส (Decoder) เพื่อกำหนดสถานะ แต่เครื่องสถานะแบบวันฮอตไม่จำเป็นต้องใช้ตัวถอดรหัส เนื่องจากเครื่องสถานะจะอยู่ใน สถานะที่ n...

การประมวลผลภาษาธรรมชาติ

ใน การประมวลผลภาษาธรรมชาติ เวกเตอร์วันฮอตคือ เมทริกซ์ (เวกเตอร์) ขนาด 1 × N ที่ใช้เพื่อแยกแยะแต่ละคำในคำศัพท์จากคำอื่นๆ ในคำศัพท์ [ 5 ] เวกเตอร์ประกอบด้วย 0 ในทุกเซลล์ ยกเว้น 1 เพียงตัวเดียวในเซลล์ที่ใช้ระบุคำอย่างเฉพาะเจาะจง...

การเรียนรู้ของเครื่องจักรและสถิติ

ในการเรียนรู้ของเครื่อง การเข้ารหัสแบบวันฮอตเป็นวิธีการที่ใช้บ่อยในการจัดการกับข้อมูลเชิงหมวดหมู่ เนื่องจากโมเดลการเรียนรู้ของเครื่องจำนวนมากต้องการตัวแปรอินพุตเป็นตัวเลข ตัวแปรเชิงหมวดหมู่จึงจำเป็นต้องแปลงในส่วนการประมวลผลล่วงหน้า [ 6 ]