อ่าน 3 นาที
หนึ่งร้อน
ใน วงจรดิจิทัล และ การเรียนรู้ของเครื่อง กลุ่มบิต แบบวันฮอต (one-hot) คือกลุ่ม บิต ที่ค่าที่ถูกต้องมีเพียงค่าบิตสูง (1) เพียงค่าเดียว และค่าบิตอื่นๆ เป็นค่าต่ำ (0) [ 1 ]...
หนึ่งร้อน
| ทศนิยม | ไบนารี | เอกภาค | หนึ่งร้อน |
|---|---|---|---|
| 0 | 000 | 00000000 | 00000001 |
| 1 | 001 | 00000001 | 00000010 |
| 2 | 010 | 00000011 | 00000100 |
| 3 | 011 | 00000111 | 00001000 |
| 4 | 100 | 00001111 | 00010000 |
| 5 | 101 | 00011111 | 00100000 |
| 6 | 110 | 00111111 | 01000000 |
| 7 | 111 | 01111111 | 10,000,000 |
ในวงจรดิจิทัลและการเรียนรู้ของเครื่อง กลุ่มบิต แบบวันฮอต (one-hot)คือกลุ่มบิตที่ค่าที่ถูกต้องมีเพียงค่าบิตสูง (1) เพียงค่าเดียว และค่าบิตอื่นๆ เป็นค่าต่ำ (0) [ 1 ]การใช้งานที่คล้ายกันซึ่งบิตทั้งหมดเป็น '1' ยกเว้นบิต '0' หนึ่งบิต บางครั้งเรียกว่าวันโคลด์ (one-cold ) [ 2 ]ในทางสถิติตัวแปรดัมมี่ (dummy variables)แสดงถึงเทคนิคที่คล้ายกันในการแสดงข้อมูล เชิงหมวดหมู่
แอปพลิเคชัน
วงจรดิจิทัล
การเข้ารหัสแบบวันฮอต (One-hot encoding) มักใช้เพื่อระบุสถานะของเครื่องสถานะ (State machine ) เมื่อใช้เลขฐานสอง จำเป็นต้องมี ตัวถอดรหัส (Decoder)เพื่อกำหนดสถานะ แต่เครื่องสถานะแบบวันฮอตไม่จำเป็นต้องใช้ตัวถอดรหัส เนื่องจากเครื่องสถานะจะอยู่ใน สถานะที่ nก็ต่อเมื่อ บิตที่ nเป็นค่าสูง เท่านั้น
ตัวนับแบบวงแหวนที่มีสถานะเรียงลำดับ 15 สถานะเป็นตัวอย่างของเครื่องสถานะ การใช้งานแบบ 'one-hot' จะมีฟลิปฟลอป 15 ตัว ต่อกันเป็นอนุกรม โดยเอาต์พุต Q ของแต่ละฟลิปฟลอปเชื่อมต่อกับอินพุต D ของฟลิปฟลอปถัดไป และอินพุต D ของฟลิปฟลอปตัวแรกเชื่อมต่อกับเอาต์พุต Q ของฟลิปฟลอปตัวที่ 15 ฟลิปฟลอปตัวแรกในสายโซ่แสดงถึงสถานะแรก ฟลิปฟลอปตัวที่สองแสดงถึงสถานะที่สอง และต่อไปเรื่อยๆ จนถึงฟลิปฟลอปตัวที่ 15 ซึ่งแสดงถึงสถานะสุดท้าย เมื่อรีเซ็ตเครื่องสถานะ ฟลิปฟลอปทั้งหมดจะถูกรีเซ็ตเป็น '0' ยกเว้นฟลิปฟลอปตัวแรกในสายโซ่ซึ่งจะถูกตั้งค่าเป็น '1' ขอบสัญญาณนาฬิกาถัดไปที่มาถึงฟลิปฟลอปจะส่งค่าบิต 'hot' ไปยังฟลิปฟลอปตัวที่สอง ค่าบิต 'hot' จะส่งไปเรื่อยๆ ในลักษณะนี้จนถึงสถานะที่ 15 หลังจากนั้นเครื่องสถานะจะกลับไปยังสถานะแรก
ตัวถอดรหัสที่อยู่จะแปลงจากเลขฐานสองไปเป็นรูปแบบวันฮอต (one-hot representation) ส่วนตัวเข้ารหัสลำดับความสำคัญจะแปลงจากรูปแบบวันฮอตไปเป็นเลขฐานสอง
การเปรียบเทียบกับวิธีการเข้ารหัสอื่นๆ
ข้อดี
- การกำหนดสถานะมีต้นทุนต่ำและคงที่ในการเข้าถึงฟลิปฟลอป หนึ่งตัว
- การเปลี่ยนสถานะมีค่าใช้จ่ายคงที่ในการเข้าถึงฟลิปฟลอปสองตัว
- ออกแบบและปรับแต่งได้ง่าย
- ตรวจจับสถานะที่ผิดกฎหมายได้ง่าย
- ใช้ประโยชน์จากฟลิปฟลอปจำนวนมากของFPGA
- โดยทั่วไปการใช้การใช้งานแบบ one-hot จะช่วยให้เครื่องสถานะทำงานที่อัตราความเร็วสัญญาณนาฬิกาที่เร็วกว่าการเข้ารหัสเครื่องสถานะแบบอื่น[ 3 ]
ข้อเสีย
การประมวลผลภาษาธรรมชาติ
ในการประมวลผลภาษาธรรมชาติเวกเตอร์วันฮอตคือ เมทริกซ์ (เวกเตอร์) ขนาด 1 × N ที่ใช้เพื่อแยกแยะแต่ละคำในคำศัพท์จากคำอื่นๆ ในคำศัพท์ [ 5 ]เวกเตอร์ประกอบด้วย 0 ในทุกเซลล์ ยกเว้น 1 เพียงตัวเดียวในเซลล์ที่ใช้ระบุคำอย่างเฉพาะเจาะจง การเข้ารหัสวันฮอตทำให้มั่นใจได้ว่าการเรียนรู้ของเครื่องจะไม่ถือว่าตัวเลขที่สูงกว่ามีความสำคัญมากกว่า ตัวอย่างเช่น ค่า '8' มีค่ามากกว่าค่า '1' แต่ไม่ได้หมายความว่า '8' มีความสำคัญมากกว่า '1' เช่นเดียวกันสำหรับคำต่างๆ ค่า 'laughter' ไม่ได้สำคัญกว่า 'laugh'
การเรียนรู้ของเครื่องจักรและสถิติ
ในการเรียนรู้ของเครื่อง การเข้ารหัสแบบวันฮอตเป็นวิธีการที่ใช้บ่อยในการจัดการกับข้อมูลเชิงหมวดหมู่ เนื่องจากโมเดลการเรียนรู้ของเครื่องจำนวนมากต้องการตัวแปรอินพุตเป็นตัวเลข ตัวแปรเชิงหมวดหมู่จึงจำเป็นต้องแปลงในส่วนการประมวลผลล่วงหน้า[ 6 ]
| ชื่ออาหาร | หมวดหมู่ # | แคลอรี |
|---|---|---|
| แอปเปิล | 1 | 95 |
| ไก่ | 2 | 231 |
| บรอกโคลี | 3 | 50 |
| แอปเปิล | ไก่ | บรอกโคลี | แคลอรี |
|---|---|---|---|
| 1 | 0 | 0 | 95 |
| 0 | 1 | 0 | 231 |
| 0 | 0 | 1 | 50 |
ข้อมูลเชิงหมวดหมู่สามารถเป็นได้ทั้งแบบนามหรือแบบลำดับ[ 7 ]ข้อมูลแบบลำดับมีลำดับการจัดอันดับสำหรับค่าของมัน ดังนั้นจึงสามารถแปลงเป็นข้อมูลเชิงตัวเลขได้โดยใช้การเข้ารหัสแบบลำดับ[ 8 ]ตัวอย่างของข้อมูลแบบลำดับคือคะแนนในการทดสอบตั้งแต่ A ถึง F ซึ่งสามารถจัดอันดับได้โดยใช้ตัวเลขตั้งแต่ 6 ถึง 1 เนื่องจากไม่มีความสัมพันธ์เชิงปริมาณระหว่างค่าแต่ละค่าของตัวแปรนาม การใช้การเข้ารหัสแบบลำดับอาจสร้างความสัมพันธ์แบบลำดับสมมติในข้อมูลได้[ 9 ]ดังนั้น การเข้ารหัสแบบวันฮอตจึงมักถูกนำไปใช้กับตัวแปรนาม เพื่อปรับปรุงประสิทธิภาพของอัลกอริทึม
สำหรับแต่ละค่าที่ไม่ซ้ำกันในคอลัมน์ประเภทข้อมูลดั้งเดิม จะมีการสร้างคอลัมน์ใหม่ขึ้นมาในวิธีนี้ จากนั้นตัวแปรดัมมี่เหล่านี้จะถูกเติมด้วยเลขศูนย์และเลขหนึ่ง (1 หมายถึง จริง, 0 หมายถึง เท็จ)
เนื่องจากกระบวนการนี้สร้างตัวแปรใหม่หลายตัว จึงมีแนวโน้มที่จะก่อให้เกิดปัญหา 'p ใหญ่' (ตัวทำนายมากเกินไป) หากมีค่าที่ไม่ซ้ำกันจำนวนมากในคอลัมน์เดิม ข้อเสียอีกประการหนึ่งของการเข้ารหัสแบบวันฮอตคือทำให้เกิดภาวะความสัมพันธ์เชิงเส้นระหว่างตัวแปรแต่ละตัว ซึ่งอาจลดความแม่นยำของแบบจำลองได้
นอกจากนี้ หากตัวแปรเชิงหมวดหมู่เป็นตัวแปรเอาต์พุต คุณอาจต้องการแปลงค่ากลับเป็นรูปแบบเชิงหมวดหมู่เพื่อนำเสนอในแอปพลิเคชันของคุณ[ 10 ]
ในการใช้งานจริง การแปลงนี้มักจะดำเนินการโดยตรงด้วยฟังก์ชันที่รับข้อมูลเชิงหมวดหมู่เป็นอินพุตและส่งออกตัวแปรดัมมี่ที่สอดคล้องกัน ตัวอย่างเช่น ฟังก์ชัน dummyVars ของไลบรารี Caret ใน R [ 11 ]
ดูเพิ่มเติม
- รหัสน้ำหนักคงที่ – วิธีการเข้ารหัสข้อมูลในการสื่อสาร โดยกำหนดค่าบิตจำนวนคงที่
- รหัสสองในห้า – รหัสตรวจจับข้อผิดพลาดสำหรับตัวเลขทศนิยม ซึ่งใช้กันอย่างแพร่หลายในระบบบาร์โค้ด และครั้งหนึ่งเคยใช้ในระบบชุมสายโทรศัพท์
- ระบบการเข้ารหัสตัวเลขแบบเลขฐานสองควินารี
- รหัสเกรย์ – การเรียงลำดับค่าไบนารี ใช้สำหรับการระบุตำแหน่งและการแก้ไขข้อผิดพลาด
- เดลต้าโครเนกเกอร์ – ฟังก์ชันทางคณิตศาสตร์ของตัวแปรสองตัว ส่งคืนค่า 1 ถ้าตัวแปรทั้งสองเท่ากัน และ 0 ถ้าตัวแปรทั้งสองไม่เท่ากัน
- เวกเตอร์ตัวบ่งชี้
- เลขฐานสิบแบบอนุกรม
- เวกเตอร์แบบรายการเดียว – แนวคิดในทางคณิตศาสตร์
- ระบบเลขฐานหนึ่ง – ระบบเลขฐาน 1
- การวัดปริมาณความเป็นเอกลักษณ์ – ตัววัดปริมาณเชิงตรรกะ
- ประตู XOR – ประตูตรรกะ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ หนึ่งร้อน
ใน วงจรดิจิทัล และ การเรียนรู้ของเครื่อง กลุ่มบิต แบบวันฮอต (one-hot) คือกลุ่ม บิต ที่ค่าที่ถูกต้องมีเพียงค่าบิตสูง (1) เพียงค่าเดียว และค่าบิตอื่นๆ เป็นค่าต่ำ (0) [ 1 ]...
วงจรดิจิทัล
การเข้ารหัสแบบวันฮอต (One-hot encoding) มักใช้เพื่อระบุสถานะของ เครื่องสถานะ (State machine ) เมื่อใช้ เลขฐานสอง จำเป็นต้องมี ตัวถอดรหัส (Decoder) เพื่อกำหนดสถานะ แต่เครื่องสถานะแบบวันฮอตไม่จำเป็นต้องใช้ตัวถอดรหัส เนื่องจากเครื่องสถานะจะอยู่ใน สถานะที่ n...
การประมวลผลภาษาธรรมชาติ
ใน การประมวลผลภาษาธรรมชาติ เวกเตอร์วันฮอตคือ เมทริกซ์ (เวกเตอร์) ขนาด 1 × N ที่ใช้เพื่อแยกแยะแต่ละคำในคำศัพท์จากคำอื่นๆ ในคำศัพท์ [ 5 ] เวกเตอร์ประกอบด้วย 0 ในทุกเซลล์ ยกเว้น 1 เพียงตัวเดียวในเซลล์ที่ใช้ระบุคำอย่างเฉพาะเจาะจง...
การเรียนรู้ของเครื่องจักรและสถิติ
ในการเรียนรู้ของเครื่อง การเข้ารหัสแบบวันฮอตเป็นวิธีการที่ใช้บ่อยในการจัดการกับข้อมูลเชิงหมวดหมู่ เนื่องจากโมเดลการเรียนรู้ของเครื่องจำนวนมากต้องการตัวแปรอินพุตเป็นตัวเลข ตัวแปรเชิงหมวดหมู่จึงจำเป็นต้องแปลงในส่วนการประมวลผลล่วงหน้า [ 6 ]