อ่าน 4 นาที
ฟังก์ชันเอนโทรปีไบนารี
ใน ทฤษฎีสารสนเทศ ฟังก์ชัน เอนโทรปีไบนารี ซึ่งแทนด้วยหรือถูกกำหนดให้เป็น เอนโทรปี ของ กระบวนการเบอร์นูลลี ( ตัวแปรไบนารี อิสระ และมีการกระจายเหมือนกัน ) ที่ มีความน่าจะเป็น...
ฟังก์ชันเอนโทรปีไบนารี

ในทฤษฎีสารสนเทศฟังก์ชันเอนโทรปีไบนารีซึ่งแทนด้วยหรือถูกกำหนดให้เป็นเอนโทรปีของกระบวนการเบอร์นูลลี ( ตัวแปรไบนารีอิสระ และมีการกระจายเหมือนกัน ) ที่มีความน่าจะเป็นของค่าใดค่าหนึ่งจากสองค่า และกำหนดโดยสูตร:
ฐานของลอการิทึมสอดคล้องกับการเลือกหน่วยของข้อมูลฐานe ( ลอการิทึมธรรมชาติ ) สอดคล้องกับหน่วย natsและสะดวกในทางคณิตศาสตร์ ในขณะที่ฐาน 2 ( ลอการิทึมไบนารี ) สอดคล้องกับหน่วย shannonsและเป็นไปตามธรรมเนียม (ดังแสดงในกราฟ) กล่าวคือ:
โปรดทราบว่าค่าที่ 0 และ 1 ได้มาจากค่าลิมิต(ตามกฎของ L'Hôpital ) และคำว่า "ไบนารี" หมายถึงค่าที่เป็นไปได้สองค่าสำหรับตัวแปร ไม่ใช่หน่วยของข้อมูล
เมื่อฟังก์ชันเอนโทรปีไบนารีจะมีค่าสูงสุดที่ 1 แชนนอน (1 หน่วยข้อมูลไบนารี) ซึ่งเป็นกรณีของการโยนเหรียญที่ไม่เอนเอียงเมื่อหรือเอนโทรปีไบนารีจะมีค่าเป็น 0 (โดยไม่คำนึงถึงหน่วย) ซึ่งสอดคล้องกับไม่มีข้อมูล เนื่องจากไม่มีความไม่แน่นอนในตัวแปร
สัญกรณ์
เอนโทรปีไบนารีเป็นกรณีพิเศษของฟังก์ชันเอนโทรปีซึ่งแตกต่างจากฟังก์ชันเอนโทรปี ทั่วไป ตรงที่เอนโทรปีไบนารีใช้จำนวนจริงตัวเดียวเป็นพารามิเตอร์ในขณะที่ฟังก์ชันเอนโทรปีทั่วไปใช้การแจกแจงหรือตัวแปรสุ่มเป็นพารามิเตอร์ ดังนั้น เอนโทรปีไบนารี (ของp ) จึงเป็นเอนโทรปีของการแจกแจงเฉพาะนั้น ดังนั้น
เมื่อเขียนความน่าจะเป็นของค่าทั้งสองค่าเป็นpและqดังนั้นและซึ่งจะสอดคล้องกับ
บางครั้งฟังก์ชันเอนโทรปีไบนารีก็เขียนเป็น เช่นกันอย่างไรก็ตาม มันแตกต่างจาก และไม่ควรสับสนกับเอนโทรปีเรนยีซึ่งเขียนแทนด้วย เช่นกัน
คำอธิบาย
ในแง่ของทฤษฎีสารสนเทศเอนโทรปีถือเป็นมาตรวัดความไม่แน่นอนในข้อความ อธิบายให้เข้าใจง่ายๆ สมมติว่าความน่าจะเป็น = 0 เหตุการณ์นั้นจะไม่เกิดขึ้นอย่างแน่นอน ดังนั้นจึงไม่มีความไม่แน่นอนเลย ส่งผลให้เอนโทรปีเป็น 0 ถ้า = 0 ผลลัพธ์ก็แน่นอนเช่นกัน ดังนั้นเอนโทรปีจึงเป็น 0 เมื่อ = 0 ความไม่แน่นอนจะสูงสุด หากเราวางเดิมพันอย่างยุติธรรมกับผลลัพธ์ในกรณีนี้ จะไม่มีข้อได้เปรียบใดๆ ที่ได้รับจากการรู้ความน่าจะเป็นล่วงหน้า ในกรณีนี้ เอนโทรปีจะมีค่าสูงสุดที่ 1 บิต ค่ากลางจะอยู่ระหว่างกรณีเหล่านี้ ตัวอย่างเช่น ถ้า = 0 ยังคงมีความไม่แน่นอนเกี่ยวกับผลลัพธ์อยู่ แต่เรายังสามารถทำนายผลลัพธ์ได้อย่างถูกต้องบ่อยกว่าผิด ดังนั้นมาตรวัดความไม่แน่นอนหรือเอนโทรปีจึงน้อยกว่า 1 บิตเต็ม
คุณสมบัติ
อนุพันธ์
อนุพันธ์ของฟังก์ชันเอนโทรปีไบนารีสามารถแสดงได้ในรูปของค่าลบของ ฟังก์ชัน โลจิต :
- .
โดยที่aแทนฐานของลอการิทึมที่กำหนดให้
คอนจูเกตนูน
คอนจูเกตแบบนูน (โดยเฉพาะการแปลงเลอจองเดอร์ ) ของเอนโทรปีไบนารี (ฐานe ) คือ ฟังก์ชัน ซอฟต์พลัส เชิงลบ ทั้งนี้เพราะ (ตามนิยามของการแปลงเลอจองเดอร์: อนุพันธ์เป็นฟังก์ชันผกผัน) อนุพันธ์ของเอนโทรปีไบนารีเชิงลบคือโลจิต ซึ่งฟังก์ชันผกผันของมันคือฟังก์ชันโลจิสติกซึ่งเป็นอนุพันธ์ของซอฟต์พลัส
Softplus สามารถตีความได้ว่าเป็นการสูญเสียแบบโลจิสติกดังนั้นโดยหลักการทวิภาวะการลดการสูญเสียแบบโลจิสติกให้เหลือน้อยที่สุดจึงสอดคล้องกับการเพิ่มเอนโทรปีให้สูงสุด ซึ่งเป็นการยืนยันหลักการของการเพิ่มเอนโทรปีให้สูงสุดในฐานะการลดการสูญเสียให้เหลือน้อย ที่สุด
ซีรี่ส์เทย์เลอร์
อนุกรมเทย์เลอร์ของฟังก์ชันเอนโทรปีไบนารีที่ 1/2 คือ
ซึ่งลู่เข้าสู่ฟังก์ชันเอนโทรปีไบนารีสำหรับทุกค่า
ขอบเขต
ขอบเขตต่อไปนี้เป็นจริงสำหรับ: [ 1 ]
และ
โดยที่หมายถึงลอการิทึมธรรมชาติ
ดูเพิ่มเติม
อ่านเพิ่มเติม
- แม็กเคย์, เดวิด เจซีทฤษฎีสารสนเทศ การอนุมาน และอัลกอริธึมการเรียนรู้เคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, 2003. ISBN 0-521-64298-1