อ่าน 2 นาที
การแบ่งช่วงของคุณลักษณะต่อเนื่อง
ในทางสถิติและการเรียนรู้ของเครื่องจักรการแบ่งช่วง (Discretization)หมายถึงกระบวนการแปลงหรือแบ่งคุณลักษณะ คุณสมบัติ หรือตัวแปรต่อเนื่องให้เป็นคุณลักษณะ / คุณสมบัติ / ตัวแปร/ ช่วง...
การแบ่งช่วงของคุณลักษณะต่อเนื่อง
ในทางสถิติและการเรียนรู้ของเครื่องจักรการแบ่งช่วง (Discretization)หมายถึงกระบวนการแปลงหรือแบ่งคุณลักษณะ คุณสมบัติ หรือตัวแปรต่อเนื่องให้เป็นคุณลักษณะ / คุณสมบัติ / ตัวแปร/ ช่วง ที่ไม่ต่อเนื่องหรือ เป็นนามธรรมซึ่งมีประโยชน์ในการสร้างฟังก์ชันความน่าจะเป็น – โดยเฉพาะอย่างยิ่งในการประมาณความ หนาแน่น การแบ่งช่วง เป็นรูปแบบหนึ่งของการแบ่ง ช่วง โดยทั่วไป และยัง เป็นรูปแบบหนึ่งของ การจัดกลุ่ม (binning ) เช่น ในการสร้างฮิสโตแกรมเมื่อใดก็ตามที่ข้อมูลต่อเนื่อง ถูกแบ่งช่วง จะมี ข้อผิดพลาดจากการแบ่งช่วง อยู่เสมอ เป้าหมายคือการลดปริมาณข้อผิดพลาดนั้นให้เหลือในระดับที่ถือว่า น้อยมากจน ไม่สำคัญสำหรับวัตถุประสงค์ใน การสร้างแบบจำลอง
โดยทั่วไป ข้อมูลจะถูกแบ่งเป็นส่วนย่อยที่ มีความยาว/ความกว้างเท่ากัน Kส่วน (ช่วงเวลาเท่ากัน) หรือคิดเป็น K% ของข้อมูลทั้งหมด (ความถี่เท่ากัน) [ 1 ]
กลไกสำหรับการแบ่งข้อมูลต่อเนื่อง ได้แก่ วิธี MDL ของ Fayyad & Irani [ 2 ]ซึ่งใช้ข้อมูลร่วมกันเพื่อกำหนด bin ที่ดีที่สุดแบบวนซ้ำ CAIM, CACC, Ameva และอื่นๆ อีกมากมาย[ 3 ]
เป็นที่ทราบกันดีว่าอัลกอริธึมการเรียนรู้ของเครื่องจำนวนมากสามารถสร้างแบบจำลองที่ดีขึ้นได้โดยการแบ่งคุณลักษณะต่อเนื่องออกเป็นส่วนย่อย[ 4 ]
ซอฟต์แวร์
นี่คือรายชื่อซอฟต์แวร์บางส่วนที่ใช้ขั้นตอนวิธี MDL
- เครื่องมือdiscretize4crf ออกแบบมาเพื่อใช้งานร่วมกับ CRF ที่นิยม ใช้กัน ( C++ )
- mdlpในแพ็กเกจ discretization ของ R
- แบ่งส่วนย่อยในแพ็กเกจ RWeka ของ R
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การแบ่งช่วงของคุณลักษณะต่อเนื่อง
ในทางสถิติและการเรียนรู้ของเครื่องจักรการแบ่งช่วง (Discretization)หมายถึงกระบวนการแปลงหรือแบ่งคุณลักษณะ คุณสมบัติ หรือตัวแปรต่อเนื่องให้เป็นคุณลักษณะ / คุณสมบัติ / ตัวแปร/ ช่วง...
ซอฟต์แวร์
นี่คือรายชื่อซอฟต์แวร์บางส่วนที่ใช้ขั้นตอนวิธี MDL
ดูเพิ่มเติม
การประมาณความหนาแน่น การแก้ไขความต่อเนื่อง ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Discretization_of_continuous_features&oldid=1196518329 "