กลับไปหน้าบทความ

อ่าน 2 นาที

การแบ่งช่วงของคุณลักษณะต่อเนื่อง

ในทางสถิติและการเรียนรู้ของเครื่องจักรการแบ่งช่วง (Discretization)หมายถึงกระบวนการแปลงหรือแบ่งคุณลักษณะ คุณสมบัติ หรือตัวแปรต่อเนื่องให้เป็นคุณลักษณะ / คุณสมบัติ / ตัวแปร/ ช่วง...

การแบ่งช่วงของคุณลักษณะต่อเนื่อง

ในทางสถิติและการเรียนรู้ของเครื่องจักรการแบ่งช่วง (Discretization)หมายถึงกระบวนการแปลงหรือแบ่งคุณลักษณะ คุณสมบัติ หรือตัวแปรต่อเนื่องให้เป็นคุณลักษณะ / คุณสมบัติ / ตัวแปร/ ช่วง ที่ไม่ต่อเนื่องหรือ เป็นนามธรรมซึ่งมีประโยชน์ในการสร้างฟังก์ชันความน่าจะเป็น – โดยเฉพาะอย่างยิ่งในการประมาณความ หนาแน่น การแบ่งช่วง เป็นรูปแบบหนึ่งของการแบ่ง ช่วง โดยทั่วไป และยัง เป็นรูปแบบหนึ่งของ การจัดกลุ่ม (binning ) เช่น ในการสร้างฮิสโตแกรมเมื่อใดก็ตามที่ข้อมูลต่อเนื่อง ถูกแบ่งช่วง จะมี ข้อผิดพลาดจากการแบ่งช่วง อยู่เสมอ เป้าหมายคือการลดปริมาณข้อผิดพลาดนั้นให้เหลือในระดับที่ถือว่า น้อยมากจน ไม่สำคัญสำหรับวัตถุประสงค์ใน การสร้างแบบจำลอง

โดยทั่วไป ข้อมูลจะถูกแบ่งเป็นส่วนย่อยที่ มีความยาว/ความกว้างเท่ากัน Kส่วน (ช่วงเวลาเท่ากัน) หรือคิดเป็น K% ของข้อมูลทั้งหมด (ความถี่เท่ากัน) [ 1 ]

กลไกสำหรับการแบ่งข้อมูลต่อเนื่อง ได้แก่ วิธี MDL ของ Fayyad & Irani [ 2 ]ซึ่งใช้ข้อมูลร่วมกันเพื่อกำหนด bin ที่ดีที่สุดแบบวนซ้ำ CAIM, CACC, Ameva และอื่นๆ อีกมากมาย[ 3 ]

เป็นที่ทราบกันดีว่าอัลกอริธึมการเรียนรู้ของเครื่องจำนวนมากสามารถสร้างแบบจำลองที่ดีขึ้นได้โดยการแบ่งคุณลักษณะต่อเนื่องออกเป็นส่วนย่อย[ 4 ​​]

ซอฟต์แวร์

นี่คือรายชื่อซอฟต์แวร์บางส่วนที่ใช้ขั้นตอนวิธี MDL

  • เครื่องมือdiscretize4crf ออกแบบมาเพื่อใช้งานร่วมกับ CRF ที่นิยม ใช้กัน ( C++ )
  • mdlpในแพ็กเกจ discretization ของ R
  • แบ่งส่วนย่อยในแพ็กเกจ RWeka ของ R

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Discretization_of_continuous_features&oldid=1196518329 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การแบ่งช่วงของคุณลักษณะต่อเนื่อง

ในทางสถิติและการเรียนรู้ของเครื่องจักรการแบ่งช่วง (Discretization)หมายถึงกระบวนการแปลงหรือแบ่งคุณลักษณะ คุณสมบัติ หรือตัวแปรต่อเนื่องให้เป็นคุณลักษณะ / คุณสมบัติ / ตัวแปร/ ช่วง...

ซอฟต์แวร์

นี่คือรายชื่อซอฟต์แวร์บางส่วนที่ใช้ขั้นตอนวิธี MDL

ดูเพิ่มเติม

การประมาณความหนาแน่น การแก้ไขความต่อเนื่อง ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Discretization_of_continuous_features&oldid=1196518329 "