อ่าน 2 นาที
การเรียนรู้พื้นที่เวอร์ชัน
การเรียนรู้พื้นที่เวอร์ชันเป็น แนวทาง เชิงตรรกะในการเรียนรู้ของเครื่องโดยเฉพาะการจำแนกแบบไบนารี อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะค้นหาพื้นที่สมมติฐาน ที่กำหนดไว้ล่วงหน้า...
การเรียนรู้พื้นที่เวอร์ชัน

การเรียนรู้พื้นที่เวอร์ชันเป็น แนวทาง เชิงตรรกะในการเรียนรู้ของเครื่องโดยเฉพาะการจำแนกแบบไบนารี อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะค้นหาพื้นที่สมมติฐาน ที่กำหนดไว้ล่วงหน้า ซึ่งถือเป็นชุดของประโยคเชิงตรรกะในทางรูปธรรม พื้นที่สมมติฐานคือ การเชื่อมโยงแบบ แยก[ 1 ]
(เช่น สมมติฐานข้อที่ 1 ถึงn ข้อใดข้อหนึ่งหรือมากกว่า นั้นเป็นจริง) อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะได้รับตัวอย่าง ซึ่งจะใช้ในการจำกัดพื้นที่สมมติฐาน สำหรับแต่ละตัวอย่างxสมมติฐานที่ไม่สอดคล้องกับxจะถูกลบออกจากพื้นที่[ 2 ]การปรับปรุงพื้นที่สมมติฐานแบบวนซ้ำนี้เรียกว่า อัลกอริทึม การกำจัดผู้สมัครพื้นที่สมมติฐานที่เก็บรักษาไว้ภายในอัลกอริทึมเรียกว่าพื้นที่เวอร์ชัน[ 1 ]
อัลกอริทึมพื้นที่เวอร์ชัน
ในการตั้งค่าที่มีการจัดลำดับความทั่วไปของสมมติฐาน เป็นไปได้ที่จะแสดงพื้นที่เวอร์ชันด้วยสมมติฐานสองชุด: (1) สมมติฐานที่สอดคล้องกัน ที่เฉพาะเจาะจงที่สุดและ (2) สมมติฐานที่สอดคล้องกัน ทั่วไปที่สุดโดยที่ "สอดคล้อง" หมายถึงการตกลงกับข้อมูลที่สังเกตได้
สมมติฐานที่เฉพาะเจาะจงที่สุด (เช่น ขอบเขตที่เฉพาะเจาะจงSB ) ครอบคลุมตัวอย่างการฝึกอบรมเชิงบวกที่สังเกตได้ และครอบคลุมพื้นที่คุณลักษณะ ที่เหลือให้น้อยที่สุด เท่าที่จะเป็นไปได้ สมมติฐานเหล่านี้ หากลดทอนลงไปอีกจะตัดตัวอย่าง การฝึกอบรม เชิงบวก ออกไป และด้วยเหตุนี้จึงไม่สอดคล้องกัน สมมติฐานขั้นต่ำเหล่านี้โดยพื้นฐานแล้วประกอบขึ้นเป็นข้ออ้าง (ในแง่ร้าย) ว่าแนวคิดที่แท้จริงถูกกำหนดโดย ข้อมูล เชิงบวกที่สังเกตได้แล้วเท่านั้น ดังนั้น หากพบจุดข้อมูลใหม่ (ไม่เคยเห็นมาก่อน) ควรสันนิษฐานว่าเป็นข้อมูลเชิงลบ (กล่าวคือ หากข้อมูลยังไม่ได้รับการยืนยันมาก่อน ก็จะถูกตัดออกไป)
สมมติฐานทั่วไปที่สุด (เช่น ขอบเขตทั่วไปGB ) ครอบคลุมตัวอย่างการฝึกอบรมเชิงบวกที่สังเกตได้ แต่ยังครอบคลุมพื้นที่คุณลักษณะที่เหลืออยู่ให้มากที่สุดโดยไม่รวมตัวอย่างการฝึกอบรมเชิงลบใดๆ หากขยายสมมติฐานเหล่านี้ออกไปอีกจะรวมตัวอย่าง การฝึกอบรม เชิงลบ เข้าไปด้วย และด้วยเหตุนี้จึงไม่สอดคล้องกัน สมมติฐานสูงสุดเหล่านี้โดยพื้นฐานแล้วเป็นการอ้าง (ในแง่ดี) ว่าแนวคิดที่แท้จริงถูกกำหนดโดย ข้อมูล เชิงลบที่สังเกตได้แล้วเท่านั้น ดังนั้น หากพบจุดข้อมูลใหม่ (ไม่เคยเห็นมาก่อน) ควรสันนิษฐานว่าเป็นข้อมูลเชิงบวก (กล่าวคือ หากข้อมูลยังไม่ถูกตัดออกไปก่อนหน้านี้ ก็จะถือว่าข้อมูลนั้นเป็นบวก)
ดังนั้น ในระหว่างการเรียนรู้ พื้นที่เวอร์ชัน (ซึ่งเป็นเซต – อาจเป็นอนันต์ – ที่ประกอบด้วย สมมติฐานที่สอดคล้องกัน ทั้งหมด ) สามารถแสดงได้ด้วยขอบเขตล่างและขอบเขตบนเท่านั้น (เซตสมมติฐานที่ครอบคลุมที่สุดและเฉพาะเจาะจงที่สุด) และการดำเนินการเรียนรู้สามารถทำได้เฉพาะกับเซตตัวแทนเหล่านี้เท่านั้น
หลังจากเรียนรู้แล้ว สามารถทำการจำแนกประเภทกับตัวอย่างที่ไม่เคยเห็นมาก่อนได้โดยการทดสอบสมมติฐานที่เรียนรู้จากอัลกอริธึม หากตัวอย่างสอดคล้องกับสมมติฐานหลายข้อ สามารถใช้กฎการลงคะแนนเสียงข้างมากได้[ 1 ]
ภูมิหลังทางประวัติศาสตร์
แนวคิดเรื่องพื้นที่เวอร์ชันได้รับการแนะนำโดยมิทเชลในช่วงต้นทศวรรษ 1980 [ 2 ]ในฐานะกรอบการทำงานเพื่อทำความเข้าใจปัญหาพื้นฐานของการเรียนรู้แบบมีผู้กำกับดูแลภายในบริบทของการค้นหาวิธีแก้ปัญหาแม้ว่าวิธีการค้นหา " การกำจัดผู้สมัคร " พื้นฐานที่มาพร้อมกับกรอบการทำงานพื้นที่เวอร์ชันจะไม่ใช่อัลกอริธึมการเรียนรู้ที่เป็นที่นิยม แต่ก็มีการนำไปใช้ในทางปฏิบัติบางอย่างที่ได้รับการพัฒนา (เช่น Sverdlik & Reynolds 1992, Hong & Tsang 1997, Dubois & Quafafou 2002)
ข้อเสียเปรียบที่สำคัญของการเรียนรู้พื้นที่เวอร์ชันคือความไม่สามารถจัดการกับสัญญาณรบกวนได้: ตัวอย่างที่ไม่สอดคล้องกันคู่ใด ๆ สามารถทำให้พื้นที่เวอร์ชันยุบตัวลง กล่าวคือ กลายเป็นว่างเปล่า ทำให้การจำแนกประเภทเป็นไปไม่ได้[ 1 ]วิธีแก้ปัญหาหนึ่งที่เสนอโดย Dubois และ Quafafou คือพื้นที่เวอร์ชันแบบหยาบ[ 3 ]ซึ่งใช้การประมาณค่าตามเซตแบบหยาบเพื่อเรียนรู้สมมติฐานที่แน่นอนและเป็นไปได้ในกรณีที่มีข้อมูลที่ไม่สอดคล้องกัน
ดูเพิ่มเติม
- การวิเคราะห์แนวคิดเชิงรูปแบบ
- การเขียนโปรแกรมเชิงตรรกะแบบอุปนัย
- กรอบแนวคิดเซตแบบ หยาบ (Rough set ) [กรอบแนวคิดเซตแบบหยาบมุ่งเน้นไปที่กรณีที่ความกำกวมเกิดขึ้นจากชุดคุณลักษณะ ที่ไม่สมบูรณ์ กล่าว คือ แนวคิดเป้าหมายไม่สามารถอธิบายได้อย่างชัดเจน เนื่องจากชุดคุณลักษณะที่มีอยู่ไม่สามารถแยกแยะวัตถุที่อยู่ในหมวดหมู่ที่แตกต่างกันได้ กรอบแนวคิดพื้นที่เวอร์ชัน (Version space) มุ่งเน้นไปที่กรณี (การเหนี่ยวนำแบบคลาสสิก) ที่ความกำกวมเกิดขึ้นจากชุดข้อมูล ที่ไม่สมบูรณ์ กล่าวคือ แนวคิดเป้าหมายไม่สามารถอธิบายได้อย่างชัดเจน เนื่องจากข้อมูลที่มีอยู่ไม่สามารถเลือกสมมติฐานได้อย่างเฉพาะเจาะจง แน่นอนว่า ความกำกวมทั้งสองประเภทสามารถเกิดขึ้นได้ในปัญหาการเรียนรู้เดียวกัน]
- การให้เหตุผลแบบอุปนัย [เกี่ยวกับปัญหาทั่วไปของการอุปนัย]
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การเรียนรู้พื้นที่เวอร์ชัน
การเรียนรู้พื้นที่เวอร์ชันเป็น แนวทาง เชิงตรรกะในการเรียนรู้ของเครื่องโดยเฉพาะการจำแนกแบบไบนารี อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะค้นหาพื้นที่สมมติฐาน ที่กำหนดไว้ล่วงหน้า...
อัลกอริทึมพื้นที่เวอร์ชัน
ในการตั้งค่าที่มีการจัดลำดับความทั่วไปของสมมติฐาน เป็นไปได้ที่จะแสดงพื้นที่เวอร์ชันด้วยสมมติฐานสองชุด: (1) สมมติฐานที่สอดคล้องกัน ที่เฉพาะเจาะจงที่สุด และ (2) สมมติฐานที่สอดคล้องกัน ทั่วไปที่สุด โดยที่ "สอดคล้อง" หมายถึงการตกลงกับข้อมูลที่สังเกตได้
ภูมิหลังทางประวัติศาสตร์
แนวคิดเรื่องพื้นที่เวอร์ชันได้รับการแนะนำโดยมิทเชลในช่วงต้นทศวรรษ 1980 [ 2 ] ในฐานะกรอบการทำงานเพื่อทำความเข้าใจปัญหาพื้นฐานของการเรียนรู้แบบมีผู้กำกับดูแลภายในบริบทของ การค้นหาวิธีแก้ปัญหา แม้ว่าวิธีการค้นหา " การกำจัดผู้สมัคร "...
ดูเพิ่มเติม
การวิเคราะห์แนวคิดเชิงรูปแบบ การเขียนโปรแกรมเชิงตรรกะแบบอุปนัย กรอบแนวคิดเซตแบบ หยาบ (Rough set ) [กรอบแนวคิดเซตแบบหยาบมุ่งเน้นไปที่กรณีที่ความกำกวมเกิดขึ้นจาก ชุดคุณลักษณะ ที่ไม่สมบูรณ์ กล่าว คือ แนวคิดเป้าหมายไม่สามารถอธิบายได้อย่างชัดเจน...