กลับไปหน้าบทความ

อ่าน 2 นาที

การเรียนรู้พื้นที่เวอร์ชัน

การเรียนรู้พื้นที่เวอร์ชันเป็น แนวทาง เชิงตรรกะในการเรียนรู้ของเครื่องโดยเฉพาะการจำแนกแบบไบนารี อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะค้นหาพื้นที่สมมติฐาน ที่กำหนดไว้ล่วงหน้า...

การเรียนรู้พื้นที่เวอร์ชัน

พื้นที่เวอร์ชันสำหรับภาษาสมมติฐานแบบ "สี่เหลี่ยมผืนผ้า" ในสองมิติ เครื่องหมายบวกสีเขียวแสดงถึงตัวอย่างเชิงบวก และวงกลมสีแดงแสดงถึงตัวอย่างเชิงลบ GB คือ ขอบเขตสมมติฐานเชิงบวกที่ ครอบคลุม มากที่สุด และ SB คือ ขอบเขตสมมติฐานเชิงบวก ที่เฉพาะเจาะจง มากที่สุด สี่เหลี่ยมผืนผ้าบางๆ ระหว่างกลางแสดงถึงสมมติฐานในพื้นที่เวอร์ชัน

การเรียนรู้พื้นที่เวอร์ชันเป็น แนวทาง เชิงตรรกะในการเรียนรู้ของเครื่องโดยเฉพาะการจำแนกแบบไบนารี อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะค้นหาพื้นที่สมมติฐาน ที่กำหนดไว้ล่วงหน้า ซึ่งถือเป็นชุดของประโยคเชิงตรรกะในทางรูปธรรม พื้นที่สมมติฐานคือ การเชื่อมโยงแบบ แยก[ 1 ]

(เช่น สมมติฐานข้อที่ 1 ถึงn ข้อใดข้อหนึ่งหรือมากกว่า นั้นเป็นจริง) อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะได้รับตัวอย่าง ซึ่งจะใช้ในการจำกัดพื้นที่สมมติฐาน สำหรับแต่ละตัวอย่างxสมมติฐานที่ไม่สอดคล้องกับxจะถูกลบออกจากพื้นที่[ 2 ]การปรับปรุงพื้นที่สมมติฐานแบบวนซ้ำนี้เรียกว่า อัลกอริทึม การกำจัดผู้สมัครพื้นที่สมมติฐานที่เก็บรักษาไว้ภายในอัลกอริทึมเรียกว่าพื้นที่เวอร์ชัน[ 1 ]

อัลกอริทึมพื้นที่เวอร์ชัน

ในการตั้งค่าที่มีการจัดลำดับความทั่วไปของสมมติฐาน เป็นไปได้ที่จะแสดงพื้นที่เวอร์ชันด้วยสมมติฐานสองชุด: (1) สมมติฐานที่สอดคล้องกัน ที่เฉพาะเจาะจงที่สุดและ (2) สมมติฐานที่สอดคล้องกัน ทั่วไปที่สุดโดยที่ "สอดคล้อง" หมายถึงการตกลงกับข้อมูลที่สังเกตได้

สมมติฐานที่เฉพาะเจาะจงที่สุด (เช่น ขอบเขตที่เฉพาะเจาะจงSB ) ครอบคลุมตัวอย่างการฝึกอบรมเชิงบวกที่สังเกตได้ และครอบคลุมพื้นที่คุณลักษณะ ที่เหลือให้น้อยที่สุด เท่าที่จะเป็นไปได้ สมมติฐานเหล่านี้ หากลดทอนลงไปอีกจะตัดตัวอย่าง การฝึกอบรม เชิงบวก ออกไป และด้วยเหตุนี้จึงไม่สอดคล้องกัน สมมติฐานขั้นต่ำเหล่านี้โดยพื้นฐานแล้วประกอบขึ้นเป็นข้ออ้าง (ในแง่ร้าย) ว่าแนวคิดที่แท้จริงถูกกำหนดโดย ข้อมูล เชิงบวกที่สังเกตได้แล้วเท่านั้น ดังนั้น หากพบจุดข้อมูลใหม่ (ไม่เคยเห็นมาก่อน) ควรสันนิษฐานว่าเป็นข้อมูลเชิงลบ (กล่าวคือ หากข้อมูลยังไม่ได้รับการยืนยันมาก่อน ก็จะถูกตัดออกไป)

สมมติฐานทั่วไปที่สุด (เช่น ขอบเขตทั่วไปGB ) ครอบคลุมตัวอย่างการฝึกอบรมเชิงบวกที่สังเกตได้ แต่ยังครอบคลุมพื้นที่คุณลักษณะที่เหลืออยู่ให้มากที่สุดโดยไม่รวมตัวอย่างการฝึกอบรมเชิงลบใดๆ หากขยายสมมติฐานเหล่านี้ออกไปอีกจะรวมตัวอย่าง การฝึกอบรม เชิงลบ เข้าไปด้วย และด้วยเหตุนี้จึงไม่สอดคล้องกัน สมมติฐานสูงสุดเหล่านี้โดยพื้นฐานแล้วเป็นการอ้าง (ในแง่ดี) ว่าแนวคิดที่แท้จริงถูกกำหนดโดย ข้อมูล เชิงลบที่สังเกตได้แล้วเท่านั้น ดังนั้น หากพบจุดข้อมูลใหม่ (ไม่เคยเห็นมาก่อน) ควรสันนิษฐานว่าเป็นข้อมูลเชิงบวก (กล่าวคือ หากข้อมูลยังไม่ถูกตัดออกไปก่อนหน้านี้ ก็จะถือว่าข้อมูลนั้นเป็นบวก)

ดังนั้น ในระหว่างการเรียนรู้ พื้นที่เวอร์ชัน (ซึ่งเป็นเซต – อาจเป็นอนันต์ – ที่ประกอบด้วย สมมติฐานที่สอดคล้องกัน ทั้งหมด ) สามารถแสดงได้ด้วยขอบเขตล่างและขอบเขตบนเท่านั้น (เซตสมมติฐานที่ครอบคลุมที่สุดและเฉพาะเจาะจงที่สุด) และการดำเนินการเรียนรู้สามารถทำได้เฉพาะกับเซตตัวแทนเหล่านี้เท่านั้น

หลังจากเรียนรู้แล้ว สามารถทำการจำแนกประเภทกับตัวอย่างที่ไม่เคยเห็นมาก่อนได้โดยการทดสอบสมมติฐานที่เรียนรู้จากอัลกอริธึม หากตัวอย่างสอดคล้องกับสมมติฐานหลายข้อ สามารถใช้กฎการลงคะแนนเสียงข้างมากได้[ 1 ]

ภูมิหลังทางประวัติศาสตร์

แนวคิดเรื่องพื้นที่เวอร์ชันได้รับการแนะนำโดยมิทเชลในช่วงต้นทศวรรษ 1980 [ 2 ]ในฐานะกรอบการทำงานเพื่อทำความเข้าใจปัญหาพื้นฐานของการเรียนรู้แบบมีผู้กำกับดูแลภายในบริบทของการค้นหาวิธีแก้ปัญหาแม้ว่าวิธีการค้นหา " การกำจัดผู้สมัคร " พื้นฐานที่มาพร้อมกับกรอบการทำงานพื้นที่เวอร์ชันจะไม่ใช่อัลกอริธึมการเรียนรู้ที่เป็นที่นิยม แต่ก็มีการนำไปใช้ในทางปฏิบัติบางอย่างที่ได้รับการพัฒนา (เช่น Sverdlik & Reynolds 1992, Hong & Tsang 1997, Dubois & Quafafou 2002)

ข้อเสียเปรียบที่สำคัญของการเรียนรู้พื้นที่เวอร์ชันคือความไม่สามารถจัดการกับสัญญาณรบกวนได้: ตัวอย่างที่ไม่สอดคล้องกันคู่ใด ๆ สามารถทำให้พื้นที่เวอร์ชันยุบตัวลง กล่าวคือ กลายเป็นว่างเปล่า ทำให้การจำแนกประเภทเป็นไปไม่ได้[ 1 ]วิธีแก้ปัญหาหนึ่งที่เสนอโดย Dubois และ Quafafou คือพื้นที่เวอร์ชันแบบหยาบ[ 3 ]ซึ่งใช้การประมาณค่าตามเซตแบบหยาบเพื่อเรียนรู้สมมติฐานที่แน่นอนและเป็นไปได้ในกรณีที่มีข้อมูลที่ไม่สอดคล้องกัน

ดูเพิ่มเติม

  • การวิเคราะห์แนวคิดเชิงรูปแบบ
  • การเขียนโปรแกรมเชิงตรรกะแบบอุปนัย
  • กรอบแนวคิดเซตแบบ หยาบ (Rough set ) [กรอบแนวคิดเซตแบบหยาบมุ่งเน้นไปที่กรณีที่ความกำกวมเกิดขึ้นจากชุดคุณลักษณะ ที่ไม่สมบูรณ์ กล่าว คือ แนวคิดเป้าหมายไม่สามารถอธิบายได้อย่างชัดเจน เนื่องจากชุดคุณลักษณะที่มีอยู่ไม่สามารถแยกแยะวัตถุที่อยู่ในหมวดหมู่ที่แตกต่างกันได้ กรอบแนวคิดพื้นที่เวอร์ชัน (Version space) มุ่งเน้นไปที่กรณี (การเหนี่ยวนำแบบคลาสสิก) ที่ความกำกวมเกิดขึ้นจากชุดข้อมูล ที่ไม่สมบูรณ์ กล่าวคือ แนวคิดเป้าหมายไม่สามารถอธิบายได้อย่างชัดเจน เนื่องจากข้อมูลที่มีอยู่ไม่สามารถเลือกสมมติฐานได้อย่างเฉพาะเจาะจง แน่นอนว่า ความกำกวมทั้งสองประเภทสามารถเกิดขึ้นได้ในปัญหาการเรียนรู้เดียวกัน]
  • การให้เหตุผลแบบอุปนัย [เกี่ยวกับปัญหาทั่วไปของการอุปนัย]
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Version_space_learning&oldid=1247414772 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การเรียนรู้พื้นที่เวอร์ชัน

การเรียนรู้พื้นที่เวอร์ชันเป็น แนวทาง เชิงตรรกะในการเรียนรู้ของเครื่องโดยเฉพาะการจำแนกแบบไบนารี อัลกอริทึมการเรียนรู้พื้นที่เวอร์ชันจะค้นหาพื้นที่สมมติฐาน ที่กำหนดไว้ล่วงหน้า...

อัลกอริทึมพื้นที่เวอร์ชัน

ในการตั้งค่าที่มีการจัดลำดับความทั่วไปของสมมติฐาน เป็นไปได้ที่จะแสดงพื้นที่เวอร์ชันด้วยสมมติฐานสองชุด: (1) สมมติฐานที่สอดคล้องกัน ที่เฉพาะเจาะจงที่สุด และ (2) สมมติฐานที่สอดคล้องกัน ทั่วไปที่สุด โดยที่ "สอดคล้อง" หมายถึงการตกลงกับข้อมูลที่สังเกตได้

ภูมิหลังทางประวัติศาสตร์

แนวคิดเรื่องพื้นที่เวอร์ชันได้รับการแนะนำโดยมิทเชลในช่วงต้นทศวรรษ 1980 [ 2 ] ในฐานะกรอบการทำงานเพื่อทำความเข้าใจปัญหาพื้นฐานของการเรียนรู้แบบมีผู้กำกับดูแลภายในบริบทของ การค้นหาวิธีแก้ปัญหา แม้ว่าวิธีการค้นหา " การกำจัดผู้สมัคร "...

ดูเพิ่มเติม

การวิเคราะห์แนวคิดเชิงรูปแบบ การเขียนโปรแกรมเชิงตรรกะแบบอุปนัย กรอบแนวคิดเซตแบบ หยาบ (Rough set ) [กรอบแนวคิดเซตแบบหยาบมุ่งเน้นไปที่กรณีที่ความกำกวมเกิดขึ้นจาก ชุดคุณลักษณะ ที่ไม่สมบูรณ์ กล่าว คือ แนวคิดเป้าหมายไม่สามารถอธิบายได้อย่างชัดเจน...