กลับไปหน้าบทความ

อ่าน 6 นาที

การเรียนรู้ภายใต้การดูแล

ใน การเรียนรู้ ของ เครื่อง การเรียนรู้แบบมีผู้กำกับดูแล ( SL ) เป็นรูปแบบหนึ่งของ การเรียนรู้ของเครื่อง...

การเรียนรู้ภายใต้การดูแล

ในการเรียนรู้แบบมีผู้กำกับดูแล ข้อมูลฝึกฝนจะถูกติดป้ายกำกับด้วยคำตอบที่คาดหวังไว้ ในขณะที่การเรียนรู้แบบไม่มีผู้กำกับดูแลโมเดลจะระบุรูปแบบหรือโครงสร้างในข้อมูลที่ไม่มีป้ายกำกับ

ใน การเรียนรู้ ของเครื่องการเรียนรู้แบบมีผู้กำกับดูแล ( SL ) เป็นรูปแบบหนึ่งของการเรียนรู้ของเครื่องที่อัลกอริทึมเรียนรู้ที่จะจับคู่ข้อมูลอินพุตกับเอาต์พุตเฉพาะโดยอาศัยคู่ข้อมูลอินพุต-เอาต์พุตตัวอย่าง กระบวนการนี้เกี่ยวข้องกับการฝึกแบบจำลองทางสถิติโดยใช้ข้อมูลที่มีป้ายกำกับ ซึ่งหมายความว่าข้อมูลอินพุตแต่ละส่วนจะได้รับเอาต์พุตที่ถูกต้อง คำว่า "มีผู้กำกับดูแล" หมายถึงบทบาทของครูหรือผู้กำกับดูแลที่ให้ข้อมูลการฝึกอบรมนี้ เพื่อชี้นำอัลกอริทึมไปสู่การทำนายที่ถูกต้อง[ 1 ]ตัวอย่างเช่น หากคุณต้องการให้แบบจำลองระบุแมวในภาพ การเรียนรู้แบบมีผู้กำกับดูแลจะเกี่ยวข้องกับการป้อนภาพแมวจำนวนมาก (อินพุต) ที่มีป้ายกำกับ "แมว" อย่างชัดเจน (เอาต์พุต)

เป้าหมายของการเรียนรู้แบบมีผู้กำกับดูแลคือการที่แบบจำลองที่ได้รับการฝึกฝนจะสามารถทำนายผลลัพธ์สำหรับข้อมูลใหม่ที่ไม่เคยเห็นมาก่อนได้อย่างแม่นยำ[ 2 ]ซึ่งต้องอาศัยอัลกอริทึมในการสรุปผลจากตัวอย่างการฝึกอบรมอย่างมีประสิทธิภาพ ซึ่งเป็นคุณภาพที่วัดได้จากข้อผิดพลาดในการสรุปผลการเรียนรู้แบบมีผู้กำกับดูแลมักใช้สำหรับงานต่างๆ เช่นการจำแนกประเภท (การทำนายหมวดหมู่ เช่น สแปมหรือไม่สแปม) และการถดถอย (การทำนายค่าต่อเนื่อง เช่น ราคาบ้าน)

ขั้นตอนที่ต้องปฏิบัติตาม

ในการแก้ปัญหาการเรียนรู้แบบมีผู้กำกับดูแลที่กำหนดไว้ จะต้องดำเนินการตามขั้นตอนต่อไปนี้:

  1. กำหนดประเภทของตัวอย่างการฝึกอบรม ก่อนที่จะทำสิ่งอื่นใด ผู้ใช้ควรตัดสินใจว่าข้อมูลประเภทใดที่จะใช้เป็นชุดข้อมูลสำหรับการฝึกอบรม ตัวอย่างเช่น ในกรณีของการวิเคราะห์ลายมืออาจเป็นตัวอักษรที่เขียนด้วยลายมือเพียงตัวเดียว คำที่เขียนด้วยลายมือทั้งคำ ประโยคที่เขียนด้วยลายมือทั้งประโยค หรือย่อหน้าที่เขียนด้วยลายมือทั้งย่อหน้า
  2. รวบรวมชุดข้อมูลฝึกฝน ชุดข้อมูลฝึกฝนต้องเป็นตัวแทนของการใช้งานฟังก์ชันในโลกแห่งความเป็นจริง ดังนั้นจึงมีการรวบรวมชุดข้อมูลป้อนเข้าพร้อมกับข้อมูลส่งออกที่สอดคล้องกัน ไม่ว่าจะเป็นจากผู้เชี่ยวชาญหรือจากการวัดผล
  3. กำหนดรูป แบบการแสดง คุณลักษณะ ของอินพุต สำหรับฟังก์ชันที่เรียนรู้ ความแม่นยำของฟังก์ชันที่เรียนรู้ขึ้นอยู่กับวิธีการแสดงวัตถุอินพุตเป็นอย่างมาก โดยทั่วไป วัตถุอินพุตจะถูกแปลงเป็นเวกเตอร์คุณลักษณะซึ่งประกอบด้วยคุณลักษณะจำนวนหนึ่งที่อธิบายถึงวัตถุนั้น จำนวนคุณลักษณะไม่ควรมากเกินไป เนื่องจากปัญหาความซับซ้อนของมิติแต่ควรมีข้อมูลเพียงพอที่จะทำนายผลลัพธ์ได้อย่างแม่นยำ
  4. กำหนดโครงสร้างของฟังก์ชันที่เรียนรู้และอัลกอริธึมการเรียนรู้ที่เกี่ยวข้อง ตัวอย่างเช่น อาจเลือกใช้เครื่องสนับสนุนเวกเตอร์ (Support Vector Machines)หรือต้นไม้ตัดสินใจ (Decision Trees )
  5. ออกแบบให้เสร็จสมบูรณ์ เรียกใช้อัลกอริธึมการเรียนรู้กับชุดข้อมูลฝึกฝนที่รวบรวมไว้ อัลกอริธึมการเรียนรู้แบบมีผู้กำกับดูแลบางตัวต้องการให้ผู้ใช้กำหนดพารามิเตอร์ควบคุม บางอย่าง พารามิเตอร์เหล่านี้สามารถปรับได้โดยการเพิ่มประสิทธิภาพบนชุดย่อย (เรียกว่าชุดข้อมูลตรวจสอบ ) ของชุดข้อมูลฝึกฝน หรือผ่าน การตรวจ สอบแบบไขว้
  6. ประเมินความถูกต้องของฟังก์ชันที่เรียนรู้ หลังจากปรับพารามิเตอร์และทำการเรียนรู้แล้ว ควรวัดประสิทธิภาพของฟังก์ชันที่ได้บนชุดข้อมูลทดสอบที่แยกต่างหากจากชุดข้อมูลฝึกฝน

การเลือกอัลกอริทึม

มีอัลกอริธึมการเรียนรู้แบบมีผู้กำกับดูแลให้เลือกมากมาย แต่ละแบบมีจุดแข็งและจุดอ่อนแตกต่างกัน ไม่มีอัลกอริธึมการเรียนรู้ใดที่ทำงานได้ดีที่สุดกับปัญหาการเรียนรู้แบบมีผู้กำกับดูแลทุกประเภท (ดูทฤษฎีบท "ไม่มีอาหารกลางวันฟรี" )

ในการเรียนรู้แบบมีผู้กำกับดูแล มีประเด็นสำคัญสี่ประการที่ต้องพิจารณา:

การแลกเปลี่ยนระหว่างอคติและความแปรปรวน

ประเด็นแรกคือการแลกเปลี่ยนระหว่างอคติและความแปรปรวน[ 3 ]ลองนึกภาพว่าเรามีชุดข้อมูลฝึกฝนที่แตกต่างกันหลายชุด แต่ดีเท่ากัน อัลกอริทึมการเรียนรู้จะมีอคติสำหรับอินพุตเฉพาะหากเมื่อฝึกฝนกับชุดข้อมูลแต่ละชุดแล้ว อัลกอริทึมจะทำนายเอาต์พุตที่ถูกต้องผิดพลาดอย่างเป็นระบบอัลกอริทึมการเรียนรู้มีความแปรปรวนสูงสำหรับอินพุตเฉพาะหากทำนายค่าเอาต์พุตที่แตกต่างกันเมื่อฝึกฝนกับชุดฝึกฝนที่แตกต่างกัน ข้อผิดพลาดในการทำนายของตัวจำแนกที่เรียนรู้แล้วนั้นเกี่ยวข้องกับผลรวมของอคติและความแปรปรวนของอัลกอริทึมการเรียนรู้[ 4 ]โดยทั่วไปแล้ว จะมีการแลกเปลี่ยนระหว่างอคติและความแปรปรวน อัลกอริทึมการเรียนรู้ที่มีอคติต่ำจะต้อง "ยืดหยุ่น" เพื่อให้สามารถปรับให้เข้ากับข้อมูลได้ดี แต่ถ้าอัลกอริทึมการเรียนรู้มีความยืดหยุ่นมากเกินไป มันจะปรับให้เข้ากับชุดข้อมูลฝึกฝนแต่ละชุดแตกต่างกัน และด้วยเหตุนี้จึงมีความแปรปรวนสูง ลักษณะสำคัญอย่างหนึ่งของวิธีการเรียนรู้แบบมีผู้กำกับดูแลหลายวิธี คือ ความสามารถในการปรับสมดุลระหว่างอคติและความแปรปรวน (ไม่ว่าจะโดยอัตโนมัติหรือโดยการกำหนดพารามิเตอร์อคติ/ความแปรปรวนที่ผู้ใช้สามารถปรับได้)

ความซับซ้อนของฟังก์ชันและปริมาณข้อมูลสำหรับการฝึกฝน

ประเด็นที่สองคือปริมาณข้อมูลฝึกฝนที่มีอยู่เมื่อเทียบกับความซับซ้อนของฟังก์ชัน "จริง" (ฟังก์ชันจำแนกหรือฟังก์ชันถดถอย) หากฟังก์ชันจริงนั้นง่าย อัลกอริทึมการเรียนรู้แบบ "ไม่ยืดหยุ่น" ที่มีอคติสูงและความแปรปรวนต่ำจะสามารถเรียนรู้ได้จากข้อมูลจำนวนเล็กน้อย แต่หากฟังก์ชันจริงมีความซับซ้อนสูง (เช่น เนื่องจากเกี่ยวข้องกับการปฏิสัมพันธ์ที่ซับซ้อนระหว่างคุณลักษณะอินพุตที่แตกต่างกันมากมายและมีพฤติกรรมที่แตกต่างกันในส่วนต่างๆ ของพื้นที่อินพุต) ฟังก์ชันนั้นจะสามารถเรียนรู้ได้ด้วยข้อมูลฝึกฝนจำนวนมากควบคู่กับอัลกอริทึมการเรียนรู้แบบ "ยืดหยุ่น" ที่มีอคติต่ำและความแปรปรวนสูงเท่านั้น

มิติของพื้นที่อินพุต

ประเด็นที่สามคือ มิติของพื้นที่ข้อมูลป้อนเข้า หากเวกเตอร์คุณลักษณะป้อนเข้ามีมิติขนาดใหญ่ การเรียนรู้ฟังก์ชันอาจทำได้ยาก แม้ว่าฟังก์ชันที่แท้จริงจะขึ้นอยู่กับคุณลักษณะเพียงไม่กี่อย่างก็ตาม เนื่องจากมิติ "พิเศษ" จำนวนมากอาจทำให้ขั้นตอนวิธีเรียนรู้สับสนและทำให้มีความแปรปรวนสูง ดังนั้น ข้อมูลป้อนเข้าที่มีมิติขนาดใหญ่จึงมักต้องปรับแต่งตัวจำแนกเพื่อให้มีความแปรปรวนต่ำและมีอคติสูง ในทางปฏิบัติ หากวิศวกรสามารถลบคุณลักษณะที่ไม่เกี่ยวข้องออกจากข้อมูลป้อนเข้าได้ด้วยตนเอง ก็มีแนวโน้มที่จะปรับปรุงความแม่นยำของฟังก์ชันที่เรียนรู้ได้ นอกจากนี้ยังมีอัลกอริทึมการเลือกคุณลักษณะ มากมาย ที่พยายามระบุคุณลักษณะที่เกี่ยวข้องและกำจัดคุณลักษณะที่ไม่เกี่ยวข้อง นี่เป็นตัวอย่างหนึ่งของกลยุทธ์ทั่วไปของการลดมิติซึ่งพยายามแมปข้อมูลป้อนเข้าไปยังพื้นที่ที่มีมิติต่ำกว่าก่อนที่จะเรียกใช้ขั้นตอนวิธีเรียนรู้แบบมีผู้กำกับดูแล

สัญญาณรบกวนในค่าเอาต์พุต

ประเด็นที่สี่คือระดับของสัญญาณรบกวนในค่าเอาต์พุตที่ต้องการ ( ตัวแปรเป้าหมายใน การกำกับดูแล ) หากค่าเอาต์พุตที่ต้องการมักไม่ถูกต้อง (เนื่องจากข้อผิดพลาดของมนุษย์หรือข้อผิดพลาดของเซ็นเซอร์) อัลกอริทึมการเรียนรู้ไม่ควรพยายามหาฟังก์ชันที่ตรงกับตัวอย่างการฝึกอบรมอย่างแม่นยำ การพยายามปรับให้เข้ากับข้อมูลอย่างระมัดระวังมากเกินไปจะนำไปสู่การโอเวอร์ฟิตคุณอาจโอเวอร์ฟิตได้แม้ว่าจะไม่มีข้อผิดพลาดในการวัด (สัญญาณรบกวนแบบสุ่ม) หากฟังก์ชันที่คุณพยายามเรียนรู้นั้นซับซ้อนเกินไปสำหรับแบบจำลองการเรียนรู้ของคุณ ในสถานการณ์เช่นนี้ ส่วนของฟังก์ชันเป้าหมายที่ไม่สามารถสร้างแบบจำลองได้จะ "ทำให้เสียหาย" ข้อมูลการฝึกอบรมของคุณ ปรากฏการณ์นี้เรียกว่าสัญญาณรบกวนแบบกำหนดได้เมื่อมีสัญญาณรบกวนประเภทใดประเภทหนึ่ง ควรเลือกใช้ตัวประมาณค่าที่มีอคติสูงกว่าและค่าความแปรปรวนต่ำกว่า

ในทางปฏิบัติ มีแนวทางหลายประการในการลดสัญญาณรบกวนในค่าเอาต์พุต เช่นการหยุดก่อนกำหนดเพื่อป้องกันการโอเวอร์ฟิตติ้ง รวมถึงการตรวจ จับ และกำจัดตัวอย่างการฝึกอบรมที่มีสัญญาณรบกวนก่อนการฝึกอัลกอริธึมการเรียนรู้แบบมีผู้กำกับดูแล มีอัลกอริธึมหลายตัวที่ระบุตัวอย่างการฝึกอบรมที่มีสัญญาณรบกวน และการกำจัดตัวอย่างการฝึกอบรมที่สงสัยว่ามีสัญญาณรบกวนก่อนการฝึกอบรมได้ลดข้อผิดพลาดในการวางนัยทั่วไป ลง อย่าง มีนัย สำคัญทางสถิติ[ 5 ] [ 6 ]

ปัจจัยอื่นๆ ที่ควรพิจารณา

ปัจจัยอื่นๆ ที่ควรพิจารณาเมื่อเลือกและใช้งานอัลกอริธึมการเรียนรู้ ได้แก่:

เมื่อพิจารณาแอปพลิเคชันใหม่ วิศวกรสามารถเปรียบเทียบอัลกอริธึมการเรียนรู้หลายแบบและทดลองเพื่อหาว่าอัลกอริธึมใดทำงานได้ดีที่สุดกับปัญหาที่กำลังเผชิญอยู่ (ดูการตรวจสอบแบบไขว้ ) การปรับแต่งประสิทธิภาพของอัลกอริธึมการเรียนรู้นั้นอาจใช้เวลานานมาก เมื่อมีทรัพยากรจำกัด การใช้เวลามากขึ้นในการรวบรวมข้อมูลการฝึกอบรมเพิ่มเติมและคุณลักษณะที่มีประโยชน์มากขึ้นมักจะดีกว่าการใช้เวลาเพิ่มเติมในการปรับแต่งอัลกอริธึมการเรียนรู้

อัลกอริทึม

อัลกอริทึมการเรียนรู้ที่ใช้กันอย่างแพร่หลายที่สุด ได้แก่:

อัลกอริทึมการเรียนรู้แบบมีผู้กำกับดูแลทำงานอย่างไร

เมื่อกำหนดชุดตัวอย่างการฝึกฝนในรูปแบบที่เป็นเวกเตอร์คุณลักษณะของตัวอย่างที่ และเป็นป้ายกำกับ (เช่น คลาส) ของมัน อัลกอริทึมการเรียนรู้จะค้นหาฟังก์ชันโดยที่เป็นพื้นที่อินพุตและเป็นพื้นที่เอาต์พุต ฟังก์ชันเป็นสมาชิกของพื้นที่ของฟังก์ชันที่เป็นไปได้ซึ่งโดยทั่วไปเรียกว่าพื้นที่สมมติฐานบางครั้งอาจสะดวกที่จะแสดงโดยใช้ฟังก์ชันการให้คะแนนเช่น ซึ่งกำหนดให้เป็นค่าที่ให้คะแนนสูงสุด: ให้แทนพื้นที่ของฟังก์ชันการให้คะแนน

แม้ว่าและจะเป็นปริภูมิของฟังก์ชันใดๆ ก็ได้ แต่อัลกอริทึมการเรียนรู้จำนวนมากเป็นแบบจำลองความน่าจะเป็น โดยที่จะอยู่ในรูปแบบของแบบจำลองความน่าจะเป็นแบบมีเงื่อนไขหรือจะอยู่ในรูปแบบของแบบจำลองความน่าจะเป็นร่วมตัวอย่างเช่นวิธีเบย์แบบง่ายและวิธีวิเคราะห์จำแนกเชิงเส้นเป็นแบบจำลองความน่าจะเป็นร่วม ในขณะที่การถดถอยโลจิสติกเป็นแบบจำลองความน่าจะเป็นแบบมีเงื่อนไข

มีแนวทางพื้นฐานสองประการในการเลือกหรือ: การลดความเสี่ยงเชิงประจักษ์และการลดความเสี่ยงเชิงโครงสร้าง [ 7 ] การลดความเสี่ยงเชิงประจักษ์จะแสวงหาฟังก์ชันที่เหมาะสมกับข้อมูลการฝึกอบรมมากที่สุด การลดความเสี่ยงเชิงโครงสร้างจะรวมฟังก์ชันการลงโทษที่ควบคุมการแลกเปลี่ยนระหว่างอคติ/ความแปรปรวน

ในทั้งสองกรณี ถือว่าชุดข้อมูลฝึกฝนประกอบด้วยตัวอย่าง คู่ ที่เป็นอิสระและมีการกระจายเหมือนกันเพื่อวัดว่าฟังก์ชันเหมาะสมกับข้อมูลฝึกฝนได้ดีเพียงใด จึง มีการกำหนด ฟังก์ชันความสูญเสียขึ้นสำหรับ ตัวอย่างการฝึกฝนความสูญเสียของการทำนายค่าคือ

ความเสี่ยง ของการทำงานถูกกำหนดให้เป็นการสูญเสียที่คาดการณ์ไว้ซึ่งสามารถประมาณได้จากข้อมูลการฝึกอบรมดังนี้

.

การลดความเสี่ยงเชิงประจักษ์

ในการลดความเสี่ยงเชิงประจักษ์ อัลกอริทึมการเรียนรู้แบบมีผู้กำกับดูแลจะค้นหาฟังก์ชันที่ทำให้ค่าต่ำสุดดังนั้น อัลกอริทึมการเรียนรู้แบบมีผู้กำกับดูแลจึงสามารถสร้างขึ้นได้โดยการใช้อัลกอริทึมการหาค่าเหมาะสมที่สุดเพื่อค้นหาค่า

เมื่อเป็นการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขและฟังก์ชันความสูญเสียคือลอการิทึมลบของความน่าจะเป็นสูงสุด: การ ลดความเสี่ยงเชิงประจักษ์จะเทียบเท่ากับการประมาณค่าความน่าจะเป็นสูงสุด

เมื่อมีฟังก์ชันผู้สมัครจำนวนมาก หรือชุดข้อมูลฝึกฝนมีขนาดไม่ใหญ่พอ การลดความเสี่ยงเชิงประจักษ์จะนำไปสู่ความแปรปรวนสูงและการวางนัยทั่วไปที่ไม่ดี อัลกอริทึมการเรียนรู้สามารถจดจำตัวอย่างการฝึกฝนได้โดยไม่สามารถวางนัยทั่วไปได้ดี (โอเวอร์ฟิตติ้ง)

การลดความเสี่ยงเชิงโครงสร้าง

การลดความเสี่ยงเชิงโครงสร้างมุ่งป้องกันการเกิดภาวะโอเวอร์ฟิตติ้งโดยการรวมเอาบทลงโทษการปรับค่า (regularization penalty ) เข้าไปในการปรับค่าให้เหมาะสม บทลงโทษการปรับค่านี้สามารถมองได้ว่าเป็นการนำหลักการของอ็อกแคม (Occam's razor) มาใช้ ซึ่งให้ความสำคัญกับฟังก์ชันที่เรียบง่ายกว่าฟังก์ชันที่ซับซ้อนกว่า

มีการใช้บทลงโทษที่หลากหลายซึ่งสอดคล้องกับคำจำกัดความของความซับซ้อนที่แตกต่างกัน ตัวอย่างเช่น พิจารณากรณีที่ฟังก์ชันเป็นฟังก์ชันเชิงเส้นในรูปแบบ

.

ค่าปรับลดที่นิยมใช้คือซึ่งเป็นค่ากำลังสอง ของ นอร์มยุคลิดของน้ำหนัก หรือที่รู้จักกันในชื่อนอร์ม นอร์มอื่นๆ ได้แก่นอร์มและ"นอร์ม"ซึ่งเป็นจำนวนของค่าที่ไม่เป็นศูนย์ ค่าปรับลดนี้จะใช้ สัญลักษณ์ แทน

ปัญหาการหาค่าเหมาะสมที่สุดของการเรียนรู้แบบมีผู้กำกับดูแล คือ การหาฟังก์ชันที่ทำให้ค่าต่ำสุด

พารามิเตอร์นี้ควบคุมความสมดุลระหว่างอคติและความแปรปรวน เมื่อค่า มีค่าน้อย จะทำให้ได้การลดความเสี่ยงเชิงประจักษ์โดยมีอคติต่ำและความแปรปรวนสูง เมื่อค่า มีค่ามาก อัลกอริทึมการเรียนรู้จะมีอคติสูงและความแปรปรวนต่ำสามารถเลือกค่า ได้โดยวิธีเชิงประจักษ์ผ่านการตรวจสอบแบบไขว้ (cross-validation )

ค่าปรับความซับซ้อนมีการตีความแบบเบย์เซียนเป็นค่าลบของลอการิทึมของความน่าจะเป็นก่อนหน้าของ, , ซึ่งในกรณีนี้คือความน่าจะเป็นภายหลังของ

การฝึกอบรมเชิงสร้างสรรค์

วิธีการฝึกอบรมที่อธิบายไว้ข้างต้นเป็น วิธี การฝึกอบรมแบบจำแนกเนื่องจากวิธีการเหล่านี้มุ่งหาฟังก์ชันที่สามารถจำแนกความแตกต่างระหว่างค่าเอาต์พุตที่แตกต่างกันได้อย่างดี (ดูแบบจำลองจำแนก ) สำหรับกรณีพิเศษที่เป็นการแจกแจงความน่าจะเป็นร่วมและฟังก์ชันความสูญเสียคือลอการิทึมความน่าจะเป็นลบ อัลกอริทึมการลดความเสี่ยงจะถูกเรียกว่าทำการฝึกอบรมแบบสร้างเนื่องจากสามารถมองได้ว่าเป็นแบบจำลองสร้างที่อธิบายว่าข้อมูลถูกสร้างขึ้นมาได้อย่างไร อัลกอริทึมการฝึกอบรมแบบสร้างมักจะง่ายกว่าและมีประสิทธิภาพในการคำนวณมากกว่าอัลกอริทึมการฝึกอบรมแบบจำแนก ในบางกรณี วิธีแก้ปัญหาสามารถคำนวณได้ในรูปแบบปิด เช่นเดียวกับในวิธีเบย์แบบง่ายและวิธีวิเคราะห์จำแนกเชิงเส้น

การสรุปโดยทั่วไป

แนวโน้มของงานที่จะใช้ทั้งวิธีการแบบมีผู้กำกับดูแลและแบบไม่มีผู้กำกับดูแล ชื่อของงานที่คร่อมขอบเขตของวงกลมนั้นเป็นไปโดยเจตนา แสดงให้เห็นว่าการแบ่งแยกแบบดั้งเดิมของงานสร้างสรรค์จินตนาการ (ด้านซ้าย) ที่ใช้วิธีการแบบไม่มีผู้กำกับดูแลนั้นเริ่มไม่ชัดเจนในรูปแบบการเรียนรู้ในปัจจุบัน

มีหลายวิธีที่สามารถขยายปัญหาการเรียนรู้แบบมีผู้กำกับดูแลมาตรฐานให้เป็นรูปแบบทั่วไปได้:

  • การเรียนรู้แบบกึ่งกำกับดูแลหรือการกำกับดูแลแบบอ่อน : ค่าผลลัพธ์ที่ต้องการจะถูกกำหนดไว้สำหรับข้อมูลฝึกฝนเพียงบางส่วนเท่านั้น ข้อมูลที่เหลือจะไม่มีป้ายกำกับหรือมีป้ายกำกับที่ไม่แม่นยำ
  • การเรียนรู้เชิงรุก : แทนที่จะสมมติว่าตัวอย่างการฝึกอบรมทั้งหมดมีให้ตั้งแต่เริ่มต้น อัลกอริทึมการเรียนรู้เชิงรุกจะรวบรวมตัวอย่างใหม่แบบโต้ตอบ โดยทั่วไปจะทำโดยการสอบถามผู้ใช้ที่เป็นมนุษย์ บ่อยครั้งที่การสอบถามนั้นอิงจากข้อมูลที่ไม่มีป้ายกำกับ ซึ่งเป็นสถานการณ์ที่ผสมผสานการเรียนรู้แบบกึ่งกำกับดูแลเข้ากับการเรียนรู้เชิงรุก
  • การทำนายแบบมีโครงสร้าง : เมื่อค่าผลลัพธ์ที่ต้องการเป็นวัตถุที่ซับซ้อน เช่นแผนผังการวิเคราะห์ไวยากรณ์หรือกราฟที่มีป้ายกำกับ วิธีการมาตรฐานจะต้องได้รับการปรับปรุงเพิ่มเติม
  • การเรียนรู้วิธีจัดอันดับ : เมื่อข้อมูลนำเข้าเป็นชุดของวัตถุ และผลลัพธ์ที่ต้องการคือการจัดอันดับของวัตถุเหล่านั้น วิธีการมาตรฐานจะต้องได้รับการปรับปรุงเพิ่มเติมอีกครั้ง

แนวทางและอัลกอริธึม

แอปพลิเคชัน

ประเด็นทั่วไป

ดูเพิ่มเติม

  • ซอฟต์แวร์โอเพนซอร์สสำหรับการเรียนรู้ของเครื่อง (MLOSS)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Supervised_learning&oldid=1351366121 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การเรียนรู้ภายใต้การดูแล

ใน การเรียนรู้ ของ เครื่อง การเรียนรู้แบบมีผู้กำกับดูแล ( SL ) เป็นรูปแบบหนึ่งของ การเรียนรู้ของเครื่อง...

ขั้นตอนที่ต้องปฏิบัติตาม

ในการแก้ปัญหาการเรียนรู้แบบมีผู้กำกับดูแลที่กำหนดไว้ จะต้องดำเนินการตามขั้นตอนต่อไปนี้:

การเลือกอัลกอริทึม

มีอัลกอริธึมการเรียนรู้แบบมีผู้กำกับดูแลให้เลือกมากมาย แต่ละแบบมีจุดแข็งและจุดอ่อนแตกต่างกัน ไม่มีอัลกอริธึมการเรียนรู้ใดที่ทำงานได้ดีที่สุดกับปัญหาการเรียนรู้แบบมีผู้กำกับดูแลทุกประเภท (ดู ทฤษฎีบท "ไม่มีอาหารกลางวันฟรี" )

การแลกเปลี่ยนระหว่างอคติและความแปรปรวน

ประเด็นแรกคือการแลกเปลี่ยนระหว่าง อคติ และความ แปรปรวน [ 3 ] ลองนึกภาพว่าเรามีชุดข้อมูลฝึกฝนที่แตกต่างกันหลายชุด แต่ดีเท่ากัน อัลกอริทึมการเรียนรู้จะมีอคติสำหรับอินพุตเฉพาะหากเมื่อฝึกฝนกับชุดข้อมูลแต่ละชุดแล้ว...