กลับไปหน้าบทความ

อ่าน 7 นาที

แบบจำลองการจำแนก

แบบจำลองจำแนก (Discriminative models ) หรือ ที่เรียกว่าแบบจำลองเงื่อนไข (Conditional models ) เป็นแบบจำลองประเภทหนึ่งที่ใช้บ่อยในการจำแนกประเภทในการเรียนรู้ของเครื่อง (Machine...

แบบจำลองการจำแนก

แบบจำลองจำแนก (Discriminative models ) หรือ ที่เรียกว่าแบบจำลองเงื่อนไข (Conditional models ) เป็นแบบจำลองประเภทหนึ่งที่ใช้บ่อยในการจำแนกประเภทในการเรียนรู้ของเครื่อง (Machine learning ) แบบจำลองเหล่านี้มักจะจำลองการแจกแจงเงื่อนไข P(Y∣X) หรือเรียนรู้กฎการตัดสินใจโดยตรงที่แมปอินพุต X ไปยังเอาต์พุต Y แบบจำลองจำแนกมักใช้สำหรับการจำแนกประเภทและการถดถอย (Regression)โดยมีเป้าหมายหลักคือการทำนายข้อมูลใหม่ได้อย่างแม่นยำ โดยทั่วไปจะใช้ในการแก้ ปัญหา การจำแนกประเภทแบบไบนารีเช่น การกำหนดป้ายกำกับ เช่น ผ่าน/ไม่ผ่าน ชนะ/แพ้ มีชีวิต/ตาย หรือ สุขภาพดี/ป่วย ให้กับจุดข้อมูลที่มีอยู่ แบบจำลองจำแนกมักได้รับการฝึกฝนเพื่อแยกคลาสหรือเพื่อลดข้อผิดพลาดในการทำนายภายใต้ฟังก์ชันการสูญเสีย ที่เลือกไว้ มักจะถูกเปรียบเทียบกับแบบจำลองสร้าง (Generative models ) ซึ่งมีเป้าหมายเพื่อจำลองวิธีการสร้างข้อมูลและสามารถใช้เพื่อสุ่มตัวอย่างข้อมูลใหม่ได้

แบบจำลองเชิงจำแนกมีหลายประเภท ได้แก่การถดถอยโลจิสติก (LR), ฟิลด์สุ่มแบบมีเงื่อนไข (CRF), ต้นไม้ตัดสินใจและอื่นๆ อีกมากมาย

คำนิยาม

แตกต่างจากการสร้างแบบจำลองเชิงกำเนิด (generative modelling) ซึ่งศึกษาความน่าจะเป็นร่วมกัน การสร้างแบบจำลองเชิงจำแนก ( discriminative modeling) ศึกษาหรือแมปตัวแปรที่ไม่สามารถสังเกตได้ (เป้าหมาย) ไปยังป้ายกำกับคลาสที่ขึ้นอยู่กับตัวแปรที่สังเกตได้ (ตัวอย่างการฝึกอบรม) ตัวอย่างเช่น ในการจดจำวัตถุ เป้าหมายมักจะเป็นเวกเตอร์ของพิกเซลดิบ (หรือคุณลักษณะที่สกัดจากพิกเซลดิบของภาพ) ภายในกรอบงานเชิงความน่าจะเป็น สิ่งนี้ทำได้โดยการสร้างแบบจำลองการกระจายความน่าจะเป็นแบบมีเงื่อนไขซึ่งสามารถใช้สำหรับการทำนายจากเป้าหมาย โปรดทราบว่ายังคงมีความแตกต่างระหว่างแบบจำลองแบบมีเงื่อนไขและแบบจำลองเชิงจำแนก แม้ว่าส่วนใหญ่มักจะถูกจัดประเภทเป็นแบบจำลองเชิงจำแนกก็ตาม

แบบจำลองการจำแนกบริสุทธิ์เทียบกับแบบจำลองแบบมีเงื่อนไข

แบบจำลองเงื่อนไข จะจำลอง การกระจายความน่าจะเป็นแบบมีเงื่อนไขในขณะที่แบบจำลองจำแนกแบบดั้งเดิมมีเป้าหมายเพื่อปรับให้เหมาะสมกับการแมปอินพุตไปรอบๆ ตัวอย่างที่ฝึกฝนที่คล้ายคลึงกันมากที่สุด[ 1 ]

เปรียบเทียบกับโมเดลเชิงกำเนิด

ในการจำแนกประเภททางสถิติมีแนวทางหลักสองแนวทาง ได้แก่ แนวทางแบบ สร้าง (generative approach) และ แนวทางแบบ จำแนก (discriminative approach) แนวทางเหล่านี้คำนวณตัวจำแนกประเภทโดยใช้วิธีการที่แตกต่างกัน โดยมีความแตกต่างกันในระดับของการสร้างแบบจำลองทางสถิติคำศัพท์ไม่สอดคล้องกัน[ a ]แต่สามารถแยกประเภทหลักได้สามประเภท:

  1. แบบจำลองเชิงกำเนิด (Generative model) คือแบบจำลองทางสถิติของการกระจายความน่าจะเป็นร่วม บนตัวแปรที่สังเกต ได้ Xและตัวแปรเป้าหมายY ที่กำหนดให้ แบบจำลองเชิงกำเนิดสามารถใช้เพื่อ "สร้าง" ตัวอย่างแบบสุ่ม ( ผลลัพธ์ ) ของการสังเกตxได้
  2. แบบจำลองจำแนก (Discriminative model)คือแบบจำลองความน่าจะเป็นแบบมีเงื่อนไข ของตัวแปรเป้าหมายYเมื่อกำหนดค่าสังเกตx มาแล้ว แบบจำลองนี้สามารถใช้เพื่อ "จำแนก" ค่าของตัวแปรเป้าหมายYเมื่อกำหนดค่าสังเกตx มาแล้ว ได้
  3. ตัวจำแนกที่คำนวณโดยไม่ใช้แบบจำลองความน่าจะเป็นนั้น มักถูกเรียกอย่างไม่เป็นทางการว่า "ตัวจำแนกแบบแยกแยะ" (discriminative)

การแบ่งแยกประเภทระหว่างสองประเภทหลังนี้ไม่ได้มีการระบุไว้อย่างสม่ำเสมอ

การแบ่งประเภทอีกแบบหนึ่งกำหนดสิ่งเหล่านี้อย่างสมมาตรดังนี้:

  • แบบ จำลอง เชิงกำเนิด (Generative model) คือแบบจำลองของความน่าจะเป็นแบบมีเงื่อนไขของตัวแปรสังเกตได้Xเมื่อกำหนดค่าเป้าหมายy มาให้ ในเชิงสัญลักษณ์
  • แบบ จำลอง จำแนก (Discriminative model) คือแบบจำลองของความน่าจะเป็นแบบมีเงื่อนไขของเป้าหมายYเมื่อกำหนดค่าสังเกตx มาให้ ในเชิงสัญลักษณ์

ไม่ว่าคำจำกัดความที่แม่นยำจะเป็นอย่างไร คำศัพท์นี้ก็ถือว่าถูกต้องตามรัฐธรรมนูญ เพราะแบบจำลองเชิงกำเนิดสามารถใช้เพื่อ "สร้าง" ตัวอย่างแบบสุ่ม ( ผลลัพธ์ ) ได้ ไม่ว่าจะเป็นการสังเกตและเป้าหมายหรือการสังเกตxเมื่อกำหนดค่าเป้าหมายy ในขณะที่แบบจำลองเชิงจำแนกหรือตัวจำแนกเชิงจำแนก (โดยไม่ต้องใช้แบบจำลอง) สามารถใช้เพื่อ "จำแนก" ค่า ของตัวแปรเป้าหมายYเมื่อกำหนดการสังเกตx

ความแตกต่างในแนวทางปฏิบัติ

สมมติว่าเราได้รับป้ายกำกับคลาส (การจำแนกประเภท) และตัวแปรคุณลักษณะเป็นตัวอย่างสำหรับการฝึกอบรม

แบบจำลองเชิงกำเนิดจะรับค่าความน่าจะเป็นร่วมโดยที่คือค่าป้อนเข้า และคือป้ายกำกับ และทำนายป้ายกำกับที่เป็นไปได้มากที่สุดสำหรับตัวแปรที่ไม่ทราบค่าโดยใช้ทฤษฎีบทของเบย์

แบบจำลองจำแนก (Discriminative models) ต่างจากแบบจำลองสร้าง (Generative models ) ตรงที่ไม่สามารถสร้างตัวอย่างจากผลรวมของการแจกแจงตัวแปรที่สังเกตได้และตัวแปรเป้าหมายได้ อย่างไรก็ตาม สำหรับงานต่างๆ เช่นการจำแนกประเภทและการถดถอยซึ่งไม่จำเป็นต้องใช้ผลรวมของการแจกแจง แบบจำลองจำแนกอาจให้ประสิทธิภาพที่ดีกว่า (ส่วนหนึ่งเป็นเพราะมีตัวแปรที่ต้องคำนวณน้อยกว่า) ในทางกลับกัน แบบจำลองสร้างมักมีความยืดหยุ่นมากกว่าแบบจำลองจำแนกในการแสดงความสัมพันธ์ในงานการเรียนรู้ที่ซับซ้อน นอกจากนี้ แบบจำลองจำแนกส่วนใหญ่เป็นแบบมีผู้กำกับดูแล โดยธรรมชาติ และไม่สามารถรองรับการเรียนรู้แบบไม่มีผู้กำกับดูแลได้ ง่าย รายละเอียดเฉพาะของแอปพลิเคชันจะเป็นตัวกำหนดความเหมาะสมในการเลือกใช้แบบจำลองจำแนกหรือแบบจำลองสร้างในท้ายที่สุด

แบบจำลองจำแนกและแบบจำลองสร้างยังแตกต่างกันในการนำเสนอความเป็นไปได้ภายหลังเพื่อรักษาการสูญเสียที่คาดหวังให้น้อยที่สุด ควรลดการจำแนกผลลัพธ์ผิดพลาดให้น้อยที่สุด ในแบบจำลองจำแนก ความน่าจะเป็นภายหลังจะถูกอนุมานจากแบบจำลองพาราเมตริก โดยที่พารามิเตอร์มาจากข้อมูลการฝึกอบรม จุดประมาณค่าของพารามิเตอร์ได้มาจากการเพิ่มค่าความน่าจะเป็นสูงสุดหรือการคำนวณการกระจายตัวเหนือพารามิเตอร์ ในทางกลับกัน เนื่องจากแบบจำลองสร้างมุ่งเน้นไปที่ความน่าจะเป็นร่วม ความเป็นไปได้ภายหลังของคลาสจึงถูกพิจารณาในทฤษฎีบทของเบย์สซึ่งคือ

.

ข้อดีและข้อเสียในการนำไปใช้

ในการทดลองซ้ำๆ ที่ใช้การถดถอยโลจิสติกและเบย์สแบบง่ายสำหรับโมเดลต่างๆ ในงานจำแนกแบบไบนารี การเรียนรู้แบบจำแนกให้ผลลัพธ์ข้อผิดพลาดเชิงอะซิมโทติกที่ต่ำกว่า ในขณะที่การเรียนรู้แบบสร้างให้ผลลัพธ์ข้อผิดพลาดเชิงอะซิมโทติกที่สูงกว่าและเร็วกว่า อย่างไรก็ตาม ในงานร่วมของ Ulusoy และ Bishop เรื่อง การเปรียบเทียบเทคนิคการสร้างและการจำแนกสำหรับการตรวจจับและการจำแนกวัตถุพวกเขาระบุว่าข้อความข้างต้นเป็นจริงเฉพาะเมื่อโมเดลนั้นเหมาะสมกับข้อมูล (กล่าวคือ การกระจายข้อมูลได้รับการจำลองอย่างถูกต้องโดยโมเดลแบบสร้าง)

ข้อดี

ข้อดีที่สำคัญของการใช้แบบจำลองจำแนกประเภทมีดังนี้:

  • ความแม่นยำที่สูงขึ้น มักนำไปสู่ผลการเรียนรู้ที่ดีขึ้น
  • ช่วยให้การป้อนข้อมูลง่ายขึ้นและนำเสนอแนวทางที่ตรงไปตรงมา
  • ประหยัดทรัพยากรในการคำนวณ
  • สร้างข้อผิดพลาดเชิงอะซิมโทติกที่ต่ำกว่า

เมื่อเปรียบเทียบกับข้อดีของการใช้แบบจำลองเชิงกำเนิด:

  • พิจารณาข้อมูลทั้งหมด ซึ่งอาจส่งผลให้การประมวลผลช้าลง ซึ่งเป็นข้อเสีย
  • ต้องการตัวอย่างการฝึกอบรมน้อยลง
  • กรอบการทำงานที่ยืดหยุ่นซึ่งสามารถทำงานร่วมกับความต้องการอื่นๆ ของแอปพลิเคชันได้อย่างง่ายดาย
ข้อเสีย
  • วิธีการฝึกอบรมมักต้องใช้เทคนิคการหาค่าเหมาะสมที่สุดเชิงตัวเลขหลายวิธี
  • ในทำนองเดียวกัน ตามคำนิยามแล้ว แบบจำลองการจำแนกจะต้องใช้การผสมผสานของงานย่อยหลายอย่างเพื่อแก้ปัญหาที่ซับซ้อนในโลกแห่งความเป็นจริง

วิธีการสร้างแบบจำลองจำแนกประเภททั่วไป

แนวทางต่อไปนี้ขึ้นอยู่กับสมมติฐานว่าได้รับชุดข้อมูลการฝึกอบรมโดยที่เป็นผลลัพธ์ที่สอดคล้องกันสำหรับอินพุต[ 2 ]

ตัวจำแนกเชิงเส้น

เราตั้งใจที่จะใช้ฟังก์ชันนี้เพื่อจำลองพฤติกรรมที่เราสังเกตได้จากชุดข้อมูลฝึกฝนโดยใช้ วิธี การจำแนกเชิงเส้นโดยใช้เวกเตอร์คุณลักษณะร่วมฟังก์ชันการตัดสินใจจะถูกกำหนดดังนี้:

ตามการตีความของ Memisevic [ 2 ] ซึ่งก็คือคำนวณคะแนนที่วัดความเข้ากันได้ของอินพุตกับเอาต์พุตที่เป็นไปได้จากนั้นจึงกำหนดคลาสที่มีคะแนนสูงสุด

การถดถอยโลจิสติก (LR)

เนื่องจากฟังก์ชันความสูญเสีย 0-1เป็นฟังก์ชันที่ใช้กันทั่วไปในทฤษฎีการตัดสินใจการแจกแจงความน่าจะ เป็นแบบมีเงื่อนไข โดยที่เป็นเวกเตอร์พารามิเตอร์สำหรับการปรับข้อมูลการฝึกอบรมให้เหมาะสม สามารถนำมาพิจารณาใหม่ได้ดังต่อไปนี้สำหรับแบบจำลองการถดถอยโลจิสติกส์:

, กับ

สมการข้างต้นแสดงถึงการถดถอยโลจิสติกส์โปรดสังเกตว่าความแตกต่างที่สำคัญระหว่างแบบจำลองต่างๆ คือวิธีการนำเสนอความน่าจะเป็นภายหลัง ความน่าจะเป็นภายหลังนั้นได้มาจากการอนุมานจากแบบจำลองพาราเมตริก จากนั้นเราสามารถเพิ่มค่าพาราเมตริกให้สูงสุดได้โดยใช้สมการต่อไปนี้:

นอกจากนี้ ยังสามารถใช้สมการการสูญเสียแบบลอการิทึมด้านล่างนี้แทนได้:

เนื่องจากฟังก์ชันความสูญเสียแบบลอการิทึมสามารถหาอนุพันธ์ได้ จึงสามารถใช้วิธีการหาอนุพันธ์ตามเกรเดียนต์เพื่อหาค่าที่เหมาะสมที่สุดของแบบจำลองได้ รับประกันว่าจะได้ค่าที่เหมาะสมที่สุดทั่วโลกเนื่องจากฟังก์ชันเป้าหมายเป็นฟังก์ชันนูน เกรเดียนต์ของความน่าจะเป็นแบบลอการิทึมแสดงได้ดังนี้:

ความคาดหวังของ. อยู่ ที่ไหน

วิธีการข้างต้นจะช่วยให้การคำนวณมีประสิทธิภาพมากขึ้นสำหรับจำนวนการจำแนกประเภทที่ค่อนข้างน้อย

วัตถุประสงค์การฝึกอบรมและการเพิ่มประสิทธิภาพในการใช้งาน

เนื่องจากวิธีการสร้างแบบจำลองทั้งสองแบบต่างก็มีข้อดีและข้อเสีย การผสมผสานทั้งสองแนวทางจึงเป็นการสร้างแบบจำลองที่ดีในทางปฏิบัติ ตัวอย่างเช่น ในบทความของ Marras เรื่องA Joint Discriminative Generative Model for Deformable Model Construction and Classification [ 3 ] เขาและผู้เขียนร่วมได้ประยุกต์ใช้การผสมผสานของการสร้างแบบจำลองสองแบบในการจำแนกใบหน้าของแบบจำลอง และได้รับความแม่นยำสูงกว่าวิธีการแบบดั้งเดิม

Similarly, Kelm[4] also proposed the combination of two modelings for pixel classification in his article Combining Generative and Discriminative Methods for Pixel Classification with Multi-Conditional Learning.

During the process of extracting the discriminative features prior to the clustering, Principal component analysis (PCA), though commonly used, is not a necessarily discriminative approach. In contrast, LDA is a discriminative one.[5]Linear discriminant analysis (LDA), provides an efficient way of eliminating the disadvantage we list above. As we know, the discriminative model needs a combination of multiple subtasks before classification, and LDA provides appropriate solution towards this problem by reducing dimension.

  • Empirical risk minimization
  • Common loss functions (log loss, hinge loss, squared loss)
  • Regularization (L1/L2)
  • Optimization methods (gradient descent family)

Families and types

Examples of discriminative models include:

See also

Notes

  1. ^Three leading sources, Ng & Jordan 2002, Jebara 2004, and Mitchell 2015, give different divisions and definitions.

แหล่งที่มา

  • เจบารา, โทนี่ (2004). การเรียนรู้ของเครื่องจักร: แบบจำแนกและแบบสร้าง . ชุดหนังสือนานาชาติของสปริงเกอร์ด้านวิศวกรรมและวิทยาศาสตร์คอมพิวเตอร์. คลูเวอร์ อคาเดมิก (สปริงเกอร์). ISBN 978-1-4020-7647-3.
  • Mitchell, Tom M. (2015). "3. ตัวจำแนกแบบสร้างและแบบจำแนก: Naive Bayes และ Logistic Regression" (PDF) . การเรียนรู้ของเครื่อง .
  • Ng, Andrew Y. ; Jordan, Michael I. (2002). "เกี่ยวกับตัวจำแนกแบบแยกแยะและแบบสร้าง: การเปรียบเทียบการถดถอยโลจิสติกและเบย์สแบบง่าย" (PDF) . ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท .
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Discriminative_model&oldid=1359952574 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แบบจำลองการจำแนก

แบบจำลองจำแนก (Discriminative models ) หรือ ที่เรียกว่าแบบจำลองเงื่อนไข (Conditional models ) เป็นแบบจำลองประเภทหนึ่งที่ใช้บ่อยในการจำแนกประเภทในการเรียนรู้ของเครื่อง (Machine...

คำนิยาม

แตกต่างจากการสร้างแบบจำลองเชิงกำเนิด (generative modelling) ซึ่งศึกษา ความน่าจะเป็นร่วมกัน การสร้างแบบจำลองเชิงจำแนก ( discriminative modeling) ศึกษาหรือแมปตัวแปรที่ไม่สามารถสังเกตได้ (เป้าหมาย) ไปยังป้ายกำกับคลาสที่ขึ้นอยู่กับตัวแปรที่สังเกตได้...

แบบจำลองการจำแนกบริสุทธิ์เทียบกับแบบจำลองแบบมีเงื่อนไข

แบบ จำลองเงื่อนไข จะจำลอง การกระจายความน่าจะ เป็นแบบมีเงื่อนไขในขณะที่แบบจำลองจำแนกแบบดั้งเดิมมีเป้าหมายเพื่อปรับให้เหมาะสมกับการแมปอินพุตไปรอบๆ ตัวอย่างที่ฝึกฝนที่คล้ายคลึงกันมากที่สุด [ 1 ]

เปรียบเทียบกับโมเดลเชิงกำเนิด

ใน การจำแนกประเภททางสถิติ มีแนวทางหลักสองแนวทาง ได้แก่ แนวทางแบบ สร้าง (generative approach) และ แนวทางแบบ จำแนก (discriminative approach) แนวทางเหล่านี้คำนวณ ตัวจำแนก ประเภทโดยใช้วิธีการที่แตกต่างกัน โดยมีความแตกต่างกันในระดับของ การสร้างแบบจำลองทางสถิติ...