อ่าน 25 นาที

ความเป็นธรรม (การเรียนรู้ของเครื่องจักร)

ความเป็นธรรมในด้านการเรียนรู้ของเครื่อง (ML) หมายถึงความพยายามต่างๆ ในการแก้ไขอคติของอัลกอริทึมในกระบวนการตัดสินใจอัตโนมัติโดยใช้แบบจำลอง ML...

ความเป็นธรรม (การเรียนรู้ของเครื่องจักร)

( เรียนรู้วิธีและเวลาในการลบข้อความนี้ )

ความเป็นธรรมในด้านการเรียนรู้ของเครื่อง (ML) หมายถึงความพยายามต่างๆ ในการแก้ไขอคติของอัลกอริทึมในกระบวนการตัดสินใจอัตโนมัติโดยใช้แบบจำลอง ML การตัดสินใจที่ทำโดยแบบจำลองดังกล่าวหลังจากกระบวนการเรียนรู้ อาจถือว่าไม่เป็นธรรมหากอิงจากตัวแปรที่ถือว่ามีความอ่อนไหว (เช่น เพศ เชื้อชาติ รสนิยมทางเพศ หรือความพิการ)

เช่นเดียวกับ แนวคิด ทางจริยธรรม หลายๆ เรื่อง นิยามของความยุติธรรมและความลำเอียงอาจเป็นเรื่องที่ถกเถียงกันได้ โดยทั่วไปแล้ว ความยุติธรรมและความลำเอียงถือว่ามีความเกี่ยวข้องเมื่อกระบวนการตัดสินใจส่งผลกระทบต่อชีวิตของผู้คน

เนื่องจากการตัดสินใจโดยเครื่องจักรอาจได้รับอิทธิพลจากปัจจัยหลายประการ จึงอาจถูกมองว่าไม่ยุติธรรมต่อกลุ่มหรือบุคคลบางกลุ่ม ตัวอย่างเช่น วิธีที่ เว็บไซต์ โซเชียลมีเดียส่งข่าวสารส่วนบุคคลให้กับผู้บริโภค

บริบท

การอภิปรายเกี่ยวกับความยุติธรรมในการเรียนรู้ของเครื่องจักรเป็นหัวข้อที่ค่อนข้างใหม่ ตั้งแต่ปี 2016 เป็นต้นมา มีการวิจัยในหัวข้อนี้เพิ่มขึ้นอย่างมาก^{[ 1 ]}การเพิ่มขึ้นนี้อาจเป็นผลมาจากรายงานที่มีอิทธิพลของProPublicaที่อ้างว่า ซอฟต์แวร์ COMPASซึ่งใช้กันอย่างแพร่หลายในศาลสหรัฐฯ เพื่อทำนายการกระทำผิดซ้ำมีอคติทางเชื้อชาติ^{[ 2 ]}หัวข้อหนึ่งของการวิจัยและการอภิปรายคือคำจำกัดความของความยุติธรรม เนื่องจากไม่มีคำจำกัดความที่เป็นสากล และคำจำกัดความที่แตกต่างกันอาจขัดแย้งกัน ทำให้ยากต่อการตัดสินแบบจำลองการเรียนรู้ของเครื่องจักร^{[ 3 ]}หัวข้อการวิจัยอื่นๆ ได้แก่ ต้นกำเนิดของอคติ ประเภทของอคติ และวิธีการลดอคติ^{[ 4 ]}

ในช่วงไม่กี่ปีที่ผ่านมา บริษัทเทคโนโลยีได้สร้างเครื่องมือและคู่มือเกี่ยวกับวิธีการตรวจจับและลดอคติในการเรียนรู้ของเครื่องIBMมีเครื่องมือสำหรับPythonและRพร้อมอัลกอริทึมหลายตัวเพื่อลดอคติของซอฟต์แวร์และเพิ่มความเป็นธรรม^{[ 5 ]}^{[ 6 ]} Google ได้เผยแพร่แนวทางและเครื่องมือเพื่อศึกษาและต่อสู้กับอคติในการเรียนรู้ของเครื่อง^{[ 7 ]}^{[ 8 ]} Facebook ได้รายงานการใช้เครื่องมือ Fairness Flow เพื่อตรวจจับอคติในAI ของ ตน^{[ 9 ]}อย่างไรก็ตาม นักวิจารณ์โต้แย้งว่าความพยายามของบริษัทนั้นไม่เพียงพอ โดยรายงานว่าพนักงานใช้เครื่องมือนี้น้อยมาก เนื่องจากไม่สามารถใช้ได้กับทุกโปรแกรม และแม้ว่าจะใช้ได้ การใช้เครื่องมือก็เป็นทางเลือก^{[ 10 ]}

สิ่งสำคัญที่ควรทราบคือ การอภิปรายเกี่ยวกับวิธีการเชิงปริมาณในการทดสอบความยุติธรรมและการเลือกปฏิบัติที่ไม่เป็นธรรมในการตัดสินใจนั้นมีมาก่อนการถกเถียงเรื่องความยุติธรรมในการเรียนรู้ของเครื่องจักรหลายทศวรรษ^{[ 11 ]}อันที่จริง การอภิปรายอย่างเข้มข้นในหัวข้อนี้โดยชุมชนวิทยาศาสตร์เฟื่องฟูในช่วงกลางทศวรรษ 1960 และ 1970 ส่วนใหญ่เป็นผลมาจากการเคลื่อนไหวเพื่อสิทธิพลเมือง ของอเมริกา และโดยเฉพาะอย่างยิ่งการผ่านร่างพระราชบัญญัติสิทธิพลเมืองของสหรัฐอเมริกาในปี 1964อย่างไรก็ตาม เมื่อสิ้นสุดทศวรรษ 1970 การถกเถียงดังกล่าวก็หายไปเป็นส่วนใหญ่ เนื่องจากแนวคิดเรื่องความยุติธรรมที่แตกต่างกันและบางครั้งก็ขัดแย้งกัน ทำให้ไม่มีที่ว่างสำหรับความชัดเจนว่าเมื่อใดที่แนวคิดเรื่องความยุติธรรมแบบหนึ่งอาจเหมาะสมกว่าอีกแบบหนึ่ง

อคติทางภาษา

อคติทางภาษาหมายถึงอคติในการสุ่มตัวอย่างทางสถิติประเภทหนึ่งที่เชื่อมโยงกับภาษาของคำถาม ซึ่งนำไปสู่ "การเบี่ยงเบนอย่างเป็นระบบในการสุ่มตัวอย่างข้อมูลที่ป้องกันไม่ให้แสดงถึงความครอบคลุมที่แท้จริงของหัวข้อและมุมมองที่มีอยู่ในคลังข้อมูลได้อย่างแม่นยำ" ^{[ 12 ]} Luo et al. ^{[ 12 ]}แสดงให้เห็นว่าแบบจำลองภาษาขนาดใหญ่ในปัจจุบัน เนื่องจากส่วนใหญ่ได้รับการฝึกฝนด้วยข้อมูลภาษาอังกฤษ จึงมักนำเสนอมุมมองของชาวแองโกล-อเมริกันว่าเป็นความจริง ในขณะที่ลดทอนมุมมองที่ไม่ใช่ภาษาอังกฤษอย่างเป็นระบบว่าเป็นสิ่งที่ไม่เกี่ยวข้อง ผิด หรือเป็นสัญญาณรบกวน เมื่อถูกถามด้วยอุดมการณ์ทางการเมืองเช่น "ลัทธิเสรีนิยมคืออะไร?" ChatGPTเนื่องจากได้รับการฝึกฝนด้วยข้อมูลที่เน้นภาษาอังกฤษ จึงอธิบายลัทธิเสรีนิยมจากมุมมองของชาวแองโกล-อเมริกัน โดยเน้นด้านสิทธิมนุษยชนและความเท่าเทียมกัน ในขณะที่ด้านอื่นๆ ที่ถูกต้องเช่นกัน เช่น "ต่อต้านการแทรกแซงของรัฐในชีวิตส่วนตัวและเศรษฐกิจ" จากมุมมองของชาวเวียดนามที่โดดเด่น และ "การจำกัดอำนาจของรัฐบาล" จากมุมมองของชาวจีนที่แพร่หลาย กลับไม่มีอยู่ ในทำนองเดียวกัน มุมมองทางการเมืองอื่นๆ ที่ฝังอยู่ในคลังข้อมูลภาษาญี่ปุ่น เกาหลี ฝรั่งเศส และเยอรมันนั้นไม่มีอยู่ในคำตอบของ ChatGPT ChatGPT ซึ่งอ้างว่าเป็นแชทบอทหลายภาษา แท้จริงแล้วส่วนใหญ่ 'มองไม่เห็น' มุมมองที่ไม่ใช่ภาษาอังกฤษ^{[ 12 ]}

อคติทางเพศ

อคติทางเพศหมายถึงแนวโน้มของแบบจำลองเหล่านี้ที่จะสร้างผลลัพธ์ที่มีอคติอย่างไม่เป็นธรรมต่อเพศหนึ่งมากกว่าอีกเพศหนึ่ง อคตินี้มักเกิดขึ้นจากข้อมูลที่ใช้ในการฝึกฝนแบบจำลองเหล่านี้ ตัวอย่างเช่น แบบจำลองภาษาขนาดใหญ่มักจะกำหนดบทบาทและลักษณะตามบรรทัดฐานทางเพศแบบดั้งเดิม อาจเชื่อมโยงพยาบาลหรือเลขานุการกับผู้หญิงเป็นหลัก และวิศวกรหรือซีอีโอกับผู้ชาย^{[ 13 ]}อีกตัวอย่างหนึ่งคือ การใช้วิธีการที่ขับเคลื่อนด้วยข้อมูลเพื่อระบุอคติทางเพศใน โปรไฟล์ LinkedInการใช้งานระบบที่เปิดใช้งาน ML ที่เพิ่มมากขึ้นได้กลายเป็นองค์ประกอบสำคัญของการสรรหาบุคลากรในยุคปัจจุบัน โดยเฉพาะอย่างยิ่งผ่านเครือข่ายสังคมออนไลน์ เช่น LinkedIn และ Facebook อย่างไรก็ตาม ข้อมูลที่ล้นเกินในระบบการสรรหาบุคลากร ซึ่งอิงตาม วิธี การประมวลผลภาษาธรรมชาติ (NLP) ได้พิสูจน์แล้วว่าส่งผลให้เกิดอคติทางเพศ^{[ 14 ]}

อคติทางการเมือง

อคติทางการเมืองหมายถึงแนวโน้มของอัลกอริทึมที่จะให้ความสำคัญกับมุมมอง อุดมการณ์ หรือผลลัพธ์ทางการเมืองบางอย่างมากกว่าอย่างอื่นอย่างเป็นระบบ โมเดลภาษาก็อาจแสดงอคติทางการเมืองได้เช่นกัน เนื่องจากข้อมูลการฝึกอบรมประกอบด้วยความคิดเห็นและการครอบคลุมทางการเมืองที่หลากหลาย โมเดลอาจสร้างการตอบสนองที่เอนเอียงไปทางอุดมการณ์หรือมุมมองทางการเมืองบางอย่าง ขึ้นอยู่กับความแพร่หลายของมุมมองเหล่านั้นในข้อมูล^{[ 15 ]}

ประเด็นถกเถียง

การใช้การตัดสินใจด้วยอัลกอริทึมในระบบกฎหมายเป็นประเด็นสำคัญที่ถูกตรวจสอบ ในปี 2557 นาย เอริค โฮลเดอร์อัยการสูงสุดของสหรัฐฯ ในขณะนั้น ได้แสดงความกังวลว่าวิธีการ "ประเมินความเสี่ยง" อาจให้ความสำคัญกับปัจจัยที่อยู่นอกเหนือการควบคุมของจำเลยมากเกินไป เช่น ระดับการศึกษาหรือภูมิหลังทางเศรษฐกิจและสังคม^[¹⁶^]รายงานปี 2559 ของProPublicaเกี่ยวกับCOMPASระบุว่าจำเลยผิวดำมีโอกาสถูกระบุว่ามีความเสี่ยงสูงกว่าจำเลยผิวขาวเกือบสองเท่า ในขณะที่จำเลยผิวขาวกลับถูกระบุความเสี่ยงต่ำกว่า^[²^]บริษัท Northepointe Inc. ผู้สร้าง COMPAS ได้โต้แย้งรายงานดังกล่าว โดยอ้างว่าเครื่องมือของพวกเขามีความยุติธรรมและ ProPublica ทำผิดพลาดทางสถิติ^[¹⁷^]ซึ่งต่อมา ProPublica ก็ได้โต้แย้งอีกครั้ง^[¹⁸^]

อคติทางเชื้อชาติและเพศยังถูกสังเกตพบในอัลกอริทึมการจดจำภาพ การตรวจจับใบหน้าและการเคลื่อนไหวในกล้องพบว่าละเลยหรือติดป้ายกำกับผิดพลาดต่อการแสดงออกทางสีหน้าของบุคคลที่ไม่ใช่คนผิวขาว^{[ 19 ]}ในปี 2015 Google ได้ขอโทษหลังจากที่Google Photosติดป้ายกำกับคู่รักผิวดำว่าเป็นกอริลลาโดยไม่ได้ตั้งใจ ในทำนองเดียวกันพบว่าฟีเจอร์ติดแท็กอัตโนมัติของ Flickr ติดป้ายกำกับคนผิวดำบางคนว่าเป็น "ลิง" และ "สัตว์" ^{[ 20 ]}การประกวดความงามระดับนานาชาติในปี 2016 ที่ตัดสินโดยอัลกอริทึม AIพบว่ามีอคติต่อบุคคลที่มีผิวขาวกว่า ซึ่งอาจเกิดจากอคติในข้อมูลการฝึกอบรม^{[ 21 ]}การศึกษาเกี่ยวกับอัลกอริทึมการจำแนกเพศเชิงพาณิชย์สามรายการในปี 2018 พบว่าอัลกอริทึมทั้งสามโดยทั่วไปมีความแม่นยำที่สุดเมื่อจำแนกผู้ชายผิวขาว และแย่ที่สุดเมื่อจำแนกผู้หญิงผิวคล้ำ^{[ 22 ]}ในปี 2020 พบว่าเครื่องมือตัดภาพจาก Twitter ชอบใบหน้าที่มีผิวขาวกว่า^{[ 23 ]}ในปี 2022 ผู้สร้างโมเดลข้อความเป็นภาพ DALL-E 2อธิบายว่าภาพที่สร้างขึ้นนั้นมีลักษณะเหมารวมอย่างมาก โดยอิงจากลักษณะต่างๆ เช่น เพศหรือเชื้อชาติ^{[ 24 ]}^{[ 25 ]}

พื้นที่อื่นๆ ที่มีการใช้อัลกอริธึมการเรียนรู้ของเครื่องซึ่งแสดงให้เห็นว่ามีอคติ ได้แก่ การสมัครงานและการขอสินเชื่อ ตัวอย่างเช่น Amazonใช้ซอฟต์แวร์ตรวจสอบใบสมัครงานที่มีอคติทางเพศ โดยลงโทษเรซูเม่ที่มีคำว่า "ผู้หญิง" ^{[ 26 ]}ในปี 2019 อัลกอริธึมของApple ในการกำหนดวงเงินบัตรเครดิตสำหรับ Apple Card ใหม่ ให้วงเงินที่สูงกว่าแก่ผู้ชายมากกว่าผู้หญิงอย่างมีนัยสำคัญ แม้แต่คู่รักที่ใช้เงินร่วมกัน^{[ 27 ]} รายงานของ The Markupในปี 2021 แสดงให้เห็นว่าอัลกอริธึมการอนุมัติสินเชื่อบ้านที่ใช้ในสหรัฐอเมริกามีแนวโน้มที่จะปฏิเสธผู้สมัครที่ไม่ใช่คนผิวขาวมากกว่า^{[ 28 ]}

ข้อจำกัด

งานวิจัยล่าสุดเน้นย้ำถึงข้อจำกัดหลายประการในภาพรวมของความยุติธรรมในการเรียนรู้ของเครื่อง โดยเฉพาะอย่างยิ่งในแง่ของสิ่งที่สามารถบรรลุได้จริงในแอปพลิเคชัน AI ในโลกแห่งความเป็นจริงที่เพิ่มขึ้นเรื่อยๆ^{[ 29 ]}^{[ 30 ]}^{[ 31 ]} ตัวอย่างเช่น แนวทางทางคณิตศาสตร์และเชิงปริมาณในการกำหนดความยุติธรรมอย่างเป็นทางการ และแนวทาง "การลดอคติ" ที่เกี่ยวข้อง อาจอาศัยสมมติฐานที่ง่ายเกินไปและมองข้ามได้ง่าย เช่น การจัดกลุ่มบุคคลออกเป็นกลุ่มทางสังคมที่กำหนดไว้ล่วงหน้า ประเด็นที่ละเอียดอ่อนอื่นๆ ได้แก่ ปฏิสัมพันธ์ระหว่างลักษณะที่รับรู้ได้หลายประการ^{[ 22 ]}และการขาดแนวคิดทางปรัชญาและ/หรือทางกฎหมายที่ชัดเจนและเป็นที่ยอมรับร่วมกันเกี่ยวกับการไม่เลือกปฏิบัติ

ในที่สุด แม้ว่าแบบจำลองการเรียนรู้ของเครื่องจะสามารถออกแบบให้สอดคล้องกับเกณฑ์ความยุติธรรมได้ แต่การตัดสินใจขั้นสุดท้ายที่ทำโดยผู้ปฏิบัติงานที่เป็นมนุษย์อาจยังคงได้รับอิทธิพลจากอคติของตนเอง ปรากฏการณ์นี้เกิดขึ้นเมื่อผู้ตัดสินใจยอมรับคำแนะนำของ AI ก็ต่อเมื่อสอดคล้องกับอคติที่มีอยู่ก่อนแล้วเท่านั้น ซึ่งเป็นการบั่นทอนความยุติธรรมที่ตั้งใจไว้ของระบบ^{[ 32 ]}

เกณฑ์ความเป็นธรรมของกลุ่ม

ใน ปัญหา การจำแนกประเภทอัลกอริทึมจะเรียนรู้ฟังก์ชันเพื่อทำนายลักษณะเฉพาะแบบไม่ต่อเนื่อง ซึ่งก็คือตัวแปรเป้าหมาย จากลักษณะเฉพาะที่ทราบเราสร้างแบบจำลองเป็นตัวแปรสุ่ม แบบไม่ต่อเนื่อง ซึ่งเข้ารหัสลักษณะเฉพาะบางอย่างที่มีอยู่หรือเข้ารหัสโดยนัยซึ่งเราถือว่าเป็นลักษณะเฉพาะที่ละเอียดอ่อน (เพศ เชื้อชาติ รสนิยมทางเพศ ฯลฯ) ในที่สุดเราจะใช้สัญลักษณ์แทนการทำนายของตัวจำแนกประเภทตอนนี้เรามากำหนดเกณฑ์หลักสามข้อเพื่อประเมินว่าตัวจำแนกประเภทที่กำหนดนั้นยุติธรรมหรือไม่ นั่นคือการทำนายของมันไม่ได้รับอิทธิพลจากตัวแปรที่ละเอียดอ่อนเหล่านี้^[³³^] ${\textstyle Y}$ ${\textstyle X}$ ${\textstyle A}$ ${\textstyle X}$ ${\textstyle R}$

เอกราช

เรากล่าวว่าตัวแปรสุ่มเป็นไปตาม หลัก ความเป็นอิสระหากลักษณะที่ละเอียดอ่อนนั้นเป็นอิสระทางสถิติจากการทำนายและเราเขียนว่า เราสามารถแสดงแนวคิดนี้ด้วยสูตรต่อไปนี้ได้เช่นกัน: นี่หมายความว่าอัตราการจำแนกประเภทสำหรับแต่ละคลาสเป้าหมายนั้นเท่ากันสำหรับบุคคลที่อยู่ในกลุ่มต่างๆ กันโดย พิจารณา จากลักษณะที่ละเอียดอ่อน ${\textstyle (R,A)}$ ${\textstyle A}$ ${\textstyle R}$ $R\bot A.$ $P(R=r\ |\ A=a)=P(R=r\ |\ A=b)\quad \forall r\in R\quad \forall a,b\in A$ $A$

นอกจากนี้ ยังสามารถแสดงนิยามที่เทียบเท่ากันอีกประการหนึ่งสำหรับความเป็นอิสระได้โดยใช้แนวคิดของข้อมูลร่วมกันระหว่างตัวแปรสุ่มซึ่งกำหนดโดย สูตร ในสูตรนี้คือเอนโทรปีของตัวแปรสุ่มดังนั้นจะมีความเป็นอิสระก็ต่อเมื่อ $I(X,Y)=H(X)+H(Y)-H(X,Y)$ ${\textstyle H(X)}$ $X$ ${\textstyle (R,A)}$ ${\textstyle I(R,A)=0}$

การผ่อนปรน นิยามความเป็นอิสระ ที่เป็นไปได้ประการหนึ่ง ได้แก่ การนำค่าส่วนเกิน ที่เป็นบวกมา ใช้ ซึ่งกำหนดโดยสูตรดังนี้: ${\textstyle \epsilon >0}$ $P(R=r\ |\ A=a)\geq P(R=r\ |\ A=b)-\epsilon \quad \forall r\in R\quad \forall a,b\in A$

สุดท้ายนี้ อีกหนึ่งแนวทางผ่อนปรน ที่เป็นไปได้ คือ การกำหนดให้มีข้อกำหนดเพิ่มเติม ${\textstyle I(R,A)\leq \epsilon }$

การแยกจากกัน

เรากล่าวว่าตัวแปรสุ่มเป็นไปตามหลักการแยกตัว หากลักษณะที่ละเอียดอ่อนนั้นเป็นอิสระทางสถิติจากการทำนายเมื่อกำหนดค่าเป้าหมายและเราเขียนว่า เราสามารถแสดงแนวคิดนี้ด้วยสูตรต่อไปนี้ได้เช่นกัน: นี่หมายความว่าการพึ่งพาของการตัดสินใจต่อคุณลักษณะที่ละเอียดอ่อน ทั้งหมด จะต้องได้รับการพิสูจน์โดยการพึ่งพาที่แท้จริงของตัวแปรเป้าหมายที่แท้จริง ${\textstyle (R,A,Y)}$ ${\textstyle A}$ ${\textstyle R}$ ${\textstyle Y}$ $R\bot A\ |\ Y.$ $P(R=r\ |\ Y=q,A=a)=P(R=r\ |\ Y=q,A=b)\quad \forall r\in R\quad q\in Y\quad \forall a,b\in A$ $R$ $A$ $Y$

อีกหนึ่งการแสดงออกที่เทียบเท่ากัน ในกรณีของอัตราเป้าหมายแบบไบนารี คือ อัตราผลบวกจริงและอัตราผลบวกเท็จจะเท่ากัน (และดังนั้น อัตราผลลบเท็จและอัตราผลลบจริงจึงเท่ากัน) สำหรับทุกค่าของลักษณะที่ไวต่อการเปลี่ยนแปลง: $P(R=1\ |\ Y=1,A=a)=P(R=1\ |\ Y=1,A=b)\quad \forall a,b\in A$ $P(R=1\ |\ Y=0,A=a)=P(R=1\ |\ Y=0,A=b)\quad \forall a,b\in A$

แนวทางการผ่อนปรนที่เป็นไปได้สำหรับคำจำกัดความที่กำหนดไว้คือ การอนุญาตให้ค่าความแตกต่างระหว่างอัตราเป็นจำนวนบวกที่ต่ำกว่าค่าความยืดหยุ่นที่กำหนดไว้แทนที่จะเท่ากับศูนย์ ${\textstyle \epsilon >0}$

ในบางสาขา การแยก (สัมประสิทธิ์การแยก) ในเมทริกซ์ความสับสนคือการวัดระยะห่าง (ที่ระดับคะแนนความน่าจะเป็นที่กำหนด) ระหว่างเปอร์เซ็นต์สะสมเชิงลบที่คาดการณ์ไว้ และ เปอร์เซ็นต์สะสมเชิงบวก ที่คาดการณ์ไว้

ยิ่งค่าสัมประสิทธิ์การแยกนี้มีค่ามากเท่าใด ณ ค่าคะแนนที่กำหนด โมเดลก็จะยิ่งมีประสิทธิภาพในการแยกแยะระหว่างชุดของค่าบวกและค่าลบ ณ จุดตัดความน่าจะเป็นที่เฉพาะเจาะจงมากขึ้นเท่านั้น ตามที่ Mayes กล่าวไว้ว่า: ^{[ 34 ]} "ในอุตสาหกรรมสินเชื่อ มักพบว่าการเลือกมาตรวัดการตรวจสอบความถูกต้องขึ้นอยู่กับวิธีการสร้างแบบจำลอง ตัวอย่างเช่น หากขั้นตอนการสร้างแบบจำลองเป็นแบบพาราเมตริกหรือกึ่งพาราเมตริก มักจะใช้ การทดสอบ KS สองตัวอย่างหากแบบจำลองได้มาจากการค้นหาแบบฮิวริสติกหรือแบบวนซ้ำ มาตรวัดประสิทธิภาพของแบบจำลองมักจะเป็น ค่า ความแตกต่างตัวเลือกที่สามคือค่าสัมประสิทธิ์การแยก...เมื่อเปรียบเทียบกับสองวิธีอื่น ค่าสัมประสิทธิ์การแยกดูเหมือนจะเป็นมาตรวัดประสิทธิภาพของแบบจำลองที่สมเหตุสมผลที่สุด เนื่องจากสะท้อนถึงรูปแบบการแยกของแบบจำลอง"

ความเพียงพอ

เรากล่าวว่าตัวแปรสุ่ม นั้น เพียงพอแล้ว หากลักษณะที่ไวต่อการเปลี่ยนแปลงนั้นเป็นอิสระทางสถิติจากค่าเป้าหมายเมื่อพิจารณาจากการทำนายและเราเขียนว่า เราสามารถแสดงแนวคิดนี้ด้วยสูตรต่อไปนี้ได้เช่นกัน: นี่หมายความว่าความน่าจะเป็นที่จะอยู่ในแต่ละกลุ่มนั้นเท่ากันสำหรับบุคคลสองคนที่มีลักษณะที่ไวต่อการเปลี่ยนแปลงแตกต่างกัน เมื่อพิจารณาว่าพวกเขาถูกทำนายว่าอยู่ในกลุ่มเดียวกัน ${\textstyle (R,A,Y)}$ ${\textstyle A}$ ${\textstyle Y}$ ${\textstyle R}$ $Y\bot A\ |\ R.$ $P(Y=q\ |\ R=r,A=a)=P(Y=q\ |\ R=r,A=b)\quad \forall q\in Y\quad r\in R\quad \forall a,b\in A$

ความสัมพันธ์ระหว่างคำจำกัดความ

สุดท้ายนี้ เราจะสรุปผลลัพธ์หลักบางประการที่เกี่ยวข้องกับคำจำกัดความทั้งสามที่กล่าวมาข้างต้น:

สมมติว่าเป็นตัวแปรไบนารี ถ้าและไม่เป็นอิสระทางสถิติ และและ ก็ไม่เป็นอิสระทางสถิติเช่นกัน ดังนั้น ความเป็นอิสระและการแยกออกจากกันจึงไม่สามารถเกิดขึ้นได้พร้อมกัน ยกเว้นในกรณีเชิงวาทศิลป์ ${\textstyle Y}$ ${\textstyle A}$ ${\textstyle Y}$ ${\textstyle R}$ ${\textstyle Y}$
หากการแจกแจงร่วมมีค่าความน่าจะเป็นเป็นบวกสำหรับค่าที่เป็นไปได้ทั้งหมด และไม่ได้เป็นอิสระทางสถิติแล้ว การแยกและการเพียงพอจะไม่สามารถเกิดขึ้นได้พร้อมกัน ยกเว้นในกรณีเชิงวาทศิลป์ ${\textstyle (R,A,Y)}$ ${\textstyle A}$ ${\textstyle Y}$

เรียกว่าความยุติธรรมโดยสมบูรณ์เมื่อความเป็นอิสระ การแยก และความเพียงพอได้รับการตอบสนองพร้อมกัน^{[ 35 ]}อย่างไรก็ตาม ความยุติธรรมโดยสมบูรณ์นั้นไม่สามารถบรรลุได้ ยกเว้นในกรณีทางวาทศิลป์เฉพาะ^{[ 36 ]}

การกำหนดนิยามความยุติธรรมของกลุ่มด้วยสูตรทางคณิตศาสตร์

คำจำกัดความเบื้องต้น

มาตรการทางสถิติส่วนใหญ่เกี่ยวกับความยุติธรรมอาศัยตัวชี้วัดที่แตกต่างกัน ดังนั้นเราจะเริ่มต้นด้วยการกำหนดตัวชี้วัดเหล่านั้น เมื่อทำงานกับ ตัวจำแนก แบบไบนารีทั้งคลาสที่คาดการณ์และคลาสจริงสามารถมีค่าได้สองค่า คือ บวกและลบ ตอนนี้เรามาเริ่มอธิบายความสัมพันธ์ที่เป็นไปได้ต่างๆ ระหว่างผลลัพธ์ที่คาดการณ์และผลลัพธ์จริงกัน: ^{[ 37 ]}

ผลบวกจริง (TP): กรณีที่ทั้งผลลัพธ์ที่คาดการณ์และผลลัพธ์จริงอยู่ในกลุ่มบวก
ผลลัพธ์เชิงลบที่แท้จริง (TN): กรณีที่ทั้งผลลัพธ์ที่คาดการณ์และผลลัพธ์ที่เกิดขึ้นจริงถูกจัดอยู่ในกลุ่มลบ
ผลบวกเท็จ (FP): กรณีที่คาดการณ์ว่าจะอยู่ในกลุ่มผลบวก แต่ผลลัพธ์ที่แท้จริงกลับอยู่ในกลุ่มผลลบ
ผลลบเท็จ (FN): กรณีที่คาดการณ์ว่าจะอยู่ในกลุ่มลบ แต่ผลลัพธ์ที่แท้จริงกลับอยู่ในกลุ่มบวก

ความสัมพันธ์เหล่านี้สามารถแสดงได้อย่างง่ายดายด้วยเมทริกซ์ความสับสนซึ่งเป็นตารางที่อธิบายความแม่นยำของแบบจำลองการจำแนกประเภท ในเมทริกซ์นี้ คอลัมน์และแถวแสดงถึงกรณีที่คาดการณ์และกรณีจริงตามลำดับ

โดยการใช้ความสัมพันธ์เหล่านี้ เราสามารถกำหนดตัวชี้วัดหลายประการ ซึ่งสามารถนำมาใช้วัดความยุติธรรมของอัลกอริทึมได้ในภายหลัง:

ค่าทำนายเชิงบวก (PPV): สัดส่วนของกรณีที่เป็นบวกที่ได้รับการทำนายอย่างถูกต้องจากจำนวนการทำนายที่เป็นบวกทั้งหมด โดยทั่วไปเรียกว่าความแม่นยำและแสดงถึงความน่าจะเป็นของการทำนายที่เป็นบวกที่ถูกต้อง คำนวณได้จากสูตรต่อไปนี้: $PPV=P(actual=+\ |\ prediction=+)={\frac {TP}{TP+FP}}$
อัตราการค้นพบที่ผิดพลาด (FDR): สัดส่วนของการทำนายผลบวกที่ผิดพลาดซึ่งแท้จริงแล้วเป็นผลลบ จากจำนวนการทำนายผลบวกทั้งหมด แสดงถึงความน่าจะเป็นของการทำนายผลบวกที่ผิดพลาด และคำนวณได้จากสูตรต่อไปนี้: $FDR=P(actual=-\ |\ prediction=+)={\frac {FP}{TP+FP}}$
ค่าทำนายเชิงลบ (NPV): สัดส่วนของกรณีเชิงลบที่ได้รับการทำนายอย่างถูกต้องจากจำนวนการทำนายเชิงลบทั้งหมด ค่านี้แสดงถึงความน่าจะเป็นของการทำนายเชิงลบที่ถูกต้อง และคำนวณได้จากสูตรต่อไปนี้: $NPV=P(actual=-\ |\ prediction=-)={\frac {TN}{TN+FN}}$
อัตราการพลาดทำนายผิดพลาด (FOR): สัดส่วนของการทำนายเชิงลบที่ผิดพลาดซึ่งจริงๆ แล้วเป็นการทำนายเชิงบวก จากจำนวนการทำนายเชิงลบทั้งหมด แสดงถึงความน่าจะเป็นของการทำนายเชิงลบที่ผิดพลาด และคำนวณได้จากสูตรต่อไปนี้: $FOR=P(actual=+\ |\ prediction=-)={\frac {FN}{TN+FN}}$
อัตราผลบวกที่แท้จริง (TPR): สัดส่วนของกรณีที่เป็นผลบวกที่ได้รับการคาดการณ์อย่างถูกต้องจากกรณีที่เป็นผลบวกทั้งหมด โดยทั่วไปจะเรียกว่าความไวหรือความจำเพาะ และแสดงถึงความน่าจะเป็นที่ผู้ป่วยที่เป็นผลบวกจะถูกจำแนกอย่างถูกต้องว่าเป็นเช่นนั้น คำนวณได้จากสูตร: $TPR=P(prediction=+\ |\ actual=+)={\frac {TP}{TP+FN}}$
อัตราผลลบเท็จ (FNR): สัดส่วนของกรณีที่เป็นบวกที่ถูกทำนายผิดว่าเป็นลบ จากกรณีที่เป็นบวกทั้งหมด แสดงถึงความน่าจะเป็นที่ผู้ป่วยที่มีผลเป็นบวกจะถูกจัดประเภทผิดว่าเป็นลบ โดยคำนวณจากสูตร: $FNR=P(prediction=-\ |\ actual=+)={\frac {FN}{TP+FN}}$
อัตราผลลบที่ถูกต้อง (True negative rate หรือ TNR): สัดส่วนของกรณีที่เป็นผลลบซึ่งได้รับการทำนายอย่างถูกต้องจากกรณีที่เป็นผลลบทั้งหมด แสดงถึงความน่าจะเป็นที่ผู้ป่วยที่มีผลลบจะถูกจำแนกอย่างถูกต้องว่าเป็นเช่นนั้น โดยคำนวณจากสูตร: $TNR=P(prediction=-\ |\ actual=-)={\frac {TN}{TN+FP}}$
อัตราผลบวกเท็จ (FPR): สัดส่วนของกรณีที่เป็นลบซึ่งถูกทำนายผิดว่าเป็นบวก จากกรณีที่เป็นลบทั้งหมด แสดงถึงความน่าจะเป็นที่ผู้ป่วยที่เป็นลบจะถูกจัดประเภทผิดว่าเป็นบวก โดยคำนวณจากสูตร: $FPR=P(prediction=+\ |\ actual=-)={\frac {FP}{TN+FP}}$

ความสัมพันธ์ระหว่างเกณฑ์ความยุติธรรมดังที่แสดงใน Barocas et al. ^{[ 33 ]}

เกณฑ์ต่อไปนี้สามารถเข้าใจได้ว่าเป็นการวัดคำจำกัดความทั่วไปสามประการที่ระบุไว้ในตอนต้นของส่วนนี้ ได้แก่ ความเป็นอิสระ การแยก และความเพียงพอ ในตาราง^{[ 33 ]}ทางด้านขวา เราสามารถเห็นความสัมพันธ์ระหว่างเกณฑ์เหล่านี้ได้

เพื่อกำหนดมาตรการเหล่านี้โดยเฉพาะ เราจะแบ่งมาตรการเหล่านี้ออกเป็นสามกลุ่มใหญ่ตามที่ทำใน Verma et al.: ^{[ 37 ]}คำจำกัดความที่อิงตามผลลัพธ์ที่คาดการณ์ไว้ ผลลัพธ์ที่คาดการณ์และผลลัพธ์จริง และคำจำกัดความที่อิงตามความน่าจะเป็นที่คาดการณ์ไว้และผลลัพธ์จริง

เราจะใช้ตัวจำแนกแบบไบนารีและสัญลักษณ์ต่อไปนี้: หมายถึงคะแนนที่ได้จากตัวจำแนก ซึ่งเป็นความน่าจะเป็นที่บุคคลใดบุคคลหนึ่งจะอยู่ในกลุ่มบวกหรือกลุ่มลบแทนการจำแนกขั้นสุดท้ายที่ทำนายโดยอัลกอริทึม และค่าของมันมักจะได้มาจากเช่น จะเป็นบวกเมื่อสูงกว่าเกณฑ์ที่กำหนดแทนผลลัพธ์ที่แท้จริง นั่นคือการจำแนกที่แท้จริงของแต่ละบุคคล และสุดท้ายแสดงถึงคุณลักษณะที่สำคัญของบุคคลนั้น ๆ ${\textstyle S}$ ${\textstyle R}$ ${\textstyle S}$ ${\textstyle S}$ ${\textstyle Y}$ ${\textstyle A}$

คำจำกัดความที่อิงตามผลลัพธ์ที่คาดการณ์ไว้

คำจำกัดความในส่วนนี้มุ่งเน้นไปที่ผลลัพธ์ที่คาดการณ์ไว้สำหรับการกระจายตัวของกลุ่มตัวอย่างต่างๆ ซึ่งเป็นแนวคิดเรื่องความยุติธรรมที่ง่ายที่สุดและเข้าใจง่ายที่สุด ${\textstyle R}$

ความเท่าเทียมทางประชากรศาสตร์หรือที่เรียกว่าความเท่าเทียมทางสถิติ ความเท่าเทียม ของอัตราการยอมรับและการเปรียบเทียบมาตรฐาน ตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มตัวอย่างในกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองมีโอกาสเท่ากันที่จะถูกจัดให้อยู่ในกลุ่มที่คาดการณ์ไว้ในเชิงบวก กล่าวคือ หากสูตรต่อไปนี้เป็นจริง: $P(R=+\ |\ A=a)=P(R=+\ |\ A=b)\quad \forall a,b\in A$
ความเท่าเทียมทางสถิติแบบมีเงื่อนไขโดยพื้นฐานแล้วประกอบด้วยคำจำกัดความข้างต้น แต่จำกัดเฉพาะกลุ่มย่อยของตัวอย่างเท่านั้น ในสัญลักษณ์ทางคณิตศาสตร์จะเป็นดังนี้: $P(R=+\ |\ L=l,A=a)=P(R=+\ |\ L=l,A=b)\quad \forall a,b\in A\quad \forall l\in L$

คำจำกัดความที่อิงตามผลลัพธ์ที่คาดการณ์และผลลัพธ์ที่เกิดขึ้นจริง

คำจำกัดความเหล่านี้ไม่เพียงพิจารณาผลลัพธ์ที่คาดการณ์ไว้เท่านั้นแต่ยังเปรียบเทียบกับผลลัพธ์ที่เกิดขึ้นจริงอีกด้วย ${\textstyle R}$ ${\textstyle Y}$

ความเท่าเทียมกันในการ ทำนาย หรือที่เรียกว่าการทดสอบผลลัพธ์ ตัวจำแนกประเภทจะตรงตาม คำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มตัวอย่างในกลุ่มที่ได้รับการปกป้องและกลุ่มที่ไม่ได้รับการปกป้องมีค่า PPV เท่ากัน กล่าวคือ หากสูตรต่อไปนี้เป็นไปตามเงื่อนไข: $P(Y=+\ |\ R=+,A=a)=P(Y=+\ |\ R=+,A=b)\quad \forall a,b\in A$

ในทางคณิตศาสตร์ หากตัวจำแนกมีค่า PPV เท่ากันสำหรับทั้งสองกลุ่ม ก็จะมีค่า FDR เท่ากันด้วย ซึ่งสอดคล้องกับสูตร:

P(Y=-\ |\ R=+,A=a)=P(Y=-\ |\ R=+,A=b)\quad \forall a,b\in A

ความสมดุลของอัตราความผิดพลาดบวกเท็จหรือที่เรียกว่าความเท่าเทียมกันในการทำนาย ตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มตัวอย่างในกลุ่มที่ได้รับการปกป้องและกลุ่มที่ไม่ได้รับการปกป้องมีอัตราความผิดพลาดบวกเท็จ (FPR) เท่ากัน กล่าวคือ หากสูตรต่อไปนี้เป็นไปตามเงื่อนไข: $P(R=+\ |\ Y=-,A=a)=P(R=+\ |\ Y=-,A=b)\quad \forall a,b\in A$

ในทางคณิตศาสตร์ หากตัวจำแนกมีอัตราการเกิดผลบวกเท็จ (FPR) เท่ากันสำหรับทั้งสองกลุ่ม ก็จะมีอัตราการเกิดผลลบเท็จ (TNR) เท่ากันด้วย ซึ่งสอดคล้องกับสูตร:

P(R=-\ |\ Y=-,A=a)=P(R=-\ |\ Y=-,A=b)\quad \forall a,b\in A

ความสมดุลของอัตราความผิดพลาดเชิงลบเท็จหรือที่เรียกว่าโอกาสที่เท่าเทียมกันตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มตัวอย่างในกลุ่มที่ได้รับการปกป้องและกลุ่มที่ไม่ได้รับการปกป้องมีอัตราความผิดพลาดเชิงลบเท็จ (FNR) เท่ากัน กล่าวคือ หากเป็นไปตามสูตรต่อไปนี้: $P(R=-\ |\ Y=+,A=a)=P(R=-\ |\ Y=+,A=b)\quad \forall a,b\in A$

ในทางคณิตศาสตร์ หากตัวจำแนกมี FNR เท่ากันสำหรับทั้งสองกลุ่ม ก็จะมีค่า TPR เท่ากันด้วย ซึ่งสอดคล้องกับสูตร:

P(R=+\ |\ Y=+,A=a)=P(R=+\ |\ Y=+,A=b)\quad \forall a,b\in A

อัตราส่วนความน่าจะเป็นที่เท่าเทียมกันหรือเรียกอีกอย่างว่าความแม่นยำของกระบวนการแบบมีเงื่อนไข ความเท่าเทียม กัน และการปฏิบัติที่ไม่เป็นธรรมที่ไม่เท่าเทียมกันตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อผู้ถูกทดสอบในกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองมี TPR และ FPR เท่ากัน โดยเป็นไปตามสูตร: $P(R=+\ |\ Y=y,A=a)=P(R=+\ |\ Y=y,A=b)\quad y\in \{+,-\}\quad \forall a,b\in A$
ความเท่าเทียมกันของความแม่นยำในการใช้งานแบบมีเงื่อนไขตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มตัวอย่างในกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองมีค่า PPV และ NPV เท่ากัน โดยเป็นไปตามสูตร: $P(Y=y\ |\ R=y,A=a)=P(Y=y\ |\ R=y,A=b)\quad y\in \{+,-\}\quad \forall a,b\in A$
ความเท่าเทียมกันของความแม่นยำโดยรวมตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อหัวข้อในกลุ่มที่ได้รับการปกป้องและกลุ่มที่ไม่ได้รับการปกป้องมีความแม่นยำในการทำนายเท่ากัน กล่าวคือ ความน่าจะเป็นที่หัวข้อจากคลาสหนึ่งจะถูกกำหนดให้เป็นคลาสนั้นเท่ากัน นั่นคือ หากเป็นไปตามสูตรต่อไปนี้: $P(R=Y\ |\ A=a)=P(R=Y\ |\ A=b)\quad \forall a,b\in A$
ความเท่าเทียมในการปฏิบัติตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองมีอัตราส่วนของ FN และ FP เท่ากัน โดยเป็นไปตามสูตร: ${\frac {FN_{A=a}}{FP_{A=a}}}={\frac {FN_{A=b}}{FP_{A=b}}}$

คำจำกัดความที่อิงตามความน่าจะเป็นที่คาดการณ์ไว้และผลลัพธ์ที่เกิดขึ้นจริง

คำจำกัดความเหล่านี้อิงตามผลลัพธ์ที่เกิดขึ้นจริงและคะแนนความน่าจะเป็นที่คาดการณ์ไว้ ${\textstyle Y}$ ${\textstyle S}$

ความเป็นธรรมในการทดสอบหรือที่เรียกว่าการปรับเทียบหรือการจับคู่ความถี่ตามเงื่อนไข ตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ หากบุคคลที่มีคะแนนความน่าจะเป็นที่คาดการณ์ไว้เท่ากันมีความน่าจะเป็นที่จะถูกจัดอยู่ในกลุ่มบวกเท่ากัน ไม่ว่าพวกเขาจะอยู่ในกลุ่มที่ได้รับการคุ้มครองหรือกลุ่มที่ไม่ได้รับการคุ้มครองก็ตาม: ${\textstyle S}$ $P(Y=+\ |\ S=s,A=a)=P(Y=+\ |\ S=s,A=b)\quad \forall s\in S\quad \forall a,b\in A$
การปรับเทียบที่ดีเป็นส่วนขยายของคำจำกัดความก่อนหน้านี้ โดยระบุว่าเมื่อบุคคลภายในหรือภายนอกกลุ่มที่ได้รับการคุ้มครองมีคะแนนความน่าจะเป็นที่คาดการณ์ไว้เท่ากัน พวกเขาจะต้องมีความน่าจะเป็นที่จะถูกจัดอยู่ในกลุ่มบวกเท่ากัน และความน่าจะเป็นนี้จะต้องเท่ากับ: ${\textstyle S}$ ${\textstyle S}$ $P(Y=+\ |\ S=s,A=a)=P(Y=+\ |\ S=s,A=b)=s\quad \forall s\in S\quad \forall a,b\in A$
ความสมดุลสำหรับกลุ่มที่มีผลลัพธ์เป็นบวกตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มตัวอย่างที่ประกอบกันเป็นกลุ่มที่มีผลลัพธ์เป็นบวกจากทั้งกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองมีคะแนนความน่าจะเป็นที่คาดการณ์เฉลี่ยเท่ากันซึ่งหมายความว่าค่าที่คาดหวังของคะแนนความน่าจะเป็นสำหรับกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองที่มีผลลัพธ์จริงเป็นบวกนั้นเท่ากัน โดยเป็นไปตามสูตร: ${\textstyle S}$ ${\textstyle Y}$ $E(S\ |\ Y=+,A=a)=E(S\ |\ Y=+,A=b)\quad \forall a,b\in A$
ความสมดุลสำหรับกลุ่มผลลัพธ์เชิงลบตัวจำแนกประเภทจะตรงตามคำจำกัดความนี้ได้ก็ต่อเมื่อกลุ่มตัวอย่างที่ประกอบกันเป็นกลุ่มผลลัพธ์เชิงลบจากทั้งกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองมีคะแนนความน่าจะเป็นที่คาดการณ์เฉลี่ยเท่ากันซึ่งหมายความว่าค่าที่คาดหวังของคะแนนความน่าจะเป็นสำหรับกลุ่มที่ได้รับการคุ้มครองและกลุ่มที่ไม่ได้รับการคุ้มครองที่มีผลลัพธ์จริงเป็นลบนั้นเท่ากัน โดยเป็นไปตามสูตร: ${\textstyle S}$ ${\textstyle Y}$ $E(S\ |\ Y=-,A=a)=E(S\ |\ Y=-,A=b)\quad \forall a,b\in A$

ความสับสนที่เท่าเทียมกัน ความยุติธรรม

ในส่วนของเมทริกซ์ความสับสน ความเป็นอิสระ การแยก และความเพียงพอ กำหนดให้ปริมาณที่เกี่ยวข้องที่ระบุไว้ด้านล่างไม่มีความแตกต่างทางสถิติอย่างมีนัยสำคัญในลักษณะที่ละเอียดอ่อน^{[ 36 ]}

ความเป็นอิสระ: (TP + FP) / (TP + FP + FN + TN) (เช่น) $P({\hat {Y}}=1)$
การแยกแยะ: TN / (TN + FP) และ TP / (TP + FN) (เช่น ความจำเพาะและการเรียกคืนข้อมูล) $P({\hat {Y}}=0\mid Y=0)$ $P({\hat {Y}}=1\mid Y=1)$
ความเพียงพอ: TP / (TP + FP) และ TN / (TN + FN) (เช่น ความแม่นยำและค่าทำนายเชิงลบ ) $P(Y=1\mid {\hat {Y}}=1)$ $P(Y=0\mid {\hat {Y}}=0)$

แนวคิดเรื่องความยุติธรรมของความสับสนที่เท่าเทียมกัน^{[ 38 ]}กำหนดให้เมทริกซ์ความสับสนของระบบการตัดสินใจที่กำหนดต้องมีการกระจายแบบเดียวกันเมื่อคำนวณแบบแบ่งชั้นตามลักษณะที่ละเอียดอ่อนทั้งหมด

หน้าที่ด้านสวัสดิการสังคม

นักวิชาการบางคนเสนอให้กำหนดความยุติธรรมของอัลกอริทึมในแง่ของฟังก์ชันสวัสดิการสังคมพวกเขาโต้แย้งว่าการใช้ฟังก์ชันสวัสดิการสังคมช่วยให้นักออกแบบอัลกอริทึมสามารถพิจารณาความยุติธรรมและความแม่นยำในการคาดการณ์ในแง่ของผลประโยชน์ต่อผู้คนที่ได้รับผลกระทบจากอัลกอริทึม นอกจากนี้ยังช่วยให้นักออกแบบสามารถแลกเปลี่ยนประสิทธิภาพและความเท่าเทียมกันในลักษณะที่มีหลักการ^{[ 39 ]} Sendhil Mullainathanกล่าวว่านักออกแบบอัลกอริทึมควรใช้ฟังก์ชันสวัสดิการสังคมเพื่อรับรู้ถึงผลประโยชน์ที่แท้จริงสำหรับกลุ่มที่ด้อยโอกาส ตัวอย่างเช่น การศึกษาพบว่าการใช้อัลกอริทึมการตัดสินใจในการควบคุมตัวก่อนการพิจารณาคดีแทนการตัดสินของมนุษย์ล้วนๆ ช่วยลดอัตราการควบคุมตัวสำหรับคนผิวดำ ชาวฮิสแปนิก และชนกลุ่มน้อยทางเชื้อชาติโดยรวม แม้ว่าอัตราการก่ออาชญากรรมจะคงที่ก็ตาม^{[ 40 ]}

เกณฑ์ความยุติธรรมเฉพาะบุคคล

ความแตกต่างที่สำคัญระหว่างคำจำกัดความของความยุติธรรมคือความแตกต่างระหว่างแนวคิดของกลุ่มและบุคคล^{[ 41 ]}^{[ 42 ]}^{[ 37 ]}^{[ 43 ]}โดยคร่าวๆ แล้ว เกณฑ์ความยุติธรรมของกลุ่มจะเปรียบเทียบปริมาณในระดับกลุ่ม ซึ่งโดยทั่วไปจะระบุโดยคุณลักษณะที่ละเอียดอ่อน (เช่น เพศ เชื้อชาติ อายุ ฯลฯ) ในขณะที่เกณฑ์ของบุคคลจะเปรียบเทียบระหว่างบุคคล กล่าวคือ ความยุติธรรมของบุคคลยึดหลักการที่ว่า "บุคคลที่คล้ายคลึงกันควรได้รับการปฏิบัติที่คล้ายคลึงกัน"

มีแนวทางที่เข้าใจง่ายอย่างหนึ่งเกี่ยวกับความยุติธรรม ซึ่งมักเรียกกันว่าความยุติธรรมผ่านการไม่รู้ตัว ( FTU ) หรือการมองข้ามซึ่งกำหนดไว้ว่าไม่ควรนำคุณลักษณะที่ละเอียดอ่อนมาใช้โดยตรงเมื่อทำการตัดสินใจ (โดยอัตโนมัติ) นี่เป็นแนวคิดเรื่องความยุติธรรมส่วนบุคคลอย่างแท้จริง เพราะบุคคลสองคนที่แตกต่างกันเพียงแค่คุณค่าของคุณลักษณะที่ละเอียดอ่อนก็จะได้รับผลลัพธ์เดียวกัน

อย่างไรก็ตาม โดยทั่วไปแล้ว FTU มีข้อเสียหลายประการ ข้อเสียหลักคือไม่ได้คำนึงถึงความสัมพันธ์ที่เป็นไปได้ระหว่างคุณลักษณะที่ละเอียดอ่อนและคุณลักษณะที่ไม่ละเอียดอ่อนที่ใช้ในกระบวนการตัดสินใจ ตัวอย่างเช่น ตัวแทนที่มีเจตนาร้ายที่จะเลือกปฏิบัติบนพื้นฐานของเพศ อาจนำตัวแปรแทนเพศ (เช่น ตัวแปรที่มีความสัมพันธ์สูงกับเพศ) มาใช้ในแบบจำลอง และใช้ข้อมูลเพศได้อย่างมีประสิทธิภาพในขณะเดียวกันก็ปฏิบัติตามข้อกำหนดของ FTU ได้

ปัญหาเกี่ยวกับตัวแปรที่สัมพันธ์กับตัวแปรที่ละเอียดอ่อนซึ่งสามารถนำมาใช้ในแบบจำลองเพื่อการตัดสินใจได้อย่างเหมาะสมนั้นเป็นปัญหาสำคัญ และมีความเกี่ยวข้องกับแนวคิดกลุ่มด้วยเช่นกัน: ตัวชี้วัดความเป็นอิสระจำเป็นต้องกำจัดข้อมูลที่ละเอียดอ่อนออกไปอย่างสมบูรณ์ ในขณะที่ตัวชี้วัดแบบแยกส่วนอนุญาตให้มีความสัมพันธ์ได้ แต่เฉพาะในขอบเขตที่ตัวแปรเป้าหมายที่ระบุไว้ "เหมาะสม" เท่านั้น

แนวคิดทั่วไปที่สุดของความยุติธรรมส่วนบุคคลได้รับการนำเสนอในงานบุกเบิกโดยCynthia Dworkและผู้ร่วมงานในปี 2012 ^{[ 44 ]}และสามารถคิดได้ว่าเป็นการแปลทางคณิตศาสตร์ของหลักการที่ว่าแผนที่การตัดสินใจที่รับคุณลักษณะเป็นอินพุตควรสร้างขึ้นเพื่อให้สามารถ "แมปบุคคลที่คล้ายคลึงกันในลักษณะเดียวกัน" ซึ่งแสดงเป็นเงื่อนไข Lipschitzบนแผนที่แบบจำลอง พวกเขาเรียกวิธีการนี้ว่าความยุติธรรมผ่านการรับรู้ ( FTA ) อย่างแม่นยำเพื่อเป็นจุดตรงข้ามกับ FTU เนื่องจากพวกเขาเน้นย้ำถึงความสำคัญของการเลือกเมตริกระยะทางที่เกี่ยวข้องกับเป้าหมายที่เหมาะสมเพื่อประเมินว่าบุคคลใดมีความคล้ายคลึงกันในสถานการณ์เฉพาะ อีกครั้ง ปัญหานี้มีความเกี่ยวข้องอย่างมากกับประเด็นที่ยกขึ้นข้างต้นเกี่ยวกับตัวแปรใดที่สามารถมองว่า "ถูกต้องตามกฎหมาย" ในบริบทเฉพาะ

แนวทางอื่นสำหรับความยุติธรรมของแต่ละบุคคลคือความยุติธรรมเชิงสมมติ^{[ 4 ]}แนวคิดเบื้องหลังความยุติธรรมเชิงสมมติคือการตัดสินใจจะยุติธรรมต่อบุคคลก็ต่อเมื่อการตัดสินใจนั้นเหมือนกันทั้งในโลกแห่งความเป็นจริงและโลกสมมติที่บุคคลนั้นอยู่ในกลุ่มประชากรที่แตกต่างกัน^{[ 45 ]}

ตัวชี้วัดตามหลักเหตุและผล

ความเป็นธรรมเชิงสาเหตุวัดความถี่ที่ผู้ใช้หรือแอปพลิเคชันสองรายที่เกือบจะเหมือนกันซึ่งแตกต่างกันเฉพาะในชุดลักษณะที่ต้องจัดสรรทรัพยากรอย่างเป็นธรรมได้รับการปฏิบัติอย่างเท่าเทียมกัน^{[ 46 ]}

สาขาการวิจัยเชิงวิชาการทั้งหมดเกี่ยวกับเมตริกความยุติธรรมทุ่มเทให้กับการใช้แบบจำลองเชิงสาเหตุเพื่อประเมินอคติใน แบบจำลอง การเรียนรู้ของเครื่องแนวทางนี้มักได้รับการพิสูจน์โดยข้อเท็จจริงที่ว่าการกระจายข้อมูลการสังเกตเดียวกันอาจซ่อนความสัมพันธ์เชิงสาเหตุที่แตกต่างกันระหว่างตัวแปรที่เกี่ยวข้อง ซึ่งอาจมีการตีความที่แตกต่างกันว่าผลลัพธ์ได้รับผลกระทบจากอคติบางรูปแบบหรือไม่^{[ 33 ]}

Kusner et al. ^{[ 45 ]}เสนอให้ใช้สถานการณ์สมมติและกำหนดกระบวนการตัดสินใจที่ยุติธรรมตามสถานการณ์สมมติหากผลลัพธ์ไม่เปลี่ยนแปลงสำหรับบุคคลใดๆ ในสถานการณ์สมมติที่คุณลักษณะที่ละเอียดอ่อนมีการเปลี่ยนแปลง โปรดทราบว่าสิ่งนี้ยังจัดอยู่ในหมวดหมู่ของการวัดความยุติธรรมของแต่ละบุคคลด้วย สูตรทางคณิตศาสตร์มีดังนี้:

$P(R_{A\leftarrow a}=1\mid A=a,X=x)=P(R_{A\leftarrow b}=1\mid A=a,X=x),\quad \forall a,b;$

กล่าวคือ: สุ่มเลือกบุคคลหนึ่งคนที่มีคุณลักษณะที่ละเอียดอ่อนและคุณสมบัติอื่นๆและบุคคลเดียวกันนั้น หากเธอมี คุณลักษณะอื่น โอกาสที่พวกเขาจะได้รับการยอมรับควรเท่ากัน สัญลักษณ์แทนตัวแปรสุ่มเชิงสมมติในสถานการณ์ที่คุณลักษณะที่ละเอียดอ่อนถูกกำหนดให้คงที่เงื่อนไขบนหมายความว่าข้อกำหนดนี้อยู่ในระดับบุคคล กล่าวคือเรากำลังพิจารณาเงื่อนไขจากตัวแปรทั้งหมดที่ระบุการสังเกตเพียงครั้งเดียว $A=a$ $X=x$ $A=b$ ${\hat {R}}_{A\leftarrow a}$ $R$ $A$ $A=a$ $A=a,X=x$

แบบจำลองการเรียนรู้ของเครื่องมักได้รับการฝึกฝนจากข้อมูลที่ผลลัพธ์ขึ้นอยู่กับการตัดสินใจที่เกิดขึ้นในขณะนั้น^{[ 47 ]}ตัวอย่างเช่น หากแบบจำลองการเรียนรู้ของเครื่องต้องพิจารณาว่าผู้ต้องขังจะกระทำผิดซ้ำหรือไม่ และจะพิจารณาว่าควรปล่อยตัวผู้ต้องขังก่อนกำหนดหรือไม่ ผลลัพธ์อาจขึ้นอยู่กับว่าผู้ต้องขังได้รับการปล่อยตัวก่อนกำหนดหรือไม่ Mishler et al. ^{[ 48 ]}เสนอสูตรสำหรับอัตราต่อรองที่เท่ากันแบบสมมติ:

$P(R=1\mid Y^{0}=0,A=a)=P(R=1\mid Y^{0}=0,A=b)\wedge P(R=0\mid Y^{1}=1,A=a)=P(R=0\mid Y^{1}=1,A=b),\quad \forall a,b;$

โดยที่เป็นตัวแปรสุ่มแสดงถึงผลลัพธ์เมื่อมีการตัดสินใจ และเป็นคุณลักษณะที่ละเอียดอ่อน $R$ $Y^{x}$ $x$ $A$

Plecko และ Bareinboim ^{[ 49 ]}เสนอกรอบการทำงานที่เป็นเอกภาพเพื่อจัดการกับการวิเคราะห์เชิงสาเหตุของความยุติธรรม พวกเขาแนะนำให้ใช้แบบจำลองความยุติธรรมมาตรฐาน ซึ่งประกอบด้วยกราฟเชิงสาเหตุที่มีตัวแปร 4 ประเภท:

คุณลักษณะที่ละเอียดอ่อน ( ) $A$
ตัวแปรเป้าหมาย ( ), $Y$
ตัวกลาง ( ) ระหว่างและซึ่งแสดงถึงผลกระทบทางอ้อมที่ เป็นไปได้ ของคุณลักษณะที่ละเอียดอ่อนต่อผลลัพธ์ $W$ $A$ $Y$
ตัวแปรที่อาจมีสาเหตุ ร่วมกัน กับ( ) ซึ่งแสดงถึง ผลกระทบ ที่ไม่แท้จริง (เช่น ไม่ใช่สาเหตุ) ของคุณลักษณะที่ละเอียดอ่อนต่อผลลัพธ์ $A$ $Z$

ภายในกรอบนี้ Plecko และ Bareinboim ^{[ 49 ]}จึงสามารถจำแนกผลกระทบที่เป็นไปได้ที่คุณลักษณะที่ละเอียดอ่อนอาจมีต่อผลลัพธ์ได้ ยิ่งไปกว่านั้น ความละเอียดในการวัดผลกระทบเหล่านี้—กล่าวคือ ตัวแปรเงื่อนไขที่ใช้ในการหาค่าเฉลี่ยของผลกระทบ—เชื่อมโยงโดยตรงกับแง่มุม "รายบุคคลเทียบกับกลุ่ม" ของการประเมินความยุติธรรม

กลยุทธ์การลดอคติ

ความเป็นธรรมสามารถนำมาประยุกต์ใช้กับอัลกอริธึมการเรียนรู้ของเครื่องได้สามวิธี ได้แก่การประมวลผลข้อมูลเบื้องต้นการเพิ่มประสิทธิภาพระหว่างการฝึกซอฟต์แวร์ หรือการประมวลผลผลลัพธ์หลังการทำงานของอัลกอริธึม

การประมวลผลล่วงหน้า

โดยปกติแล้ว ปัญหาไม่ได้อยู่ที่ตัวจำแนกเพียงอย่างเดียวชุดข้อมูลก็อาจมีความลำเอียงด้วยเช่นกัน การจำแนกชุดข้อมูลตามกลุ่มสามารถกำหนดได้ดังนี้: ${\textstyle D}$ ${\textstyle A=a}$ $disc_{A=a}(D)={\frac {|\{X\in D|X(A)\neq a,X(Y)=+\}|}{|\{X\in D|X(A)\neq a\}|}}-{\frac {|\{X\in D|X(A)=a,X(Y)=+\}|}{|\{X\in D|X(A)=a\}|}}$

กล่าวคือ เป็นค่าประมาณของความแตกต่างระหว่างความน่าจะเป็นของการอยู่ในกลุ่มบวก โดยที่บุคคลนั้นมีลักษณะที่ได้รับการคุ้มครองซึ่งแตกต่างจากและ เท่ากับ ${\textstyle a}$ ${\textstyle a}$

อัลกอริทึมที่แก้ไขความลำเอียงในขั้นตอนการประมวลผลเบื้องต้นจะลบข้อมูลเกี่ยวกับตัวแปรในชุดข้อมูลที่อาจส่งผลให้เกิดการตัดสินใจที่ไม่เป็นธรรม โดยพยายามเปลี่ยนแปลงให้น้อยที่สุดเท่าที่จะเป็นไปได้ นี่ไม่ใช่เรื่องง่ายเพียงแค่ลบตัวแปรที่ละเอียดอ่อนออกไป เพราะคุณลักษณะอื่นๆ อาจมีความสัมพันธ์กับตัวแปรที่ได้รับการปกป้องอยู่

วิธีหนึ่งในการทำเช่นนี้คือ การแปลงข้อมูลของแต่ละบุคคลในชุดข้อมูลเริ่มต้นไปเป็นข้อมูลระดับกลาง ซึ่งทำให้ไม่สามารถระบุได้ว่าบุคคลนั้นอยู่ในกลุ่มที่ได้รับการคุ้มครองกลุ่มใด ในขณะเดียวกันก็ยังคงรักษาข้อมูลหลักไว้ให้มากที่สุด จากนั้นจึงปรับข้อมูลรูปแบบใหม่นี้เพื่อให้ได้ความแม่นยำสูงสุดในอัลกอริทึม

ด้วยวิธีนี้ บุคคลแต่ละคนจะถูกแปลงเป็นรูปแบบการแสดงผลแบบหลายตัวแปรใหม่ โดยที่ความน่าจะเป็นที่สมาชิกคนใดคนหนึ่งในกลุ่มที่ได้รับการคุ้มครองจะถูกแปลงเป็นค่าใดค่าหนึ่งในรูปแบบการแสดงผลใหม่นั้น จะเท่ากับความน่าจะเป็นของบุคคลที่ไม่ใช่สมาชิกของกลุ่มที่ได้รับการคุ้มครอง จากนั้น รูปแบบการแสดงผลนี้จะถูกนำมาใช้เพื่อทำนายผลสำหรับบุคคลนั้น แทนที่จะใช้ข้อมูลเริ่มต้น เนื่องจากรูปแบบการแสดงผลระดับกลางที่สร้างขึ้นนั้นให้ความน่าจะเป็นเท่ากันแก่บุคคลทั้งภายในและภายนอกกลุ่มที่ได้รับการคุ้มครอง คุณลักษณะนี้จึงถูกซ่อนไว้จากตัวจำแนกประเภท

ตัวอย่างหนึ่งได้รับการอธิบายใน Zemel et al. ^{[ 50 ]}ซึ่งตัวแปรสุ่มแบบหลายนามถูกใช้เป็นตัวแทนระดับกลาง ในกระบวนการนี้ ระบบได้รับการสนับสนุนให้รักษาข้อมูลทั้งหมด ยกเว้นข้อมูลที่อาจนำไปสู่การตัดสินใจที่ลำเอียง และเพื่อให้ได้การคาดการณ์ที่แม่นยำที่สุดเท่าที่จะเป็นไปได้

ในด้านหนึ่ง วิธีการนี้มีข้อดีคือข้อมูลที่ผ่านการประมวลผลล่วงหน้าสามารถนำไปใช้กับงานเรียนรู้ของเครื่องใดๆ ก็ได้ นอกจากนี้ ตัวจำแนกไม่จำเป็นต้องได้รับการแก้ไข เนื่องจากมีการปรับแก้ชุดข้อมูลก่อนการประมวลผลแล้ว ในอีกด้านหนึ่ง วิธีการอื่นๆ ให้ผลลัพธ์ที่ดีกว่าในด้านความแม่นยำและความเป็นธรรม

การชั่งน้ำหนักใหม่

การชั่งน้ำหนักใหม่เป็นตัวอย่างของอัลกอริธึมการประมวลผลล่วงหน้า แนวคิดคือการกำหนดน้ำหนักให้กับจุดข้อมูลแต่ละจุดเพื่อให้การจำแนกน้ำหนักเป็น 0 เมื่อเทียบกับกลุ่มที่กำหนด^{[ 51 ]}

หากชุดข้อมูลไม่มีอคติ ตัวแปรที่ไวต่อการเปลี่ยนแปลงและตัวแปรเป้าหมายจะเป็นอิสระต่อกันทางสถิติและความน่าจะเป็นของการแจกแจงร่วมจะเป็นผลคูณของความน่าจะเป็นดังต่อไปนี้: ${\textstyle D}$ ${\textstyle A}$ ${\textstyle Y}$ $P_{exp}(A=a\wedge Y=+)=P(A=a)\times P(Y=+)={\frac {|\{X\in D|X(A)=a\}|}{|D|}}\times {\frac {|\{X\in D|X(Y)=+\}|}{|D|}}$

แต่ในความเป็นจริง ชุดข้อมูลนั้นไม่ได้ปราศจากอคติ และตัวแปรต่างๆ ก็ไม่ได้เป็นอิสระทางสถิติ ดังนั้นความน่าจะเป็นที่สังเกตได้จึงเป็นดังนี้: $P_{obs}(A=a\wedge Y=+)={\frac {|\{X\in D|X(A)=a\wedge X(Y)=+\}|}{|D|}}$

เพื่อชดเชยความลำเอียง ซอฟต์แวร์จะเพิ่มค่าน้ำหนัก โดยให้ค่าน้ำหนัก น้อยกว่าสำหรับวัตถุที่ชื่นชอบ และให้ค่าน้ำหนักมากกว่าสำหรับวัตถุที่ไม่ชื่นชอบ สำหรับแต่ละกรณีเราจะได้ผลลัพธ์ดังนี้: ${\textstyle X\in D}$ $W(X)={\frac {P_{exp}(A=X(A)\wedge Y=X(Y))}{P_{obs}(A=X(A)\wedge Y=X(Y))}}$

เมื่อเรากำหนดค่าน้ำหนักให้กับแต่ละกลุ่มแล้วเราจะคำนวณค่าการจำแนกแบบถ่วงน้ำหนักโดยสัมพันธ์กับกลุ่มดังนี้: ${\textstyle X}$ ${\textstyle W(X)}$ ${\textstyle A=a}$ $disc_{A=a}(D)={\frac {\sum W(X)X\in \{X\in D|X(A)\neq a,X(Y)=+\}}{\sum W(X)X\in \{X\in D|X(A)\neq a\}}}-{\frac {\sum W(X)X\in \{X\in D|X(A)=a,X(Y)=+\}}{\sum W(X)X\in \{X\in D|X(A)=a\}}}$

สามารถแสดงได้ว่าหลังจากปรับน้ำหนักใหม่แล้ว ค่าการจำแนกแบบถ่วงน้ำหนักนี้จะเป็น 0

กระบวนการเข้า

แนวทางอื่นคือการแก้ไขอคติในระหว่างการฝึกอบรม ซึ่งสามารถทำได้โดยการเพิ่มข้อจำกัดให้กับวัตถุประสงค์การปรับให้เหมาะสมของอัลกอริทึม^{[ 52 ]}ข้อจำกัดเหล่านี้บังคับให้อัลกอริทึมปรับปรุงความยุติธรรมโดยการรักษาอัตราเดียวกันของมาตรการบางอย่างสำหรับกลุ่มที่ได้รับการคุ้มครองและบุคคลอื่น ๆ ตัวอย่างเช่น เราสามารถเพิ่มเงื่อนไขให้กับวัตถุประสงค์ของอัลกอริทึมว่าอัตราการเกิดผลบวกเท็จจะต้องเท่ากันสำหรับบุคคลในกลุ่มที่ได้รับการคุ้มครองและบุคคลภายนอกกลุ่มที่ได้รับการคุ้มครอง

มาตรการหลักที่ใช้ในแนวทางนี้ ได้แก่ อัตราผลบวกเท็จ อัตราผลลบเท็จ และอัตราการจำแนกผิดโดยรวม สามารถเพิ่มข้อจำกัดเหล่านี้เพียงหนึ่งข้อหรือหลายข้อลงในเป้าหมายของอัลกอริทึมได้ โปรดทราบว่า ความเท่าเทียมกันของอัตราผลลบเท็จหมายถึงความเท่าเทียมกันของอัตราผลบวกจริง ดังนั้นจึงหมายถึงความเท่าเทียมกันของโอกาส หลังจากเพิ่มข้อจำกัดลงในปัญหาแล้ว ปัญหาอาจแก้ไขได้ยาก ดังนั้นอาจจำเป็นต้องผ่อนปรนข้อจำกัดเหล่านั้น

การลดอคติแบบต่อต้าน

เราฝึกตัวจำแนก สองตัว พร้อมกันโดยใช้วิธีการไล่ระดับ (เช่นการไล่ระดับแบบลดระดับ ) ตัวแรกคือตัวทำนายพยายามที่จะทำนายตัวแปรเป้าหมาย โดยกำหนดอินพุต โดยการปรับน้ำหนักเพื่อลดฟังก์ชันการสูญเสีย บาง อย่าง ตัวที่สองคือตัวโจมตีพยายามที่จะทำนายตัวแปรที่ไวต่อการเปลี่ยนแปลง โดยกำหนดอินพุต โดยการปรับน้ำหนักเพื่อลดฟังก์ชันการสูญเสียบางอย่าง[ ⁵³^]^จุด สำคัญในที่นี้คือ เพื่อให้การแพร่กระจายถูกต้องข้างต้นต้องอ้างอิงถึงเอาต์พุตดิบของตัวจำแนก ไม่ใช่การทำนายแบบไม่ต่อเนื่อง ตัวอย่างเช่น สำหรับโครง ข่ายประสาทเทียมและปัญหาการจำแนกประเภทอาจอ้างอิงถึงเอาต์พุตของเลเยอร์ softmax ${\textstyle Y}$ ${\textstyle X}$ ${\textstyle W}$ ${\textstyle L_{P}({\hat {y}},y)}$ ${\textstyle A}$ ${\textstyle {\hat {Y}}}$ ${\textstyle U}$ ${\textstyle L_{A}({\hat {a}},a)}$ ${\textstyle {\hat {Y}}}$ ${\textstyle {\hat {Y}}}$

จากนั้นเราจะอัปเดตเพื่อลดค่าให้น้อยที่สุดในแต่ละขั้นตอนการฝึกอบรมตามเกรเดียนต์และเราจะปรับเปลี่ยนตามนิพจน์: โดยที่เป็นไฮเปอร์พารามิเตอร์ ที่ปรับได้ ซึ่งสามารถเปลี่ยนแปลงได้ในแต่ละช่วงเวลา ${\textstyle U}$ ${\textstyle L_{A}}$ ${\textstyle \nabla _{U}L_{A}}$ ${\textstyle W}$ $\nabla _{W}L_{P}-proj_{\nabla _{W}L_{A}}\nabla _{W}L_{P}-\alpha \nabla _{W}L_{A}$ $\alpha$

การแสดงภาพกราฟิกของเวกเตอร์ที่ใช้ในการลดอคติแบบต่อต้านดังที่แสดงใน Zhang et al. ^{[ 53 ]}

แนวคิดโดยสัญชาตญาณคือ เราต้องการให้ตัวทำนายพยายามลดค่า(ดังนั้นจึงใช้เทอม) ให้เหลือน้อยที่สุด ในขณะเดียวกันก็เพิ่มค่า(ดังนั้นจึงใช้เทอม) ให้มากที่สุด เพื่อให้ฝ่ายตรงข้ามไม่สามารถทำนายตัวแปรที่สำคัญจาก ได้ ${\textstyle L_{P}}$ ${\textstyle \nabla _{W}L_{P}}$ ${\textstyle L_{A}}$ ${\textstyle -\alpha \nabla _{W}L_{A}}$ ${\textstyle {\hat {Y}}}$

เงื่อนไขนี้ป้องกันไม่ให้ตัวทำนายเคลื่อนที่ไปในทิศทางที่ช่วยให้ฝ่ายตรงข้ามลดฟังก์ชันความสูญเสียลงได้ ${\textstyle -proj_{\nabla _{W}L_{A}}\nabla _{W}L_{P}}$

สามารถแสดงให้เห็นได้ว่า การฝึกโมเดล การจำแนกประเภท ตัวทำนายด้วยอัลกอริธึมนี้ ช่วยปรับปรุงความเท่าเทียมกันทางด้านประชากรศาสตร์เมื่อเทียบกับการฝึกโมเดลโดยไม่มีตัว ร้าย

การประมวลผลภายหลัง

วิธีสุดท้ายพยายามแก้ไขผลลัพธ์ของตัวจำแนกเพื่อให้เกิดความเป็นธรรม ในวิธีนี้ เรามีตัวจำแนกที่ให้คะแนนแก่แต่ละบุคคล และเราจำเป็นต้องทำนายผลแบบไบนารีสำหรับพวกเขา คะแนนสูงมีแนวโน้มที่จะได้ผลลัพธ์ที่เป็นบวก ในขณะที่คะแนนต่ำมีแนวโน้มที่จะได้ผลลัพธ์ที่เป็นลบ แต่เราสามารถปรับค่าเกณฑ์เพื่อกำหนดว่าจะตอบว่าใช่เมื่อใดตามที่ต้องการ โปรดทราบว่าการเปลี่ยนแปลงในค่าเกณฑ์จะส่งผลต่อความสมดุลระหว่างอัตราผลบวกที่แท้จริงและผลลบที่แท้จริง

หากฟังก์ชันคะแนนมีความเป็นธรรมในแง่ที่ว่าเป็นอิสระจากคุณลักษณะที่ได้รับการคุ้มครอง การเลือกเกณฑ์ใดๆ ก็จะมีความเป็นธรรมเช่นกัน แต่ตัวจำแนกประเภทนี้มักมีอคติ ดังนั้นอาจต้องใช้เกณฑ์ที่แตกต่างกันสำหรับแต่ละกลุ่มที่ได้รับการคุ้มครองเพื่อให้เกิดความเป็นธรรม^{[ 54 ]}วิธีหนึ่งในการทำเช่นนี้คือการพล็อตอัตราการตรวจพบที่ถูกต้องเทียบกับอัตราการตรวจพบที่ผิดพลาดที่การตั้งค่าเกณฑ์ต่างๆ (เรียกว่าเส้นโค้ง ROC ) และหาเกณฑ์ที่อัตราสำหรับกลุ่มที่ได้รับการคุ้มครองและบุคคลอื่นๆ เท่ากัน^{[ 54 ]}

การปฏิเสธการจำแนกประเภทตามตัวเลือก

เมื่อกำหนดตัวจำแนกแล้ว ให้เป็นความน่าจะเป็นที่คำนวณโดยตัวจำแนกเป็นความน่าจะเป็นที่อินสแตนซ์เป็นของคลาสบวก + เมื่อมีค่าใกล้เคียงกับ 1 หรือ 0 อินสแตนซ์จะถูกระบุด้วยความแน่นอนสูงว่าเป็นของคลาส + หรือ – ตามลำดับ อย่างไรก็ตาม เมื่อมีค่าใกล้เคียงกับ 0.5 การจำแนกประเภทจะไม่ชัดเจนมากขึ้น^[⁵⁵^] ${\textstyle P(+|X)}$ ${\textstyle X}$ ${\textstyle P(+|X)}$ ${\textstyle X}$ ${\textstyle P(+|X)}$

เรากล่าวว่าเป็น "กรณีที่ถูกปฏิเสธ" หากมีค่าบางอย่างที่ทำให้ ${\textstyle X}$ ${\textstyle max(P(+|X),1-P(+|X))\leq \theta }$ ${\textstyle \theta }$ ${\textstyle 0.5<\theta <1}$

อัลกอริทึมของ "ROC" ประกอบด้วยการจำแนกอินสแตนซ์ที่ไม่ถูกปฏิเสธตามกฎข้างต้น และอินสแตนซ์ที่ถูกปฏิเสธดังนี้: หากอินสแตนซ์เป็นตัวอย่างของกลุ่มที่ด้อยโอกาส ( ) ให้ติดป้ายกำกับว่าเป็นบวก มิเช่นนั้นให้ติดป้ายกำกับว่าเป็นลบ $X(A)=a$

เราสามารถปรับมาตรการการเลือกปฏิบัติที่แตกต่างกัน (ลิงก์) ให้เป็นฟังก์ชันของเพื่อค้นหาค่าที่เหมาะสมที่สุดสำหรับแต่ละปัญหา และหลีกเลี่ยงการเลือกปฏิบัติกับกลุ่มที่มีสิทธิพิเศษ^[⁵⁵^] ${\textstyle \theta }$ ${\textstyle \theta }$

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Fairness_(machine_learning)&oldid=1359366213 "

ความเป็นธรรม (การเรียนรู้ของเครื่องจักร)

บริบท

อคติทางภาษา

อคติทางเพศ

อคติทางการเมือง

ประเด็นถกเถียง

ข้อจำกัด

เกณฑ์ความเป็นธรรมของกลุ่ม

เอกราช

การแยกจากกัน

ความเพียงพอ

ความสัมพันธ์ระหว่างคำจำกัดความ

การกำหนดนิยามความยุติธรรมของกลุ่มด้วยสูตรทางคณิตศาสตร์

คำจำกัดความเบื้องต้น

คำจำกัดความที่อิงตามผลลัพธ์ที่คาดการณ์ไว้

คำจำกัดความที่อิงตามผลลัพธ์ที่คาดการณ์และผลลัพธ์ที่เกิดขึ้นจริง

คำจำกัดความที่อิงตามความน่าจะเป็นที่คาดการณ์ไว้และผลลัพธ์ที่เกิดขึ้นจริง

ความสับสนที่เท่าเทียมกัน ความยุติธรรม

หน้าที่ด้านสวัสดิการสังคม

เกณฑ์ความยุติธรรมเฉพาะบุคคล

ตัวชี้วัดตามหลักเหตุและผล

กลยุทธ์การลดอคติ

การประมวลผลล่วงหน้า

การชั่งน้ำหนักใหม่

กระบวนการเข้า

การลดอคติแบบต่อต้าน

การประมวลผลภายหลัง

การปฏิเสธการจำแนกประเภทตามตัวเลือก

ดูเพิ่มเติม

ข้อมูลสำคัญจากบทความ