อ่าน 18 นาที
อัตราส่วนความน่าจะเป็น
อัตราส่วน ความน่าจะเป็น ( Odds Ratio หรือ OR ) เป็น สถิติ ที่ใช้วัดความแข็งแกร่งของ ความสัมพันธ์ ระหว่างเหตุการณ์สองเหตุการณ์ คือ A และ B อัตราส่วนความน่าจะเป็นถูกกำหนดให้เป็น...
อัตราส่วนความน่าจะเป็น
อัตราส่วน ความน่าจะเป็น ( Odds RatioหรือOR ) เป็นสถิติที่ใช้วัดความแข็งแกร่งของความสัมพันธ์ระหว่างเหตุการณ์สองเหตุการณ์ คือ A และ B อัตราส่วนความน่าจะเป็นถูกกำหนดให้เป็นอัตราส่วนของความน่าจะเป็นที่เหตุการณ์ A จะเกิดขึ้นเมื่อมีเหตุการณ์ B อยู่ด้วย และความน่าจะเป็นที่เหตุการณ์ A จะเกิดขึ้นเมื่อไม่มีเหตุการณ์ B อยู่ด้วย เนื่องจากสมมาตรอัตราส่วนความน่าจะเป็นจึงคำนวณอัตราส่วนผกผันของความน่าจะเป็นที่เหตุการณ์ B จะเกิดขึ้นเมื่อมีเหตุการณ์ A อยู่ด้วย และความน่าจะเป็นที่เหตุการณ์ B จะเกิดขึ้นเมื่อไม่มีเหตุการณ์ A อยู่ด้วย เหตุการณ์สองเหตุการณ์จะเป็นอิสระต่อกันก็ต่อเมื่อ OR เท่ากับ 1 กล่าวคือ ความน่าจะเป็นของเหตุการณ์หนึ่งจะเท่ากันไม่ว่าจะมีหรือไม่มีเหตุการณ์อีกเหตุการณ์หนึ่งอยู่ด้วยก็ตาม ถ้าค่า OR มากกว่า 1 แสดงว่า A และ B มีความสัมพันธ์กัน (สหสัมพันธ์) ในแง่ที่ว่า เมื่อเปรียบเทียบกับการไม่มี B การมี B จะเพิ่มโอกาสที่จะเกิด A และในทางกลับกัน การมี A ก็จะเพิ่มโอกาสที่จะเกิด B ในทางตรงกันข้าม ถ้าค่า OR น้อยกว่า 1 แสดงว่า A และ B มีความสัมพันธ์เชิงลบ และการเกิดเหตุการณ์หนึ่งจะลดโอกาสที่จะเกิดอีกเหตุการณ์หนึ่ง
โปรดทราบว่าอัตราส่วนความน่าจะเป็นมีความสมมาตรในเหตุการณ์ทั้งสอง และไม่มี ทิศทาง เชิงสาเหตุ ใด ๆ ที่บ่งบอก (ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ ): OR ที่มากกว่า 1 ไม่ได้พิสูจน์ว่า B เป็นสาเหตุของ A หรือว่า A เป็นสาเหตุของ B [ 1 ]
สถิติที่คล้ายคลึงกันสองอย่างที่มักใช้ในการวัดความสัมพันธ์คือความเสี่ยงสัมพัทธ์ (RR) และการลดความเสี่ยงสัมบูรณ์ (ARR) บ่อยครั้งที่พารามิเตอร์ที่น่าสนใจที่สุดคือ RR ซึ่งเป็นอัตราส่วนของความน่าจะเป็นที่คล้ายกับอัตราต่อรองที่ใช้ใน OR อย่างไรก็ตาม ข้อมูลที่มีอยู่มักไม่เอื้ออำนวยต่อการคำนวณ RR หรือ ARR แต่เอื้ออำนวยต่อการคำนวณ OR เช่นในงานวิจัยแบบกรณีศึกษาและกลุ่มควบคุมดังที่อธิบายไว้ด้านล่าง ในทางกลับกัน หากคุณสมบัติใดคุณสมบัติหนึ่ง (A หรือ B) เกิดขึ้นได้ยาก (ในระบาดวิทยาเรียกว่าสมมติฐานโรคหายาก ) แล้ว OR จะมีค่าประมาณเท่ากับ RR ที่สอดคล้องกัน
OR มีบทบาทสำคัญในแบบจำลองโลจิสติกส์
คำจำกัดความและคุณสมบัติพื้นฐาน
สัญชาตญาณจากตัวอย่างสำหรับคนทั่วไป
ถ้าเราโยนเหรียญที่ไม่เอนเอียง โอกาสที่จะได้หัวและโอกาสที่จะได้ก้อยจะเท่ากัน คือ 50% ทั้งคู่ ลองจินตนาการว่าเรามีเหรียญที่เอนเอียง ซึ่งถ้าโยนแล้ว โอกาสที่จะได้หัวจะมากกว่าก้อยถึงสองเท่า (กล่าวคือโอกาสเพิ่มขึ้นเป็นสองเท่า จาก 1:1 เป็น 2:1) โอกาสใหม่จะเป็น 66.666...% สำหรับหัว และ 33.333...% สำหรับก้อย
ตัวอย่างที่สร้างแรงบันดาลใจ ในบริบทของสมมติฐานเกี่ยวกับโรคหายาก
สมมติว่าการรั่วไหลของรังสีในหมู่บ้านที่มีประชากร 1,000 คน ทำให้เกิดโรคหายากเพิ่มขึ้น จำนวนประชากรทั้งหมดที่ได้รับรังสีคือ ซึ่งในจำนวนนั้นป่วยเป็นโรคและมีสุขภาพดี จำนวนประชากรทั้งหมดที่ไม่ได้ได้รับรังสีคือ ซึ่งในจำนวนนั้นป่วยเป็นโรคและมีสุขภาพดี เราสามารถจัดเรียงข้อมูลนี้ในตารางความสัมพันธ์ได้ดังนี้:
ความเสี่ยงในการเกิดโรคเมื่อได้รับสัมผัสคือและความเสี่ยงในการเกิดโรคเมื่อไม่ได้รับสัมผัสคือวิธีที่ชัดเจนวิธีหนึ่งในการเปรียบเทียบความเสี่ยงคือการใช้สัดส่วนของทั้งสอง ซึ่งก็คือความ เสี่ยงสัมพัทธ์
อัตราส่วนความเสี่ยง (odds ratio) นั้นแตกต่างกันความเสี่ยงที่จะเป็นโรคหากสัมผัสเชื้อคือและความเสี่ยงหากไม่สัมผัสเชื้อคือ อัตราส่วนความเสี่ยงคืออัตราส่วนของทั้งสองค่า
ดังที่แสดงให้เห็นในตัวอย่างนี้ ในกรณีของโรคหายากเช่นนี้ความเสี่ยงสัมพัทธ์และอัตราส่วนความน่าจะเป็นแทบจะเท่ากัน ตามนิยามแล้ว โรคหายากหมายความว่าและดังนั้น ตัวหารในความเสี่ยงสัมพัทธ์และอัตราส่วนความน่าจะเป็นจึงแทบจะเท่ากัน ( และ)
ความเสี่ยงสัมพัทธ์นั้นเข้าใจง่ายกว่าอัตราส่วนความน่าจะเป็น แต่เหตุผลหนึ่งที่ต้องใช้อัตราส่วนความน่าจะเป็นก็คือ โดยปกติแล้ว ข้อมูลเกี่ยวกับประชากรทั้งหมดจะไม่สามารถหาได้ และ ต้องใช้ การสุ่มตัวอย่างในตัวอย่างข้างต้น หากการสัมภาษณ์ชาวบ้านและหาว่าพวกเขาได้รับรังสีหรือไม่นั้นมีค่าใช้จ่ายสูงมากความชุกของการได้รับรังสีก็จะไม่เป็นที่ทราบ และค่าของหรือ ก็จะไม่ เป็นที่ทราบเช่นกัน เราอาจสุ่มตัวอย่างชาวบ้าน 50 คน แต่เป็นไปได้ว่าตัวอย่างสุ่มดังกล่าวจะไม่รวมใครเลยที่เป็นโรค เนื่องจากมีเพียง 2.6% ของประชากรเท่านั้นที่เป็นโรค แทนที่จะเป็นเช่นนั้น เราอาจใช้การศึกษาแบบกรณีควบคุม[ 2 ]ซึ่งสัมภาษณ์ชาวบ้านที่เป็นโรคทั้งหมด 26 คน รวมทั้งตัวอย่างสุ่ม 26 คนที่ไม่เป็นโรค ผลลัพธ์อาจออกมาเป็นดังนี้ ("อาจ" เพราะนี่คือตัวอย่างสุ่ม):
ในกลุ่มตัวอย่างนี้ โอกาสที่จะเป็นโรคเมื่อได้รับเชื้อคือ 20/10 และโอกาสที่จะเป็นโรคเมื่อไม่ได้รับเชื้อคือ 6/16 ดังนั้น อัตราส่วนความเสี่ยงจึงค่อนข้างใกล้เคียงกับอัตราส่วนความเสี่ยงที่คำนวณได้สำหรับทั้งหมู่บ้าน อย่างไรก็ตาม ไม่สามารถคำนวณความเสี่ยงสัมพัทธ์ได้ เนื่องจากเป็นอัตราส่วนของความเสี่ยงในการเป็นโรค และเราจำเป็นต้องใช้ค่าและเพื่อคำนวณค่าเหล่านั้น เนื่องจากในการศึกษาครั้งนี้ได้เลือกเฉพาะผู้ที่เป็นโรค ดังนั้นครึ่งหนึ่งของกลุ่มตัวอย่างจึงเป็นโรค และเป็นที่ทราบกันดีว่าจำนวนนี้มากกว่าอัตราการแพร่ระบาดในประชากรโดยรวม ดังนั้น จำนวนผู้ป่วยและผู้ที่ไม่เป็นโรคในกลุ่มที่ได้รับเชื้อ และจำนวนผู้ป่วยและผู้ที่ไม่เป็นโรคในกลุ่มที่ไม่ได้รับเชื้อ จึงไม่สามารถนำมาบวกกันได้
ในเอกสารทางการแพทย์ การคำนวณอัตราส่วนความเสี่ยง (odds ratio) และใช้สมมติฐานโรคหายาก (ซึ่งโดยทั่วไปถือว่าสมเหตุสมผล) เพื่ออ้างว่าความเสี่ยงสัมพัทธ์ (relative risk) มีค่าประมาณเท่ากับอัตราส่วนความเสี่ยงถือเป็นมาตรฐาน วิธีนี้ไม่เพียงแต่ช่วยให้สามารถใช้การศึกษาแบบกรณีควบคุม (case-control studies) ได้เท่านั้น แต่ยังทำให้การควบคุมตัวแปรแทรกซ้อนเช่น น้ำหนักหรืออายุ โดยใช้การวิเคราะห์การถดถอย (regression analysis) ทำได้ง่ายขึ้น และมีคุณสมบัติที่พึงประสงค์ดังที่ได้กล่าวถึงในส่วนอื่นๆ ของบทความนี้ คือความไม่เปลี่ยนแปลงและความไม่ไวต่อประเภทของการสุ่มตัวอย่าง[ 3 ]
นิยามในแง่ของอัตราต่อรองตามกลุ่ม
อัตราส่วนความน่าจะเป็น (Odds Ratio) คือ อัตราส่วนของความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นในกลุ่มหนึ่ง ต่อความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นในอีกกลุ่มหนึ่ง คำนี้ยังใช้เพื่ออ้างถึงการประมาณค่าอัตราส่วนนี้จากตัวอย่างด้วย กลุ่มเหล่านี้อาจเป็นชายและหญิง กลุ่มทดลองและกลุ่มควบคุมหรือ การจำแนก แบบสองกลุ่ม อื่นๆ ถ้าความน่าจะเป็นของเหตุการณ์ในแต่ละกลุ่มคือp₁ (กลุ่มแรก) และp₂ (กลุ่มที่สอง) แล้ว อัตราส่วนความน่าจะเป็นคือ:
โดยที่q x = 1 − p xอัตราส่วนความน่าจะเป็น (odds ratio) เท่ากับ 1 แสดงว่าเงื่อนไขหรือเหตุการณ์ที่กำลังศึกษาอยู่นั้นมีโอกาสเกิดขึ้นเท่ากันในทั้งสองกลุ่ม อัตราส่วนความน่าจะเป็นที่มากกว่า 1 แสดงว่าเงื่อนไขหรือเหตุการณ์นั้นมีโอกาสเกิดขึ้นในกลุ่มแรกมากกว่า และอัตราส่วนความน่าจะเป็นที่น้อยกว่า 1 แสดงว่าเงื่อนไขหรือเหตุการณ์นั้นมีโอกาสเกิดขึ้นในกลุ่มแรกน้อยกว่า อัตราส่วนความน่าจะเป็นต้องมีค่าไม่เป็นลบจึงจะนิยามได้ หากp 2 q 1เท่ากับศูนย์ หรือq 1เท่ากับศูนย์ จะ นิยาม ไม่ ได้
นิยามในแง่ของความน่าจะเป็นร่วมและความน่าจะเป็นแบบมีเงื่อนไข
อัตราส่วนความน่าจะเป็นสามารถกำหนดได้โดยใช้การแจกแจงความน่าจะเป็นร่วมของตัวแปรสุ่ม ไบนารีสองตัว การแจกแจงความน่าจะเป็นร่วมของตัวแปรสุ่มไบนารีXและYสามารถเขียนได้ดังนี้
โดยที่p 11 , p 10 , p 01และp 00คือ "ความน่าจะเป็นของเซลล์" ที่ไม่ติดลบและรวมกันได้เท่ากับหนึ่ง อัตราต่อรองสำหรับYภายในประชากรย่อยสองกลุ่มที่กำหนดโดยX = 1 และX = 0 ถูกกำหนดในแง่ของความน่าจะเป็นแบบมีเงื่อนไขเมื่อกำหนดXแล้วนั่นคือP ( Y | X ) :
ดังนั้น อัตราส่วนความน่าจะเป็นคือ:
โปรดทราบว่าอัตราส่วนความน่าจะเป็น (odds ratio) คือผลคูณของความน่าจะเป็นของ " เซลล์ที่สอดคล้องกัน " ( X = Y )หารด้วยผลคูณของความน่าจะเป็นของ " เซลล์ที่ไม่สอดคล้องกัน " ( X ≠ Y )อย่างไรก็ตาม ในบางแอปพลิเคชัน การกำหนดป้ายกำกับหมวดหมู่เป็นศูนย์และหนึ่งนั้นเป็นไปโดยพลการ ดังนั้นจึงไม่มีอะไรพิเศษเกี่ยวกับค่าที่สอดคล้องกันเทียบกับค่าที่ไม่สอดคล้องกันในแอปพลิเคชันเหล่านี้
สมมาตร
ถ้าเราคำนวณอัตราส่วนความน่าจะเป็นโดยอิงจากความน่าจะเป็นแบบมีเงื่อนไขเมื่อกำหนดค่าYแล้ว
เราก็จะได้รับผลลัพธ์เดียวกัน
มาตรวัดขนาดผลกระทบ อื่นๆ สำหรับข้อมูลไบนารีเช่นความเสี่ยงสัมพัทธ์ไม่มีคุณสมบัติสมมาตรนี้
ความสัมพันธ์กับความเป็นอิสระทางสถิติ
ถ้าXและYเป็นอิสระต่อกัน ความน่าจะเป็นร่วมของทั้งสองสามารถแสดงได้ในรูปของความน่าจะเป็นส่วนย่อยp x = P ( X = 1)และp y = P ( Y = 1)ดังนี้
ในกรณีนี้ อัตราส่วนความน่าจะเป็นเท่ากับหนึ่ง และในทางกลับกัน อัตราส่วนความน่าจะเป็นจะเท่ากับหนึ่งได้ก็ต่อเมื่อความน่าจะเป็นร่วมสามารถแยกตัวประกอบได้ในลักษณะนี้ ดังนั้น อัตราส่วนความน่าจะเป็นจะเท่ากับหนึ่งก็ต่อเมื่อXและYเป็นอิสระต่อกัน
การกู้คืนความน่าจะเป็นของเซลล์จากอัตราส่วนความน่าจะเป็นและความน่าจะเป็นส่วนขอบ
อัตราส่วนความน่าจะเป็นเป็นฟังก์ชันของความน่าจะเป็นของเซลล์ และในทางกลับกัน ความน่าจะเป็นของเซลล์สามารถหาได้จากความรู้เกี่ยวกับอัตราส่วนความน่าจะเป็นและความน่าจะเป็นส่วนขอบP ( X = 1) = p 11 + p 10และP ( Y = 1) = p 11 + p 01ถ้าอัตราส่วนความน่าจะเป็นRแตกต่างจาก 1 แล้ว
โดยที่p 1• = p 11 + p 10 , p •1 = p 11 + p 01 , และ
ในกรณีที่R = 1เราจะมีความเป็นอิสระ ดังนั้นp 11 = p 1• p • 1
เมื่อเราได้ค่าp 11แล้ว ความน่าจะเป็นของเซลล์อีกสามเซลล์ที่เหลือก็สามารถหาได้จากความน่าจะเป็นแบบมาร์จินัลได้อย่างง่ายดาย
ตัวอย่าง

สมมติว่าในกลุ่มตัวอย่างผู้ชาย 100 คน มี 90 คนดื่มไวน์ในสัปดาห์ก่อนหน้า (ดังนั้น 10 คนไม่ได้ดื่ม) ในขณะที่ในกลุ่มตัวอย่างผู้หญิง 80 คน มีเพียง 20 คนเท่านั้นที่ดื่มไวน์ในช่วงเวลาเดียวกัน (ดังนั้น 60 คนไม่ได้ดื่ม) นี่คือตารางความสัมพันธ์:
อัตราส่วนความน่าจะเป็น (OR) สามารถคำนวณได้โดยตรงจากตารางนี้ดังนี้:
อีกทางหนึ่ง โอกาสที่ผู้ชายจะดื่มไวน์คือ 90 ต่อ 10 หรือ 9:1 ในขณะที่โอกาสที่ผู้หญิงจะดื่มไวน์คือ 20 ต่อ 60 หรือ 1:3 = 0.33 ดังนั้น อัตราส่วนความน่าจะเป็นคือ 9/0.33 หรือ 27 ซึ่งแสดงให้เห็นว่าผู้ชายมีแนวโน้มที่จะดื่มไวน์มากกว่าผู้หญิงมาก การคำนวณโดยละเอียดมีดังนี้:
ตัวอย่างนี้ยังแสดงให้เห็นว่าอัตราส่วนความน่าจะเป็นบางครั้งมีความละเอียดอ่อนในการระบุตำแหน่งสัมพัทธ์: ในตัวอย่างนี้ ผู้ชายมีโอกาสดื่มไวน์มากกว่าผู้หญิง (90/100)/(20/80) = 3.6 เท่า แต่มีความน่าจะเป็นมากกว่าถึง 27 เท่า ลอการิทึมของอัตราส่วนความน่าจะเป็น ซึ่งเป็นผลต่างของลอจิตของความน่าจะเป็น จะช่วยลดผลกระทบนี้ และยังทำให้การวัดมีความสมมาตรเมื่อเทียบกับลำดับของกลุ่ม ตัวอย่างเช่น เมื่อใช้ลอการิทึมธรรมชาติอัตราส่วนความน่าจะเป็น 27/1 จะเท่ากับ 3.296 และอัตราส่วนความน่าจะเป็น 1/27 จะเท่ากับ −3.296
การอนุมานทางสถิติ

มีการพัฒนาแนวทางหลายวิธีในการอนุมานทางสถิติสำหรับอัตราส่วนความน่าจะเป็น
แนวทางหนึ่งในการอนุมานใช้การประมาณค่าจากตัวอย่างขนาดใหญ่กับค่าการแจกแจงตัวอย่างของอัตราส่วนลอการิทึมของอัตราต่อรอง ( ลอการิทึมธรรมชาติของอัตราส่วนอัตราต่อรอง) หากเราใช้สัญลักษณ์ความน่าจะเป็นร่วมที่กำหนดไว้ข้างต้น อัตราส่วนลอการิทึมของอัตราต่อรองของประชากรจะเป็นดังนี้
หากเราพิจารณาข้อมูลในรูปแบบตารางความสัมพันธ์
จากนั้นสามารถประมาณความน่าจะเป็นในการแจกแจงร่วมได้ดังนี้
ที่ไหนij = n ij / nโดยที่ n = n 11 + n 10 + n 01 + n 00คือผลรวมของจำนวนเซลล์ทั้งสี่ อัตราส่วนลอการิทึมของอัตราต่อรองของตัวอย่างคือ
- .
การกระจายตัวของอัตราส่วนลอการิทึมของอัตราต่อรองมีลักษณะใกล้เคียง กับการกระจาย แบบปกติ โดยมีรายละเอียดดังนี้ :
ค่าความคลาดเคลื่อนมาตรฐานสำหรับอัตราส่วนลอการิทึมของอัตราต่อรองคือประมาณ
- .
นี่เป็นการประมาณค่าเชิงอะซิมโทติก และจะไม่ให้ผลลัพธ์ที่มีความหมายหากจำนวนเซลล์ใดๆ มีขนาดเล็กมาก หากLคืออัตราส่วนลอการิทึมของอัตราต่อรองตัวอย่างช่วงความเชื่อ มั่น 95% โดยประมาณ สำหรับอัตราส่วนลอการิทึมของอัตราต่อรองของประชากรคือL ± 1.96SE [ 4 ] สามารถ แมปไปยังexp( L − 1.96SE), exp( L + 1.96SE)เพื่อให้ได้ช่วงความเชื่อมั่น 95% สำหรับอัตราส่วนอัตราต่อรอง หากเราต้องการทดสอบสมมติฐานว่าอัตราส่วนอัตราต่อรองของประชากรเท่ากับหนึ่งค่า p สองด้าน คือ2 P ( Z < −| L |/SE)โดยที่Pหมาย ถึงความน่าจะเป็น และZหมายถึงตัวแปรสุ่มปกติมาตรฐาน
แนวทางทางเลือกในการอนุมานอัตราส่วนความน่าจะเป็นคือการพิจารณาการกระจายของข้อมูลโดยมีเงื่อนไขตามความถี่ส่วนขอบของXและYข้อดีของแนวทางนี้คือสามารถแสดงการกระจายตัวอย่างของอัตราส่วนความน่าจะเป็นได้อย่างแม่นยำ
บทบาทในการถดถอยโลจิสติกส์
การถดถอยโลจิสติกเป็นวิธีหนึ่งในการขยายอัตราส่วนความน่าจะเป็น (odds ratio) ให้ครอบคลุมมากกว่าตัวแปรไบนารีสองตัว สมมติว่าเรามีตัวแปรตอบสนองไบนารีYและตัวแปรทำนายไบนารีXและนอกจากนี้เรายังมีตัวแปรทำนายอื่นๆZ 1 , ..., Z pที่อาจเป็นไบนารีหรือไม่ก็ได้ หากเราใช้การถดถอยโลจิสติกหลายตัวแปรเพื่อถดถอยYกับX , Z 1 , ..., Z pแล้ว ค่าสัมประสิทธิ์ที่ประมาณได้สำหรับXจะเกี่ยวข้องกับอัตราส่วนความน่าจะเป็นแบบมีเงื่อนไข โดยเฉพาะอย่างยิ่งในระดับประชากร
ดังนั้นจึงเป็นการประมาณค่าอัตราส่วนความน่าจะเป็นแบบมีเงื่อนไข การตีความของคือ การประมาณค่าอัตราส่วนความน่าจะเป็นระหว่างYและXเมื่อค่าของZ 1 , ..., Z pถูกกำหนดให้คงที่
ความไม่ไวต่อประเภทของการสุ่มตัวอย่าง
หากข้อมูลเป็น "ตัวอย่างประชากร" ความน่าจะเป็นของเซลล์จะถูกตีความว่าเป็นความถี่ของแต่ละกลุ่มทั้งสี่กลุ่มในประชากรตามที่กำหนดโดย ค่า XและYในหลายกรณี การได้มาซึ่งตัวอย่างประชากรนั้นทำได้ยาก ดังนั้นจึงใช้ตัวอย่างที่เลือกมาแทน ตัวอย่างเช่น เราอาจเลือกสุ่มตัวอย่างหน่วยที่มีX = 1ด้วยความน่าจะเป็นf ที่กำหนด โดยไม่คำนึงถึงความถี่ของหน่วยนั้นในประชากร (ซึ่งจะทำให้ต้องสุ่มตัวอย่างหน่วยที่มีX = 0ด้วยความน่าจะเป็น1 − f ) ในสถานการณ์นี้ ข้อมูลของเราจะมีความน่าจะเป็นร่วมดังต่อไปนี้:
อัตราส่วนความน่าจะเป็นp 11 p 00 / p 01 p 10สำหรับการแจกแจงนี้ไม่ขึ้นอยู่กับค่าของfซึ่งแสดงให้เห็นว่าอัตราส่วนความน่าจะเป็น (และด้วยเหตุนี้อัตราส่วนความน่าจะเป็นแบบลอการิทึม) ไม่เปลี่ยนแปลงไปตามการสุ่มตัวอย่างที่ไม่เป็นแบบสุ่มโดยอิงจากตัวแปรหนึ่งที่กำลังศึกษา อย่างไรก็ตาม โปรดทราบว่าค่าความคลาดเคลื่อนมาตรฐานของอัตราส่วนความน่าจะเป็นแบบลอการิทึมนั้นขึ้นอยู่กับค่าของ f
ข้อเท็จจริงนี้ถูกนำไปใช้ประโยชน์ในสองสถานการณ์สำคัญ:
- สมมติว่าการสุ่มตัวอย่างประชากรทั้งหมดเป็นเรื่องไม่สะดวกหรือไม่สามารถทำได้จริง แต่การสุ่มตัวอย่างแบบสะดวกโดยเลือกหน่วยที่มี ค่า X ต่างกันนั้นสามารถทำได้จริง โดยที่ภายในกลุ่มย่อยX = 0และX = 1 ค่า Yจะเป็นตัวแทนของประชากรทั้งหมด (กล่าวคือ เป็นไปตามความน่าจะเป็นแบบมีเงื่อนไขที่ถูกต้อง)
- สมมติว่าการแจกแจงแบบมาร์จินัลของตัวแปรหนึ่ง เช่นXมีความเบ้มาก ตัวอย่างเช่น หากเรากำลังศึกษาความสัมพันธ์ระหว่างการดื่มแอลกอฮอล์ในปริมาณมากกับมะเร็งตับอ่อนในประชากรทั่วไป อัตราการเกิดมะเร็งตับอ่อนจะต่ำมาก ดังนั้นจึงจำเป็นต้องใช้กลุ่มตัวอย่างประชากรขนาดใหญ่มากเพื่อให้ได้จำนวนผู้ป่วยมะเร็งตับอ่อนที่พอประมาณ อย่างไรก็ตาม เราสามารถใช้ข้อมูลจากโรงพยาบาลเพื่อติดต่อผู้ป่วยมะเร็งตับอ่อนส่วนใหญ่หรือทั้งหมด แล้วสุ่มเลือกกลุ่มตัวอย่างที่ไม่มีมะเร็งตับอ่อนจำนวนเท่ากัน (วิธีนี้เรียกว่า " การศึกษาแบบกรณีควบคุม ")
ในทั้งสองกรณีนี้ สามารถคำนวณอัตราส่วนความน่าจะเป็นได้จากกลุ่มตัวอย่างที่เลือก โดยไม่ทำให้ผลลัพธ์คลาดเคลื่อนไปจากผลลัพธ์ที่จะได้จากกลุ่มตัวอย่างประชากร
ใช้ในการวิจัยเชิงปริมาณ
เนื่องจากการใช้การถดถอยโลจิสติก อย่างแพร่หลาย อัตราส่วนความน่าจะเป็นจึงถูกนำมาใช้อย่างกว้างขวางในหลายสาขาของการวิจัยทางการแพทย์และสังคมศาสตร์ อัตราส่วนความน่าจะเป็นมักใช้ในการวิจัยสำรวจในระบาดวิทยาและเพื่อแสดงผลลัพธ์ของการทดลองทางคลินิก บางอย่าง เช่น ในการศึกษาแบบกรณีควบคุมมักย่อว่า "OR" ในรายงาน เมื่อรวมข้อมูลจากการสำรวจหลายครั้ง มักจะแสดงเป็น "อัตราส่วนความน่าจะเป็นแบบรวม" (pooled OR)
ความสัมพันธ์กับความเสี่ยงสัมพัทธ์

ดังที่อธิบายไว้ในส่วน "ตัวอย่างที่สร้างแรงบันดาลใจ"ความเสี่ยงสัมพัทธ์มักจะดีกว่าอัตราส่วนความน่าจะเป็นในการทำความเข้าใจความสัมพันธ์ระหว่างความเสี่ยงและตัวแปรบางอย่าง เช่น รังสีหรือยาใหม่ ส่วนนั้นยังอธิบายด้วยว่าหากสมมติฐานเกี่ยวกับโรคหายากเป็นจริง อัตราส่วนความน่าจะเป็นจะเป็นค่าประมาณที่ดีของความเสี่ยงสัมพัทธ์[ 5 ]และมีข้อดีบางประการเหนือความเสี่ยงสัมพัทธ์ เมื่อสมมติฐานเกี่ยวกับโรคหายากไม่เป็นจริง อัตราส่วนความน่าจะเป็นที่ไม่ได้ปรับค่าจะมากกว่าความเสี่ยงสัมพัทธ์[ 6 ] [ 7 ] [ 8 ]แต่วิธีการใหม่ๆ สามารถใช้ข้อมูลเดียวกันเพื่อประมาณความเสี่ยงสัมพัทธ์ ความแตกต่างของความเสี่ยง ความน่าจะเป็นพื้นฐาน หรือปริมาณอื่นๆ ได้อย่างง่ายดาย[ 9 ]
หากทราบความเสี่ยงสัมบูรณ์ในกลุ่มที่ไม่ได้รับสัมผัส การแปลงระหว่างทั้งสองจะคำนวณโดย: [ 6 ]
โดยที่RCคือความเสี่ยงสัมบูรณ์ของกลุ่มที่ไม่ได้รับผล กระทบ
หากสมมติฐานเกี่ยวกับโรคหายากไม่เป็นไปตามที่กล่าวไว้ อัตราส่วนความน่าจะเป็นอาจแตกต่างจากความเสี่ยงสัมพัทธ์อย่างมาก และไม่ควรตีความว่าเป็นความเสี่ยงสัมพัทธ์
พิจารณาอัตราการเสียชีวิตของผู้โดยสารชายและหญิงเมื่อเรืออับปาง[ 3 ]จากผู้หญิง 462 คน มีผู้เสียชีวิต 154 คน และรอดชีวิต 308 คน จากผู้ชาย 851 คน มีผู้เสียชีวิต 709 คน และรอดชีวิต 142 คน เห็นได้ชัดว่าผู้ชายบนเรือมีโอกาสเสียชีวิตมากกว่าผู้หญิง แต่มากกว่ามากแค่ไหน? เนื่องจากผู้โดยสารเสียชีวิตมากกว่าครึ่ง สมมติฐานเกี่ยวกับโรคหายากจึงถูกละเมิดอย่างรุนแรง
ในการคำนวณอัตราส่วนความเสี่ยง โปรดทราบว่าสำหรับผู้หญิง โอกาสที่จะเสียชีวิตคือ 1 ต่อ 2 (154/308) สำหรับผู้ชาย โอกาสคือ 5 ต่อ 1 (709/142) อัตราส่วนความเสี่ยงคือ 9.99 (4.99/0.5) ผู้ชายมีโอกาสเสียชีวิตมากกว่าผู้หญิงถึงสิบเท่า
สำหรับผู้หญิง โอกาสเสียชีวิตอยู่ที่ 33% (154/462) สำหรับผู้ชาย โอกาสเสียชีวิตอยู่ที่ 83% (709/851) ความเสี่ยงสัมพัทธ์ของการเสียชีวิตคือ 2.5 (0.83/0.33) นั่นหมายความว่าผู้ชายมีโอกาสเสียชีวิตมากกว่าผู้หญิง 2.5 เท่า
ความสับสนและการกล่าวเกินจริง
อัตราส่วนความน่าจะเป็นมักถูกเข้าใจผิดว่าเป็นความเสี่ยงสัมพัทธ์ในเอกสารทางการแพทย์ สำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญด้านสถิติ อัตราส่วนความน่าจะเป็นเป็นแนวคิดที่เข้าใจยาก และให้ตัวเลขที่น่าประทับใจกว่าสำหรับผลกระทบ[ 10 ]อย่างไรก็ตาม ผู้เขียนส่วนใหญ่พิจารณาว่าความเสี่ยงสัมพัทธ์นั้นเข้าใจได้ง่าย[ 11 ]ในการศึกษาหนึ่ง สมาชิกของมูลนิธิโรคแห่งชาติมีโอกาสมากกว่าผู้ที่ไม่ใช่สมาชิกถึง 3.5 เท่าที่จะเคยได้ยินเกี่ยวกับการรักษาทั่วไปสำหรับโรคนั้น – แต่อัตราส่วนความน่าจะเป็นคือ 24 และเอกสารระบุว่าสมาชิกมีโอกาสมากกว่า 20 เท่าที่จะเคยได้ยินเกี่ยวกับการรักษา[ 12 ]การศึกษาเอกสารที่ตีพิมพ์ในวารสารสองฉบับรายงานว่า 26% ของบทความที่ใช้อัตราส่วนความน่าจะเป็นตีความว่าเป็นอัตราส่วนความเสี่ยง[ 13 ]
สิ่งนี้อาจสะท้อนถึงกระบวนการง่ายๆ ของผู้เขียนที่ไม่เข้าใจซึ่งเลือกรูปภาพที่ดูน่าประทับใจและสามารถตีพิมพ์ได้มากที่สุด[ 11 ]แต่ในบางกรณีการใช้งานอาจเป็นการหลอกลวงโดยเจตนา[ 14 ]มีข้อเสนอแนะว่าอัตราส่วนความน่าจะเป็นควรนำเสนอเป็นมาตรวัดขนาดผลกระทบ เฉพาะ เมื่อไม่สามารถประมาณอัตราส่วนความเสี่ยง ได้โดยตรง [ 10 ]แต่ด้วยวิธีการใหม่ๆ ที่มีอยู่ ทำให้สามารถประมาณอัตราส่วนความเสี่ยงได้เสมอ ซึ่งโดยทั่วไปควรใช้แทน[ 9 ]
แม้ว่าความเสี่ยงสัมพัทธ์อาจตีความได้ง่ายกว่าสำหรับผู้ชมทั่วไป แต่ก็มีข้อดีทางคณิตศาสตร์และแนวคิดเมื่อใช้อัตราส่วนความน่าจะเป็นแทนความเสี่ยงสัมพัทธ์ โดยเฉพาะอย่างยิ่งในแบบจำลองการถดถอย ด้วยเหตุนี้ จึงไม่มีฉันทามติในสาขาระบาดวิทยาหรือสถิติชีวภาพว่าควรเลือกใช้ความเสี่ยงสัมพัทธ์หรืออัตราส่วนความน่าจะเป็นเมื่อสามารถใช้ได้ทั้งสองอย่างอย่างถูกต้อง เช่น ในการทดลองทางคลินิกและการศึกษากลุ่ม[ 15 ]
ความสามารถในการผกผันและความไม่เปลี่ยนแปลง
อัตราส่วนความน่าจะเป็น (Odds Ratio) มีคุณสมบัติพิเศษอีกอย่างหนึ่งคือ สามารถผกผันทางคณิตศาสตร์ได้โดยตรง ไม่ว่าจะวิเคราะห์ OR ในแง่ของการรอดชีวิตจากโรคหรือการเกิดโรคก็ตาม โดยที่ OR สำหรับการรอดชีวิตจะเป็นส่วนกลับโดยตรงของ 1/OR สำหรับความเสี่ยง คุณสมบัตินี้เรียกว่า 'ความไม่เปลี่ยนแปลงของอัตราส่วนความน่าจะเป็น' ในทางตรงกันข้าม ความเสี่ยงสัมพัทธ์ (Relative Risk) ไม่มีคุณสมบัติการผกผันทางคณิตศาสตร์นี้เมื่อศึกษาการรอดชีวิตจากโรคเทียบกับการเกิดโรค ปรากฏการณ์ของการผกผันของ OR เทียบกับการผกผันไม่ได้ของ RR สามารถอธิบายได้ดีที่สุดด้วยตัวอย่างต่อไปนี้:
สมมติว่าในการทดลองทางคลินิก มีความเสี่ยงต่อเหตุการณ์ไม่พึงประสงค์ 4/100 ในกลุ่มที่ได้รับยา และ 2/100 ในกลุ่มที่ได้รับยาหลอก... ซึ่งจะได้ค่า RR=2 และ OR=2.04166 สำหรับความเสี่ยงต่อเหตุการณ์ไม่พึงประสงค์ระหว่างกลุ่มที่ได้รับยาและกลุ่มที่ได้รับยาหลอก อย่างไรก็ตาม หากกลับการวิเคราะห์และวิเคราะห์เหตุการณ์ไม่พึงประสงค์เป็นอัตราการรอดชีวิตโดยปราศจากเหตุการณ์ กลุ่มที่ได้รับยาจะมีอัตรา 96/100 และกลุ่มที่ได้รับยาหลอกจะมีอัตรา 98/100—ซึ่งจะได้ค่า RR=0.9796 สำหรับการรอดชีวิตระหว่างกลุ่มที่ได้รับยาและกลุ่มที่ได้รับยาหลอก แต่ค่า OR=0.48979 จะเห็นได้ว่าค่า RR 0.9796 ไม่ใช่ค่าผกผันของค่า RR 2 อย่างชัดเจน ในทางตรงกันข้าม ค่า OR 0.48979 นั้นเป็นค่าผกผันโดยตรงของค่า OR 2.04166 อย่างแท้จริง
นี่คือสิ่งที่เรียกว่า 'ความไม่เปลี่ยนแปลงของอัตราส่วนความน่าจะเป็น' และเป็นเหตุผลว่าทำไม RR สำหรับการรอดชีวิตจึงไม่เหมือนกับ RR สำหรับความเสี่ยง ในขณะที่ OR มีคุณสมบัติสมมาตรนี้เมื่อวิเคราะห์ทั้งการรอดชีวิตหรือความเสี่ยงที่ไม่พึงประสงค์ อันตรายต่อการตีความทางคลินิกของ OR เกิดขึ้นเมื่ออัตราการเกิดเหตุการณ์ไม่พึงประสงค์ไม่หายาก ซึ่งจะทำให้ความแตกต่างถูกขยายให้เกินจริงเมื่อไม่เป็นไปตามข้อสมมติฐานเกี่ยวกับโรคหายากของ OR ในทางกลับกัน เมื่อโรคหายาก การใช้ RR สำหรับการรอดชีวิต (เช่น RR=0.9796 จากตัวอย่างข้างต้น) อาจซ่อนและปกปิดความเสี่ยงที่ไม่พึงประสงค์ที่เพิ่มขึ้นเป็นสองเท่าอย่างมีนัยสำคัญที่เกี่ยวข้องกับยาหรือการสัมผัสในทางคลินิกได้
ตัวประมาณค่าอัตราส่วนความน่าจะเป็น
อัตราส่วนความน่าจะเป็นของตัวอย่าง
อัตราส่วนความน่าจะเป็นของตัวอย่าง n 11 n 00 / n 10 n 01 นั้นคำนวณได้ง่าย และสำหรับตัวอย่างขนาดปานกลางและขนาดใหญ่ จะทำงานได้ดีในฐานะตัวประมาณอัตราส่วนความน่าจะเป็นของประชากร เมื่อเซลล์หนึ่งเซลล์หรือมากกว่าในตารางความสัมพันธ์มีค่าเล็กน้อย อัตราส่วนความน่าจะเป็นของตัวอย่างอาจมีความเอนเอียงและแสดงความแปรปรวนสูง
ตัวประมาณค่าทางเลือก
มีการเสนอตัวประมาณค่าอัตราส่วนความน่าจะเป็นทางเลือกหลายตัวเพื่อแก้ไขข้อจำกัดของอัตราส่วนความน่าจะเป็นของตัวอย่าง ตัวประมาณค่าทางเลือกหนึ่งคือตัวประมาณค่าความน่าจะเป็นสูงสุดแบบมีเงื่อนไข ซึ่งกำหนดเงื่อนไขตามขอบแถวและคอลัมน์เมื่อสร้างความน่าจะเป็นเพื่อเพิ่มค่าสูงสุด (เช่นเดียวกับการทดสอบที่แม่นยำของ Fisher ) [ 16 ] ตัวประมาณค่าทางเลือกอีกตัวหนึ่งคือ ตัว ประมาณ ค่า Mantel–Haenszel
ตัวอย่างเชิงตัวเลข
ตารางความสัมพันธ์สี่ตารางต่อไปนี้ประกอบด้วยจำนวนเซลล์ที่สังเกตได้ พร้อมด้วยอัตราส่วนความน่าจะเป็นตัวอย่าง ( OR ) และอัตราส่วนความน่าจะเป็นล็อกตัวอย่าง ( LOR ) ที่สอดคล้องกัน:
| OR = 1, LOR = 0 | OR = 1, LOR = 0 | OR = 4, LOR = 1.39 | OR = 0.25, LOR = −1.39 | |||||
|---|---|---|---|---|---|---|---|---|
| Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | |
| X = 1 | 10 | 10 | 100 | 100 | 20 | 10 | 10 | 20 |
| X = 0 | 5 | 5 | 50 | 50 | 10 | 20 | 20 | 10 |
ตารางแสดงการแจกแจงความน่าจะเป็นร่วมต่อไปนี้ประกอบด้วยความน่าจะเป็นของเซลล์ประชากร พร้อมด้วยอัตราส่วนความน่าจะเป็นของประชากร ( OR ) และอัตราส่วนความน่าจะเป็นแบบลอการิทึมของประชากร ( LOR ) ที่สอดคล้องกัน:
| OR = 1, LOR = 0 | OR = 1, LOR = 0 | OR = 16, LOR = 2.77 | OR = 0.67, LOR = −0.41 | |||||
|---|---|---|---|---|---|---|---|---|
| Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | Y = 1 | Y = 0 | |
| X = 1 | 0.2 | 0.2 | 0.4 | 0.4 | 0.4 | 0.1 | 0.1 | 0.3 |
| X = 0 | 0.3 | 0.3 | 0.1 | 0.1 | 0.1 | 0.4 | 0.2 | 0.4 |
ตัวอย่างเชิงตัวเลข
| ปริมาณ | กลุ่มทดลอง (E) | กลุ่มควบคุม (C) | ทั้งหมด |
|---|---|---|---|
| กิจกรรม (E) | อีอี = 15 | CE = 100 | 115 |
| เหตุการณ์ที่ไม่เกิดขึ้น (N) | EN = 135 | CN = 150 | 285 |
| จำนวนผู้เรียนทั้งหมด (S) | ES = EE + EN = 150 | CS = CE + CN = 250 | 400 |
| อัตราการเกิดเหตุการณ์ (ER) | EER = EE / ES = 0.1 หรือ 10% | CER = CE / CS = 0.4 หรือ 40% | — |
| ตัวแปร | ตัวย่อ | สูตร | ค่า |
|---|---|---|---|
| การลดความเสี่ยงสัมบูรณ์ | อาร์อาร์อาร์ | CER − EER | 0.3 หรือ 30% |
| จำนวนที่ต้องรักษา | เอ็นเอ็นที | 1 / ( CER − EER ) | 3.33 |
| ความเสี่ยงสัมพัทธ์ (อัตราส่วนความเสี่ยง) | อาร์อาร์ | อีอีอาร์ / ซีอาร์ | 0.25 |
| การลดความเสี่ยงสัมพัทธ์ | รอาร์อาร์ | ( CER − EER ) / CERหรือ 1 − RR | 0.75 หรือ 75% |
| สัดส่วนที่ป้องกันได้ในกลุ่มผู้ที่ไม่ได้รับเชื้อ | พีเอฟยู | ( CER − EER ) / CER | 0.75 |
| อัตราส่วนความน่าจะเป็น | หรือ | ( EE / EN ) / ( CE / CN ) | 0.167 |
สถิติที่เกี่ยวข้อง
มีสถิติสรุปอื่นๆ อีกหลายอย่างสำหรับตารางความสัมพันธ์ที่วัดความเชื่อมโยงระหว่างสองเหตุการณ์ เช่นYule's YและYule's Qโดยทั้งสองค่านี้จะถูกทำให้เป็นมาตรฐานเพื่อให้มีค่าเป็น 0 สำหรับเหตุการณ์ที่เป็นอิสระ 1 สำหรับเหตุการณ์ที่มีความสัมพันธ์กันอย่างสมบูรณ์ และ −1 สำหรับเหตุการณ์ที่มีความสัมพันธ์กันในเชิงลบอย่างสมบูรณ์AWF Edwardsได้ศึกษาเรื่องเหล่านี้และโต้แย้งว่าการวัดความเชื่อมโยงเหล่านี้จะต้องเป็นฟังก์ชันของอัตราส่วนความน่าจะเป็น ซึ่งเขาเรียกว่าอัตราส่วนไขว้[ 17 ]
อัตราส่วนความน่าจะเป็นสำหรับการศึกษาแบบจับคู่กรณีควบคุม
การศึกษา กรณีควบคุมเกี่ยวข้องกับการเลือกตัวอย่างที่เป็นตัวแทนของกรณีและกลุ่มควบคุมที่มีและไม่มีโรคตามลำดับ ตัวอย่างเหล่านี้มักจะเป็นอิสระต่อกัน ความชุกก่อนหน้าของการสัมผัสกับปัจจัยเสี่ยงบางอย่างจะถูกสังเกตในผู้ป่วยจากทั้งสองตัวอย่าง ซึ่งช่วยให้สามารถประมาณอัตราส่วนความน่าจะเป็นของโรคในผู้ที่สัมผัสเทียบกับผู้ที่ไม่สัมผัสได้ตามที่กล่าวไว้ข้างต้น[ 18 ] อย่างไรก็ตาม บางครั้งการจับคู่กรณีกับกลุ่มควบคุมโดยใช้ตัวแปรที่ ทำให้ เกิดความสับสน อย่างน้อยหนึ่งตัวก็มีความเหมาะสม [ 19 ]ในกรณีนี้ การสัมผัสก่อนหน้าที่สนใจจะถูกกำหนดสำหรับแต่ละกรณีและกลุ่มควบคุมที่จับคู่กัน ข้อมูลสามารถสรุปได้ในตารางต่อไปนี้
ตาราง จับคู่ 2 × 2
| คู่กรณีศึกษาและกลุ่มควบคุม | การควบคุมถูกเปิดเผย | ควบคุมไม่ให้เห็น |
|---|---|---|
| คดีถูกเปิดเผย | ||
| คดีนี้ยังไม่เปิดเผย |
ตารางนี้แสดงสถานะการได้รับสัมผัสของคู่ตัวอย่างที่จับคู่กัน มีคู่ที่ทั้งผู้ป่วยและกลุ่มควบคุมได้รับสัมผัสคู่ที่ผู้ป่วยได้รับสัมผัสแต่กลุ่มควบคุมไม่ได้รับสัมผัสคู่ที่กลุ่มควบคุมได้รับสัมผัสแต่ผู้ป่วยไม่ได้รับสัมผัส และคู่ที่ทั้งสองกลุ่มไม่ได้รับสัมผัส การได้รับสัมผัสของคู่ผู้ป่วยและกลุ่มควบคุมที่จับคู่กันมีความสัมพันธ์กันเนื่องจากค่าตัวแปรแทรกซ้อนร่วมกันมีค่าใกล้เคียงกัน
การพิสูจน์ต่อไปนี้มาจากBreslow & Day [ 19 ] เราพิจารณาแต่ละคู่ว่าอยู่ในชั้น ที่มีค่าของตัวแปรที่ทำให้เกิดความสับสนเหมือนกัน ภายใต้ เงื่อนไขที่อยู่ในชั้นเดียวกัน สถานะการสัมผัสของกรณีและกลุ่มควบคุมจะเป็นอิสระต่อกัน สำหรับคู่กรณี-กลุ่มควบคุมใดๆ ภายในชั้นเดียวกัน ให้
- ความน่าจะเป็นที่ผู้ป่วยจะได้รับเชื้อคือเท่าใด
- จงหาความน่าจะเป็นที่ผู้ป่วยกลุ่มควบคุมจะได้รับสารดังกล่าว
- เป็นความน่าจะเป็นที่ผู้ป่วยจะไม่ได้รับเชื้อ และ
- คือความน่าจะเป็นที่ผู้ป่วยกลุ่มควบคุมจะไม่ได้รับสารสัมผัส
ดังนั้น ความน่าจะเป็นที่ผู้ป่วยจะได้รับเชื้อแต่กลุ่มควบคุมไม่ได้รับเชื้อคือและความน่าจะเป็นที่กลุ่มควบคุมได้รับเชื้อแต่ผู้ป่วยไม่ได้รับเชื้อคือ อัตราส่วนความเสี่ยง (odds ratio) ภายในกลุ่มย่อยสำหรับผู้ป่วยที่ได้รับเชื้อเมื่อเทียบกับกลุ่มควบคุมคือ
เราถือว่าψมีค่าคงที่ตลอดชั้น[ 19 ]
คู่ที่สอดคล้องกันซึ่งทั้งผู้ป่วยและกลุ่มควบคุมได้รับสารสัมผัส หรือทั้งสองฝ่ายไม่ได้รับสารสัมผัส ไม่ได้บอกอะไรเราเกี่ยวกับโอกาสที่ผู้ป่วยจะได้รับสารสัมผัสเมื่อเทียบกับโอกาสที่กลุ่มควบคุมจะได้รับสารสัมผัส ความน่าจะเป็นที่ผู้ป่วยได้รับสารสัมผัสและกลุ่มควบคุมไม่ได้รับสารสัมผัส เมื่อพิจารณาว่าคู่ไม่สอดคล้องกันนั้นคือ
การแจกแจงของจำนวนคู่ที่ไม่สอดคล้องกันจะเป็นแบบทวินาม ~ B และ ค่าประมาณ ความน่าจะเป็นสูงสุดของπคือ
เมื่อคูณทั้งสองข้างของสมการนี้ด้วยและลบออกจะได้
- และด้วยเหตุนี้
- .
ตอนนี้คือค่าประมาณความน่าจะเป็นสูงสุดของπและψเป็นฟังก์ชันโมโนโทนิกของดังนั้นจึงเป็นค่าประมาณความน่าจะเป็นสูงสุดแบบ มีเงื่อนไข ของเมื่อกำหนดจำนวนคู่ที่ไม่สอดคล้องกันRothman et al. [ 20 ]ให้การพิสูจน์ทางเลือกของโดยแสดงให้เห็นว่าเป็นกรณีพิเศษของค่าประมาณ Mantel-Haenszel ของอัตราส่วนความน่าจะเป็นภายในชั้นสำหรับตาราง 2x2 แบบแบ่งชั้น[ 20 ]พวกเขายังอ้างอิง Breslow & Day [ 19 ]ว่าเป็นผู้ให้การพิสูจน์ที่ให้ไว้ในที่นี้
ภายใต้สมมติฐานว่างที่ว่า.
ดังนั้น เราสามารถทดสอบสมมติฐานว่างที่ว่าโดยการทดสอบสมมติฐานว่างที่ว่า ซึ่งทำได้โดยใช้การทดสอบของ McNemar
มีหลายวิธีในการคำนวณช่วงความเชื่อมั่นสำหรับπให้และแทนขอบล่างและขอบบนของช่วงความเชื่อมั่นสำหรับπตามลำดับ เนื่องจาก ดังนั้นช่วงความเชื่อมั่นที่สอดคล้องกันสำหรับψคือ
- .
ตาราง 2x2 ที่จับคู่กันอาจได้รับการวิเคราะห์โดยใช้การถดถอยโลจิสติกแบบมีเงื่อนไข[ 21 ]เทคนิคนี้มีข้อดีคือช่วยให้ผู้ใช้สามารถถดถอยสถานะกรณี-ควบคุมกับปัจจัยเสี่ยงหลายประการจากข้อมูลกรณี-ควบคุมที่จับคู่กัน
ตัวอย่าง
McEvoy และคณะ [ 22 ]ศึกษาการใช้โทรศัพท์มือถือของผู้ขับขี่เป็นปัจจัยเสี่ยงต่ออุบัติเหตุทางรถยนต์ในการศึกษาแบบ case-crossover [ 18 ]ผู้เข้าร่วมการศึกษาทั้งหมดเกี่ยวข้องกับอุบัติเหตุทางรถยนต์ที่ต้องเข้ารับการรักษาในโรงพยาบาล การใช้โทรศัพท์มือถือของผู้ขับขี่แต่ละคนในขณะที่เกิดอุบัติเหตุจะถูกเปรียบเทียบกับการใช้โทรศัพท์มือถือในช่วงเวลาควบคุมในเวลาเดียวกันของวันหนึ่งสัปดาห์ก่อนหน้า เราคาดว่าการใช้โทรศัพท์มือถือของบุคคลในขณะที่เกิดอุบัติเหตุจะมีความสัมพันธ์กับการใช้ของเขา/เธอหนึ่งสัปดาห์ก่อนหน้า การเปรียบเทียบการใช้งานในช่วงเวลาที่เกิดอุบัติเหตุและช่วงเวลาควบคุมจะปรับให้เข้ากับลักษณะของผู้ขับขี่ เวลาของวัน และวันในสัปดาห์ ข้อมูลสามารถสรุปได้ในตารางต่อไปนี้
| คู่กรณีศึกษาและกลุ่มควบคุม | โทรศัพท์ที่ใช้ในช่วงเวลาควบคุม | โทรศัพท์ไม่ได้ถูกใช้งานในช่วงเวลาควบคุม |
|---|---|---|
| โทรศัพท์ที่ใช้ในช่วงเวลาที่เกิดอุบัติเหตุ | 5 | 27 |
| โทรศัพท์ไม่ได้ถูกใช้งานในช่วงเวลาที่เกิดการขัดข้อง | 6 | 288 |
มีผู้ขับขี่ 5 คนที่ใช้โทรศัพท์ในทั้งสองช่วงเวลา 27 คนที่ใช้โทรศัพท์ในช่วงเวลาที่เกิดอุบัติเหตุแต่ไม่ใช้ในช่วงเวลาควบคุม 6 คนที่ใช้โทรศัพท์ในช่วงเวลาควบคุมแต่ไม่ใช้ในช่วงเวลาที่เกิดอุบัติเหตุ และ 288 คนที่ไม่ใช้โทรศัพท์ในทั้งสองช่วงเวลา อัตราส่วนความเสี่ยงของการเกิดอุบัติเหตุขณะใช้โทรศัพท์เมื่อเทียบกับการขับรถโดยไม่ใช้โทรศัพท์คือ
- .
การทดสอบสมมติฐานว่างที่เหมือนกับการทดสอบสมมติฐานว่างที่ว่าจากคู่ที่ไม่สอดคล้องกัน 33 คู่ มี 27 คู่ที่ผู้ขับขี่ใช้โทรศัพท์มือถือขณะเกิดอุบัติเหตุสถิติของ McNemar มีระดับความเป็นอิสระ 1 ระดับ และให้ค่า Pเท่ากับ 0.0003 ซึ่งทำให้เราสามารถปฏิเสธสมมติฐานที่ว่าการใช้โทรศัพท์มือถือไม่มีผลต่อความเสี่ยงของการเกิดอุบัติเหตุทางรถยนต์ ( ) ด้วยระดับนัยสำคัญทางสถิติที่สูง
เมื่อใช้ ระเบียบวิธี ของวิลสันช่วงความเชื่อมั่น 95% สำหรับπคือ (0.6561, 0.9139) ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับ ψคือ
(McEvoy et al. [ 22 ]วิเคราะห์ข้อมูลโดยใช้การถดถอยโลจิสติกแบบมีเงื่อนไขและได้ผลลัพธ์ที่เกือบจะเหมือนกันกับที่ระบุไว้ที่นี่ ดูแถวสุดท้ายของตารางที่ 3 ในเอกสารของพวกเขา)
ดูเพิ่มเติม
- โคเฮนส์ h
- อัตราส่วนไขว้
- อัตราส่วนความน่าจะเป็นในการวินิจฉัย
- แปลงป่า
- อัตราส่วนความเสี่ยง
- อัตราส่วนความน่าจะเป็น
- อัตราส่วน
ลิงก์ภายนอก
- เครื่องคำนวณอัตราต่อรอง – เว็บไซต์
- เครื่องคำนวณอัตราส่วนความน่าจะเป็นพร้อมการทดสอบต่างๆ – เว็บไซต์
- OpenEpiเป็นโปรแกรมบนเว็บที่คำนวณอัตราส่วนความน่าจะเป็น ทั้งในกรณีที่ไม่ได้จับคู่และในกรณีที่จับคู่แล้ว
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ อัตราส่วนความน่าจะเป็น
อัตราส่วน ความน่าจะเป็น ( Odds Ratio หรือ OR ) เป็น สถิติ ที่ใช้วัดความแข็งแกร่งของ ความสัมพันธ์ ระหว่างเหตุการณ์สองเหตุการณ์ คือ A และ B อัตราส่วนความน่าจะเป็นถูกกำหนดให้เป็น...
สัญชาตญาณจากตัวอย่างสำหรับคนทั่วไป
ถ้าเราโยนเหรียญที่ไม่เอนเอียง โอกาสที่จะได้หัวและโอกาสที่จะได้ก้อยจะเท่ากัน คือ 50% ทั้งคู่ ลองจินตนาการว่าเรามีเหรียญที่เอนเอียง ซึ่งถ้าโยนแล้ว โอกาสที่จะได้หัวจะมากกว่าก้อยถึงสองเท่า (กล่าวคือ โอกาส เพิ่มขึ้นเป็นสองเท่า จาก 1:1 เป็น 2:1) โอกาสใหม่จะเป็น 66.
ตัวอย่างที่สร้างแรงบันดาลใจ ในบริบทของ สมมติฐานเกี่ยวกับโรคหายาก
สมมติว่าการรั่วไหลของรังสีในหมู่บ้านที่มีประชากร 1,000 คน ทำให้เกิดโรคหายากเพิ่มขึ้น จำนวนประชากรทั้งหมดที่ได้รับรังสีคือ ซึ่งในจำนวนนั้นป่วยเป็นโรคและมีสุขภาพดี จำนวนประชากรทั้งหมดที่ไม่ได้ได้รับรังสีคือ ซึ่งในจำนวนนั้นป่วยเป็นโรคและมีสุขภาพดี...
นิยามในแง่ของอัตราต่อรองตามกลุ่ม
อัตราส่วนความน่าจะเป็น (Odds Ratio) คือ อัตราส่วนของ ความน่าจะเป็น ที่เหตุการณ์จะเกิดขึ้นในกลุ่มหนึ่ง ต่อความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นในอีกกลุ่มหนึ่ง คำนี้ยังใช้เพื่ออ้างถึงการประมาณค่าอัตราส่วนนี้จากตัวอย่างด้วย กลุ่มเหล่านี้อาจเป็นชายและหญิง...