อัตราส่วนความน่าจะเป็น

อัตราส่วน ความน่าจะเป็น ( Odds RatioหรือOR ) เป็นสถิติที่ใช้วัดความแข็งแกร่งของความสัมพันธ์ระหว่างเหตุการณ์สองเหตุการณ์ คือ A และ B อัตราส่วนความน่าจะเป็นถูกกำหนดให้เป็นอัตราส่วนของความน่าจะเป็นที่เหตุการณ์ A จะเกิดขึ้นเมื่อมีเหตุการณ์ B อยู่ด้วย และความน่าจะเป็นที่เหตุการณ์ A จะเกิดขึ้นเมื่อไม่มีเหตุการณ์ B อยู่ด้วย เนื่องจากสมมาตรอัตราส่วนความน่าจะเป็นจึงคำนวณอัตราส่วนผกผันของความน่าจะเป็นที่เหตุการณ์ B จะเกิดขึ้นเมื่อมีเหตุการณ์ A อยู่ด้วย และความน่าจะเป็นที่เหตุการณ์ B จะเกิดขึ้นเมื่อไม่มีเหตุการณ์ A อยู่ด้วย เหตุการณ์สองเหตุการณ์จะเป็นอิสระต่อกันก็ต่อเมื่อ OR เท่ากับ 1 กล่าวคือ ความน่าจะเป็นของเหตุการณ์หนึ่งจะเท่ากันไม่ว่าจะมีหรือไม่มีเหตุการณ์อีกเหตุการณ์หนึ่งอยู่ด้วยก็ตาม ถ้าค่า OR มากกว่า 1 แสดงว่า A และ B มีความสัมพันธ์กัน (สหสัมพันธ์) ในแง่ที่ว่า เมื่อเปรียบเทียบกับการไม่มี B การมี B จะเพิ่มโอกาสที่จะเกิด A และในทางกลับกัน การมี A ก็จะเพิ่มโอกาสที่จะเกิด B ในทางตรงกันข้าม ถ้าค่า OR น้อยกว่า 1 แสดงว่า A และ B มีความสัมพันธ์เชิงลบ และการเกิดเหตุการณ์หนึ่งจะลดโอกาสที่จะเกิดอีกเหตุการณ์หนึ่ง

โปรดทราบว่าอัตราส่วนความน่าจะเป็นมีความสมมาตรในเหตุการณ์ทั้งสอง และไม่มี ทิศทาง เชิงสาเหตุ ใด ๆ ที่บ่งบอก (ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ ): OR ที่มากกว่า 1 ไม่ได้พิสูจน์ว่า B เป็นสาเหตุของ A หรือว่า A เป็นสาเหตุของ B ^{[ 1 ]}

สถิติที่คล้ายคลึงกันสองอย่างที่มักใช้ในการวัดความสัมพันธ์คือความเสี่ยงสัมพัทธ์ (RR) และการลดความเสี่ยงสัมบูรณ์ (ARR) บ่อยครั้งที่พารามิเตอร์ที่น่าสนใจที่สุดคือ RR ซึ่งเป็นอัตราส่วนของความน่าจะเป็นที่คล้ายกับอัตราต่อรองที่ใช้ใน OR อย่างไรก็ตาม ข้อมูลที่มีอยู่มักไม่เอื้ออำนวยต่อการคำนวณ RR หรือ ARR แต่เอื้ออำนวยต่อการคำนวณ OR เช่นในงานวิจัยแบบกรณีศึกษาและกลุ่มควบคุมดังที่อธิบายไว้ด้านล่าง ในทางกลับกัน หากคุณสมบัติใดคุณสมบัติหนึ่ง (A หรือ B) เกิดขึ้นได้ยาก (ในระบาดวิทยาเรียกว่าสมมติฐานโรคหายาก ) แล้ว OR จะมีค่าประมาณเท่ากับ RR ที่สอดคล้องกัน

OR มีบทบาทสำคัญในแบบจำลองโลจิสติกส์

คำจำกัดความและคุณสมบัติพื้นฐาน

สัญชาตญาณจากตัวอย่างสำหรับคนทั่วไป

ถ้าเราโยนเหรียญที่ไม่เอนเอียง โอกาสที่จะได้หัวและโอกาสที่จะได้ก้อยจะเท่ากัน คือ 50% ทั้งคู่ ลองจินตนาการว่าเรามีเหรียญที่เอนเอียง ซึ่งถ้าโยนแล้ว โอกาสที่จะได้หัวจะมากกว่าก้อยถึงสองเท่า (กล่าวคือโอกาสเพิ่มขึ้นเป็นสองเท่า จาก 1:1 เป็น 2:1) โอกาสใหม่จะเป็น 66.666...% สำหรับหัว และ 33.333...% สำหรับก้อย

ตัวอย่างที่สร้างแรงบันดาลใจ ในบริบทของสมมติฐานเกี่ยวกับโรคหายาก

สมมติว่าการรั่วไหลของรังสีในหมู่บ้านที่มีประชากร 1,000 คน ทำให้เกิดโรคหายากเพิ่มขึ้น จำนวนประชากรทั้งหมดที่ได้รับรังสีคือ ซึ่งในจำนวนนั้นป่วยเป็นโรคและมีสุขภาพดี จำนวนประชากรทั้งหมดที่ไม่ได้ได้รับรังสีคือ ซึ่งในจำนวนนั้นป่วยเป็นโรคและมีสุขภาพดี เราสามารถจัดเรียงข้อมูลนี้ในตารางความสัมพันธ์ได้ดังนี้: $V_{E}=400,$ $D_{E}=20$ $H_{E}=380$ $V_{N}=600,$ $D_{N}=6$ $H_{N}=594$

{\begin{array}{|r|cc|}\hline &{\text{ เป็นโรค }}&{\text{ สุขภาพดี }}\\\hline {\text{ สัมผัสเชื้อ }}&20&380\\{\text{ ไม่สัมผัสเชื้อ }}&6&594\\\hline \end{array}}

ความเสี่ยงในการเกิดโรคเมื่อได้รับสัมผัสคือและความเสี่ยงในการเกิดโรคเมื่อไม่ได้รับสัมผัสคือวิธีที่ชัดเจนวิธีหนึ่งในการเปรียบเทียบความเสี่ยงคือการใช้สัดส่วนของทั้งสอง ซึ่งก็คือความ เสี่ยงสัมพัทธ์ $D_{E}/V_{E}=20/400=.05$ $D_{N}/V_{N}=6/600=.01$

{\text{Relative risk}}={\frac {D_{E}/(D_{E}+H_{E})}{D_{N}/(D_{N}+H_{N})}}={\frac {D_{E}/V_{E}}{D_{N}/V_{N}}}={\frac {20/400}{6/600}}={\frac {.05}{.01}}=5\,.

อัตราส่วนความเสี่ยง (odds ratio) นั้นแตกต่างกันความเสี่ยงที่จะเป็นโรคหากสัมผัสเชื้อคือและความเสี่ยงหากไม่สัมผัสเชื้อคือ อัตราส่วนความเสี่ยงคืออัตราส่วนของทั้งสองค่า $D_{E}/H_{E}=20/380\approx .0526,$ $D_{N}/H_{N}=6/594\approx .0101\,.$

{\text{Odds ratio}}={\frac {D_{E}/H_{E}}{D_{N}/H_{N}}}={\frac {20/380}{6/594}}\approx {\frac {.0526}{.0101}}=5.2\,.

ดังที่แสดงให้เห็นในตัวอย่างนี้ ในกรณีของโรคหายากเช่นนี้ความเสี่ยงสัมพัทธ์และอัตราส่วนความน่าจะเป็นแทบจะเท่ากัน ตามนิยามแล้ว โรคหายากหมายความว่าและดังนั้น ตัวหารในความเสี่ยงสัมพัทธ์และอัตราส่วนความน่าจะเป็นจึงแทบจะเท่ากัน ( และ) $V_{E}\approx H_{E}$ $V_{N}\approx H_{N}$ $400\approx 380$ $600\approx 594)$

ความเสี่ยงสัมพัทธ์นั้นเข้าใจง่ายกว่าอัตราส่วนความน่าจะเป็น แต่เหตุผลหนึ่งที่ต้องใช้อัตราส่วนความน่าจะเป็นก็คือ โดยปกติแล้ว ข้อมูลเกี่ยวกับประชากรทั้งหมดจะไม่สามารถหาได้ และ ต้องใช้ การสุ่มตัวอย่างในตัวอย่างข้างต้น หากการสัมภาษณ์ชาวบ้านและหาว่าพวกเขาได้รับรังสีหรือไม่นั้นมีค่าใช้จ่ายสูงมากความชุกของการได้รับรังสีก็จะไม่เป็นที่ทราบ และค่าของหรือ ก็จะไม่ เป็นที่ทราบเช่นกัน เราอาจสุ่มตัวอย่างชาวบ้าน 50 คน แต่เป็นไปได้ว่าตัวอย่างสุ่มดังกล่าวจะไม่รวมใครเลยที่เป็นโรค เนื่องจากมีเพียง 2.6% ของประชากรเท่านั้นที่เป็นโรค แทนที่จะเป็นเช่นนั้น เราอาจใช้การศึกษาแบบกรณีควบคุม^[²^]ซึ่งสัมภาษณ์ชาวบ้านที่เป็นโรคทั้งหมด 26 คน รวมทั้งตัวอย่างสุ่ม 26 คนที่ไม่เป็นโรค ผลลัพธ์อาจออกมาเป็นดังนี้ ("อาจ" เพราะนี่คือตัวอย่างสุ่ม): $V_{E}$ $V_{N}$

{\begin{array}{|r|cc|}\hline &{\text{ Diseased }}&{\text{ Healthy }}\\\hline {\text{ Exposed }}&20&10\\{\text{ Not exposed }}&6&16\\\hline \end{array}}

ในกลุ่มตัวอย่างนี้ โอกาสที่จะเป็นโรคเมื่อได้รับเชื้อคือ 20/10 และโอกาสที่จะเป็นโรคเมื่อไม่ได้รับเชื้อคือ 6/16 ดังนั้น อัตราส่วนความเสี่ยงจึงค่อนข้างใกล้เคียงกับอัตราส่วนความเสี่ยงที่คำนวณได้สำหรับทั้งหมู่บ้าน อย่างไรก็ตาม ไม่สามารถคำนวณความเสี่ยงสัมพัทธ์ได้ เนื่องจากเป็นอัตราส่วนของความเสี่ยงในการเป็นโรค และเราจำเป็นต้องใช้ค่าและเพื่อคำนวณค่าเหล่านั้น เนื่องจากในการศึกษาครั้งนี้ได้เลือกเฉพาะผู้ที่เป็นโรค ดังนั้นครึ่งหนึ่งของกลุ่มตัวอย่างจึงเป็นโรค และเป็นที่ทราบกันดีว่าจำนวนนี้มากกว่าอัตราการแพร่ระบาดในประชากรโดยรวม ดังนั้น จำนวนผู้ป่วยและผู้ที่ไม่เป็นโรคในกลุ่มที่ได้รับเชื้อ และจำนวนผู้ป่วยและผู้ที่ไม่เป็นโรคในกลุ่มที่ไม่ได้รับเชื้อ จึงไม่สามารถนำมาบวกกันได้ ${\frac {20/10}{6/16}}\approx 5.3$ $V_{E}$ $V_{N}$

ในเอกสารทางการแพทย์ การคำนวณอัตราส่วนความเสี่ยง (odds ratio) และใช้สมมติฐานโรคหายาก (ซึ่งโดยทั่วไปถือว่าสมเหตุสมผล) เพื่ออ้างว่าความเสี่ยงสัมพัทธ์ (relative risk) มีค่าประมาณเท่ากับอัตราส่วนความเสี่ยงถือเป็นมาตรฐาน วิธีนี้ไม่เพียงแต่ช่วยให้สามารถใช้การศึกษาแบบกรณีควบคุม (case-control studies) ได้เท่านั้น แต่ยังทำให้การควบคุมตัวแปรแทรกซ้อนเช่น น้ำหนักหรืออายุ โดยใช้การวิเคราะห์การถดถอย (regression analysis) ทำได้ง่ายขึ้น และมีคุณสมบัติที่พึงประสงค์ดังที่ได้กล่าวถึงในส่วนอื่นๆ ของบทความนี้ คือความไม่เปลี่ยนแปลงและความไม่ไวต่อประเภทของการสุ่มตัวอย่าง^{[ 3 ]}

นิยามในแง่ของอัตราต่อรองตามกลุ่ม

อัตราส่วนความน่าจะเป็น (Odds Ratio) คือ อัตราส่วนของความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นในกลุ่มหนึ่ง ต่อความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นในอีกกลุ่มหนึ่ง คำนี้ยังใช้เพื่ออ้างถึงการประมาณค่าอัตราส่วนนี้จากตัวอย่างด้วย กลุ่มเหล่านี้อาจเป็นชายและหญิง กลุ่มทดลองและ_{กลุ่ม}ควบคุมหรือ การจำแนก แบบสอง_{กลุ่ม} อื่นๆ ถ้าความน่าจะเป็นของเหตุการณ์ในแต่ละกลุ่มคือp₁ (กลุ่มแรก) และp₂ (กลุ่มที่สอง) แล้ว อัตราส่วนความน่าจะเป็นคือ:

OR={\frac {p_{1}/(1-p_{1})}{p_{2}/(1-p_{2})}}={\frac {p_{1}/q_{1}}{p_{2}/q_{2}}}={\frac {\;p_{1}q_{2}\;}{\;p_{2}q_{1}\;}},

โดยที่q _x = 1 − p _xอัตราส่วนความน่าจะเป็น (odds ratio) เท่ากับ 1 แสดงว่าเงื่อนไขหรือเหตุการณ์ที่กำลังศึกษาอยู่นั้นมีโอกาสเกิดขึ้นเท่ากันในทั้งสองกลุ่ม อัตราส่วนความน่าจะเป็นที่มากกว่า 1 แสดงว่าเงื่อนไขหรือเหตุการณ์นั้นมีโอกาสเกิดขึ้นในกลุ่มแรกมากกว่า และอัตราส่วนความน่าจะเป็นที่น้อยกว่า 1 แสดงว่าเงื่อนไขหรือเหตุการณ์นั้นมีโอกาสเกิดขึ้นในกลุ่มแรกน้อยกว่า อัตราส่วนความน่าจะเป็นต้องมีค่าไม่เป็นลบจึงจะนิยามได้ หากp ₂q ₁เท่ากับศูนย์ หรือq ₁เท่ากับศูนย์ จะ _{นิยาม ไม่}ได้

นิยามในแง่ของความน่าจะเป็นร่วมและความน่าจะเป็นแบบมีเงื่อนไข

อัตราส่วนความน่าจะเป็นสามารถกำหนดได้โดยใช้การแจกแจงความน่าจะเป็นร่วมของตัวแปรสุ่ม ไบนารีสองตัว การแจกแจงความน่าจะเป็นร่วมของตัวแปรสุ่มไบนารี $X$ และ $Y$ สามารถเขียนได้ดังนี้

{\begin{array}{c|cc}&Y=1&Y=0\\\hline X=1&p_{11}&p_{10}\\X=0&p_{01}&p_{00}\end{array}}

โดยที่ $p$ ₁₁ , $p$ ₁₀ , $p$ ₀₁และ $p$ ₀₀คือ "ความน่าจะเป็นของเซลล์" ที่ไม่ติดลบและรวมกันได้เท่ากับหนึ่ง อัตราต่อรองสำหรับ $Y$ ภายในประชากรย่อยสองกลุ่มที่กำหนดโดย $X$ = 1 และ $X$ = 0 ถูกกำหนดในแง่ของความน่าจะเป็นแบบมีเงื่อนไขเมื่อกำหนด $X$ แล้วนั่นคือ $P (Y | X)$ :

{\begin{array}{c|cc}&Y=1&Y=0\\\hline X=1&{\frac {p_{11}}{p_{11}+p_{10}}}&{\frac {p_{10}}{p_{11}+p_{10}}}\\X=0&{\frac {p_{01}}{p_{01}+p_{00}}}&{\frac {p_{00}}{p_{01}+p_{00}}}\end{array}}

ดังนั้น อัตราส่วนความน่าจะเป็นคือ:

OR={\dfrac {p_{11}/(p_{11}+p_{10})}{p_{10}/(p_{11}+p_{10})}}{\bigg /}{\dfrac {p_{01}/(p_{01}+p_{00})}{p_{00}/(p_{01}+p_{00})}}={\frac {p_{11}p_{00}}{p_{10}p_{01}}}

โปรดทราบว่าอัตราส่วนความน่าจะเป็น (odds ratio) คือผลคูณของความน่าจะเป็นของ " เซลล์ที่สอดคล้องกัน " $(X = Y)$ หารด้วยผลคูณของความน่าจะเป็นของ " เซลล์ที่ไม่สอดคล้องกัน " $(X \neq Y)$ อย่างไรก็ตาม ในบางแอปพลิเคชัน การกำหนดป้ายกำกับหมวดหมู่เป็นศูนย์และหนึ่งนั้นเป็นไปโดยพลการ ดังนั้นจึงไม่มีอะไรพิเศษเกี่ยวกับค่าที่สอดคล้องกันเทียบกับค่าที่ไม่สอดคล้องกันในแอปพลิเคชันเหล่านี้

สมมาตร

ถ้าเราคำนวณอัตราส่วนความน่าจะเป็นโดยอิงจากความน่าจะเป็นแบบมีเงื่อนไขเมื่อกำหนดค่าYแล้ว

{\begin{array}{c|cc}&Y=1&Y=0\\\hline X=1&{\frac {p_{11}}{p_{11}+p_{01}}}&{\frac {p_{10}}{p_{10}+p_{00}}}\\X=0&{\frac {p_{01}}{p_{11}+p_{01}}}&{\frac {p_{00}}{p_{10}+p_{00}}}\end{array}}

เราก็จะได้รับผลลัพธ์เดียวกัน

{\dfrac {p_{11}/(p_{11}+p_{01})}{p_{01}/(p_{11}+p_{01})}}{\bigg /}{\dfrac {p_{10}/(p_{10}+p_{00})}{p_{00}/(p_{10}+p_{00})}}={\dfrac {p_{11}p_{00}}{p_{10}p_{01}}}.

มาตรวัดขนาดผลกระทบ อื่นๆ สำหรับข้อมูลไบนารีเช่นความเสี่ยงสัมพัทธ์ไม่มีคุณสมบัติสมมาตรนี้

ความสัมพันธ์กับความเป็นอิสระทางสถิติ

ถ้าXและYเป็นอิสระต่อกัน ความน่าจะเป็นร่วมของทั้งสองสามารถแสดงได้ในรูปของความน่าจะเป็นส่วนย่อย $p x = P (X = 1)$ และ $p y = P (Y = 1)$ ดังนี้

{\begin{array}{c|cc}&Y=1&Y=0\\\hline X=1&p_{x}p_{y}&p_{x}(1-p_{y})\\X=0&(1-p_{x})p_{y}&(1-p_{x})(1-p_{y})\end{array}}

ในกรณีนี้ อัตราส่วนความน่าจะเป็นเท่ากับหนึ่ง และในทางกลับกัน อัตราส่วนความน่าจะเป็นจะเท่ากับหนึ่งได้ก็ต่อเมื่อความน่าจะเป็นร่วมสามารถแยกตัวประกอบได้ในลักษณะนี้ ดังนั้น อัตราส่วนความน่าจะเป็นจะเท่ากับหนึ่งก็ต่อเมื่อXและYเป็นอิสระต่อกัน

การกู้คืนความน่าจะเป็นของเซลล์จากอัตราส่วนความน่าจะเป็นและความน่าจะเป็นส่วนขอบ

อัตราส่วนความน่าจะเป็นเป็นฟังก์ชันของความน่าจะเป็นของเซลล์ และในทางกลับกัน ความน่าจะเป็นของเซลล์สามารถหาได้จากความรู้เกี่ยวกับอัตราส่วนความน่าจะเป็นและความน่าจะเป็นส่วนขอบ $P (X = 1) = p 11 + p 10$ และ $P (Y = 1) = p 11 + p 01$ ถ้าอัตราส่วนความน่าจะเป็นRแตกต่างจาก 1 แล้ว

p_{11}={\frac {1+(p_{1\cdot }+p_{\cdot 1})(R-1)-S}{2(R-1)}}

โดยที่ $p 1• = p 11 + p 10, p •1 = p 11 + p 01$ , และ

S={\sqrt {(1+(p_{1\cdot }+p_{\cdot 1})(R-1))^{2}+4R(1-R)p_{1\cdot }p_{\cdot 1}}}.

ในกรณีที่ $R = 1$ เราจะมีความเป็นอิสระ ดังนั้น $p 11 = p 1• p •$ 1

เมื่อเราได้ค่า $p 11$ แล้ว ความน่าจะเป็นของเซลล์อีกสามเซลล์ที่เหลือก็สามารถหาได้จากความน่าจะเป็นแบบมาร์จินัลได้อย่างง่ายดาย

ตัวอย่าง

สมมติว่าในกลุ่มตัวอย่างผู้ชาย 100 คน มี 90 คนดื่มไวน์ในสัปดาห์ก่อนหน้า (ดังนั้น 10 คนไม่ได้ดื่ม) ในขณะที่ในกลุ่มตัวอย่างผู้หญิง 80 คน มีเพียง 20 คนเท่านั้นที่ดื่มไวน์ในช่วงเวลาเดียวกัน (ดังนั้น 60 คนไม่ได้ดื่ม) นี่คือตารางความสัมพันธ์:

{\begin{array}{c|cc}&M=1&M=0\\\hline D=1&90&20\\D=0&10&60\end{array}}

อัตราส่วนความน่าจะเป็น (OR) สามารถคำนวณได้โดยตรงจากตารางนี้ดังนี้:

{OR}={\frac {\;90\times 60\;}{\;10\times 20\;}}=27

อีกทางหนึ่ง โอกาสที่ผู้ชายจะดื่มไวน์คือ 90 ต่อ 10 หรือ 9:1 ในขณะที่โอกาสที่ผู้หญิงจะดื่มไวน์คือ 20 ต่อ 60 หรือ 1:3 = 0.33 ดังนั้น อัตราส่วนความน่าจะเป็นคือ 9/0.33 หรือ 27 ซึ่งแสดงให้เห็นว่าผู้ชายมีแนวโน้มที่จะดื่มไวน์มากกว่าผู้หญิงมาก การคำนวณโดยละเอียดมีดังนี้:

{0.9/0.1 \over 0.2/0.6}={\frac {\;0.9\times 0.6\;}{\;0.1\times 0.2\;}}={0.54 \over 0.02}=27

ตัวอย่างนี้ยังแสดงให้เห็นว่าอัตราส่วนความน่าจะเป็นบางครั้งมีความละเอียดอ่อนในการระบุตำแหน่งสัมพัทธ์: ในตัวอย่างนี้ ผู้ชายมีโอกาสดื่มไวน์มากกว่าผู้หญิง (90/100)/(20/80) = 3.6 เท่า แต่มีความน่าจะเป็นมากกว่าถึง 27 เท่า ลอการิทึมของอัตราส่วนความน่าจะเป็น ซึ่งเป็นผลต่างของลอจิตของความน่าจะเป็น จะช่วยลดผลกระทบนี้ และยังทำให้การวัดมีความสมมาตรเมื่อเทียบกับลำดับของกลุ่ม ตัวอย่างเช่น เมื่อใช้ลอการิทึมธรรมชาติอัตราส่วนความน่าจะเป็น 27/1 จะเท่ากับ 3.296 และอัตราส่วนความน่าจะเป็น 1/27 จะเท่ากับ −3.296

การอนุมานทางสถิติ

มีการพัฒนาแนวทางหลายวิธีในการอนุมานทางสถิติสำหรับอัตราส่วนความน่าจะเป็น

แนวทางหนึ่งในการอนุมานใช้การประมาณค่าจากตัวอย่างขนาดใหญ่กับค่าการแจกแจงตัวอย่างของอัตราส่วนลอการิทึมของอัตราต่อรอง ( ลอการิทึมธรรมชาติของอัตราส่วนอัตราต่อรอง) หากเราใช้สัญลักษณ์ความน่าจะเป็นร่วมที่กำหนดไว้ข้างต้น อัตราส่วนลอการิทึมของอัตราต่อรองของประชากรจะเป็นดังนี้

{\log \left({\frac {p_{11}p_{00}}{p_{01}p_{10}}}\right)=\log(p_{11})+\log(p_{00}{\big )}-\log(p_{10})-\log(p_{01})}.\,

หากเราพิจารณาข้อมูลในรูปแบบตารางความสัมพันธ์

{\begin{array}{c|cc}&Y=1&Y=0\\\hline X=1&n_{11}&n_{10}\\X=0&n_{01}&n_{00}\end{array}}

จากนั้นสามารถประมาณความน่าจะเป็นในการแจกแจงร่วมได้ดังนี้

{\begin{array}{c|cc}&Y=1&Y=0\\\hline X=1&{\hat {p}}_{11}&{\hat {p}}_{10}\\X=0&{\hat {p}}_{01}&{\hat {p}}_{00}\end{array}}

ที่ไหน $︿ พี ij = n ij / n$ โดยที่ $n = n 11 + n 10 + n 01 + n 00$ คือผลรวมของจำนวนเซลล์ทั้งสี่ อัตราส่วนลอการิทึมของอัตราต่อรองของตัวอย่างคือ

{L=\log \left({\dfrac {{\hat {p}}_{11}{\hat {p}}_{00}}{{\hat {p}}_{10}{\hat {p}}_{01}}}\right)=\log \left({\dfrac {n_{11}n_{00}}{n_{10}n_{01}}}\right)}

.

การกระจายตัวของอัตราส่วนลอการิทึมของอัตราต่อรองมีลักษณะใกล้เคียง กับการกระจาย แบบปกติ โดยมีรายละเอียดดังนี้ :

L\ \sim \ {\mathcal {N}}(\log(OR),\,\sigma ^{2}).\,

ค่าความคลาดเคลื่อนมาตรฐานสำหรับอัตราส่วนลอการิทึมของอัตราต่อรองคือประมาณ

{{\rm {SE}}={\sqrt {{\dfrac {1}{n_{11}}}+{\dfrac {1}{n_{10}}}+{\dfrac {1}{n_{01}}}+{\dfrac {1}{n_{00}}}}}}

.

นี่เป็นการประมาณค่าเชิงอะซิมโทติก และจะไม่ให้ผลลัพธ์ที่มีความหมายหากจำนวนเซลล์ใดๆ มีขนาดเล็กมาก หากLคืออัตราส่วนลอการิทึมของอัตราต่อรองตัวอย่างช่วงความเชื่อ มั่น 95% โดยประมาณ สำหรับอัตราส่วนลอการิทึมของอัตราต่อรองของประชากรคือ $L \pm 1.96SE$ [ ^{4 ] สามารถ} แมปไปยัง $exp(L - 1.96SE), exp(L + 1.96SE)$ เพื่อให้ได้ช่วงความเชื่อมั่น 95% สำหรับอัตราส่วนอัตราต่อรอง หากเราต้องการทดสอบสมมติฐานว่าอัตราส่วนอัตราต่อรองของประชากรเท่ากับหนึ่งค่า p สองด้าน คือ $2 P (Z < -| L |/SE)$ โดยที่Pหมาย ถึงความน่าจะเป็น และZหมายถึงตัวแปรสุ่มปกติมาตรฐาน

แนวทางทางเลือกในการอนุมานอัตราส่วนความน่าจะเป็นคือการพิจารณาการกระจายของข้อมูลโดยมีเงื่อนไขตามความถี่ส่วนขอบของXและYข้อดีของแนวทางนี้คือสามารถแสดงการกระจายตัวอย่างของอัตราส่วนความน่าจะเป็นได้อย่างแม่นยำ

บทบาทในการถดถอยโลจิสติกส์

การถดถอยโลจิสติกเป็นวิธีหนึ่งในการขยายอัตราส่วนความน่าจะเป็น (odds ratio) ให้ครอบคลุมมากกว่าตัวแปรไบนารีสองตัว สมมติว่าเรามีตัวแปรตอบสนองไบนารีYและตัวแปรทำนายไบนารีXและนอกจากนี้เรายังมีตัวแปรทำนายอื่นๆZ ₁ , ..., Z _pที่อาจเป็นไบนารีหรือไม่ก็ได้ หากเราใช้การถดถอยโลจิสติกหลายตัวแปรเพื่อถดถอยYกับX , Z ₁ , ..., Z _pแล้ว ค่าสัมประสิทธิ์ที่ประมาณได้สำหรับXจะเกี่ยวข้องกับอัตราส่วนความน่าจะเป็นแบบมีเงื่อนไข โดยเฉพาะอย่างยิ่งในระดับประชากร ${\hat {\beta }}_{x}$

e^{\beta _{x}}=\exp(\beta _{x})={\frac {P(Y=1\mid X=1,Z_{1},\ldots ,Z_{p})/P(Y=0\mid X=1,Z_{1},\ldots ,Z_{p})}{P(Y=1\mid X=0,Z_{1},\ldots ,Z_{p})/P(Y=0\mid X=0,Z_{1},\ldots ,Z_{p})}},

ดังนั้นจึงเป็นการประมาณค่าอัตราส่วนความน่าจะเป็นแบบมีเงื่อนไข การตีความของคือ การประมาณค่าอัตราส่วนความน่าจะเป็นระหว่างYและXเมื่อค่าของZ ₁ , ..., Z _pถูกกำหนดให้คงที่ $\exp({\hat {\beta }}_{x})$ $\exp({\hat {\beta }}_{x})$

ความไม่ไวต่อประเภทของการสุ่มตัวอย่าง

หากข้อมูลเป็น "ตัวอย่างประชากร" ความน่าจะเป็นของเซลล์จะถูกตีความว่าเป็นความถี่ของแต่ละกลุ่มทั้งสี่กลุ่มในประชากรตามที่กำหนดโดย ค่า XและYในหลายกรณี การได้มาซึ่งตัวอย่างประชากรนั้นทำได้ยาก ดังนั้นจึงใช้ตัวอย่างที่เลือกมาแทน ตัวอย่างเช่น เราอาจเลือกสุ่มตัวอย่างหน่วยที่มี $X$ $= 1$ ด้วยความน่าจะเป็นf ที่กำหนด โดยไม่คำนึงถึงความถี่ของหน่วยนั้นในประชากร (ซึ่งจะทำให้ต้องสุ่มตัวอย่างหน่วยที่มี $X$ $= 0$ ด้วยความน่าจะเป็น $1 -$ $f$ ) ในสถานการณ์นี้ ข้อมูลของเราจะมีความน่าจะเป็นร่วมดังต่อไปนี้: ${\widehat {p\,}}_{ij}$

{\begin{array}{c|cc}&Y=1&Y=0\\\hline X=1&{\frac {fp_{11}}{p_{11}+p_{10}}}&{\frac {fp_{10}}{p_{11}+p_{10}}}\\X=0&{\frac {(1-f)p_{01}}{p_{01}+p_{00}}}&{\frac {(1-f)p_{00}}{p_{01}+p_{00}}}\end{array}}

อัตราส่วนความน่าจะเป็น $p 11 p 00 / p 01 p 10$ สำหรับการแจกแจงนี้ไม่ขึ้นอยู่กับค่าของfซึ่งแสดงให้เห็นว่าอัตราส่วนความน่าจะเป็น (และด้วยเหตุนี้อัตราส่วนความน่าจะเป็นแบบลอการิทึม) ไม่เปลี่ยนแปลงไปตามการสุ่มตัวอย่างที่ไม่เป็นแบบสุ่มโดยอิงจากตัวแปรหนึ่งที่กำลังศึกษา อย่างไรก็ตาม โปรดทราบว่าค่าความคลาดเคลื่อนมาตรฐานของอัตราส่วนความน่าจะเป็นแบบลอการิทึมนั้นขึ้นอยู่กับค่าของ f

ข้อเท็จจริงนี้ถูกนำไปใช้ประโยชน์ในสองสถานการณ์สำคัญ:

สมมติว่าการสุ่มตัวอย่างประชากรทั้งหมดเป็นเรื่องไม่สะดวกหรือไม่สามารถทำได้จริง แต่การสุ่มตัวอย่างแบบสะดวกโดยเลือกหน่วยที่มี ค่า X ต่างกันนั้นสามารถทำได้จริง โดยที่ภายในกลุ่มย่อย $X = 0$ และ $X = 1 ค่า$ Yจะเป็นตัวแทนของประชากรทั้งหมด (กล่าวคือ เป็นไปตามความน่าจะเป็นแบบมีเงื่อนไขที่ถูกต้อง)
สมมติว่าการแจกแจงแบบมาร์จินัลของตัวแปรหนึ่ง เช่นXมีความเบ้มาก ตัวอย่างเช่น หากเรากำลังศึกษาความสัมพันธ์ระหว่างการดื่มแอลกอฮอล์ในปริมาณมากกับมะเร็งตับอ่อนในประชากรทั่วไป อัตราการเกิดมะเร็งตับอ่อนจะต่ำมาก ดังนั้นจึงจำเป็นต้องใช้กลุ่มตัวอย่างประชากรขนาดใหญ่มากเพื่อให้ได้จำนวนผู้ป่วยมะเร็งตับอ่อนที่พอประมาณ อย่างไรก็ตาม เราสามารถใช้ข้อมูลจากโรงพยาบาลเพื่อติดต่อผู้ป่วยมะเร็งตับอ่อนส่วนใหญ่หรือทั้งหมด แล้วสุ่มเลือกกลุ่มตัวอย่างที่ไม่มีมะเร็งตับอ่อนจำนวนเท่ากัน (วิธีนี้เรียกว่า " การศึกษาแบบกรณีควบคุม ")

ในทั้งสองกรณีนี้ สามารถคำนวณอัตราส่วนความน่าจะเป็นได้จากกลุ่มตัวอย่างที่เลือก โดยไม่ทำให้ผลลัพธ์คลาดเคลื่อนไปจากผลลัพธ์ที่จะได้จากกลุ่มตัวอย่างประชากร

ใช้ในการวิจัยเชิงปริมาณ

เนื่องจากการใช้การถดถอยโลจิสติก อย่างแพร่หลาย อัตราส่วนความน่าจะเป็นจึงถูกนำมาใช้อย่างกว้างขวางในหลายสาขาของการวิจัยทางการแพทย์และสังคมศาสตร์ อัตราส่วนความน่าจะเป็นมักใช้ในการวิจัยสำรวจในระบาดวิทยาและเพื่อแสดงผลลัพธ์ของการทดลองทางคลินิก บางอย่าง เช่น ในการศึกษาแบบกรณีควบคุมมักย่อว่า "OR" ในรายงาน เมื่อรวมข้อมูลจากการสำรวจหลายครั้ง มักจะแสดงเป็น "อัตราส่วนความน่าจะเป็นแบบรวม" (pooled OR)

ความสัมพันธ์กับความเสี่ยงสัมพัทธ์

ดังที่อธิบายไว้ในส่วน "ตัวอย่างที่สร้างแรงบันดาลใจ"ความเสี่ยงสัมพัทธ์มักจะดีกว่าอัตราส่วนความน่าจะเป็นในการทำความเข้าใจความสัมพันธ์ระหว่างความเสี่ยงและตัวแปรบางอย่าง เช่น รังสีหรือยาใหม่ ส่วนนั้นยังอธิบายด้วยว่าหากสมมติฐานเกี่ยวกับโรคหายากเป็นจริง อัตราส่วนความน่าจะเป็นจะเป็นค่าประมาณที่ดีของความเสี่ยงสัมพัทธ์^{[ 5 ]}และมีข้อดีบางประการเหนือความเสี่ยงสัมพัทธ์ เมื่อสมมติฐานเกี่ยวกับโรคหายากไม่เป็นจริง อัตราส่วนความน่าจะเป็นที่ไม่ได้ปรับค่าจะมากกว่าความเสี่ยงสัมพัทธ์^{[ 6 ]}^{[ 7 ]}^{[ 8 ]}แต่วิธีการใหม่ๆ สามารถใช้ข้อมูลเดียวกันเพื่อประมาณความเสี่ยงสัมพัทธ์ ความแตกต่างของความเสี่ยง ความน่าจะเป็นพื้นฐาน หรือปริมาณอื่นๆ ได้อย่างง่ายดาย^{[ 9 ]}

หากทราบความเสี่ยงสัมบูรณ์ในกลุ่มที่ไม่ได้รับสัมผัส การแปลงระหว่างทั้งสองจะคำนวณโดย: ^{[ 6 ]}

{\text{Relative risk}}\approx {\frac {\text{Odds ratio}}{1-R_{C}+(R_{C}\times {\text{Odds ratio}})}}

โดยที่RCคือความเสี่ยงสัมบูรณ์ของกลุ่มที่ไม่ได้รับผล _{กระทบ}

หากสมมติฐานเกี่ยวกับโรคหายากไม่เป็นไปตามที่กล่าวไว้ อัตราส่วนความน่าจะเป็นอาจแตกต่างจากความเสี่ยงสัมพัทธ์อย่างมาก และไม่ควรตีความว่าเป็นความเสี่ยงสัมพัทธ์

พิจารณาอัตราการเสียชีวิตของผู้โดยสารชายและหญิงเมื่อเรืออับปาง^{[ 3 ]}จากผู้หญิง 462 คน มีผู้เสียชีวิต 154 คน และรอดชีวิต 308 คน จากผู้ชาย 851 คน มีผู้เสียชีวิต 709 คน และรอดชีวิต 142 คน เห็นได้ชัดว่าผู้ชายบนเรือมีโอกาสเสียชีวิตมากกว่าผู้หญิง แต่มากกว่ามากแค่ไหน? เนื่องจากผู้โดยสารเสียชีวิตมากกว่าครึ่ง สมมติฐานเกี่ยวกับโรคหายากจึงถูกละเมิดอย่างรุนแรง

ในการคำนวณอัตราส่วนความเสี่ยง โปรดทราบว่าสำหรับผู้หญิง โอกาสที่จะเสียชีวิตคือ 1 ต่อ 2 (154/308) สำหรับผู้ชาย โอกาสคือ 5 ต่อ 1 (709/142) อัตราส่วนความเสี่ยงคือ 9.99 (4.99/0.5) ผู้ชายมีโอกาสเสียชีวิตมากกว่าผู้หญิงถึงสิบเท่า

สำหรับผู้หญิง โอกาสเสียชีวิตอยู่ที่ 33% (154/462) สำหรับผู้ชาย โอกาสเสียชีวิตอยู่ที่ 83% (709/851) ความเสี่ยงสัมพัทธ์ของการเสียชีวิตคือ 2.5 (0.83/0.33) นั่นหมายความว่าผู้ชายมีโอกาสเสียชีวิตมากกว่าผู้หญิง 2.5 เท่า

ความสับสนและการกล่าวเกินจริง

อัตราส่วนความน่าจะเป็นมักถูกเข้าใจผิดว่าเป็นความเสี่ยงสัมพัทธ์ในเอกสารทางการแพทย์ สำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญด้านสถิติ อัตราส่วนความน่าจะเป็นเป็นแนวคิดที่เข้าใจยาก และให้ตัวเลขที่น่าประทับใจกว่าสำหรับผลกระทบ^{[ 10 ]}อย่างไรก็ตาม ผู้เขียนส่วนใหญ่พิจารณาว่าความเสี่ยงสัมพัทธ์นั้นเข้าใจได้ง่าย^{[ 11 ]}ในการศึกษาหนึ่ง สมาชิกของมูลนิธิโรคแห่งชาติมีโอกาสมากกว่าผู้ที่ไม่ใช่สมาชิกถึง 3.5 เท่าที่จะเคยได้ยินเกี่ยวกับการรักษาทั่วไปสำหรับโรคนั้น – แต่อัตราส่วนความน่าจะเป็นคือ 24 และเอกสารระบุว่าสมาชิกมีโอกาสมากกว่า 20 เท่าที่จะเคยได้ยินเกี่ยวกับการรักษา^{[ 12 ]}การศึกษาเอกสารที่ตีพิมพ์ในวารสารสองฉบับรายงานว่า 26% ของบทความที่ใช้อัตราส่วนความน่าจะเป็นตีความว่าเป็นอัตราส่วนความเสี่ยง^{[ 13 ]}

สิ่งนี้อาจสะท้อนถึงกระบวนการง่ายๆ ของผู้เขียนที่ไม่เข้าใจซึ่งเลือกรูปภาพที่ดูน่าประทับใจและสามารถตีพิมพ์ได้มากที่สุด^{[ 11 ]}แต่ในบางกรณีการใช้งานอาจเป็นการหลอกลวงโดยเจตนา^{[ 14 ]}มีข้อเสนอแนะว่าอัตราส่วนความน่าจะเป็นควรนำเสนอเป็นมาตรวัดขนาดผลกระทบ เฉพาะ เมื่อไม่สามารถประมาณอัตราส่วนความเสี่ยง ได้โดยตรง ^{[ 10 ]}แต่ด้วยวิธีการใหม่ๆ ที่มีอยู่ ทำให้สามารถประมาณอัตราส่วนความเสี่ยงได้เสมอ ซึ่งโดยทั่วไปควรใช้แทน^{[ 9 ]}

แม้ว่าความเสี่ยงสัมพัทธ์อาจตีความได้ง่ายกว่าสำหรับผู้ชมทั่วไป แต่ก็มีข้อดีทางคณิตศาสตร์และแนวคิดเมื่อใช้อัตราส่วนความน่าจะเป็นแทนความเสี่ยงสัมพัทธ์ โดยเฉพาะอย่างยิ่งในแบบจำลองการถดถอย ด้วยเหตุนี้ จึงไม่มีฉันทามติในสาขาระบาดวิทยาหรือสถิติชีวภาพว่าควรเลือกใช้ความเสี่ยงสัมพัทธ์หรืออัตราส่วนความน่าจะเป็นเมื่อสามารถใช้ได้ทั้งสองอย่างอย่างถูกต้อง เช่น ในการทดลองทางคลินิกและการศึกษากลุ่ม^{[ 15 ]}

ความสามารถในการผกผันและความไม่เปลี่ยนแปลง

อัตราส่วนความน่าจะเป็น (Odds Ratio) มีคุณสมบัติพิเศษอีกอย่างหนึ่งคือ สามารถผกผันทางคณิตศาสตร์ได้โดยตรง ไม่ว่าจะวิเคราะห์ OR ในแง่ของการรอดชีวิตจากโรคหรือการเกิดโรคก็ตาม โดยที่ OR สำหรับการรอดชีวิตจะเป็นส่วนกลับโดยตรงของ 1/OR สำหรับความเสี่ยง คุณสมบัตินี้เรียกว่า 'ความไม่เปลี่ยนแปลงของอัตราส่วนความน่าจะเป็น' ในทางตรงกันข้าม ความเสี่ยงสัมพัทธ์ (Relative Risk) ไม่มีคุณสมบัติการผกผันทางคณิตศาสตร์นี้เมื่อศึกษาการรอดชีวิตจากโรคเทียบกับการเกิดโรค ปรากฏการณ์ของการผกผันของ OR เทียบกับการผกผันไม่ได้ของ RR สามารถอธิบายได้ดีที่สุดด้วยตัวอย่างต่อไปนี้:

สมมติว่าในการทดลองทางคลินิก มีความเสี่ยงต่อเหตุการณ์ไม่พึงประสงค์ 4/100 ในกลุ่มที่ได้รับยา และ 2/100 ในกลุ่มที่ได้รับยาหลอก... ซึ่งจะได้ค่า RR=2 และ OR=2.04166 สำหรับความเสี่ยงต่อเหตุการณ์ไม่พึงประสงค์ระหว่างกลุ่มที่ได้รับยาและกลุ่มที่ได้รับยาหลอก อย่างไรก็ตาม หากกลับการวิเคราะห์และวิเคราะห์เหตุการณ์ไม่พึงประสงค์เป็นอัตราการรอดชีวิตโดยปราศจากเหตุการณ์ กลุ่มที่ได้รับยาจะมีอัตรา 96/100 และกลุ่มที่ได้รับยาหลอกจะมีอัตรา 98/100—ซึ่งจะได้ค่า RR=0.9796 สำหรับการรอดชีวิตระหว่างกลุ่มที่ได้รับยาและกลุ่มที่ได้รับยาหลอก แต่ค่า OR=0.48979 จะเห็นได้ว่าค่า RR 0.9796 ไม่ใช่ค่าผกผันของค่า RR 2 อย่างชัดเจน ในทางตรงกันข้าม ค่า OR 0.48979 นั้นเป็นค่าผกผันโดยตรงของค่า OR 2.04166 อย่างแท้จริง

นี่คือสิ่งที่เรียกว่า 'ความไม่เปลี่ยนแปลงของอัตราส่วนความน่าจะเป็น' และเป็นเหตุผลว่าทำไม RR สำหรับการรอดชีวิตจึงไม่เหมือนกับ RR สำหรับความเสี่ยง ในขณะที่ OR มีคุณสมบัติสมมาตรนี้เมื่อวิเคราะห์ทั้งการรอดชีวิตหรือความเสี่ยงที่ไม่พึงประสงค์ อันตรายต่อการตีความทางคลินิกของ OR เกิดขึ้นเมื่ออัตราการเกิดเหตุการณ์ไม่พึงประสงค์ไม่หายาก ซึ่งจะทำให้ความแตกต่างถูกขยายให้เกินจริงเมื่อไม่เป็นไปตามข้อสมมติฐานเกี่ยวกับโรคหายากของ OR ในทางกลับกัน เมื่อโรคหายาก การใช้ RR สำหรับการรอดชีวิต (เช่น RR=0.9796 จากตัวอย่างข้างต้น) อาจซ่อนและปกปิดความเสี่ยงที่ไม่พึงประสงค์ที่เพิ่มขึ้นเป็นสองเท่าอย่างมีนัยสำคัญที่เกี่ยวข้องกับยาหรือการสัมผัสในทางคลินิกได้

ตัวประมาณค่าอัตราส่วนความน่าจะเป็น

อัตราส่วนความน่าจะเป็นของตัวอย่าง

อัตราส่วนความน่าจะเป็นของตัวอย่าง n 11 _n00 _/ n 10 _n01 _นั้นคำนวณได้ง่าย และสำหรับตัวอย่างขนาดปานกลางและขนาดใหญ่ จะทำงานได้ดีในฐานะตัวประมาณอัตราส่วนความน่าจะเป็นของประชากร เมื่อเซลล์หนึ่งเซลล์หรือมากกว่าในตารางความสัมพันธ์มีค่าเล็กน้อย อัตราส่วนความน่าจะเป็นของตัวอย่างอาจมีความเอนเอียงและแสดงความแปรปรวนสูง

ตัวประมาณค่าทางเลือก

มีการเสนอตัวประมาณค่าอัตราส่วนความน่าจะเป็นทางเลือกหลายตัวเพื่อแก้ไขข้อจำกัดของอัตราส่วนความน่าจะเป็นของตัวอย่าง ตัวประมาณค่าทางเลือกหนึ่งคือตัวประมาณค่าความน่าจะเป็นสูงสุดแบบมีเงื่อนไข ซึ่งกำหนดเงื่อนไขตามขอบแถวและคอลัมน์เมื่อสร้างความน่าจะเป็นเพื่อเพิ่มค่าสูงสุด (เช่นเดียวกับการทดสอบที่แม่นยำของ Fisher ) ^{[ 16 ]} ตัวประมาณค่าทางเลือกอีกตัวหนึ่งคือ ตัว ประมาณ ค่า Mantel–Haenszel

ตัวอย่างเชิงตัวเลข

ตารางความสัมพันธ์สี่ตารางต่อไปนี้ประกอบด้วยจำนวนเซลล์ที่สังเกตได้ พร้อมด้วยอัตราส่วนความน่าจะเป็นตัวอย่าง ( OR ) และอัตราส่วนความน่าจะเป็นล็อกตัวอย่าง ( LOR ) ที่สอดคล้องกัน:

	OR = 1, LOR = 0		OR = 1, LOR = 0		OR = 4, LOR = 1.39		OR = 0.25, LOR = −1.39
	Y = 1	Y = 0	Y = 1	Y = 0	Y = 1	Y = 0	Y = 1	Y = 0
X = 1	10	10	100	100	20	10	10	20
X = 0	5	5	50	50	10	20	20	10

ตารางแสดงการแจกแจงความน่าจะเป็นร่วมต่อไปนี้ประกอบด้วยความน่าจะเป็นของเซลล์ประชากร พร้อมด้วยอัตราส่วนความน่าจะเป็นของประชากร ( OR ) และอัตราส่วนความน่าจะเป็นแบบลอการิทึมของประชากร ( LOR ) ที่สอดคล้องกัน:

	OR = 1, LOR = 0		OR = 1, LOR = 0		OR = 16, LOR = 2.77		OR = 0.67, LOR = −0.41
	Y = 1	Y = 0	Y = 1	Y = 0	Y = 1	Y = 0	Y = 1	Y = 0
X = 1	0.2	0.2	0.4	0.4	0.4	0.1	0.1	0.3
X = 0	0.3	0.3	0.1	0.1	0.1	0.4	0.2	0.4

ตัวอย่างเชิงตัวเลข

ตัวอย่างของการลดความเสี่ยง
ปริมาณ	กลุ่มทดลอง (E)	กลุ่มควบคุม (C)	ทั้งหมด
กิจกรรม (E)	อีอี = 15	CE = 100	115
เหตุการณ์ที่ไม่เกิดขึ้น (N)	EN = 135	CN = 150	285
จำนวนผู้เรียนทั้งหมด (S)	ES = EE + EN = 150	CS = CE + CN = 250	400
อัตราการเกิดเหตุการณ์ (ER)	EER = EE / ES = 0.1 หรือ 10%	CER = CE / CS = 0.4 หรือ 40%	—

ตัวแปร	ตัวย่อ	สูตร	ค่า
การลดความเสี่ยงสัมบูรณ์	อาร์อาร์อาร์	CER − EER	0.3 หรือ 30%
จำนวนที่ต้องรักษา	เอ็นเอ็นที	1 / ( CER − EER )	3.33
ความเสี่ยงสัมพัทธ์ (อัตราส่วนความเสี่ยง)	อาร์อาร์	อีอีอาร์ / ซีอาร์	0.25
การลดความเสี่ยงสัมพัทธ์	รอาร์อาร์	( CER − EER ) / CERหรือ 1 − RR	0.75 หรือ 75%
สัดส่วนที่ป้องกันได้ในกลุ่มผู้ที่ไม่ได้รับเชื้อ	พีเอฟยู	( CER − EER ) / CER	0.75
อัตราส่วนความน่าจะเป็น	หรือ	( EE / EN ) / ( CE / CN )	0.167

สถิติที่เกี่ยวข้อง

มีสถิติสรุปอื่นๆ อีกหลายอย่างสำหรับตารางความสัมพันธ์ที่วัดความเชื่อมโยงระหว่างสองเหตุการณ์ เช่นYule's YและYule's Qโดยทั้งสองค่านี้จะถูกทำให้เป็นมาตรฐานเพื่อให้มีค่าเป็น 0 สำหรับเหตุการณ์ที่เป็นอิสระ 1 สำหรับเหตุการณ์ที่มีความสัมพันธ์กันอย่างสมบูรณ์ และ −1 สำหรับเหตุการณ์ที่มีความสัมพันธ์กันในเชิงลบอย่างสมบูรณ์AWF Edwardsได้ศึกษาเรื่องเหล่านี้และโต้แย้งว่าการวัดความเชื่อมโยงเหล่านี้จะต้องเป็นฟังก์ชันของอัตราส่วนความน่าจะเป็น ซึ่งเขาเรียกว่าอัตราส่วนไขว้^{[ 17 ]}

อัตราส่วนความน่าจะเป็นสำหรับการศึกษาแบบจับคู่กรณีควบคุม

การศึกษา กรณีควบคุมเกี่ยวข้องกับการเลือกตัวอย่างที่เป็นตัวแทนของกรณีและกลุ่มควบคุมที่มีและไม่มีโรคตามลำดับ ตัวอย่างเหล่านี้มักจะเป็นอิสระต่อกัน ความชุกก่อนหน้าของการสัมผัสกับปัจจัยเสี่ยงบางอย่างจะถูกสังเกตในผู้ป่วยจากทั้งสองตัวอย่าง ซึ่งช่วยให้สามารถประมาณอัตราส่วนความน่าจะเป็นของโรคในผู้ที่สัมผัสเทียบกับผู้ที่ไม่สัมผัสได้ตามที่กล่าวไว้ข้างต้น^{[ 18 ]} อย่างไรก็ตาม บางครั้งการจับคู่กรณีกับกลุ่มควบคุมโดยใช้ตัวแปรที่ ทำให้ เกิดความสับสน อย่างน้อยหนึ่งตัวก็มีความเหมาะสม ^{[ 19 ]}ในกรณีนี้ การสัมผัสก่อนหน้าที่สนใจจะถูกกำหนดสำหรับแต่ละกรณีและกลุ่มควบคุมที่จับคู่กัน ข้อมูลสามารถสรุปได้ในตารางต่อไปนี้

ตาราง จับคู่ 2 × 2

คู่กรณีศึกษาและกลุ่มควบคุม	การควบคุมถูกเปิดเผย	ควบคุมไม่ให้เห็น
คดีถูกเปิดเผย	$n_{11}$	$n_{10}$
คดีนี้ยังไม่เปิดเผย	$n_{01}$	$n_{00}$

ตารางนี้แสดงสถานะการได้รับสัมผัสของคู่ตัวอย่างที่จับคู่กัน มีคู่ที่ทั้งผู้ป่วยและกลุ่มควบคุมได้รับสัมผัสคู่ที่ผู้ป่วยได้รับสัมผัสแต่กลุ่มควบคุมไม่ได้รับสัมผัสคู่ที่กลุ่มควบคุมได้รับสัมผัสแต่ผู้ป่วยไม่ได้รับสัมผัส และคู่ที่ทั้งสองกลุ่มไม่ได้รับสัมผัส การได้รับสัมผัสของคู่ผู้ป่วยและกลุ่มควบคุมที่จับคู่กันมีความสัมพันธ์กันเนื่องจากค่าตัวแปรแทรกซ้อนร่วมกันมีค่าใกล้เคียงกัน $n_{11}$ $n_{10}$ $n_{01}$ $n_{00}$

การพิสูจน์ต่อไปนี้มาจากBreslow & Day ^{[ 19} ] เราพิจารณาแต่ละคู่ว่าอยู่ในชั้น ที่มีค่าของตัวแปรที่ทำให้เกิดความสับสนเหมือนกัน ภายใต้ ^{เงื่อนไข}ที่อยู่ในชั้นเดียวกัน สถานะการสัมผัสของกรณีและกลุ่มควบคุมจะเป็นอิสระต่อกัน สำหรับคู่กรณี-กลุ่มควบคุมใดๆ ภายในชั้นเดียวกัน ให้

p_{1}

ความน่าจะเป็นที่ผู้ป่วยจะได้รับเชื้อคือเท่าใด

p_{0}

จงหาความน่าจะเป็นที่ผู้ป่วยกลุ่มควบคุมจะได้รับสารดังกล่าว

q_{1}=1-p_{1}

เป็นความน่าจะเป็นที่ผู้ป่วยจะไม่ได้รับเชื้อ และ

q_{0}=1-p_{0}

คือความน่าจะเป็นที่ผู้ป่วยกลุ่มควบคุมจะไม่ได้รับสารสัมผัส

ดังนั้น ความน่าจะเป็นที่ผู้ป่วยจะได้รับเชื้อแต่กลุ่มควบคุมไม่ได้รับเชื้อคือและความน่าจะเป็นที่กลุ่มควบคุมได้รับเชื้อแต่ผู้ป่วยไม่ได้รับเชื้อคือ อัตราส่วนความเสี่ยง (odds ratio) ภายในกลุ่มย่อยสำหรับผู้ป่วยที่ได้รับเชื้อเมื่อเทียบกับกลุ่มควบคุมคือ $p_{1}q_{0}$ $p_{0}q_{1}$

\psi =(p_{1}/q_{1})/(p_{0}/q_{0})=p_{1}q_{0}/(q_{1}p_{0})

เราถือว่า $ψ$ มีค่าคงที่ตลอดชั้น^{[ 19 ]}

คู่ที่สอดคล้องกันซึ่งทั้งผู้ป่วยและกลุ่มควบคุมได้รับสารสัมผัส หรือทั้งสองฝ่ายไม่ได้รับสารสัมผัส ไม่ได้บอกอะไรเราเกี่ยวกับโอกาสที่ผู้ป่วยจะได้รับสารสัมผัสเมื่อเทียบกับโอกาสที่กลุ่มควบคุมจะได้รับสารสัมผัส ความน่าจะเป็นที่ผู้ป่วยได้รับสารสัมผัสและกลุ่มควบคุมไม่ได้รับสารสัมผัส เมื่อพิจารณาว่าคู่ไม่สอดคล้องกันนั้นคือ

\pi =(p_{1}q_{0})/(p_{1}q_{0}+q_{1}p_{0})=\psi /(\psi +1)

การแจกแจงของจำนวนคู่ที่ไม่สอดคล้องกันจะเป็นแบบทวินาม ~ B และ ค่าประมาณ ความน่าจะเป็นสูงสุดของ $π$ คือ $n_{10}$ $(n_{10}+n_{01},\pi )$

{\hat {\pi }}=n_{10}/(n_{10}+n_{01})={\hat {\psi }}/({\hat {\psi }}+1)

เมื่อคูณทั้งสองข้างของสมการนี้ด้วยและลบออกจะได้ $(n_{10}+n_{01})({\hat {\psi }}+1)$ $n_{10}{\hat {\psi }}$

n_{10}={\hat {\psi }}(n_{10}+n_{01}-n_{10})

และด้วยเหตุนี้

{\hat {\psi }}=n_{10}/n_{01}

.

ตอนนี้คือค่าประมาณความน่าจะเป็นสูงสุดของ $π$ และ $ψ$ เป็นฟังก์ชันโมโนโทนิกของดังนั้นจึงเป็นค่าประมาณความน่าจะเป็นสูงสุดแบบ มีเงื่อนไข ของเมื่อกำหนดจำนวนคู่ที่ไม่สอดคล้องกันRothman et al. ^[²⁰^]ให้การพิสูจน์ทางเลือกของโดยแสดงให้เห็นว่าเป็นกรณีพิเศษของค่าประมาณ Mantel-Haenszel ของอัตราส่วนความน่าจะเป็นภายในชั้นสำหรับตาราง 2x2 แบบแบ่งชั้น^[²⁰^]พวกเขายังอ้างอิง Breslow & Day ^[¹⁹^]ว่าเป็นผู้ให้การพิสูจน์ที่ให้ไว้ในที่นี้ ${\hat {\pi }}$ ${\hat {\pi }}$ ${\hat {\psi }}$ ${\hat {\psi }}$ ${\hat {\psi }}$

ภายใต้สมมติฐานว่างที่ว่า. $\psi =1,\pi =1/(1+1)=0.5$

ดังนั้น เราสามารถทดสอบสมมติฐานว่างที่ว่าโดยการทดสอบสมมติฐานว่างที่ว่า ซึ่งทำได้โดยใช้การทดสอบของ McNemar $\psi =1$ $\pi =0.5$

มีหลายวิธีในการคำนวณช่วงความเชื่อมั่นสำหรับ $π$ ให้และแทนขอบล่างและขอบบนของช่วงความเชื่อมั่นสำหรับ $π$ ตามลำดับ เนื่องจาก ดังนั้นช่วงความเชื่อมั่นที่สอดคล้องกันสำหรับ $ψ$ คือ ${\hat {\pi }}_{LB}$ ${\hat {\pi }}_{UB}$ $\psi =\pi /(1-\pi )$

({\frac {{\hat {\pi }}_{LB}}{1-{\hat {\pi }}_{LB}}},{\frac {{\hat {\pi }}_{UB}}{1-{\hat {\pi }}_{UB}}})

.

ตาราง 2x2 ที่จับคู่กันอาจได้รับการวิเคราะห์โดยใช้การถดถอยโลจิสติกแบบมีเงื่อนไข^{[ 21 ]}เทคนิคนี้มีข้อดีคือช่วยให้ผู้ใช้สามารถถดถอยสถานะกรณี-ควบคุมกับปัจจัยเสี่ยงหลายประการจากข้อมูลกรณี-ควบคุมที่จับคู่กัน

ตัวอย่าง

McEvoy และคณะ ^{[ 22 ]}ศึกษาการใช้โทรศัพท์มือถือของผู้ขับขี่เป็นปัจจัยเสี่ยงต่ออุบัติเหตุทางรถยนต์ในการศึกษาแบบ case-crossover ^{[ 18 ]}ผู้เข้าร่วมการศึกษาทั้งหมดเกี่ยวข้องกับอุบัติเหตุทางรถยนต์ที่ต้องเข้ารับการรักษาในโรงพยาบาล การใช้โทรศัพท์มือถือของผู้ขับขี่แต่ละคนในขณะที่เกิดอุบัติเหตุจะถูกเปรียบเทียบกับการใช้โทรศัพท์มือถือในช่วงเวลาควบคุมในเวลาเดียวกันของวันหนึ่งสัปดาห์ก่อนหน้า เราคาดว่าการใช้โทรศัพท์มือถือของบุคคลในขณะที่เกิดอุบัติเหตุจะมีความสัมพันธ์กับการใช้ของเขา/เธอหนึ่งสัปดาห์ก่อนหน้า การเปรียบเทียบการใช้งานในช่วงเวลาที่เกิดอุบัติเหตุและช่วงเวลาควบคุมจะปรับให้เข้ากับลักษณะของผู้ขับขี่ เวลาของวัน และวันในสัปดาห์ ข้อมูลสามารถสรุปได้ในตารางต่อไปนี้

คู่กรณีศึกษาและกลุ่มควบคุม	โทรศัพท์ที่ใช้ในช่วงเวลาควบคุม	โทรศัพท์ไม่ได้ถูกใช้งานในช่วงเวลาควบคุม
โทรศัพท์ที่ใช้ในช่วงเวลาที่เกิดอุบัติเหตุ	5	27
โทรศัพท์ไม่ได้ถูกใช้งานในช่วงเวลาที่เกิดการขัดข้อง	6	288

มีผู้ขับขี่ 5 คนที่ใช้โทรศัพท์ในทั้งสองช่วงเวลา 27 คนที่ใช้โทรศัพท์ในช่วงเวลาที่เกิดอุบัติเหตุแต่ไม่ใช้ในช่วงเวลาควบคุม 6 คนที่ใช้โทรศัพท์ในช่วงเวลาควบคุมแต่ไม่ใช้ในช่วงเวลาที่เกิดอุบัติเหตุ และ 288 คนที่ไม่ใช้โทรศัพท์ในทั้งสองช่วงเวลา อัตราส่วนความเสี่ยงของการเกิดอุบัติเหตุขณะใช้โทรศัพท์เมื่อเทียบกับการขับรถโดยไม่ใช้โทรศัพท์คือ

{\hat {\psi }}=27/6=4.5

.

การทดสอบสมมติฐานว่างที่เหมือนกับการทดสอบสมมติฐานว่างที่ว่าจากคู่ที่ไม่สอดคล้องกัน 33 คู่ มี 27 คู่ที่ผู้ขับขี่ใช้โทรศัพท์มือถือขณะเกิดอุบัติเหตุสถิติของ McNemar มีระดับความเป็นอิสระ 1 ระดับ และให้ค่า Pเท่ากับ 0.0003 ซึ่งทำให้เราสามารถปฏิเสธสมมติฐานที่ว่าการใช้โทรศัพท์มือถือไม่มีผลต่อความเสี่ยงของการเกิดอุบัติเหตุทางรถยนต์ ( ) ด้วยระดับนัยสำคัญทางสถิติที่สูง ${\hat {\psi }}=1$ ${\hat {\pi }}=0.5$ $\chi ^{2}=13.36$ $\psi =1$

เมื่อใช้ ระเบียบวิธี ของวิลสัน ช่วงความเชื่อมั่น 95% สำหรับ $π$ คือ (0.6561, 0.9139) ดังนั้น ช่วงความเชื่อมั่น 95% สำหรับ $ψ$ คือ

\left({\frac {0.6561}{1-0.6561}},{\frac {0.9139}{1-0.9139}}\right)=(1.9,10.6)

(McEvoy et al. ^{[ 22 ]}วิเคราะห์ข้อมูลโดยใช้การถดถอยโลจิสติกแบบมีเงื่อนไขและได้ผลลัพธ์ที่เกือบจะเหมือนกันกับที่ระบุไว้ที่นี่ ดูแถวสุดท้ายของตารางที่ 3 ในเอกสารของพวกเขา)

ดูเพิ่มเติม

ลิงก์ภายนอก

เครื่องคำนวณอัตราต่อรอง – เว็บไซต์
เครื่องคำนวณอัตราส่วนความน่าจะเป็นพร้อมการทดสอบต่างๆ – เว็บไซต์
OpenEpiเป็นโปรแกรมบนเว็บที่คำนวณอัตราส่วนความน่าจะเป็น ทั้งในกรณีที่ไม่ได้จับคู่และในกรณีที่จับคู่แล้ว

[ 1 ]

[

[ 3 ]

4 ] สามารถ

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[

[ 21 ]

[ 22 ]

อัตราส่วนความน่าจะเป็น

คำจำกัดความและคุณสมบัติพื้นฐาน

สัญชาตญาณจากตัวอย่างสำหรับคนทั่วไป

ตัวอย่างที่สร้างแรงบันดาลใจ ในบริบทของสมมติฐานเกี่ยวกับโรคหายาก

นิยามในแง่ของอัตราต่อรองตามกลุ่ม

นิยามในแง่ของความน่าจะเป็นร่วมและความน่าจะเป็นแบบมีเงื่อนไข

สมมาตร

ความสัมพันธ์กับความเป็นอิสระทางสถิติ

การกู้คืนความน่าจะเป็นของเซลล์จากอัตราส่วนความน่าจะเป็นและความน่าจะเป็นส่วนขอบ

ตัวอย่าง

การอนุมานทางสถิติ

บทบาทในการถดถอยโลจิสติกส์

ความไม่ไวต่อประเภทของการสุ่มตัวอย่าง

ใช้ในการวิจัยเชิงปริมาณ

ความสัมพันธ์กับความเสี่ยงสัมพัทธ์

ความสับสนและการกล่าวเกินจริง

ความสามารถในการผกผันและความไม่เปลี่ยนแปลง

ตัวประมาณค่าอัตราส่วนความน่าจะเป็น

อัตราส่วนความน่าจะเป็นของตัวอย่าง

ตัวประมาณค่าทางเลือก

ตัวอย่างเชิงตัวเลข

ตัวอย่างเชิงตัวเลข

สถิติที่เกี่ยวข้อง

อัตราส่วนความน่าจะเป็นสำหรับการศึกษาแบบจับคู่กรณีควบคุม

ตาราง จับคู่ 2 × 2

ตัวอย่าง

ดูเพิ่มเติม

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ