การทดสอบไคสแควร์

Q: การทดสอบไคสแควร์ของเพียร์สัน

ใน ปี พ.ศ. 2443 เพียร์สันได้ตีพิมพ์บทความ [ 2 ] เกี่ยวกับ การทดสอบ χ² ซึ่งถือเป็นหนึ่งในรากฐานของสถิติสมัยใหม่ [ 7 ] ในบทความนี้ เพียร์สันได้ตรวจสอบการทดสอบความเหมาะสมของแบบจำลอง

การทดสอบไคสแควร์ (หรือ $การ$ ทดสอบไคสแควร์หรือ $χ²$ ) เป็นการทดสอบสมมติฐานทางสถิติที่ใช้ในการวิเคราะห์ตารางความสัมพันธ์เมื่อขนาดตัวอย่างมีขนาดใหญ่ กล่าวโดยง่าย การทดสอบนี้ใช้เพื่อตรวจสอบว่าตัวแปรเชิงหมวดหมู่สองตัว ( สองมิติของตารางความสัมพันธ์ ) เป็นอิสระต่อกันในการมีอิทธิพลต่อสถิติการทดสอบ ( ค่าภายในตาราง ) หรือไม่ ^{[ 1 ]}

การทดสอบนี้ใช้ได้ผลเมื่อค่าสถิติการทดสอบมีการกระจายแบบไคกำลังสองภายใต้สมมติฐานว่างโดยเฉพาะอย่างยิ่งการทดสอบไคกำลังสองของเพียร์สันและรูปแบบต่างๆ ของการทดสอบดังกล่าว การทดสอบไคกำลังสองของเพียร์สันใช้เพื่อตรวจสอบว่ามี ความแตกต่าง ทางสถิติอย่างมีนัยสำคัญระหว่างความถี่ ที่คาดหวัง และความถี่ที่สังเกตได้ในหนึ่งหรือหลายหมวดหมู่ของตารางความสัมพันธ์หรือไม่ สำหรับตารางความสัมพันธ์ที่มีขนาดตัวอย่างเล็กกว่า จะใช้ การทดสอบความแม่นยำของฟิชเชอร์แทน

ในการประยุกต์ใช้การทดสอบนี้แบบมาตรฐาน ข้อมูลที่สังเกตได้จะถูกจัดกลุ่มเป็นกลุ่มที่ไม่ทับซ้อนกัน หากสมมติฐานหลักที่ว่าไม่มีความแตกต่างระหว่างกลุ่มในประชากรนั้นเป็นจริง ค่าสถิติการทดสอบที่คำนวณจากข้อมูลที่สังเกตได้จะมีการกระจายความถี่ $แบบ$ $χ²$ จุดประสงค์ของการทดสอบคือการประเมินว่าความถี่ที่สังเกตได้จะมีโอกาสมากน้อยเพียงใดหากสมมติว่าสมมติฐานหลักเป็นจริง

สถิติการทดสอบที่สอดคล้องกับ การแจกแจงแบบไค $กำลังสอง$ $(χ²$ ) เกิดขึ้นเมื่อการสังเกตการณ์เป็นอิสระต่อกัน นอกจากนี้ยังมี การทดสอบไคกำลัง $สอง$ $(χ²$ ) สำหรับการทดสอบสมมติฐานว่างของการเป็นอิสระต่อกันของตัวแปรสุ่มสองตัวโดยอาศัยการสังเกตการณ์ของคู่ตัวแปรเหล่านั้น

การทดสอบไคสแควร์มักหมายถึงการทดสอบที่การกระจายของค่าสถิติการทดสอบเข้าใกล้การกระจาย ไค $ส แควร์ในเชิง อะ$ ซิปโทติกซึ่งหมายความว่าการกระจายตัวอย่าง (หากสมมติฐานว่างเป็นจริง) ของค่าสถิติการทดสอบจะใกล้เคียงกับการกระจายไคสแควร์มากขึ้นเรื่อยๆ เมื่อขนาด ตัวอย่าง เพิ่มขึ้น

ประวัติศาสตร์

ในศตวรรษที่ 19 วิธีการวิเคราะห์ทางสถิติส่วนใหญ่ถูกนำมาใช้ในการวิเคราะห์ข้อมูลทางชีววิทยา และเป็นเรื่องปกติที่นักวิจัยจะถือว่าการสังเกตเป็นไปตามการกระจายแบบปกติเช่นเซอร์ จอร์จ แอร์รีและแมนส์ฟิลด์ เมอร์ริแมนซึ่งผลงานของพวกเขาถูกวิจารณ์โดยคาร์ล เพียร์สันในบทความปี 1900 ของเขา^{[ 2 ]}

ในช่วงปลายศตวรรษที่ 19 เพียร์สันสังเกตเห็นความเบี่ยงเบน อย่างมีนัยสำคัญ ในการสังเกตทางชีววิทยาบางอย่าง เพื่อสร้างแบบจำลองการสังเกตโดยไม่คำนึงถึงว่าจะเป็นปกติหรือเบี่ยงเบน เพียร์สันได้คิดค้นการแจกแจงเพียร์สัน ซึ่งเป็นตระกูลของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง ซึ่งรวมถึงการแจกแจงปกติและการแจกแจงเบี่ยงเบนหลายแบบ ในบทความหลายชุดที่ตีพิมพ์ตั้งแต่ปี 1893 ถึง 1916 ^[ 3 ] ^{[ 4 ] [} 5 ] ^[⁶^]^{และเสนอวิธี}^{การวิเคราะห์ทาง}^{สถิติ}ที่ประกอบด้วยการใช้การแจกแจงเพียร์สันเพื่อสร้างแบบจำลองการสังเกตและทำการทดสอบความเหมาะสมเพื่อพิจารณาว่าแบบจำลองนั้นเหมาะสมกับการสังเกตได้ดีเพียงใด

การทดสอบไคสแควร์ของเพียร์สัน

$ใน ปี$ พ.ศ. 2443 เพียร์สันได้ตีพิมพ์บทความ^{[ 2 ]}เกี่ยวกับ การทดสอบ $χ²$ ซึ่งถือเป็นหนึ่งในรากฐานของสถิติสมัยใหม่^{[ 7 ]}ในบทความนี้ เพียร์สันได้ตรวจสอบการทดสอบความเหมาะสมของแบบจำลอง

สมมติว่า การสังเกต $n ครั้ง$ ในตัวอย่างสุ่มจากประชากรถูกจัดกลุ่มเป็น $k$ กลุ่มที่ไม่ซ้ำซ้อนกัน โดยมีจำนวนการสังเกต $x i$ ตามลำดับ (สำหรับ $i = 1, 2, \dots, k$ ) และสมมติฐานว่างให้ความน่าจะ เป็น $p i$ ที่การสังเกตจะตกอยู่ใน กลุ่มที่ $i$ ดังนั้นเราจึงมีจำนวนที่คาดหวัง $m i = np i$ สำหรับทุก $i$ โดยที่

{\begin{aligned}&\sum _{i=1}^{k}{p_{i}}=1\\[8pt]&\sum _{i=1}^{k}{m_{i}}=n\sum _{i=1}^{k}{p_{i}}=n\end{aligned}}

เพียร์สันเสนอว่า ภายใต้สถานการณ์ที่สมมติฐานว่างถูกต้อง เมื่อ $n \to \infty$ การแจกแจงจำกัดของปริมาณที่กำหนดด้านล่างคือ $การ$ แจกแจง $χ²$

X^{2}=\sum _{i=1}^{k}{\frac {(x_{i}-m_{i})^{2}}{m_{i}}}=\sum _{i=1}^{k}{{\frac {x_{i}^{2}}{m_{i}}}-n}

เพียร์สันได้พิจารณากรณีแรกที่ค่าคาดหวัง $m i$ มีขนาดใหญ่พอและเป็นจำนวนที่ทราบในทุกเซลล์ โดยสมมติว่าการสังเกต $x i$ ทุกครั้ง สามารถถือได้ว่ามีการแจกแจงแบบปกติและได้ผลลัพธ์ว่า ในกรณีที่ $n$ มีขนาดใหญ่ขึ้น $X 2$ จะเป็นไปตาม การแจกแจง $χ 2$ ที่มีองศาอิสระ $k - 1$

อย่างไรก็ตาม เพียร์สันได้พิจารณากรณีต่อไปที่จำนวนที่คาดหวังขึ้นอยู่กับพารามิเตอร์ที่ต้องประมาณจากตัวอย่าง และเสนอแนะว่า โดยใช้สัญลักษณ์ $m i$ เป็นจำนวนที่คาดหวังที่แท้จริง และ $m' i$ เป็นจำนวนที่คาดหวังที่ประมาณได้ ความแตกต่าง

X^{2}-{X'}^{2}=\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m_{i}}}-\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m'_{i}}}

โดยทั่วไปแล้วจะเป็นค่าบวกและมีขนาดเล็กพอที่จะละเว้นได้ ในบทสรุป เพียร์สันโต้แย้งว่าหากเราถือว่า $X' 2$ $มีการแจกแจงแบบ χ 2$ เช่นกันโดยมี องศาอิสระ $k - 1$ ข้อผิดพลาดในการประมาณค่านี้จะไม่ส่งผลกระทบต่อการตัดสินใจในทางปฏิบัติ ข้อสรุปนี้ก่อให้เกิดข้อโต้แย้งบางประการในการใช้งานจริง และยังไม่ได้รับการแก้ไขเป็นเวลา 20 ปี จนกระทั่งเอกสารของฟิชเชอร์ในปี 1922 และ 1924 ^{[ 8 ]}^{[ 9 ]}

ตัวอย่างอื่นๆ ของการทดสอบไคสแควร์

สถิติการทดสอบหนึ่งที่สอดคล้องกับการแจกแจงไคกำลังสองอย่างแม่นยำคือ การทดสอบว่าความแปรปรวนของประชากรที่มีการแจกแจงแบบปกติมีค่าตามที่กำหนดโดยอิงจากความแปรปรวนของตัวอย่างการทดสอบดังกล่าวไม่ค่อยพบเห็นในทางปฏิบัติ เนื่องจากโดยปกติแล้วความแปรปรวนที่แท้จริงของประชากรนั้นไม่เป็นที่ทราบ อย่างไรก็ตาม มีการทดสอบทางสถิติหลายอย่างที่การแจกแจงไคกำลังสองมีความถูกต้องโดยประมาณ:

การทดสอบที่แม่นยำของฟิชเชอร์

สำหรับการทดสอบที่แม่นยำซึ่งใช้แทนการทดสอบไคกำลังสอง 2 × 2 สำหรับความเป็นอิสระเมื่อผลรวมของแถวและคอลัมน์ทั้งหมดถูกกำหนดไว้โดยการออกแบบ โปรดดูการทดสอบที่แม่นยำของ Fisher เมื่อขอบของแถวหรือคอลัมน์ (หรือทั้งสองอย่าง) เป็นตัวแปรสุ่ม (เช่นเดียวกับการออกแบบการวิจัยทั่วไปส่วนใหญ่) วิธีนี้มักจะอนุรักษ์ นิยมมากเกินไปและมีกำลังการทดสอบต่ำ^{[ 10 ]}

การทดสอบทวินาม

สำหรับการทดสอบที่แม่นยำซึ่งใช้แทนการทดสอบไคกำลังสอง 2 × 1 สำหรับความเหมาะสมของแบบจำลอง โปรดดูที่ การทดสอบ ทวิ นาม

การทดสอบไคสแควร์อื่นๆ

การทดสอบไคสแคว ร์ของ Cochran–Mantel–Haenszel
การทดสอบของ McNemarใช้ในตาราง2 × 2 บางประเภทที่มีการจับคู่
การทดสอบการบวกของทูคีย์
การทดสอบพอร์ตแมนโทในการวิเคราะห์อนุกรมเวลาเพื่อทดสอบการมีอยู่ของความสัมพันธ์อัตโนมัติ
การทดสอบอัตราส่วนความน่าจะเป็นในการสร้างแบบจำลองทางสถิติ ทั่วไป ใช้สำหรับทดสอบว่ามีหลักฐานที่บ่งชี้ถึงความจำเป็นในการเปลี่ยนจากแบบจำลองอย่างง่ายไปสู่แบบจำลองที่ซับซ้อนกว่าหรือไม่ (โดยที่แบบจำลองอย่างง่ายนั้นซ้อนอยู่ภายในแบบจำลองที่ซับซ้อนกว่า)

การแก้ไขความต่อเนื่องของเยตส์

การใช้การแจกแจงไคกำลังสองในการตีความสถิติไคกำลังสองของเพียร์สันจำเป็นต้องสมมติว่าความ น่าจะเป็นแบบ ไม่ต่อเนื่องของความถี่ทวินาม ที่สังเกตได้ ในตารางสามารถประมาณได้ด้วยการแจกแจงไคกำลังสองแบบ ต่อเนื่อง ซึ่ง สมมติฐานนี้ไม่ถูกต้องนักและทำให้เกิดข้อผิดพลาดบางประการ

เพื่อลดข้อผิดพลาดในการประมาณค่าแฟรงค์ เยตส์เสนอการแก้ไขความต่อเนื่องที่ปรับสูตรสำหรับการทดสอบไคกำลังสองของเพียร์สันโดยการลบ 0.5 ออกจากความแตกต่างสัมบูรณ์ระหว่างค่าที่สังเกตได้แต่ละค่ากับค่าที่คาดหวังในตารางความสัมพันธ์2 × 2 ^{[ 11 ]}ซึ่งจะลดค่าไคกำลังสองที่ได้รับและทำให้ค่า p เพิ่ม ขึ้น

การทดสอบไคสแควร์สำหรับความแปรปรวนในประชากรปกติ

หากสุ่มตัวอย่างขนาด $n$ จากประชากรที่มีการแจกแจงแบบปกติจะได้ผลลัพธ์ (ดูการแจกแจงของความแปรปรวนของตัวอย่าง ) ซึ่งช่วยให้สามารถทดสอบได้ว่าความแปรปรวนของประชากรมีค่าที่กำหนดไว้ล่วงหน้าหรือไม่ ตัวอย่างเช่น กระบวนการผลิตอาจอยู่ในสภาวะคงที่มาเป็นเวลานาน ทำให้สามารถกำหนดค่าความแปรปรวนได้โดยแทบไม่มีข้อผิดพลาด สมมติว่ากำลังทดสอบตัวแปรของกระบวนการ ทำให้ได้ตัวอย่างขนาดเล็กจำนวน $n$ รายการผลิตภัณฑ์ ซึ่งต้องการทดสอบความแปรผัน สถิติการทดสอบ $T$ ในกรณีนี้สามารถกำหนดให้เป็นผลรวมของกำลังสองรอบค่าเฉลี่ยของตัวอย่าง หารด้วยค่าที่กำหนดสำหรับความแปรปรวน (เช่น ค่าที่จะทดสอบว่าคงที่) จากนั้น $T$ จะ มีการแจกแจงแบบไคกำลังสองที่มีองศาอิสระ $n - 1$ ตัวอย่างเช่น หากขนาดตัวอย่างคือ 21 บริเวณการยอมรับสำหรับ $T$ ที่ระดับนัยสำคัญ 5% จะอยู่ระหว่าง 9.59 และ 34.17

ตัวอย่างการทดสอบไคสแควร์สำหรับข้อมูลเชิงหมวดหมู่

สมมติว่ามีเมืองหนึ่งที่มีประชากร 1,000,000 คน แบ่งออกเป็นสี่เขตย่อย ได้แก่ $A$ , $B$ , $C$ และ $D$ มีการสุ่มตัวอย่างประชากร 650 คนจากเมืองนี้ และบันทึกอาชีพของพวกเขาเป็น"พนักงานออฟฟิศ" "พนักงานโรงงาน" หรือ "ไม่มีอาชีพ"สมมติฐานหลักคือ เขตที่อยู่อาศัยของแต่ละบุคคลไม่ขึ้นอยู่กับการจำแนกประเภทอาชีพของบุคคลนั้น ข้อมูลถูกจัดทำเป็นตารางดังนี้:

	$เอ$	$บี$	$ซี$	$ดี$	ทั้งหมด
พนักงานออฟฟิศ	90	60	104	95	349
คนงานระดับล่าง	30	50	51	20	151
ไม่มีปลอกคอ	30	40	45	35	150
ทั้งหมด	150	150	200	150	650

ลองใช้กลุ่มตัวอย่างที่อาศัยอยู่ในย่าน $A$ จำนวน 150 คน เพื่อประมาณสัดส่วนของประชากรทั้งหมด 1,000,000 คนที่อาศัยอยู่ในย่าน $A$ ในทำนองเดียวกัน เราใช้⁠349/650เพื่อประเมินว่าสัดส่วนของพนักงานออฟฟิศในจำนวน 1,000,000 คนนั้นเป็น เท่าใดโดยอาศัยสมมติฐานเรื่องความเป็นอิสระ ภายใต้สมมติฐานที่ว่าเราควร "คาดหวัง" ว่าจำนวนพนักงานออฟฟิศในย่าน $A$ จะเป็นเท่าใด

150\times {\frac {349}{650}}\approx 80.54

จากนั้นใน "ช่อง" นั้นของตาราง เราจะมี

{\frac {\left({\text{observed}}-{\text{expected}}\right)^{2}}{\text{expected}}}={\frac {\left(90-80.54\right)^{2}}{80.54}}\approx 1.11

ผลรวมของปริมาณเหล่านี้ในทุกเซลล์คือค่าสถิติการทดสอบ ในกรณีนี้คือ ภายใต้สมมติฐานว่าง ผลรวมนี้จะมีลักษณะการแจกแจงแบบไคกำลังสองโดยประมาณ ซึ่งมีจำนวนองศาอิสระเท่ากับ $\approx 24.57$

({\text{number of rows}}-1)({\text{number of columns}}-1)=(3-1)(4-1)=6

ถ้าค่าสถิติการทดสอบมีขนาดใหญ่ผิดปกติเมื่อพิจารณาจากค่าไคกำลังสองแล้ว แสดงว่าเราต้องปฏิเสธสมมติฐานหลักเรื่องความเป็นอิสระ

ประเด็นที่เกี่ยวข้องอีกประการหนึ่งคือการทดสอบความสม่ำเสมอ สมมติว่าแทนที่จะให้โอกาสผู้อยู่อาศัยทุกคนในแต่ละย่านทั้งสี่แห่งมีโอกาสถูกเลือกเป็นตัวอย่างเท่ากัน เราตัดสินใจล่วงหน้าว่าจะเลือกผู้อยู่อาศัยในแต่ละย่านจำนวนเท่าใด ในกรณีนี้ ผู้อยู่อาศัยแต่ละคนจะมีโอกาสถูกเลือกเท่ากันกับผู้อยู่อาศัยทั้งหมดในย่านเดียวกัน แต่ผู้อยู่อาศัยในย่านที่แตกต่างกันจะมีโอกาสถูกเลือกแตกต่างกัน หากขนาดตัวอย่างทั้งสี่ไม่เป็นสัดส่วนกับจำนวนประชากรของย่านทั้งสี่ ในกรณีเช่นนี้ เราจะทดสอบ "ความสม่ำเสมอ" มากกว่า "ความเป็นอิสระ" คำถามคือสัดส่วนของแรงงานระดับล่าง แรงงานระดับบน และแรงงานนอกระบบในสี่ย่านนั้นเท่ากันหรือไม่ อย่างไรก็ตาม การทดสอบจะทำในลักษณะเดียวกัน

แอปพลิเคชัน

ในการวิเคราะห์การเข้ารหัสการทดสอบไคสแควร์ใช้เพื่อเปรียบเทียบการกระจายของข้อความธรรมดาและข้อความ เข้ารหัสที่ถอดรหัสได้ (หรืออาจจะถอดรหัสได้) ค่าต่ำสุดของการทดสอบหมายความว่าการถอดรหัสสำเร็จด้วยความน่าจะเป็นสูง^{[ 12 ]}^{[ 13 ]}วิธีนี้สามารถนำไปใช้ทั่วไปในการแก้ปัญหาการเข้ารหัสสมัยใหม่ได้^{[ 14 ]}

ในชีวสารสนเทศการทดสอบไคสแควร์ใช้เพื่อเปรียบเทียบการกระจายของคุณสมบัติบางอย่างของยีน (เช่น เนื้อหาจีโนม อัตราการกลายพันธุ์ การจัดกลุ่มเครือข่ายปฏิสัมพันธ์ ฯลฯ) ที่อยู่ในหมวดหมู่ที่แตกต่างกัน (เช่น ยีนโรค ยีนที่จำเป็น ยีนบนโครโมโซมบางตัว ฯลฯ) ^{[ 15 ]}^{[ 16 ]}

ข้อจำกัด

การทดสอบไคสแควร์ แม้ว่าจะใช้กันอย่างแพร่หลายในการวิเคราะห์ข้อมูลเชิงหมวดหมู่ แต่ก็มีข้อจำกัดที่สำคัญหลายประการที่นักวิจัยควรพิจารณา ประการแรก การทดสอบนี้ถือว่าการสังเกตการณ์เป็นอิสระต่อกัน การละเมิดข้อสมมตินี้อาจนำไปสู่ผลลัพธ์ที่ผิดพลาดได้ ประการที่สอง การทดสอบมีความไวต่อขนาดของกลุ่มตัวอย่าง ในกลุ่มตัวอย่างขนาดใหญ่มาก แม้แต่ความแตกต่างเล็กน้อยระหว่างความถี่ที่สังเกตได้และความถี่ที่คาดหวังก็อาจทำให้เกิดผลลัพธ์ที่มีนัยสำคัญทางสถิติ ในขณะที่ในกลุ่มตัวอย่างขนาดเล็กมาก การทดสอบอาจไม่มีประสิทธิภาพเพียงพอที่จะตรวจจับความสัมพันธ์ที่มีความหมาย ประการที่สาม การทดสอบไคสแควร์ไม่ได้วัดความแข็งแกร่งหรือความสำคัญในทางปฏิบัติของความสัมพันธ์—มันเพียงแต่บ่งชี้ว่ามีความสัมพันธ์ที่มีนัยสำคัญอยู่หรือไม่ ควรมีการรายงานมาตรวัดขนาดผลกระทบ เช่นCramér's Vหรือสัมประสิทธิ์ความสัมพันธ์ควบคู่ไปกับสถิติการทดสอบเพื่อให้บริบท สุดท้าย การทดสอบอาจไม่แม่นยำเมื่อความถี่ที่คาดหวังในเซลล์ใด ๆ มีขนาดเล็กมาก ซึ่งมักแนะนำให้มีอย่างน้อย 5 ในกรณีเช่นนี้ ควรเลือกใช้การทดสอบที่แม่นยำหรือวิธีการอื่น ๆ นักวิจัยต้องระมัดระวังเมื่อต้องจัดการกับหมวดหมู่ที่มีการกระจายไม่สม่ำเสมอ เนื่องจากกลุ่มที่เด่นกว่าอาจบดบังรูปแบบในกลุ่มที่เล็กกว่าได้^{[ 17 ]}^{[ 18 ]}

ดูเพิ่มเติม

อ่านเพิ่มเติม

ไวส์สไตน์, เอริค ดับเบิลยู. "การทดสอบไคสแควร์" . MathWorld .
Corder, GW; Foreman, DI (2014). สถิติแบบไม่ใช้พารามิเตอร์: วิธีการทีละขั้นตอน . นิวยอร์ก: Wiley. ISBN 978-1118840313.
กรีนวูด, ซินดี้ ; นิกูลิน, เอ็มเอส (1996). คู่มือการทดสอบไคสแควร์ . นิวยอร์ก: ไวลีย์. ISBN 0-471-55779-X.
Nikulin, MS (1973). การทดสอบไคสแควร์สำหรับภาวะปกติ . รายงานการประชุมนานาชาติวิลนีอุสว่าด้วยทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ . เล่ม 2. หน้า 119–122 .
Bagdonavicius, Vilijandas B.; Nikulin, Mikhail S. (2011). " การทดสอบความเหมาะสมของไคกำลังสองสำหรับข้อมูลที่ถูกตัดตอนทางขวา"วารสารคณิตศาสตร์ประยุกต์และสถิติระหว่างประเทศ24 : 30– 50. MR 2800388

[ 1 ]

[ 2 ]

[

6

และเสนอวิธี

การวิเคราะห์ทาง

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]