กลับไปหน้าบทความ

อ่าน 7 นาที

การทดสอบไคสแควร์

การ ทดสอบไคสแควร์ (หรือ การ ทดสอบ ไคสแควร์ หรือ χ² ) เป็นการ ทดสอบสมมติฐานทางสถิติ ที่ใช้ในการวิเคราะห์ ตารางความสัมพันธ์ เมื่อ ขนาดตัวอย่าง มีขนาดใหญ่ กล่าวโดยง่าย...

การทดสอบไคสแควร์

การแจกแจงไคกำลังสองโดยแสดงค่า χ²บนแกนแรก และ ค่า p (ความน่าจะเป็นของหางด้านขวา) บนแกนที่สอง

การทดสอบไคสแควร์ (หรือการทดสอบไคสแควร์หรือχ² ) เป็นการทดสอบสมมติฐานทางสถิติที่ใช้ในการวิเคราะห์ตารางความสัมพันธ์เมื่อขนาดตัวอย่างมีขนาดใหญ่ กล่าวโดยง่าย การทดสอบนี้ใช้เพื่อตรวจสอบว่าตัวแปรเชิงหมวดหมู่สองตัว ( สองมิติของตารางความสัมพันธ์ ) เป็นอิสระต่อกันในการมีอิทธิพลต่อสถิติการทดสอบ ( ค่าภายในตาราง ) หรือไม่ [ 1 ]

การทดสอบนี้ใช้ได้ผลเมื่อค่าสถิติการทดสอบมีการกระจายแบบไคกำลังสองภายใต้สมมติฐานว่างโดยเฉพาะอย่างยิ่งการทดสอบไคกำลังสองของเพียร์สันและรูปแบบต่างๆ ของการทดสอบดังกล่าว การทดสอบไคกำลังสองของเพียร์สันใช้เพื่อตรวจสอบว่ามี ความแตกต่าง ทางสถิติอย่างมีนัยสำคัญระหว่างความถี่ ที่คาดหวัง และความถี่ที่สังเกตได้ในหนึ่งหรือหลายหมวดหมู่ของตารางความสัมพันธ์หรือไม่ สำหรับตารางความสัมพันธ์ที่มีขนาดตัวอย่างเล็กกว่า จะใช้ การทดสอบความแม่นยำของฟิชเชอร์แทน

ในการประยุกต์ใช้การทดสอบนี้แบบมาตรฐาน ข้อมูลที่สังเกตได้จะถูกจัดกลุ่มเป็นกลุ่มที่ไม่ทับซ้อนกัน หากสมมติฐานหลักที่ว่าไม่มีความแตกต่างระหว่างกลุ่มในประชากรนั้นเป็นจริง ค่าสถิติการทดสอบที่คำนวณจากข้อมูลที่สังเกตได้จะมีการกระจายความถี่แบบ χ² จุดประสงค์ของการทดสอบคือการประเมินว่าความถี่ที่สังเกตได้จะมีโอกาสมากน้อยเพียงใดหากสมมติว่าสมมติฐานหลักเป็นจริง

สถิติการทดสอบที่สอดคล้องกับ การแจกแจงแบบไค กำลังสอง (χ² ) เกิดขึ้นเมื่อการสังเกตการณ์เป็นอิสระต่อกัน นอกจากนี้ยังมี การทดสอบไคกำลัง สอง (χ² ) สำหรับการทดสอบสมมติฐานว่างของการเป็นอิสระต่อกันของตัวแปรสุ่มสองตัวโดยอาศัยการสังเกตการณ์ของคู่ตัวแปรเหล่านั้น

การทดสอบไคสแควร์มักหมายถึงการทดสอบที่การกระจายของค่าสถิติการทดสอบเข้าใกล้การกระจาย ไค ส แควร์ในเชิง อะซิปโทติกซึ่งหมายความว่าการกระจายตัวอย่าง (หากสมมติฐานว่างเป็นจริง) ของค่าสถิติการทดสอบจะใกล้เคียงกับการกระจายไคสแควร์มากขึ้นเรื่อยๆ เมื่อขนาด ตัวอย่าง เพิ่มขึ้น

ประวัติศาสตร์

ในศตวรรษที่ 19 วิธีการวิเคราะห์ทางสถิติส่วนใหญ่ถูกนำมาใช้ในการวิเคราะห์ข้อมูลทางชีววิทยา และเป็นเรื่องปกติที่นักวิจัยจะถือว่าการสังเกตเป็นไปตามการกระจายแบบปกติเช่นเซอร์ จอร์จ แอร์รีและแมนส์ฟิลด์ เมอร์ริแมนซึ่งผลงานของพวกเขาถูกวิจารณ์โดยคาร์ล เพียร์สันในบทความปี 1900 ของเขา[ 2 ]

ในช่วงปลายศตวรรษที่ 19 เพียร์สันสังเกตเห็นความเบี่ยงเบน อย่างมีนัยสำคัญ ในการสังเกตทางชีววิทยาบางอย่าง เพื่อสร้างแบบจำลองการสังเกตโดยไม่คำนึงถึงว่าจะเป็นปกติหรือเบี่ยงเบน เพียร์สันได้คิดค้นการแจกแจงเพียร์สัน ซึ่งเป็นตระกูลของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง ซึ่งรวมถึงการแจกแจงปกติและการแจกแจงเบี่ยงเบนหลายแบบ ในบทความหลายชุดที่ตีพิมพ์ตั้งแต่ปี 1893 ถึง 1916 [ 3 ] [ 4 ] [ 5 ] [ 6 ] และเสนอวิธีการวิเคราะห์ทางสถิติที่ประกอบด้วยการใช้การแจกแจงเพียร์สันเพื่อสร้างแบบจำลองการสังเกตและทำการทดสอบความเหมาะสมเพื่อพิจารณาว่าแบบจำลองนั้นเหมาะสมกับการสังเกตได้ดีเพียงใด

การทดสอบไคสแควร์ของเพียร์สัน

ใน ปีพ.ศ. 2443 เพียร์สันได้ตีพิมพ์บทความ[ 2 ]เกี่ยวกับ การทดสอบ χ²ซึ่งถือเป็นหนึ่งในรากฐานของสถิติสมัยใหม่[ 7 ]ในบทความนี้ เพียร์สันได้ตรวจสอบการทดสอบความเหมาะสมของแบบจำลอง

สมมติว่า การสังเกต n ครั้งในตัวอย่างสุ่มจากประชากรถูกจัดกลุ่มเป็นkกลุ่มที่ไม่ซ้ำซ้อนกัน โดยมีจำนวนการสังเกตx i ตามลำดับ (สำหรับi = 1, 2, …, k ) และสมมติฐานว่างให้ความน่าจะ เป็น p iที่การสังเกตจะตกอยู่ใน กลุ่มที่ iดังนั้นเราจึงมีจำนวนที่คาดหวังm i = np iสำหรับทุกiโดยที่

เพียร์สันเสนอว่า ภายใต้สถานการณ์ที่สมมติฐานว่างถูกต้อง เมื่อn → ∞การแจกแจงจำกัดของปริมาณที่กำหนดด้านล่างคือการแจกแจง χ²

เพียร์สันได้พิจารณากรณีแรกที่ค่าคาดหวังm iมีขนาดใหญ่พอและเป็นจำนวนที่ทราบในทุกเซลล์ โดยสมมติว่าการสังเกตx i ทุกครั้ง สามารถถือได้ว่ามีการแจกแจงแบบปกติและได้ผลลัพธ์ว่า ในกรณีที่nมีขนาดใหญ่ขึ้นX 2จะเป็นไปตาม การแจกแจง χ 2ที่มีองศาอิสระ k − 1

อย่างไรก็ตาม เพียร์สันได้พิจารณากรณีต่อไปที่จำนวนที่คาดหวังขึ้นอยู่กับพารามิเตอร์ที่ต้องประมาณจากตัวอย่าง และเสนอแนะว่า โดยใช้สัญลักษณ์m iเป็นจำนวนที่คาดหวังที่แท้จริง และmiเป็นจำนวนที่คาดหวังที่ประมาณได้ ความแตกต่าง

โดยทั่วไปแล้วจะเป็นค่าบวกและมีขนาดเล็กพอที่จะละเว้นได้ ในบทสรุป เพียร์สันโต้แย้งว่าหากเราถือว่าX2 มีการแจกแจงแบบ χ 2เช่นกันโดยมี องศาอิสระ k − 1ข้อผิดพลาดในการประมาณค่านี้จะไม่ส่งผลกระทบต่อการตัดสินใจในทางปฏิบัติ ข้อสรุปนี้ก่อให้เกิดข้อโต้แย้งบางประการในการใช้งานจริง และยังไม่ได้รับการแก้ไขเป็นเวลา 20 ปี จนกระทั่งเอกสารของฟิชเชอร์ในปี 1922 และ 1924 [ 8 ] [ 9 ]

ตัวอย่างอื่นๆ ของการทดสอบไคสแควร์

สถิติการทดสอบหนึ่งที่สอดคล้องกับการแจกแจงไคกำลังสองอย่างแม่นยำคือ การทดสอบว่าความแปรปรวนของประชากรที่มีการแจกแจงแบบปกติมีค่าตามที่กำหนดโดยอิงจากความแปรปรวนของตัวอย่างการทดสอบดังกล่าวไม่ค่อยพบเห็นในทางปฏิบัติ เนื่องจากโดยปกติแล้วความแปรปรวนที่แท้จริงของประชากรนั้นไม่เป็นที่ทราบ อย่างไรก็ตาม มีการทดสอบทางสถิติหลายอย่างที่การแจกแจงไคกำลังสองมีความถูกต้องโดยประมาณ:

การทดสอบที่แม่นยำของฟิชเชอร์

สำหรับการทดสอบที่แม่นยำซึ่งใช้แทนการทดสอบไคกำลังสอง 2 × 2 สำหรับความเป็นอิสระเมื่อผลรวมของแถวและคอลัมน์ทั้งหมดถูกกำหนดไว้โดยการออกแบบ โปรดดูการทดสอบที่แม่นยำของ Fisher เมื่อขอบของแถวหรือคอลัมน์ (หรือทั้งสองอย่าง) เป็นตัวแปรสุ่ม (เช่นเดียวกับการออกแบบการวิจัยทั่วไปส่วนใหญ่) วิธีนี้มักจะอนุรักษ์ นิยมมากเกินไปและมีกำลังการทดสอบต่ำ[ 10 ]

การทดสอบทวินาม

สำหรับการทดสอบที่แม่นยำซึ่งใช้แทนการทดสอบไคกำลังสอง 2 × 1 สำหรับความเหมาะสมของแบบจำลอง โปรดดูที่ การทดสอบ ทวิ นาม

การทดสอบไคสแควร์อื่นๆ

การแก้ไขความต่อเนื่องของเยตส์

การใช้การแจกแจงไคกำลังสองในการตีความสถิติไคกำลังสองของเพียร์สันจำเป็นต้องสมมติว่าความ น่าจะเป็นแบบ ไม่ต่อเนื่องของความถี่ทวินาม ที่สังเกตได้ ในตารางสามารถประมาณได้ด้วยการแจกแจงไคกำลังสองแบบ ต่อเนื่อง ซึ่ง สมมติฐานนี้ไม่ถูกต้องนักและทำให้เกิดข้อผิดพลาดบางประการ

เพื่อลดข้อผิดพลาดในการประมาณค่าแฟรงค์ เยตส์เสนอการแก้ไขความต่อเนื่องที่ปรับสูตรสำหรับการทดสอบไคกำลังสองของเพียร์สันโดยการลบ 0.5 ออกจากความแตกต่างสัมบูรณ์ระหว่างค่าที่สังเกตได้แต่ละค่ากับค่าที่คาดหวังในตารางความสัมพันธ์2 × 2 [ 11 ]ซึ่งจะลดค่าไคกำลังสองที่ได้รับและทำให้ค่าp เพิ่ม ขึ้น

การทดสอบไคสแควร์สำหรับความแปรปรวนในประชากรปกติ

หากสุ่มตัวอย่างขนาดnจากประชากรที่มีการแจกแจงแบบปกติจะได้ผลลัพธ์ (ดูการแจกแจงของความแปรปรวนของตัวอย่าง ) ซึ่งช่วยให้สามารถทดสอบได้ว่าความแปรปรวนของประชากรมีค่าที่กำหนดไว้ล่วงหน้าหรือไม่ ตัวอย่างเช่น กระบวนการผลิตอาจอยู่ในสภาวะคงที่มาเป็นเวลานาน ทำให้สามารถกำหนดค่าความแปรปรวนได้โดยแทบไม่มีข้อผิดพลาด สมมติว่ากำลังทดสอบตัวแปรของกระบวนการ ทำให้ได้ตัวอย่างขนาดเล็กจำนวนnรายการผลิตภัณฑ์ ซึ่งต้องการทดสอบความแปรผัน สถิติการทดสอบTในกรณีนี้สามารถกำหนดให้เป็นผลรวมของกำลังสองรอบค่าเฉลี่ยของตัวอย่าง หารด้วยค่าที่กำหนดสำหรับความแปรปรวน (เช่น ค่าที่จะทดสอบว่าคงที่) จากนั้นT จะ มีการแจกแจงแบบไคกำลังสองที่มีองศาอิสระn − 1 ตัวอย่างเช่น หากขนาดตัวอย่างคือ 21 บริเวณการยอมรับสำหรับTที่ระดับนัยสำคัญ 5% จะอยู่ระหว่าง 9.59 และ 34.17

ตัวอย่างการทดสอบไคสแควร์สำหรับข้อมูลเชิงหมวดหมู่

สมมติว่ามีเมืองหนึ่งที่มีประชากร 1,000,000 คน แบ่งออกเป็นสี่เขตย่อย ได้แก่A , B , CและDมีการสุ่มตัวอย่างประชากร 650 คนจากเมืองนี้ และบันทึกอาชีพของพวกเขาเป็น"พนักงานออฟฟิศ" "พนักงานโรงงาน" หรือ "ไม่มีอาชีพ"สมมติฐานหลักคือ เขตที่อยู่อาศัยของแต่ละบุคคลไม่ขึ้นอยู่กับการจำแนกประเภทอาชีพของบุคคลนั้น ข้อมูลถูกจัดทำเป็นตารางดังนี้:

เอบีซีดีทั้งหมด
พนักงานออฟฟิศ906010495349
คนงานระดับล่าง30505120151
ไม่มีปลอกคอ30404535150
ทั้งหมด150150200150650

ลองใช้กลุ่มตัวอย่างที่อาศัยอยู่ในย่านAจำนวน 150 คน เพื่อประมาณสัดส่วนของประชากรทั้งหมด 1,000,000 คนที่อาศัยอยู่ในย่านAในทำนองเดียวกัน เราใช้349/650เพื่อประเมินว่าสัดส่วนของพนักงานออฟฟิศในจำนวน 1,000,000 คนนั้นเป็น เท่าใดโดยอาศัยสมมติฐานเรื่องความเป็นอิสระ ภายใต้สมมติฐานที่ว่าเราควร "คาดหวัง" ว่าจำนวนพนักงานออฟฟิศในย่านAจะเป็นเท่าใด

จากนั้นใน "ช่อง" นั้นของตาราง เราจะมี

ผลรวมของปริมาณเหล่านี้ในทุกเซลล์คือค่าสถิติการทดสอบ ในกรณีนี้คือ ภายใต้สมมติฐานว่าง ผลรวมนี้จะมีลักษณะการแจกแจงแบบไคกำลังสองโดยประมาณ ซึ่งมีจำนวนองศาอิสระเท่ากับ

ถ้าค่าสถิติการทดสอบมีขนาดใหญ่ผิดปกติเมื่อพิจารณาจากค่าไคกำลังสองแล้ว แสดงว่าเราต้องปฏิเสธสมมติฐานหลักเรื่องความเป็นอิสระ

ประเด็นที่เกี่ยวข้องอีกประการหนึ่งคือการทดสอบความสม่ำเสมอ สมมติว่าแทนที่จะให้โอกาสผู้อยู่อาศัยทุกคนในแต่ละย่านทั้งสี่แห่งมีโอกาสถูกเลือกเป็นตัวอย่างเท่ากัน เราตัดสินใจล่วงหน้าว่าจะเลือกผู้อยู่อาศัยในแต่ละย่านจำนวนเท่าใด ในกรณีนี้ ผู้อยู่อาศัยแต่ละคนจะมีโอกาสถูกเลือกเท่ากันกับผู้อยู่อาศัยทั้งหมดในย่านเดียวกัน แต่ผู้อยู่อาศัยในย่านที่แตกต่างกันจะมีโอกาสถูกเลือกแตกต่างกัน หากขนาดตัวอย่างทั้งสี่ไม่เป็นสัดส่วนกับจำนวนประชากรของย่านทั้งสี่ ในกรณีเช่นนี้ เราจะทดสอบ "ความสม่ำเสมอ" มากกว่า "ความเป็นอิสระ" คำถามคือสัดส่วนของแรงงานระดับล่าง แรงงานระดับบน และแรงงานนอกระบบในสี่ย่านนั้นเท่ากันหรือไม่ อย่างไรก็ตาม การทดสอบจะทำในลักษณะเดียวกัน

แอปพลิเคชัน

ในการวิเคราะห์การเข้ารหัสการทดสอบไคสแควร์ใช้เพื่อเปรียบเทียบการกระจายของข้อความธรรมดาและข้อความ เข้ารหัสที่ถอดรหัสได้ (หรืออาจจะถอดรหัสได้) ค่าต่ำสุดของการทดสอบหมายความว่าการถอดรหัสสำเร็จด้วยความน่าจะเป็นสูง[ 12 ] [ 13 ]วิธีนี้สามารถนำไปใช้ทั่วไปในการแก้ปัญหาการเข้ารหัสสมัยใหม่ได้[ 14 ]

ในชีวสารสนเทศการทดสอบไคสแควร์ใช้เพื่อเปรียบเทียบการกระจายของคุณสมบัติบางอย่างของยีน (เช่น เนื้อหาจีโนม อัตราการกลายพันธุ์ การจัดกลุ่มเครือข่ายปฏิสัมพันธ์ ฯลฯ) ที่อยู่ในหมวดหมู่ที่แตกต่างกัน (เช่น ยีนโรค ยีนที่จำเป็น ยีนบนโครโมโซมบางตัว ฯลฯ) [ 15 ] [ 16 ]

ข้อจำกัด

การทดสอบไคสแควร์ แม้ว่าจะใช้กันอย่างแพร่หลายในการวิเคราะห์ข้อมูลเชิงหมวดหมู่ แต่ก็มีข้อจำกัดที่สำคัญหลายประการที่นักวิจัยควรพิจารณา ประการแรก การทดสอบนี้ถือว่าการสังเกตการณ์เป็นอิสระต่อกัน การละเมิดข้อสมมตินี้อาจนำไปสู่ผลลัพธ์ที่ผิดพลาดได้ ประการที่สอง การทดสอบมีความไวต่อขนาดของกลุ่มตัวอย่าง ในกลุ่มตัวอย่างขนาดใหญ่มาก แม้แต่ความแตกต่างเล็กน้อยระหว่างความถี่ที่สังเกตได้และความถี่ที่คาดหวังก็อาจทำให้เกิดผลลัพธ์ที่มีนัยสำคัญทางสถิติ ในขณะที่ในกลุ่มตัวอย่างขนาดเล็กมาก การทดสอบอาจไม่มีประสิทธิภาพเพียงพอที่จะตรวจจับความสัมพันธ์ที่มีความหมาย ประการที่สาม การทดสอบไคสแควร์ไม่ได้วัดความแข็งแกร่งหรือความสำคัญในทางปฏิบัติของความสัมพันธ์—มันเพียงแต่บ่งชี้ว่ามีความสัมพันธ์ที่มีนัยสำคัญอยู่หรือไม่ ควรมีการรายงานมาตรวัดขนาดผลกระทบ เช่นCramér's Vหรือสัมประสิทธิ์ความสัมพันธ์ควบคู่ไปกับสถิติการทดสอบเพื่อให้บริบท สุดท้าย การทดสอบอาจไม่แม่นยำเมื่อความถี่ที่คาดหวังในเซลล์ใด ๆ มีขนาดเล็กมาก ซึ่งมักแนะนำให้มีอย่างน้อย 5 ในกรณีเช่นนี้ ควรเลือกใช้การทดสอบที่แม่นยำหรือวิธีการอื่น ๆ นักวิจัยต้องระมัดระวังเมื่อต้องจัดการกับหมวดหมู่ที่มีการกระจายไม่สม่ำเสมอ เนื่องจากกลุ่มที่เด่นกว่าอาจบดบังรูปแบบในกลุ่มที่เล็กกว่าได้[ 17 ] [ 18 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • ไวส์สไตน์, เอริค ดับเบิลยู. "การทดสอบไคสแควร์" . MathWorld .
  • Corder, GW; Foreman, DI (2014). สถิติแบบไม่ใช้พารามิเตอร์: วิธีการทีละขั้นตอน . นิวยอร์ก: Wiley. ISBN 978-1118840313.
  • กรีนวูด, ซินดี้ ; นิกูลิน, เอ็มเอส (1996). คู่มือการทดสอบไคสแควร์ . นิวยอร์ก: ไวลีย์. ISBN 0-471-55779-X.
  • Nikulin, MS (1973). การทดสอบไคสแควร์สำหรับภาวะปกติ . รายงานการประชุมนานาชาติวิลนีอุสว่าด้วยทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ . เล่ม 2. หน้า  119–122 .
  • Bagdonavicius, Vilijandas B.; Nikulin, Mikhail S. (2011). " การทดสอบความเหมาะสมของไคกำลังสองสำหรับข้อมูลที่ถูกตัดตอนทางขวา"วารสารคณิตศาสตร์ประยุกต์และสถิติระหว่างประเทศ24 : 30– 50. MR  2800388
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Chi-squared_test&oldid=1360616052 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การทดสอบไคสแควร์

การ ทดสอบไคสแควร์ (หรือ การ ทดสอบ ไคสแควร์ หรือ χ² ) เป็นการ ทดสอบสมมติฐานทางสถิติ ที่ใช้ในการวิเคราะห์ ตารางความสัมพันธ์ เมื่อ ขนาดตัวอย่าง มีขนาดใหญ่ กล่าวโดยง่าย...

ประวัติศาสตร์

ในศตวรรษที่ 19 วิธีการวิเคราะห์ทางสถิติส่วนใหญ่ถูกนำมาใช้ในการวิเคราะห์ข้อมูลทางชีววิทยา และเป็นเรื่องปกติที่นักวิจัยจะถือว่าการสังเกตเป็นไปตาม การกระจายแบบปกติ เช่น เซอร์ จอร์จ แอร์รี และ แมนส์ฟิลด์ เมอร์ริแมน ซึ่งผลงานของพวกเขาถูกวิจารณ์โดย คาร์ล เพียร์สัน...

การทดสอบไคสแควร์ของเพียร์สัน

ใน ปี พ.ศ. 2443 เพียร์สันได้ตีพิมพ์บทความ [ 2 ] เกี่ยวกับ การทดสอบ χ² ซึ่งถือเป็นหนึ่งในรากฐานของสถิติสมัยใหม่ [ 7 ] ในบทความนี้ เพียร์สันได้ตรวจสอบการทดสอบความเหมาะสมของแบบจำลอง

ตัวอย่างอื่นๆ ของการทดสอบไคสแควร์

สถิติการทดสอบ หนึ่งที่สอดคล้องกับ การแจกแจงไคกำลังสอง อย่างแม่นยำคือ การทดสอบว่าความแปรปรวนของประชากรที่มีการแจกแจงแบบปกติมีค่าตามที่กำหนดโดยอิงจาก ความแปรปรวนของตัวอย่าง การทดสอบดังกล่าวไม่ค่อยพบเห็นในทางปฏิบัติ...