อ่าน 5 นาที
การทดสอบZ
การทดสอบZคือการทดสอบทางสถิติ ใดๆ ที่การแจกแจงของค่าสถิติการทดสอบภายใต้สมมติฐานว่างสามารถประมาณได้ด้วยการแจกแจงปกติ การทดสอบ Zทดสอบค่าเฉลี่ยของการแจกแจง...
การทดสอบZ

การทดสอบZคือการทดสอบทางสถิติ ใดๆ ที่การแจกแจงของค่าสถิติการทดสอบภายใต้สมมติฐานว่างสามารถประมาณได้ด้วยการแจกแจงปกติ การทดสอบ Zทดสอบค่าเฉลี่ยของการแจกแจง สำหรับแต่ละระดับนัยสำคัญในช่วงความเชื่อมั่น การ ทดสอบ Zจะมีค่าวิกฤตเพียงค่าเดียว (ตัวอย่างเช่น 1.96 สำหรับ 5% แบบสองด้าน) ซึ่งทำให้สะดวกกว่าการทดสอบtของนักเรียนซึ่งค่าวิกฤตถูกกำหนดโดยขนาดตัวอย่าง (ผ่านระดับความเป็นอิสระ ที่สอดคล้องกัน ) ทั้ง การทดสอบ Zและ การทดสอบ t ของนักเรียน มีความคล้ายคลึงกันตรงที่ทั้งสองช่วยในการกำหนดนัยสำคัญของชุดข้อมูล อย่างไรก็ตาม การ ทดสอบ Zจำเป็นต้องทราบค่าเบี่ยงเบนของประชากร ซึ่งบางครั้งยากที่จะกำหนด ทำให้การ ทดสอบ tสะดวกกว่า
ความสามารถในการใช้งาน
เนื่องจากทฤษฎีบทขีดจำกัดกลางสถิติการทดสอบจำนวนมากจึงมีการแจกแจงแบบปกติโดยประมาณสำหรับตัวอย่างขนาดใหญ่ ดังนั้น การทดสอบทางสถิติหลายอย่างจึงสามารถทำได้อย่างสะดวกโดยใช้ การทดสอบ Z โดยประมาณ หากขนาดตัวอย่างมีขนาดใหญ่หรือทราบค่าความแปรปรวนของประชากร หากไม่ทราบค่าความแปรปรวนของประชากร (และจึงต้องประมาณจากตัวอย่างเอง) และขนาดตัวอย่างไม่ใหญ่ ( n < 30) การทดสอบ tของนักเรียนอาจเหมาะสมกว่า (ในบางกรณีn < 50 ดังที่อธิบายไว้ด้านล่าง)
ขั้นตอน
ขั้นตอนในการทำการ ทดสอบ Zกับสถิติที่มีการกระจายแบบปกติโดยประมาณภายใต้สมมติฐานว่าง มีดังนี้:
- ประมาณค่าที่คาดหวัง μ ของภายใต้สมมติฐานว่าง และประมาณค่าsของส่วนเบี่ยงเบนมาตรฐานของ
- จงระบุคุณสมบัติของการทดสอบ: การทดสอบแบบหางเดียว หรือ การทดสอบแบบสองหาง
- สำหรับสมมติฐานว่างH 0 : μ ≥ μ 0เทียบกับสมมติฐานทางเลือกH 1 : μ < μ 0จะเป็นการทดสอบแบบหางล่าง/หางซ้าย (แบบหางเดียว)
- สำหรับสมมติฐานว่างH 0 : μ ≤ μ 0เทียบกับสมมติฐานทางเลือกH 1 : μ > μ 0นั้นเป็นการทดสอบแบบหางบน/หางขวา (แบบหางเดียว)
- สำหรับสมมติฐานว่างH 0 : μ = μ 0เทียบกับสมมติฐานทางเลือกH 1 : μ ≠ μ 0นั้นเป็นการทดสอบแบบสองด้าน
- คำนวณคะแนนมาตรฐาน :
ค่าpแบบหางเดียวและสองหางสามารถคำนวณได้ดังนี้(สำหรับการทดสอบแบบหางล่าง/ซ้าย), (สำหรับการทดสอบแบบหางบน/ขวา) และ(สำหรับการทดสอบแบบสองหาง) โดยที่คือฟังก์ชันการกระจายสะสมปกติมาตรฐาน
ใช้ในการทดสอบสถานที่
- คำว่า " การทดสอบ Z " มักใช้เพื่ออ้างถึงการทดสอบตำแหน่งตัวอย่างเดียว โดยเฉพาะ ซึ่งเปรียบเทียบค่าเฉลี่ยของชุดการวัดกับค่าคงที่ที่กำหนด เมื่อทราบค่าความแปรปรวนของตัวอย่างแล้ว ตัวอย่างเช่น ถ้าข้อมูลที่สังเกตได้X 1 , ..., X n (i) เป็นอิสระต่อกัน (ii) มีค่าเฉลี่ยร่วมกัน μ และ (iii) มีความแปรปรวนร่วมกัน σ 2แล้ว ค่าเฉลี่ยของตัวอย่างXจะมีค่าเฉลี่ย μ และความแปรปรวน σ 2
- สมมติฐานว่างคือค่าเฉลี่ยของ X คือค่า μ₀ ที่กำหนดเราสามารถใช้X เป็นสถิติทดสอบได้ โดยจะปฏิเสธสมมติฐานว่างหากX − μ₀ มีค่ามาก
- ในการคำนวณค่าสถิติมาตรฐานเราจำเป็นต้องทราบหรือมีค่าโดยประมาณของ σ² จากนั้นจึงสามารถคำนวณค่าได้ในบางกรณี ค่า σ² อาจเป็นที่ทราบ แต่กรณีนี้พบได้ไม่บ่อยนัก
- หากขนาดตัวอย่างมีขนาดปานกลางหรือใหญ่ เราสามารถใช้ค่าความแปรปรวนของตัวอย่าง แทน ค่า σ² ได้ ซึ่งจะได้ การทดสอบ แบบแทนค่า (plug-in test) การทดสอบที่ได้จะไม่ใช่ การทดสอบ Z ที่แม่นยำ เนื่องจากไม่ได้คำนึงถึงความไม่แน่นอนในค่าความแปรปรวนของตัวอย่าง แต่จะเป็นการประมาณค่าที่ดี เว้นแต่ว่าขนาดตัวอย่างจะมีขนาดเล็ก
- การทดสอบtสามารถใช้เพื่อพิจารณาความไม่แน่นอนในความแปรปรวนของตัวอย่างเมื่อข้อมูลมีการกระจายแบบปกติ อย่าง สมบูรณ์
- ความแตกต่างระหว่าง การทดสอบ Zและ การทดสอบ t : การทดสอบ Zใช้เมื่อขนาดตัวอย่างมีขนาดใหญ่ ( n > 50) หรือทราบค่าความแปรปรวนของประชากร การทดสอบ tใช้เมื่อขนาดตัวอย่างมีขนาดเล็ก ( n < 50) และไม่ทราบค่าความแปรปรวนของประชากร
- ไม่มีค่าคงที่สากลใดที่กำหนดว่าขนาดตัวอย่างเท่าใดจึงจะถือว่าใหญ่พอที่จะใช้การทดสอบแบบปลั๊กอินได้ โดยทั่วไปแล้ว หลักเกณฑ์คร่าวๆ คือ ขนาดตัวอย่างควรมีจำนวนข้อมูลอย่างน้อย 50 รายการขึ้นไป
- สำหรับขนาดตัวอย่างขนาดใหญ่ ขั้นตอนการทดสอบ t จะให้ ค่าpที่เกือบจะ เหมือนกับ ขั้นตอนการทดสอบZ
- การทดสอบตำแหน่งอื่นๆ ที่สามารถดำเนินการได้โดยใช้ การทดสอบ Zได้แก่ การทดสอบตำแหน่งสองกลุ่มตัวอย่าง และ การทดสอบความแตกต่างแบบ จับคู่
เงื่อนไข
การ ทดสอบ Zจะสามารถใช้งานได้ ต้องเป็นไปตามเงื่อนไขบางประการ
- พารามิเตอร์ที่ไม่เกี่ยวข้องควรทราบหรือประมาณค่าได้อย่างแม่นยำสูง (ตัวอย่างของพารามิเตอร์ที่ไม่เกี่ยวข้องคือค่าเบี่ยงเบนมาตรฐานในการทดสอบตำแหน่งตัวอย่างเดียว) การทดสอบ Zมุ่งเน้นไปที่พารามิเตอร์เพียงตัวเดียว และถือว่าพารามิเตอร์ที่ไม่ทราบค่าอื่นๆ ทั้งหมดมีค่าคงที่ตามค่าจริง ในทางปฏิบัติ เนื่องจากทฤษฎีบทของ Slutsky การ "แทนค่า" ค่าประมาณ ที่สอดคล้องกันของพารามิเตอร์ที่ไม่เกี่ยวข้องจึงสามารถทำได้ อย่างไรก็ตาม หากขนาดตัวอย่างไม่ใหญ่พอที่จะทำให้ค่าประมาณเหล่านี้มีความแม่นยำอย่างเหมาะสม การทดสอบ Zอาจทำงานได้ไม่ดี
- ค่าสถิติการทดสอบควรมีการแจกแจงแบบปกติโดยทั่วไปแล้ว จะใช้ทฤษฎีบทขีดจำกัดกลางมาสนับสนุนสมมติฐานที่ว่าค่าสถิติการทดสอบมีการแจกแจงแบบปกติ มีงานวิจัยทางสถิติมากมายเกี่ยวกับคำถามที่ว่าเมื่อใดค่าสถิติการทดสอบจึงจะแจกแจงแบบปกติโดยประมาณ หากการแจกแจงของค่าสถิติการทดสอบไม่เป็นไปตามการแจกแจงแบบปกติอย่างชัดเจนไม่ควรใช้การทดสอบZ
หากมีการแทนค่าประมาณของพารามิเตอร์รบกวนตามที่กล่าวไว้ข้างต้น สิ่งสำคัญคือต้องใช้ค่าประมาณที่เหมาะสมกับวิธีการสุ่มตัวอย่าง ข้อมูล ในกรณีพิเศษของ การทดสอบ Zสำหรับปัญหาตำแหน่งตัวอย่างหนึ่งหรือสองตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของตัวอย่างตามปกติจะเหมาะสมก็ต่อเมื่อข้อมูลถูกเก็บรวบรวมเป็นตัวอย่างอิสระเท่านั้น
ในบางสถานการณ์ เป็นไปได้ที่จะคิดค้นการทดสอบที่คำนึงถึงความแปรปรวนในการประมาณค่าพารามิเตอร์รบกวนแบบปลั๊กอินได้อย่างเหมาะสม ในกรณีของปัญหาการหาตำแหน่งตัวอย่างหนึ่งและสองตัวอย่างการทดสอบtสามารถทำเช่นนั้นได้
ตัวอย่าง
สมมติว่าในภูมิภาคทางภูมิศาสตร์แห่งหนึ่ง ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของคะแนนสอบการอ่านคือ 100 คะแนน และ 12 คะแนน ตามลำดับ เราสนใจคะแนนของนักเรียน 55 คนในโรงเรียนแห่งหนึ่ง ซึ่งได้คะแนนเฉลี่ย 96 คะแนน เราอาจถามว่าคะแนนเฉลี่ยนี้ต่ำกว่าค่าเฉลี่ยของภูมิภาคอย่างมีนัยสำคัญหรือไม่ กล่าวคือ นักเรียนในโรงเรียนนี้เทียบเคียงได้กับกลุ่มตัวอย่างแบบสุ่มอย่างง่ายของนักเรียน 55 คนจากภูมิภาคโดยรวมหรือไม่ หรือคะแนนของพวกเขานั้นต่ำกว่าที่คาดการณ์ไว้
ขั้นแรกให้คำนวณค่าความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย:
ค่าเบี่ยงเบนมาตรฐานของประชากรอยู่ ที่ไหน
ขั้นตอนต่อไปคือการคำนวณค่าz -scoreซึ่งเป็นระยะห่างจากค่าเฉลี่ยของกลุ่มตัวอย่างไปยังค่าเฉลี่ยของประชากร โดยมีหน่วยเป็นค่าความคลาดเคลื่อนมาตรฐาน:
ในตัวอย่างนี้ เราถือว่าค่าเฉลี่ยและความแปรปรวนของประชากรเป็นที่ทราบแล้ว ซึ่งจะเหมาะสมหากมีการทดสอบนักเรียนทุกคนในภูมิภาคนั้น แต่หากไม่ทราบค่าพารามิเตอร์ของประชากรควรใช้การ ทดสอบtของนักเรียน แทน
คะแนนเฉลี่ยของห้องเรียนคือ 96 ซึ่งห่างจากค่าเฉลี่ยของประชากรที่ 100 อยู่ −2.47 หน่วยความคลาดเคลื่อนมาตรฐาน เมื่อดูค่าz -score ในตารางความน่าจะเป็นสะสมของการแจกแจงปกติ มาตรฐาน เราพบว่าความน่าจะเป็นที่จะสังเกตเห็นค่าปกติมาตรฐานที่ต่ำกว่า −2.47 นั้นประมาณ 0.5 − 0.4932 = 0.0068 นี่คือค่าp -value ด้านเดียว สำหรับสมมติฐานว่างที่ว่านักเรียน 55 คนนั้นเทียบเคียงได้กับตัวอย่างสุ่มอย่างง่ายจากประชากรของผู้เข้าสอบทั้งหมด ค่า p -value สองด้าน นั้นประมาณ 0.014 (สองเท่าของค่า p -value ด้านเดียว)
อีกวิธีหนึ่งในการกล่าวถึงเรื่องนี้คือ ด้วยความน่าจะเป็น 1 − 0.014 = 0.986 ตัวอย่างสุ่มอย่างง่ายของนักเรียน 55 คน จะมีคะแนนสอบเฉลี่ยอยู่ภายใน 4 หน่วยจากค่าเฉลี่ยของประชากร เราอาจกล่าวได้ว่าด้วยความมั่นใจ 98.6% เราปฏิเสธสมมติฐานว่างที่ว่าผู้เข้าสอบ 55 คนนั้นเทียบเคียงได้กับตัวอย่างสุ่มอย่างง่ายจากประชากรผู้เข้าสอบ
การ ทดสอบ Zบอกเราว่านักเรียน 55 คนที่เราสนใจมีคะแนนสอบเฉลี่ยต่ำผิดปกติเมื่อเทียบกับกลุ่มตัวอย่างแบบสุ่มอย่างง่ายที่มีขนาดใกล้เคียงกันจากประชากรผู้เข้าสอบส่วนใหญ่ ข้อบกพร่องของการวิเคราะห์นี้คือไม่ได้พิจารณาว่าขนาดผลกระทบ 4 คะแนนนั้นมีความหมายหรือไม่ หากเราพิจารณาพื้นที่ย่อยที่มีนักเรียน 900 คนซึ่งมีคะแนนเฉลี่ย 99 แทนที่จะเป็นห้องเรียน เรา จะสังเกตเห็นค่า Zและ ค่า p ที่เกือบจะเหมือนกัน ซึ่งแสดงให้เห็นว่าหากขนาดของกลุ่มตัวอย่างใหญ่พอ ความแตกต่างเล็กน้อยมากจากค่าว่างอาจมีความสำคัญทางสถิติอย่างมาก ดูการทดสอบสมมติฐานทางสถิติสำหรับการอภิปรายเพิ่มเติมเกี่ยวกับประเด็นนี้
การเกิดขึ้นและการประยุกต์ใช้
สำหรับการประมาณค่าพารามิเตอร์ด้วยวิธีความน่าจะเป็นสูงสุด
การทดสอบตำแหน่งเป็นการ ทดสอบ Z ที่คุ้นเคยมากที่สุด การทดสอบ Zอีกประเภทหนึ่งเกิดขึ้นใน การประมาณค่า ความน่าจะเป็นสูงสุดของพารามิเตอร์ในแบบจำลองทางสถิติแบบพาราเมตริก การประมาณค่าความน่าจะเป็นสูงสุดจะมีลักษณะใกล้เคียงกับการแจกแจงปกติภายใต้เงื่อนไขบางประการ และความแปรปรวนเชิงอะซิมโทติกสามารถคำนวณได้ในรูปของข้อมูลฟิชเชอร์ การประมาณค่าความน่าจะเป็นสูงสุดหารด้วยค่าความคลาดเคลื่อนมาตรฐานสามารถใช้เป็นสถิติการทดสอบสำหรับสมมติฐานว่างที่ว่าค่าประชากรของพารามิเตอร์เท่ากับศูนย์ โดยทั่วไปแล้ว ถ้าคือการประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์ θ และ θ₀ คือค่าของ θ ภายใต้สมมติฐานว่าง
สามารถใช้เป็นสถิติการทดสอบ Z ได้
เมื่อใช้ การทดสอบ Zสำหรับการประมาณค่าความน่าจะเป็นสูงสุด สิ่งสำคัญคือต้องตระหนักว่าการประมาณค่าแบบปกติอาจไม่แม่นยำหากขนาดตัวอย่างไม่ใหญ่พอ แม้ว่าจะไม่มีกฎง่ายๆ ที่เป็นสากลระบุว่าขนาดตัวอย่างต้องมีขนาดใหญ่เท่าใดจึงจะใช้การทดสอบZ ได้ แต่ การจำลองสามารถให้แนวคิดที่ดีว่า การทดสอบ Zเหมาะสมในสถานการณ์ ใด
การทดสอบ Zถูกนำมาใช้เมื่อใดก็ตามที่สามารถสรุปได้ว่าค่าสถิติการทดสอบมีการกระจายแบบปกติภายใต้สมมติฐานว่างที่สนใจ ค่าสถิติการทดสอบ แบบไม่ใช้พารามิเตอร์ หลายตัว เช่นค่าสถิติ Uมีการกระจายแบบปกติโดยประมาณสำหรับขนาดตัวอย่างที่ใหญ่พอ และด้วยเหตุนี้จึงมักทำการทดสอบด้วยการทดสอบ Z
การเปรียบเทียบสัดส่วนของพหุนามสองพหุนาม
การ ทดสอบ Zสำหรับเปรียบเทียบสัดส่วนสองค่าเป็นวิธีการทางสถิติที่ใช้ในการประเมินว่าสัดส่วนของลักษณะเฉพาะบางอย่างแตกต่างกันอย่างมีนัยสำคัญระหว่างสองกลุ่มตัวอย่างอิสระหรือไม่ การทดสอบนี้ใช้ประโยชน์จากคุณสมบัติที่ว่าสัดส่วนของกลุ่มตัวอย่าง (ซึ่งเป็นค่าเฉลี่ยของการสังเกตที่ได้มาจากการแจกแจงแบบเบอร์นูลลี ) มี ลักษณะเป็นแบบ ปกติ เชิงอะซิมโท ติก ภายใต้ทฤษฎีบทขีดจำกัดกลางทำให้สามารถสร้างการทดสอบ Z ได้
ค่าสถิติ z สำหรับเปรียบเทียบสัดส่วนสองค่าคำนวณได้โดยใช้สูตร:
ที่ไหน:
- = สัดส่วนตัวอย่างในตัวอย่างแรก
- = สัดส่วนตัวอย่างในตัวอย่างที่สอง
- = ขนาดของตัวอย่างแรก
- = ขนาดของตัวอย่างที่สอง
- = สัดส่วนรวม คำนวณจากสูตร โดยที่และคือจำนวนความสำเร็จในสองกลุ่มตัวอย่าง
ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วนสองค่า โดยอิงตามคำจำกัดความข้างต้น คือ:
ที่ไหน:
- คือค่าวิกฤตของการแจกแจงปกติมาตรฐาน (เช่น 1.96 สำหรับระดับความเชื่อมั่น 95%)
ที่ไหน:
- : ค่าวิกฤตสำหรับระดับนัยสำคัญ
- : ควอนไทล์สำหรับกำลังไฟฟ้าที่ต้องการ
- : เมื่อสมมติว่าสมมติฐานว่างถูกต้อง
ดูเพิ่มเติม
อ่านเพิ่มเติม
- Sprinthall, RC (2011). การวิเคราะห์ทางสถิติเบื้องต้น (ฉบับที่ 9). Pearson Education. ISBN 978-0-205-05217-2.
- Casella, G. , Berger, RL (2002). การอนุมานทางสถิติ . สำนักพิมพ์ Duxbury. ISBN 0-534-24312-6.
- Douglas C. Montgomery, George C. Runger.(2014). สถิติประยุกต์และความน่าจะเป็นสำหรับวิศวกร (ฉบับที่ 6). John Wiley & Sons, inc. ISBN 9781118539712,9781118645062.
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การทดสอบZ
การทดสอบZคือการทดสอบทางสถิติ ใดๆ ที่การแจกแจงของค่าสถิติการทดสอบภายใต้สมมติฐานว่างสามารถประมาณได้ด้วยการแจกแจงปกติ การทดสอบ Zทดสอบค่าเฉลี่ยของการแจกแจง...
ความสามารถในการใช้งาน
เนื่องจาก ทฤษฎีบทขีดจำกัดกลาง สถิติการทดสอบจำนวนมากจึงมีการแจกแจงแบบปกติโดยประมาณสำหรับตัวอย่างขนาดใหญ่ ดังนั้น การทดสอบทางสถิติหลายอย่างจึงสามารถทำได้อย่างสะดวกโดยใช้ การทดสอบ Z โดยประมาณ หากขนาดตัวอย่างมีขนาดใหญ่หรือทราบค่าความแปรปรวนของประชากร...
ขั้นตอน
ขั้นตอนในการทำการ ทดสอบ Z กับสถิติที่มีการกระจายแบบปกติโดยประมาณภายใต้สมมติฐานว่าง มีดังนี้: ที {\displaystyle T}
ใช้ในการทดสอบสถานที่
คำว่า " การทดสอบ Z " มักใช้เพื่ออ้างถึง การทดสอบตำแหน่งตัวอย่างเดียว โดยเฉพาะ ซึ่งเปรียบเทียบค่าเฉลี่ยของชุดการวัดกับค่าคงที่ที่กำหนด เมื่อทราบค่าความแปรปรวนของตัวอย่างแล้ว ตัวอย่างเช่น ถ้าข้อมูลที่สังเกตได้ X 1 , ...