การทดสอบZ

Q: ขั้นตอน

ขั้นตอนในการทำการ ทดสอบ Z กับสถิติที่มีการกระจายแบบปกติโดยประมาณภายใต้สมมติฐานว่าง มีดังนี้: ที {\displaystyle T}

การทดสอบZคือการทดสอบทางสถิติ ใดๆ ที่การแจกแจงของค่าสถิติการทดสอบภายใต้สมมติฐานว่างสามารถประมาณได้ด้วยการแจกแจงปกติ การทดสอบ Zทดสอบค่าเฉลี่ยของการแจกแจง สำหรับแต่ละระดับนัยสำคัญในช่วงความเชื่อมั่น การ ทดสอบ Zจะมีค่าวิกฤตเพียงค่าเดียว (ตัวอย่างเช่น 1.96 สำหรับ 5% แบบสองด้าน) ซึ่งทำให้สะดวกกว่าการทดสอบ t ของนักเรียนซึ่งค่าวิกฤตถูกกำหนดโดยขนาดตัวอย่าง (ผ่านระดับความเป็นอิสระ ที่สอดคล้องกัน ) ทั้ง การทดสอบ Zและ การทดสอบ t ของนักเรียน มีความคล้ายคลึงกันตรงที่ทั้งสองช่วยในการกำหนดนัยสำคัญของชุดข้อมูล อย่างไรก็ตาม การ ทดสอบ Zจำเป็นต้องทราบค่าเบี่ยงเบนของประชากร ซึ่งบางครั้งยากที่จะกำหนด ทำให้การ ทดสอบ tสะดวกกว่า

ความสามารถในการใช้งาน

เนื่องจากทฤษฎีบทขีดจำกัดกลางสถิติการทดสอบจำนวนมากจึงมีการแจกแจงแบบปกติโดยประมาณสำหรับตัวอย่างขนาดใหญ่ ดังนั้น การทดสอบทางสถิติหลายอย่างจึงสามารถทำได้อย่างสะดวกโดยใช้ การทดสอบ Z โดยประมาณ หากขนาดตัวอย่างมีขนาดใหญ่หรือทราบค่าความแปรปรวนของประชากร หากไม่ทราบค่าความแปรปรวนของประชากร (และจึงต้องประมาณจากตัวอย่างเอง) และขนาดตัวอย่างไม่ใหญ่ ( n < 30) การทดสอบ tของนักเรียนอาจเหมาะสมกว่า (ในบางกรณีn < 50 ดังที่อธิบายไว้ด้านล่าง)

ขั้นตอน

ขั้นตอนในการทำการ ทดสอบ Zกับสถิติที่มีการกระจายแบบปกติโดยประมาณภายใต้สมมติฐานว่าง มีดังนี้: $T$

ประมาณค่าที่คาดหวัง μ ของภายใต้สมมติฐานว่าง และประมาณค่าsของส่วนเบี่ยงเบนมาตรฐานของ $T$ $T$
จงระบุคุณสมบัติของการทดสอบ: การทดสอบแบบหางเดียว หรือ การทดสอบแบบสองหาง $T$
- สำหรับสมมติฐานว่างH ₀ : μ ≥ μ ₀เทียบกับสมมติฐานทางเลือกH ₁ : μ < μ ₀จะเป็นการทดสอบแบบหางล่าง/หางซ้าย (แบบหางเดียว)
- สำหรับสมมติฐานว่างH ₀ : μ ≤ μ ₀เทียบกับสมมติฐานทางเลือกH ₁ : μ > μ ₀นั้นเป็นการทดสอบแบบหางบน/หางขวา (แบบหางเดียว)
- สำหรับสมมติฐานว่างH ₀ : μ = μ ₀เทียบกับสมมติฐานทางเลือกH ₁ : μ ≠ μ ₀นั้นเป็นการทดสอบแบบสองด้าน
คำนวณคะแนนมาตรฐาน : $Z={\frac {{\bar {T}}-\mu _{0}}{s}}$

ค่า p แบบหางเดียวและสองหางสามารถคำนวณได้ดังนี้(สำหรับการทดสอบแบบหางล่าง/ซ้าย), (สำหรับการทดสอบแบบหางบน/ขวา) และ(สำหรับการทดสอบแบบสองหาง) โดยที่คือฟังก์ชันการกระจายสะสม ปกติมาตรฐาน $\Phi (Z)$ $\Phi (-Z)$ $2\Phi (-|Z|)$ $\Phi$

ใช้ในการทดสอบสถานที่

คำว่า " การทดสอบ Z " มักใช้เพื่ออ้างถึงการทดสอบตำแหน่งตัวอย่างเดียว โดยเฉพาะ ซึ่งเปรียบเทียบค่าเฉลี่ยของชุดการวัดกับค่าคงที่ที่กำหนด เมื่อทราบค่าความแปรปรวนของตัวอย่างแล้ว ตัวอย่างเช่น ถ้าข้อมูลที่สังเกตได้X ₁ , ..., X _n (i) เป็นอิสระต่อกัน (ii) มีค่าเฉลี่ยร่วมกัน μ และ (iii) มีความแปรปรวนร่วมกัน σ ²แล้ว ค่าเฉลี่ยของตัวอย่างXจะมีค่าเฉลี่ย μ และความแปรปรวน σ 2 ${\frac {\sigma ^{2}}{n}}$
สมมติฐานว่างคือค่าเฉลี่ยของ X คือค่า μ₀ ที่กำหนด_เราสามารถใช้X เป็นสถิติทดสอบได้ โดยจะปฏิเสธสมมติฐานว่างหากX − μ₀ _มีค่ามาก
ในการคำนวณค่าสถิติมาตรฐานเราจำเป็นต้องทราบหรือมีค่าโดยประมาณของ σ² ^จากนั้นจึงสามารถคำนวณค่าได้ในบางกรณี ค่า σ² ^อาจเป็นที่ทราบ แต่กรณีนี้พบได้ไม่บ่อยนัก $Z={\frac {({\bar {X}}-\mu _{0})}{s}}$ $s^{2}={\frac {\sigma ^{2}}{n}}$
หากขนาดตัวอย่างมีขนาดปานกลางหรือใหญ่ เราสามารถใช้ค่าความแปรปรวนของตัวอย่าง แทน ^ค่า σ² ได้ ซึ่งจะได้ การทดสอบ แบบแทนค่า (plug-in test) การทดสอบที่ได้จะไม่ใช่ การทดสอบ Z ที่แม่นยำ เนื่องจากไม่ได้คำนึงถึงความไม่แน่นอนในค่าความแปรปรวนของตัวอย่าง แต่จะเป็นการประมาณค่าที่ดี เว้นแต่ว่าขนาดตัวอย่างจะมีขนาดเล็ก
การทดสอบ tสามารถใช้เพื่อพิจารณาความไม่แน่นอนในความแปรปรวนของตัวอย่างเมื่อข้อมูลมีการกระจายแบบปกติ อย่าง สมบูรณ์
ความแตกต่างระหว่าง การทดสอบ Zและ การทดสอบ t : การทดสอบ Zใช้เมื่อขนาดตัวอย่างมีขนาดใหญ่ ( n > 50) หรือทราบค่าความแปรปรวนของประชากร การทดสอบ tใช้เมื่อขนาดตัวอย่างมีขนาดเล็ก ( n < 50) และไม่ทราบค่าความแปรปรวนของประชากร
ไม่มีค่าคงที่สากลใดที่กำหนดว่าขนาดตัวอย่างเท่าใดจึงจะถือว่าใหญ่พอที่จะใช้การทดสอบแบบปลั๊กอินได้ โดยทั่วไปแล้ว หลักเกณฑ์คร่าวๆ คือ ขนาดตัวอย่างควรมีจำนวนข้อมูลอย่างน้อย 50 รายการขึ้นไป
สำหรับขนาดตัวอย่างขนาดใหญ่ ขั้นตอนการทดสอบ t จะให้ ค่าpที่เกือบจะ เหมือนกับ ขั้นตอนการทดสอบZ
การทดสอบตำแหน่งอื่นๆ ที่สามารถดำเนินการได้โดยใช้ การทดสอบ Zได้แก่ การทดสอบตำแหน่งสองกลุ่มตัวอย่าง และ การทดสอบความแตกต่างแบบ จับคู่

เงื่อนไข

การ ทดสอบ Zจะสามารถใช้งานได้ ต้องเป็นไปตามเงื่อนไขบางประการ

พารามิเตอร์ที่ไม่เกี่ยวข้องควรทราบหรือประมาณค่าได้อย่างแม่นยำสูง (ตัวอย่างของพารามิเตอร์ที่ไม่เกี่ยวข้องคือค่าเบี่ยงเบนมาตรฐานในการทดสอบตำแหน่งตัวอย่างเดียว) การทดสอบ Zมุ่งเน้นไปที่พารามิเตอร์เพียงตัวเดียว และถือว่าพารามิเตอร์ที่ไม่ทราบค่าอื่นๆ ทั้งหมดมีค่าคงที่ตามค่าจริง ในทางปฏิบัติ เนื่องจากทฤษฎีบทของ Slutsky การ "แทนค่า" ค่าประมาณ ที่สอดคล้องกันของพารามิเตอร์ที่ไม่เกี่ยวข้องจึงสามารถทำได้ อย่างไรก็ตาม หากขนาดตัวอย่างไม่ใหญ่พอที่จะทำให้ค่าประมาณเหล่านี้มีความแม่นยำอย่างเหมาะสม การทดสอบ Zอาจทำงานได้ไม่ดี
ค่าสถิติการทดสอบควรมีการแจกแจงแบบปกติโดยทั่วไปแล้ว จะใช้ทฤษฎีบทขีดจำกัดกลางมาสนับสนุนสมมติฐานที่ว่าค่าสถิติการทดสอบมีการแจกแจงแบบปกติ มีงานวิจัยทางสถิติมากมายเกี่ยวกับคำถามที่ว่าเมื่อใดค่าสถิติการทดสอบจึงจะแจกแจงแบบปกติโดยประมาณ หากการแจกแจงของค่าสถิติการทดสอบไม่เป็นไปตามการแจกแจงแบบปกติอย่างชัดเจนไม่ควรใช้การทดสอบZ

หากมีการแทนค่าประมาณของพารามิเตอร์รบกวนตามที่กล่าวไว้ข้างต้น สิ่งสำคัญคือต้องใช้ค่าประมาณที่เหมาะสมกับวิธีการสุ่มตัวอย่าง ข้อมูล ในกรณีพิเศษของ การทดสอบ Zสำหรับปัญหาตำแหน่งตัวอย่างหนึ่งหรือสองตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของตัวอย่างตามปกติจะเหมาะสมก็ต่อเมื่อข้อมูลถูกเก็บรวบรวมเป็นตัวอย่างอิสระเท่านั้น

ในบางสถานการณ์ เป็นไปได้ที่จะคิดค้นการทดสอบที่คำนึงถึงความแปรปรวนในการประมาณค่าพารามิเตอร์รบกวนแบบปลั๊กอินได้อย่างเหมาะสม ในกรณีของปัญหาการหาตำแหน่งตัวอย่างหนึ่งและสองตัวอย่างการทดสอบ tสามารถทำเช่นนั้นได้

ตัวอย่าง

สมมติว่าในภูมิภาคทางภูมิศาสตร์แห่งหนึ่ง ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของคะแนนสอบการอ่านคือ 100 คะแนน และ 12 คะแนน ตามลำดับ เราสนใจคะแนนของนักเรียน 55 คนในโรงเรียนแห่งหนึ่ง ซึ่งได้คะแนนเฉลี่ย 96 คะแนน เราอาจถามว่าคะแนนเฉลี่ยนี้ต่ำกว่าค่าเฉลี่ยของภูมิภาคอย่างมีนัยสำคัญหรือไม่ กล่าวคือ นักเรียนในโรงเรียนนี้เทียบเคียงได้กับกลุ่มตัวอย่างแบบสุ่มอย่างง่ายของนักเรียน 55 คนจากภูมิภาคโดยรวมหรือไม่ หรือคะแนนของพวกเขานั้นต่ำกว่าที่คาดการณ์ไว้

ขั้นแรกให้คำนวณค่าความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย:

\mathrm {SE} ={\frac {\sigma }{\sqrt {n}}}={\frac {12}{\sqrt {55}}}={\frac {12}{7.42}}=1.62

ค่าเบี่ยงเบนมาตรฐานของประชากรอยู่ ที่ไหน ${\sigma }$

ขั้นตอนต่อไปคือการคำนวณค่าz -scoreซึ่งเป็นระยะห่างจากค่าเฉลี่ยของกลุ่มตัวอย่างไปยังค่าเฉลี่ยของประชากร โดยมีหน่วยเป็นค่าความคลาดเคลื่อนมาตรฐาน:

z={\frac {M-\mu }{\mathrm {SE} }}={\frac {96-100}{1.62}}=-2.47

ในตัวอย่างนี้ เราถือว่าค่าเฉลี่ยและความแปรปรวนของประชากรเป็นที่ทราบแล้ว ซึ่งจะเหมาะสมหากมีการทดสอบนักเรียนทุกคนในภูมิภาคนั้น แต่หากไม่ทราบค่าพารามิเตอร์ของประชากรควรใช้การ ทดสอบ t ของนักเรียน แทน

คะแนนเฉลี่ยของห้องเรียนคือ 96 ซึ่งห่างจากค่าเฉลี่ยของประชากรที่ 100 อยู่ −2.47 หน่วยความคลาดเคลื่อนมาตรฐาน เมื่อดูค่าz -score ในตารางความน่าจะเป็นสะสมของการแจกแจงปกติ มาตรฐาน เราพบว่าความน่าจะเป็นที่จะสังเกตเห็นค่าปกติมาตรฐานที่ต่ำกว่า −2.47 นั้นประมาณ 0.5 − 0.4932 = 0.0068 นี่คือค่าp -value ด้านเดียว สำหรับสมมติฐานว่างที่ว่านักเรียน 55 คนนั้นเทียบเคียงได้กับตัวอย่างสุ่มอย่างง่ายจากประชากรของผู้เข้าสอบทั้งหมด ค่า p -value สองด้าน นั้นประมาณ 0.014 (สองเท่าของค่า p -value ด้านเดียว)

อีกวิธีหนึ่งในการกล่าวถึงเรื่องนี้คือ ด้วยความน่าจะเป็น 1 − 0.014 = 0.986 ตัวอย่างสุ่มอย่างง่ายของนักเรียน 55 คน จะมีคะแนนสอบเฉลี่ยอยู่ภายใน 4 หน่วยจากค่าเฉลี่ยของประชากร เราอาจกล่าวได้ว่าด้วยความมั่นใจ 98.6% เราปฏิเสธสมมติฐานว่างที่ว่าผู้เข้าสอบ 55 คนนั้นเทียบเคียงได้กับตัวอย่างสุ่มอย่างง่ายจากประชากรผู้เข้าสอบ

การ ทดสอบ Zบอกเราว่านักเรียน 55 คนที่เราสนใจมีคะแนนสอบเฉลี่ยต่ำผิดปกติเมื่อเทียบกับกลุ่มตัวอย่างแบบสุ่มอย่างง่ายที่มีขนาดใกล้เคียงกันจากประชากรผู้เข้าสอบส่วนใหญ่ ข้อบกพร่องของการวิเคราะห์นี้คือไม่ได้พิจารณาว่าขนาดผลกระทบ 4 คะแนนนั้นมีความหมายหรือไม่ หากเราพิจารณาพื้นที่ย่อยที่มีนักเรียน 900 คนซึ่งมีคะแนนเฉลี่ย 99 แทนที่จะเป็นห้องเรียน เรา จะสังเกตเห็นค่า Zและ ค่า p ที่เกือบจะเหมือนกัน ซึ่งแสดงให้เห็นว่าหากขนาดของกลุ่มตัวอย่างใหญ่พอ ความแตกต่างเล็กน้อยมากจากค่าว่างอาจมีความสำคัญทางสถิติอย่างมาก ดูการทดสอบสมมติฐานทางสถิติสำหรับการอภิปรายเพิ่มเติมเกี่ยวกับประเด็นนี้

การเกิดขึ้นและการประยุกต์ใช้

สำหรับการประมาณค่าพารามิเตอร์ด้วยวิธีความน่าจะเป็นสูงสุด

การทดสอบตำแหน่งเป็นการ ทดสอบ Z ที่คุ้นเคยมากที่สุด การทดสอบ Zอีกประเภทหนึ่งเกิดขึ้นใน การประมาณค่า ความน่าจะเป็นสูงสุดของพารามิเตอร์ในแบบจำลองทางสถิติแบบ พาราเมตริก การประมาณค่าความน่าจะเป็นสูงสุดจะมีลักษณะใกล้เคียงกับการแจกแจงปกติภายใต้เงื่อนไขบางประการ และความแปรปรวนเชิงอะซิมโทติกสามารถคำนวณได้ในรูปของข้อมูลฟิชเชอร์ การประมาณค่าความน่าจะเป็นสูงสุดหารด้วยค่าความคลาดเคลื่อนมาตรฐานสามารถใช้เป็นสถิติการทดสอบสำหรับสมมติฐานว่างที่ว่าค่าประชากรของพารามิเตอร์เท่ากับศูนย์ โดยทั่วไปแล้ว ถ้าคือการประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์ θ และ θ₀ _คือค่าของ θ ภายใต้สมมติฐานว่าง ${\hat {\theta }}$

{\frac {{\hat {\theta }}-\theta _{0}}{{\rm {SE}}({\hat {\theta }})}}

สามารถใช้เป็นสถิติการทดสอบ Z ได้

เมื่อใช้ การทดสอบ Zสำหรับการประมาณค่าความน่าจะเป็นสูงสุด สิ่งสำคัญคือต้องตระหนักว่าการประมาณค่าแบบปกติอาจไม่แม่นยำหากขนาดตัวอย่างไม่ใหญ่พอ แม้ว่าจะไม่มีกฎง่ายๆ ที่เป็นสากลระบุว่าขนาดตัวอย่างต้องมีขนาดใหญ่เท่าใดจึงจะใช้การทดสอบZ ได้ แต่ การจำลองสามารถให้แนวคิดที่ดีว่า การทดสอบ Zเหมาะสมในสถานการณ์ ใด

การทดสอบ Zถูกนำมาใช้เมื่อใดก็ตามที่สามารถสรุปได้ว่าค่าสถิติการทดสอบมีการกระจายแบบปกติภายใต้สมมติฐานว่างที่สนใจ ค่าสถิติการทดสอบ แบบไม่ใช้พารามิเตอร์ หลายตัว เช่นค่าสถิติ Uมีการกระจายแบบปกติโดยประมาณสำหรับขนาดตัวอย่างที่ใหญ่พอ และด้วยเหตุนี้จึงมักทำการทดสอบด้วยการทดสอบ Z

การเปรียบเทียบสัดส่วนของพหุนามสองพหุนาม

การ ทดสอบ Zสำหรับเปรียบเทียบสัดส่วนสองค่าเป็นวิธีการทางสถิติที่ใช้ในการประเมินว่าสัดส่วนของลักษณะเฉพาะบางอย่างแตกต่างกันอย่างมีนัยสำคัญระหว่างสองกลุ่มตัวอย่างอิสระหรือไม่ การทดสอบนี้ใช้ประโยชน์จากคุณสมบัติที่ว่าสัดส่วนของกลุ่มตัวอย่าง (ซึ่งเป็นค่าเฉลี่ยของการสังเกตที่ได้มาจากการแจกแจงแบบเบอร์นูลลี ) มี ลักษณะเป็นแบบ ปกติ เชิงอะซิมโท ติก ภายใต้ทฤษฎีบทขีดจำกัดกลางทำให้สามารถสร้างการทดสอบ Z ได้

ค่าสถิติ z สำหรับเปรียบเทียบสัดส่วนสองค่าคำนวณได้โดยใช้สูตร:

$z={\frac {{\hat {p}}_{1}-{\hat {p}}_{2}}{\sqrt {{\hat {p}}(1-{\hat {p}})\left({\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}\right)}}}$

ที่ไหน:

${\หมวก {p}__{1}$ = สัดส่วนตัวอย่างในตัวอย่างแรก
${\หมวก {p}__{2}$ = สัดส่วนตัวอย่างในตัวอย่างที่สอง
$n_{1}$ = ขนาดของตัวอย่างแรก
$n_{2}$ = ขนาดของตัวอย่างที่สอง
${\hat {p}}$ = สัดส่วนรวม คำนวณจากสูตร โดยที่และคือจำนวนความสำเร็จในสองกลุ่มตัวอย่าง ${\hat {p}}={\frac {x_{1}+x_{2}}{n_{1}+n_{2}}}$ $x_{1}$ $x_{2}$

ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วนสองค่า โดยอิงตามคำจำกัดความข้างต้น คือ:

$({\hat {p}__{1}-{\hat {p}__{2})\pm z_{\alpha /2}{\sqrt {{\frac {{\hat {p}}_{1}(1-{\hat {p}__{1})}{n_{1}}}+{\frac {{\hat {p}__{2}(1-{\hat {p}__{2})}{n_{2}}}}}$

ที่ไหน:

$z_{\alpha /2}$ คือค่าวิกฤตของการแจกแจงปกติมาตรฐาน (เช่น 1.96 สำหรับระดับความเชื่อมั่น 95%)

ที่ไหน:

$z_{1-\alpha /2}$ : ค่าวิกฤตสำหรับระดับนัยสำคัญ
$z_{1-\beta }$ : ควอนไทล์สำหรับกำลังไฟฟ้าที่ต้องการ
$p_{0}=p_{1}=p_{2}$ : เมื่อสมมติว่าสมมติฐานว่างถูกต้อง

ดูเพิ่มเติม

อ่านเพิ่มเติม

Sprinthall, RC (2011). การวิเคราะห์ทางสถิติเบื้องต้น (ฉบับที่ 9). Pearson Education. ISBN 978-0-205-05217-2.
Casella, G. , Berger, RL (2002). การอนุมานทางสถิติ . สำนักพิมพ์ Duxbury. ISBN 0-534-24312-6.
Douglas C. Montgomery, George C. Runger.(2014). สถิติประยุกต์และความน่าจะเป็นสำหรับวิศวกร (ฉบับที่ 6). John Wiley & Sons, inc. ISBN 9781118539712,9781118645062.

การทดสอบZ

ความสามารถในการใช้งาน

ขั้นตอน

ใช้ในการทดสอบสถานที่

เงื่อนไข

ตัวอย่าง

การเกิดขึ้นและการประยุกต์ใช้

สำหรับการประมาณค่าพารามิเตอร์ด้วยวิธีความน่าจะเป็นสูงสุด

การเปรียบเทียบสัดส่วนของพหุนามสองพหุนาม

ดูเพิ่มเติม

อ่านเพิ่มเติม

ข้อมูลสำคัญจากบทความ