อ่าน 5 นาที
ค่าสถิติ t
ในทาง สถิติ ค่า สถิติ t คือ อัตราส่วนของผลต่างระหว่างค่าประมาณของตัวเลขกับค่าที่สมมติขึ้น กับค่า ความคลาดเคลื่อนมาตรฐาน ใช้ใน การทดสอบสมมติฐาน โดยใช้ การทดสอบ t ของนักเรียน ค่า...
ค่าสถิติt
ในทางสถิติ ค่าสถิติt คืออัตราส่วนของผลต่างระหว่างค่าประมาณของตัวเลขกับค่าที่สมมติขึ้น กับค่าความคลาดเคลื่อนมาตรฐานใช้ในการทดสอบสมมติฐานโดยใช้การทดสอบtของนักเรียนค่า สถิติ tใช้ในการ ทดสอบ tเพื่อพิจารณาว่าจะสนับสนุนหรือปฏิเสธสมมติฐานว่าง มันคล้ายกับค่า z มาก แต่แตกต่างตรงที่ ค่าสถิติ tใช้เมื่อขนาดตัวอย่างเล็กหรือค่าเบี่ยงเบนมาตรฐานของประชากรไม่ทราบค่า ตัวอย่างเช่น ค่า สถิติ tใช้ในการประมาณค่าเฉลี่ยของประชากรจาก ผลรวม ของการแจกแจงค่าเฉลี่ยตัวอย่าง หาก ค่าเบี่ยงเบนมาตรฐานของประชากรไม่ทราบค่า นอกจากนี้ยังใช้ร่วมกับค่า pเมื่อทำการทดสอบสมมติฐาน โดยค่า p จะบอกเราถึงโอกาสที่จะเกิดผลลัพธ์นั้นๆ
คำจำกัดความและคุณลักษณะ
ให้เป็นตัวประมาณค่าของพารามิเตอร์βในแบบจำลองทางสถิติ บางแบบ แล้ว ค่าสถิติ tสำหรับพารามิเตอร์นี้คือปริมาณใดๆ ที่อยู่ในรูปแบบ
โดยที่β 0เป็นค่าคงที่ที่ทราบแล้วและไม่ใช่ค่าสุ่ม ซึ่งอาจตรงหรือไม่ตรงกับค่าพารามิเตอร์ที่ไม่ทราบค่าจริงβก็ได้ และคือค่าความคลาดเคลื่อนมาตรฐานของตัวประมาณค่าสำหรับβ
โดยปกติแล้ว โปรแกรมวิเคราะห์ทางสถิติจะรายงาน ค่า t -statistic โดยใช้β₀ = 0 (ค่าt -statistic เหล่านี้ใช้เพื่อทดสอบนัยสำคัญของตัวแปรอิสระที่เกี่ยวข้อง) อย่างไรก็ตาม เมื่อ ต้องการค่า t -statistic เพื่อทดสอบสมมติฐานในรูปแบบH₀ : β₀ = β₀ ก็ สามารถใช้ ค่า β₀ ที่ไม่ใช่ศูนย์ได้
ถ้าเป็น ตัวประมาณ ค่ากำลังสองน้อยที่สุดแบบธรรมดาในแบบจำลองการถดถอยเชิงเส้น แบบคลาสสิก (นั่นคือ มี พจน์ความคลาดเคลื่อน ที่กระจายแบบปกติและ มีค่าความแปรปรวน คงที่ ) และถ้าค่าที่แท้จริงของพารามิเตอร์βเท่ากับβ 0แล้วการกระจายตัวอย่างของ ค่าสถิติ tจะเป็นการกระจายแบบtของนักเรียนที่มีองศาอิสระ( n − k ) โดยที่ nคือจำนวนการสังเกต และkคือจำนวนตัวแปรอิสระ (รวมถึงค่าคงที่)
ในแบบจำลองส่วนใหญ่ ตัวประมาณค่าจะมีความสอดคล้องสำหรับβและมีการกระจายแบบปกติเชิงอะซิปโทติกหากค่าที่แท้จริงของพารามิเตอร์βเท่ากับβ₀และปริมาณดังกล่าวประมาณค่าความแปรปรวนเชิงอะซิปโทติกของตัวประมาณค่านี้ได้อย่างถูกต้อง สถิติ tจะมีการกระจาย แบบปกติมาตรฐานเชิง อะซิปโทติก
ในบางแบบจำลอง การกระจายตัวของค่า สถิติ tอาจแตกต่างจากการกระจายตัวแบบปกติ แม้กระทั่งในเชิงอะซิปโทติก ตัวอย่างเช่น เมื่อ ทำการถดถอย อนุกรมเวลาที่มีรากหน่วยในการทดสอบ Dickey–Fuller แบบเสริม ค่า สถิติ tของการทดสอบจะมีการกระจายตัวแบบใดแบบหนึ่งของ Dickey–Fuller ในเชิงอะซิปโทติก (ขึ้นอยู่กับการตั้งค่าการทดสอบ)
ใช้
โดยส่วนใหญ่แล้ว ค่าสถิติ tจะถูกใช้ในการทดสอบtของนักเรียน ซึ่ง เป็น รูปแบบหนึ่งของการทดสอบสมมติฐานทางสถิติและในการคำนวณช่วงความเชื่อ มั่นบางประเภท
คุณสมบัติสำคัญของ สถิติ tคือเป็นปริมาณสำคัญ – แม้ว่าจะนิยามโดยใช้ค่าเฉลี่ยของกลุ่มตัวอย่าง แต่การแจกแจงตัวอย่างของมันไม่ขึ้นอยู่กับพารามิเตอร์ของประชากร ดังนั้นจึงสามารถนำไปใช้ได้โดยไม่คำนึงถึงว่าพารามิเตอร์เหล่านั้นจะเป็นอย่างไรก็ตาม
การทำนาย
เมื่อพิจารณาการ แจกแจงแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนที่ไม่ทราบค่า ค่าสถิติ tของการสังเกตในอนาคตหลังจากที่ได้ทำการ สังเกตไปแล้ว nครั้ง จะเป็นสถิติเสริม – ปริมาณสำคัญ (ไม่ขึ้นอยู่กับค่าของμและσ² ) ซึ่งเป็นสถิติ (คำนวณจากข้อมูลที่สังเกตได้) สิ่งนี้ทำให้สามารถคำนวณช่วงการทำนาย แบบความถี่ ( ช่วงความเชื่อ มั่นในการทำนาย ) ได้โดยใช้การแจกแจง t ดังต่อไปนี้:
การแก้สมการจะได้ผลลัพธ์เป็นการกระจายการทำนาย
จากนั้นจึงสามารถคำนวณช่วงความเชื่อมั่นในการทำนายได้ กล่าวคือ เมื่อกำหนดความน่าจะเป็นpแล้ว สามารถคำนวณช่วงเวลาได้ โดยที่ 100 p % ของเวลา การสังเกตการณ์ครั้งต่อไปจะตกอยู่ในช่วงเวลานั้น
ประวัติศาสตร์
คำว่า " t -statistic" ย่อมาจาก "hypothesis test statistic" [ 1 ]ในทางสถิติ การแจกแจง t ได้รับการพิสูจน์ครั้งแรกในฐานะการแจกแจงแบบเบื้องหลังในปี พ.ศ. 2419 โดยHelmert [ 2 ] [ 3 ] [ 4 ]และLüroth [ 5 ] [ 6 ] [ 7 ]การแจกแจง t ยังปรากฏในรูปแบบทั่วไปมากขึ้นในชื่อการแจกแจงแบบ Pearson Type IVใน บทความของ Karl Pearson ใน ปีพ.ศ. 2438 [ 8 ]อย่างไรก็ตาม การแจกแจงแบบ T หรือที่รู้จักกันในชื่อการแจกแจงแบบ T ของนักเรียนได้รับชื่อมาจากWilliam Sealy Gossetซึ่งเป็นคนแรกที่ตีพิมพ์ผลลัพธ์เป็นภาษาอังกฤษในบทความปี 1908 ของเขาที่มีชื่อว่า "The Probable Error of a Mean" (ในBiometrika ) โดยใช้นามแฝงว่า "Student" [ 9 ] [ 10 ]เนื่องจากนายจ้างของเขาต้องการให้พนักงานใช้นามแฝงเมื่อตีพิมพ์บทความทางวิทยาศาสตร์แทนที่จะใช้ชื่อจริง ดังนั้นเขาจึงใช้นามแฝง "Student" เพื่อปกปิดตัวตนของเขา[ 11 ]โรงเบียร์กินเนสส์ในดับลินประเทศไอร์แลนด์และสนใจในปัญหาของตัวอย่างขนาดเล็ก เช่น คุณสมบัติทางเคมีของข้าวบาร์เลย์ ซึ่งขนาดตัวอย่างอาจมีเพียง 3 ดังนั้น ที่มาของคำว่า Student ในอีกเวอร์ชันหนึ่งก็คือ กินเนสส์ไม่ต้องการให้คู่แข่งรู้ว่าพวกเขากำลังใช้การทดสอบ t เพื่อกำหนดคุณภาพของวัตถุดิบ แม้ว่าคำว่า "Student" จะตั้งตามชื่อของ William Gosset แต่ความจริงแล้วการแจกแจงนี้เป็นที่รู้จักกันดีในชื่อ "การแจกแจงของ Student" [ 12 ] [ 13 ]และ " การทดสอบ t ของ Student " มาจากผลงานของ Ronald Fisher
แนวคิดที่เกี่ยวข้อง
- ค่าz (การหาค่ามาตรฐาน) : หากทราบค่าพารามิเตอร์ของประชากรแล้ว แทนที่จะคำนวณค่าสถิติ t เราสามารถคำนวณค่า z ได้ ในทำนองเดียวกัน แทนที่จะใช้ การทดสอบ tเราสามารถใช้การทดสอบzได้ วิธีนี้พบได้น้อยนอกเหนือจากทดสอบมาตรฐาน
- ค่าตกค้างแบบ Studentized : ในการวิเคราะห์การถดถอยค่าความคลาดเคลื่อนมาตรฐานของตัวประมาณค่า ณ จุดข้อมูลต่างๆ จะแตกต่างกัน (ลองเปรียบเทียบจุดกลางกับจุดปลายของการถดถอยเชิงเส้นอย่างง่าย ) ดังนั้นจึงต้องหารค่าตกค้างที่แตกต่างกันด้วยค่าประมาณความคลาดเคลื่อนที่แตกต่างกัน ซึ่งจะได้ค่าที่เรียกว่า ค่าตกค้าง แบบStudentized
- คะแนนมาตรฐานตัวอย่าง: การแทนที่ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของประชากรในคะแนน z ด้วยค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของตัวอย่างจะได้: ค่าสังเกตมาตรฐานนี้มีความเกี่ยวข้องกับสถิติ t เนื่องจากใช้พารามิเตอร์มาตราส่วนที่ประมาณค่าได้ ไม่ควรสับสนกับสถิติ t แบบหนึ่งตัวอย่างซึ่งปรับค่าเฉลี่ยของตัวอย่างให้เป็นมาตรฐานโดยใช้ค่าความคลาดเคลื่อนที่ประมาณได้
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ค่าสถิติ t
ในทาง สถิติ ค่า สถิติ t คือ อัตราส่วนของผลต่างระหว่างค่าประมาณของตัวเลขกับค่าที่สมมติขึ้น กับค่า ความคลาดเคลื่อนมาตรฐาน ใช้ใน การทดสอบสมมติฐาน โดยใช้ การทดสอบ t ของนักเรียน ค่า...
คำจำกัดความและคุณลักษณะ
ให้เป็น ตัวประมาณค่า ของพารามิเตอร์ β ในแบบ จำลองทางสถิติ บางแบบ แล้ว ค่าสถิติ t สำหรับพารามิเตอร์นี้คือปริมาณใดๆ ที่อยู่ในรูปแบบ เบต้า ^ {\displaystyle {\หมวก {\beta }}}
ใช้
โดยส่วนใหญ่แล้ว ค่าสถิติ t จะถูกใช้ใน การทดสอบ t ของนักเรียน ซึ่ง เป็น รูปแบบหนึ่งของ การทดสอบสมมติฐานทางสถิติ และในการคำนวณ ช่วงความเชื่อ มั่นบางประเภท
การทำนาย
เมื่อพิจารณาการ แจกแจง แบบปกติที่มีค่าเฉลี่ยและความแปรปรวนที่ไม่ทราบค่า ค่าสถิติ t ของการสังเกตในอนาคตหลังจากที่ได้ทำการ สังเกตไปแล้ว n ครั้ง จะเป็น สถิติเสริม – ปริมาณสำคัญ (ไม่ขึ้นอยู่กับค่าของ μ และ σ² ) ซึ่งเป็นสถิติ (คำนวณจากข้อมูลที่สังเกตได้)...