อ่าน 11 นาที
ช่วงความเชื่อมั่น
ตามการอนุมานแบบความถี่ช่วงความเชื่อ มั่น ( CI ) คือช่วงของค่าที่น่าจะครอบคลุม (ในการสุ่มตัวอย่างซ้ำ) ค่าที่แท้จริงของพารามิเตอร์ทางสถิติ ที่ไม่ทราบค่า เช่นค่าเฉลี่ยของ ประชากร...
ช่วงความเชื่อมั่น

ตามการอนุมานแบบความถี่ช่วงความเชื่อ มั่น ( CI ) คือช่วงของค่าที่น่าจะครอบคลุม (ในการสุ่มตัวอย่างซ้ำ) ค่าที่แท้จริงของพารามิเตอร์ทางสถิติ ที่ไม่ทราบค่า เช่นค่าเฉลี่ยของ ประชากร [ 1 ]แทนที่จะรายงานค่าประมาณจุดเดียว (เช่น "เวลาหน้าจอเฉลี่ยคือ 3 ชั่วโมงต่อวัน") ช่วงความเชื่อมั่นจะให้ช่วง เช่น 2 ถึง 4 ชั่วโมง พร้อมกับระดับความเชื่อมั่น ที่ระบุ โดยทั่วไปคือ 95%
ระดับความเชื่อมั่น 95% ไม่ได้หมายความว่ามีความน่าจะเป็น 95% ที่ค่าพารามิเตอร์ที่แท้จริงจะอยู่ในช่วงที่คำนวณได้ ซึ่งเกี่ยวข้องกับช่วงความน่าเชื่อถือในการอนุมานแบบเบย์เซียนระดับความเชื่อมั่นสะท้อนถึงความน่าเชื่อถือในระยะยาวของวิธีการที่ใช้ในการสร้างช่วง[ 2 ] [ 3 ]กล่าวอีกนัยหนึ่ง หากทำซ้ำขั้นตอนการสุ่มตัวอย่างเดียวกัน 100 ครั้งจากประชากรเดียวกัน คาดว่าประมาณ 95 ของช่วงที่ได้จะครอบคลุมค่าเฉลี่ยของประชากรที่แท้จริง วิธีการแบบความถี่นิยมมองว่าค่าเฉลี่ยของประชากรที่แท้จริงเป็นค่าคงที่ที่ไม่ทราบค่า ในขณะที่ช่วงความเชื่อมั่นคำนวณโดยใช้ข้อมูลจากตัวอย่างแบบสุ่ม เนื่องจากตัวอย่างเป็นแบบสุ่ม จุดปลายของช่วงจึงเป็นตัวแปรสุ่ม
คำนิยาม
ให้เป็นตัวอย่างสุ่มจาก1 การแจกแจงความน่า จะ เป็นที่มีพารามิเตอร์ทางสถิติโดยที่คือปริมาณที่ต้องการประมาณค่า ในขณะที่รวมถึงพารามิเตอร์อื่นๆ (ถ้ามี) ที่กำหนดการแจกแจง ช่วงความเชื่อมั่นสำหรับพารามิเตอร์ที่มีระดับความเชื่อมั่นหรือสัมประสิทธิ์คือช่วงที่กำหนดโดยตัวแปรสุ่มและที่มีคุณสมบัติดังนี้:
ตัวเลขซึ่งโดยทั่วไปจะมีค่ามาก (เช่น 0.95) บางครั้งจะระบุในรูปแบบ(หรือเป็นเปอร์เซ็นต์) โดยที่เป็นจำนวนบวกขนาดเล็ก มักจะเป็น 0.05 หมายความว่าช่วงความเชื่อมั่นนั้นมีโอกาสที่จะครอบคลุมค่าของในการสุ่มตัวอย่างซ้ำๆ
ในการใช้งานหลายๆ กรณี การสร้างช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่นตรงตามที่ต้องการนั้นทำได้ยาก แต่สามารถคำนวณช่วงความเชื่อมั่นโดยประมาณได้ กฎสำหรับการสร้างช่วงความเชื่อมั่นนั้นอาจยอมรับได้หาก
ในระดับการประมาณที่ยอมรับได้ หรืออีกทางหนึ่ง ผู้เขียนบางคน[ 4 ]เพียงแค่ต้องการว่า
เมื่อทราบว่าความน่าจะเป็นของการครอบคลุมอาจมากกว่าค่าพารามิเตอร์บางค่าอย่างชัดเจน ช่วงความเชื่อมั่นจะเรียกว่าแบบอนุรักษ์นิยม กล่าวคือ มักจะเลือกด้านที่ปลอดภัยกว่า ซึ่งหมายความว่าช่วงความเชื่อมั่นอาจกว้างกว่าที่จำเป็นก็ได้
วิธีการหาอนุพันธ์
มีหลายวิธีในการคำนวณช่วงความเชื่อมั่น และวิธีที่ดีที่สุดจะขึ้นอยู่กับสถานการณ์ สองวิธีที่ใช้กันอย่างแพร่หลายคือบูตสแตรปปิ้งและทฤษฎีบทขีดจำกัดกลาง[ 2 ]วิธีหลังนี้ใช้ได้เฉพาะเมื่อตัวอย่างมีขนาดใหญ่ เนื่องจากต้องคำนวณค่าเฉลี่ยตัวอย่างและส่วนเบี่ยงเบนมาตรฐานตัวอย่างและใช้ปริมาณปกติมาตรฐานเชิงอะซิมโทติก
โดยที่และคือค่าเฉลี่ยของประชากรและขนาดของกลุ่มตัวอย่าง ตามลำดับ
ตัวอย่าง

สมมติว่าเป็น ตัวอย่าง อิสระจาก ประชากร ที่มีการแจกแจงแบบปกติโดยมีพารามิเตอร์ที่ไม่ทราบค่าคือ ค่าเฉลี่ยและความแปรปรวนกำหนดค่าเฉลี่ยของตัวอย่างและความแปรปรวนของตัวอย่างที่ไม่เอนเอียงดังนี้
จากนั้นค่า
มีการแจกแจงแบบStudent's tที่มีองศาอิสระ[ 5 ]ค่านี้มีประโยชน์เพราะการแจกแจงของค่านี้ไม่ขึ้นอยู่กับค่าของพารามิเตอร์ที่ไม่สามารถสังเกตได้และกล่าวคือ เป็นปริมาณ สำคัญ
สมมติว่าเราต้องการคำนวณช่วงความเชื่อมั่น 95% สำหรับก่อนอื่น ให้ เป็น เปอร์เซ็นไทล์ที่ 97.5 ของการแจกแจงของแล้วจะมีโอกาส 2.5% ที่จะน้อยกว่าและมีโอกาส 2.5% ที่ จะมากกว่า(เนื่องจาก การแจกแจงแบบ tสมมาตรเกี่ยวกับ 0) กล่าวอีกนัยหนึ่งคือ
ดังนั้น โดยการแทนที่และจัดเรียงคำศัพท์ใหม่
โดยที่คือค่าความน่าจะเป็นสำหรับตัวอย่าง
หมายความว่ามีความน่าจะเป็น 95% ที่เงื่อนไขนี้จะเกิดขึ้นในการสุ่มตัวอย่างซ้ำ หลังจากสังเกตตัวอย่างแล้ว เราจะหาค่าสำหรับและสำหรับจากนั้นเราจะคำนวณช่วงความเชื่อมั่นด้านล่าง และเรากล่าวว่านี่คือช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ย
การตีความ
สามารถตีความช่วงความเชื่อมั่นได้หลายแบบ (โดยจะยกตัวอย่างช่วงความเชื่อมั่น 95% ในตัวอย่างต่อไปนี้)
- ช่วงความเชื่อมั่นสามารถแสดงได้ในแง่ของความถี่ระยะยาวในตัวอย่างซ้ำ (หรือในการสุ่มตัวอย่างซ้ำ ): "หากขั้นตอนนี้ทำซ้ำกับตัวอย่างจำนวนมาก สัดส่วนของช่วงความเชื่อมั่น 95% ที่คำนวณได้ซึ่งครอบคลุมค่าที่แท้จริงของพารามิเตอร์ประชากรจะมีแนวโน้มเข้าใกล้ 95%" [ 6 ]
- ช่วงความเชื่อมั่นสามารถแสดงได้ในแง่ของความน่าจะเป็นโดยสัมพันธ์กับตัวอย่างเชิงทฤษฎีเพียงตัวอย่างเดียว (ที่ยังไม่เกิดขึ้นจริง): "มีความน่าจะเป็น 95% ที่ช่วงความเชื่อมั่น 95% ที่คำนวณจากตัวอย่างในอนาคตที่กำหนดจะครอบคลุมค่าที่แท้จริงของพารามิเตอร์ประชากร" [ 7 ]โดยพื้นฐานแล้วนี่เป็นการปรับกรอบการตีความ "ตัวอย่างซ้ำ" ใหม่ให้เป็นความน่าจะเป็นแทนที่จะเป็นความถี่
- ช่วงความเชื่อมั่นสามารถแสดงได้ในแง่ของนัยสำคัญทางสถิติ เช่น "ช่วงความเชื่อมั่น 95% แสดงถึงค่าที่ไม่ แตกต่างกัน อย่างมีนัยสำคัญทางสถิติจากค่าประมาณจุดที่ระดับ .05" [ 8 ]

ความเข้าใจผิดที่พบบ่อย

ช่วงความเชื่อมั่นและระดับความเชื่อมั่นมักถูกเข้าใจผิด และการศึกษาที่ตีพิมพ์แสดงให้เห็นว่าแม้แต่นักวิทยาศาสตร์มืออาชีพก็มักตีความผิดพลาด[ 9 ]
ตรงกันข้ามกับความเข้าใจผิดทั่วไป ระดับความเชื่อมั่น 95% ไม่ได้หมายความว่า:
- สำหรับช่วงเวลาที่เกิดขึ้นจริงที่กำหนดไว้ จะมีความน่าจะเป็น 95% ที่พารามิเตอร์ของประชากรจะอยู่ภายในช่วงเวลานั้น[ 10 ] [ 11 ]
- 95% ของข้อมูลตัวอย่างอยู่ภายในช่วงความเชื่อมั่น[ 1 ]หรือ
- มีความน่าจะเป็น 95% ที่ค่าประมาณพารามิเตอร์จากการทดลองซ้ำจะอยู่ในช่วงความเชื่อมั่นที่คำนวณจากการทดลองที่กำหนด[ 11 ]
ตัวอย่างเช่น สมมติว่าโรงงานผลิตแท่งโลหะ และตัวอย่างสุ่มของแท่งโลหะ 25 แท่งให้ช่วงความเชื่อมั่น 95% ของความยาวเฉลี่ยของประชากรที่ 36.8 ถึง 39.0 มม. [ 12 ]
- การกล่าวว่ามีความน่าจะเป็น 95% ที่ค่าเฉลี่ยประชากรที่แท้จริงจะอยู่ในช่วงนี้ไม่ถูกต้อง เพราะค่าเฉลี่ยที่แท้จริงนั้นคงที่ ไม่ได้เกิดขึ้นแบบสุ่ม ค่าเฉลี่ยที่แท้จริงอาจเป็น 37 มม. ซึ่งอยู่ในช่วงความเชื่อมั่น หรือ 40 มม. ซึ่งอยู่นอกช่วงความเชื่อมั่น ไม่ว่าในกรณีใด การที่ค่าเฉลี่ยจะอยู่ระหว่าง 36.8 และ 39.0 มม. นั้นเป็นเรื่องของข้อเท็จจริง ไม่ใช่เรื่องของความน่าจะเป็น
- ไม่จำเป็นเสมอไปที่ความยาวของแท่งตัวอย่าง 95% จะอยู่ในช่วงนี้ ในกรณีนี้ มันเป็นไปไม่ได้ เพราะ 95% ของ 25 ไม่ใช่จำนวนเต็ม
- โดยทั่วไปแล้วไม่เป็นความจริงที่ว่ามีความน่าจะเป็น 95% ที่ค่าเฉลี่ยความยาวของตัวอย่าง (ซึ่งเป็นการประมาณค่าเฉลี่ยความยาวของประชากร) ในตัวอย่างที่สองจะอยู่ในช่วงความเชื่อมั่นนี้ ในความเป็นจริง หากค่าเฉลี่ยความยาวที่แท้จริงอยู่ห่างจากช่วงความเชื่อมั่นนี้มาก ก็เป็นไปได้ยากมากที่ค่าเฉลี่ยของตัวอย่างถัดไปจะอยู่ในช่วงดังกล่าว
แต่ระดับความเชื่อมั่น 95% หมายความว่า หากเราสุ่มตัวอย่าง 100 ตัวอย่าง เราคาดว่าค่าเฉลี่ยของประชากรที่แท้จริงจะอยู่ภายในช่วงประมาณ 95 ช่วงที่คำนวณได้[ 1 ] [ 10 ] [ 11 ] [ 12 ]
การเปรียบเทียบกับช่วงการทำนาย
ช่วงความเชื่อมั่นใช้ในการประมาณค่าพารามิเตอร์ของประชากร เช่น ค่าเฉลี่ย ตัวอย่างเช่น ค่าที่คาดหวังของลูกเต๋าหกด้านที่ยุติธรรมคือ 3.5 จากการสุ่มตัวอย่างซ้ำๆ หลังจากคำนวณช่วงความเชื่อมั่น 95% หลายครั้ง ประมาณ 95% ของช่วงความเชื่อมั่นเหล่านั้นจะครอบคลุมค่า 3.5 (และความกว้างของช่วงความเชื่อมั่นจะแคบลงตามขนาดของตัวอย่าง)
ในทางกลับกัน ช่วงการทำนายจะให้ช่วงที่คาดว่าการสังเกตแต่ละครั้งในอนาคตจะตกอยู่ในช่วงนั้นด้วยความน่าจะเป็นที่แน่นอน ในกรณีของการทอยลูกเต๋าหกด้านที่ยุติธรรมเพียงครั้งเดียว ช่วงการทำนาย 95% ที่แน่นอนนั้นไม่มีอยู่จริง อย่างไรก็ตาม มีช่วงการทำนาย 95% ที่แน่นอนสำหรับการทอยลูกเต๋า 20 ด้าน ช่วงหนึ่งดังกล่าวคือเนื่องจาก95 % ของเวลาที่ทอยจะได้ผลลัพธ์เป็น 19 หรือน้อยกว่า และอีก 5% ที่เหลือจะได้ผลลัพธ์เป็น 20
ความแตกต่างที่สำคัญคือ ช่วงความเชื่อมั่นใช้ในการวัดความไม่แน่นอนในการประมาณค่าพารามิเตอร์ ในขณะที่ช่วงการทำนายใช้ในการวัดความไม่แน่นอนในการพยากรณ์ข้อมูลในอนาคต
การเปรียบเทียบกับช่วงความเชื่อมั่น
ในสถานการณ์ทั่วไปหลายอย่าง เช่น การประมาณค่าเฉลี่ยของการแจกแจงปกติที่มีความแปรปรวนที่ทราบ[ 13 ]ช่วงความเชื่อมั่นจะตรงกับช่วงความน่าเชื่อถือภายใต้ไพรเออร์ที่ไม่ให้ข้อมูล ในกรณีเช่นนี้ ความเข้าใจผิดทั่วไปเกี่ยวกับช่วงความเชื่อมั่น (เช่น การตีความว่าเป็นข้อความความน่าจะเป็นเกี่ยวกับพารามิเตอร์) อาจนำไปสู่ข้อสรุปที่ถูกต้องในทางปฏิบัติ
ตัวอย่างของปัญหาที่เกิดจากการตีความช่วงความเชื่อมั่นอย่างไม่รอบคอบ
ขั้นตอนความมั่นใจสำหรับการกำหนดตำแหน่งที่เป็นมาตรฐาน

เวลช์[ 14 ]นำเสนอตัวอย่างที่แสดงให้เห็นความแตกต่างระหว่างทฤษฎีช่วงความเชื่อมั่นและทฤษฎีการประมาณค่าช่วงอื่นๆ อย่างชัดเจน (รวมถึง ช่วง ความเชื่อมั่น ของฟิชเชอร์ และ ช่วง เบย์เซียน เชิงวัตถุประสงค์ ) โรบินสัน[ 15 ]เรียกตัวอย่างนี้ว่า "[อาจเป็นตัวอย่างค้านที่รู้จักกันดีที่สุดสำหรับทฤษฎีช่วงความเชื่อมั่นเวอร์ชันของเนย์แมน" สำหรับเวลช์ มันแสดงให้เห็นถึงความเหนือกว่าของทฤษฎีช่วงความเชื่อมั่น สำหรับนักวิจารณ์ของทฤษฎีนี้ มันแสดงให้เห็นถึงข้อบกพร่อง ในที่นี้เราจะนำเสนอเวอร์ชันที่เรียบง่ายกว่า
สมมติว่าเป็นการสังเกตที่เป็นอิสระจาก การกระจาย แบบเอกรูปดังนั้นขั้นตอนความเชื่อมั่น 50% ที่เหมาะสมที่สุดสำหรับคือ[ 16 ]
การใช้เหตุผลแบบเบย์เซียนเชิงอ้างอิงหรือเชิงวัตถุวิสัยสามารถนำมาใช้เพื่อหาค่าประมาณช่วงความ เชื่อมั่น ซึ่งเป็นกระบวนการความเชื่อมั่น 50% เช่นกัน เวลช์แสดงให้เห็นว่ากระบวนการความเชื่อมั่นแบบแรกนั้นดีกว่าแบบที่สอง ตามข้อกำหนดจากทฤษฎีช่วงความเชื่อมั่น กล่าวคือ สำหรับทุกค่า ความน่าจะเป็นที่กระบวนการแรกจะมี ค่า นั้นน้อยกว่าหรือเท่ากับความน่าจะเป็นที่กระบวนการที่สองจะมีค่า ความกว้างเฉลี่ยของช่วงความเชื่อมั่นจากกระบวนการแรกนั้นน้อยกว่าของกระบวนการที่สอง ดังนั้น กระบวนการแรกจึงเป็นที่ต้องการมากกว่าภายใต้ทฤษฎีช่วงความเชื่อมั่นแบบคลาสสิก
อย่างไรก็ตาม เมื่อช่วงความเชื่อมั่นจากขั้นตอนแรกรับประกันว่าจะครอบคลุมค่าที่แท้จริงดังนั้น ค่าสัมประสิทธิ์ความเชื่อมั่น 50% ที่ระบุไว้จึงไม่เกี่ยวข้องกับความไม่แน่นอนที่เราควรมีว่าช่วงความเชื่อมั่นเฉพาะนั้นจะครอบคลุมค่าที่แท้จริงหรือไม่ ขั้นตอนที่สองไม่มีคุณสมบัตินี้
ยิ่งไปกว่านั้น เมื่อกระบวนการแรกสร้างช่วงเวลาที่สั้นมาก นั่นแสดงว่าค่าต่างๆอยู่ใกล้กันมาก และจึงให้ข้อมูลได้เพียงจุดเดียวเท่านั้น อย่างไรก็ตาม ช่วงเวลาแรกจะตัดค่าพารามิเตอร์ที่สมเหตุสมผลเกือบทั้งหมดออกไปเนื่องจากความกว้างที่สั้น กระบวนการที่สองไม่มีคุณสมบัตินี้
คุณสมบัติสองประการที่ดูเหมือนจะขัดกับสามัญสำนึกของวิธีการแรก – การครอบคลุม 100% เมื่ออยู่ห่างกันมาก และการครอบคลุมเกือบ 0% เมื่ออยู่ใกล้กัน – จะหักล้างกันเพื่อให้ได้การครอบคลุมเฉลี่ย 50% อย่างไรก็ตาม แม้ว่าวิธีการแรกจะเป็นวิธีที่ดีที่สุด แต่ช่วงความเชื่อมั่นที่ได้นั้นไม่ได้ให้การประเมินความแม่นยำของการประมาณค่า หรือการประเมินความไม่แน่นอนที่ควรมีว่าช่วงความเชื่อมั่นนั้นครอบคลุมค่าที่แท้จริงหรือไม่
ตัวอย่างนี้ใช้เพื่อโต้แย้งการตีความช่วงความเชื่อมั่นแบบง่ายๆ หากมีการกล่าวอ้างว่ากระบวนการสร้างความเชื่อมั่นมีคุณสมบัติที่นอกเหนือไปจากความครอบคลุมตามปกติ (เช่น ความสัมพันธ์กับความแม่นยำ หรือความสัมพันธ์กับการอนุมานแบบเบย์เซียน) คุณสมบัติเหล่านั้นจะต้องได้รับการพิสูจน์ ไม่ใช่ว่ามันเป็นผลลัพธ์ที่เกิดขึ้นจากข้อเท็จจริงที่ว่ากระบวนการนั้นเป็นกระบวนการสร้างความเชื่อมั่น
ขั้นตอนความเชื่อมั่นสำหรับω 2
Steiger [ 17 ]แนะนำขั้นตอนความเชื่อมั่นจำนวนหนึ่งสำหรับ มาตรวัด ขนาดผลกระทบ ทั่วไป ในANOVA Morey et al. [ 10 ]ชี้ให้เห็นว่าขั้นตอนความเชื่อมั่นเหล่านี้หลายขั้นตอน รวมถึงขั้นตอนสำหรับω 2มีคุณสมบัติที่ว่าเมื่อ ค่าสถิติ Fเล็กลงเรื่อยๆ ซึ่งบ่งชี้ถึงความไม่สอดคล้องกับค่าที่เป็นไปได้ทั้งหมดของω 2ช่วงความเชื่อมั่นจะหดตัวลงและอาจมีเพียงค่าเดียวคือ ω 2 = 0 เท่านั้น นั่นคือ ช่วงความเชื่อมั่นแคบมาก (สิ่งนี้เกิดขึ้นเมื่อสำหรับช่วงความเชื่อมั่น)
พฤติกรรมนี้สอดคล้องกับความสัมพันธ์ระหว่างกระบวนการความเชื่อมั่นและการทดสอบนัยสำคัญ : เมื่อค่า Fมีขนาดเล็กมากจนค่าเฉลี่ยของกลุ่มอยู่ใกล้กันมากกว่าที่เราคาดหวังโดยบังเอิญ การทดสอบนัยสำคัญอาจบ่งชี้การปฏิเสธสำหรับค่าω² ส่วน ใหญ่ หรือทั้งหมด ดังนั้นช่วงความเชื่อมั่นจะแคบมากหรืออาจว่างเปล่า (หรือตามแบบแผนที่เสนอโดย Steiger จะมีเพียง 0 เท่านั้น) อย่างไรก็ตาม นี่ไม่ได้บ่งชี้ว่าการประมาณค่าω² นั้นแม่นยำมาก ในแง่หนึ่ง มันบ่งชี้ในทางตรงกันข้าม: ความน่าเชื่อถือของผลลัพธ์เองอาจเป็นที่น่าสงสัย ซึ่งขัดแย้งกับการตีความทั่วไปของช่วงความเชื่อมั่นที่ว่ามันแสดงให้เห็นถึงความแม่นยำของการประมาณค่า
ประวัติศาสตร์
วิธีการคำนวณช่วงความเชื่อมั่นสำหรับสัดส่วนทวินามปรากฏขึ้นตั้งแต่ทศวรรษ 1920 [ 18 ] [ 19 ]แนวคิดหลักของช่วงความเชื่อมั่นโดยทั่วไปได้รับการพัฒนาในช่วงต้นทศวรรษ 1930 [ 20 ] [ 21 ] [ 22 ]และคำอธิบายที่ละเอียดถี่ถ้วนและทั่วไปครั้งแรกนั้นจัดทำโดยJerzy Neymanในปี 1937 [ 7 ]
เนย์แมนอธิบายการพัฒนาแนวคิดดังต่อไปนี้ (หมายเลขอ้างอิงได้ถูกเปลี่ยนแปลง): [ 22 ]
[งานของผมเกี่ยวกับช่วงความเชื่อมั่น] เริ่มต้นขึ้นราวปี 1930 จากคำถามง่ายๆ ของวาคลอว์ ปิตคอฟสกี ซึ่งในขณะนั้นเป็นนักศึกษาของผมในวอร์ซอ และกำลังทำการศึกษาเชิงประจักษ์ด้านเศรษฐศาสตร์การเกษตร คำถามนั้นคือ: จะอธิบายความแม่นยำของค่าสัมประสิทธิ์การถดถอยที่ประมาณค่าได้โดยปราศจากอคติได้อย่างไร?...
งานเขียนของ Pytkowski ... ตีพิมพ์ในปี พ.ศ. 2475 [ 23 ]ปรากฏว่าก่อนหน้านั้นเล็กน้อย Fisher ได้ตีพิมพ์บทความแรกของเขา[ 24 ]ซึ่งเกี่ยวข้องกับการแจกแจงแบบฟิดูเชียลและข้อโต้แย้งแบบฟิดูเชียล ที่น่าประหลาดใจคือ แม้ว่ากรอบแนวคิดของข้อโต้แย้งแบบฟิดูเชียลจะแตกต่างจากช่วงความเชื่อมั่นโดยสิ้นเชิง แต่วิธีแก้ปัญหาเฉพาะบางอย่างกลับตรงกัน ดังนั้น ในบทความแรกที่ฉันนำเสนอทฤษฎีของช่วงความเชื่อมั่น ซึ่งตีพิมพ์ในปี พ.ศ. 2477 [ 20 ]ฉันยอมรับความสำคัญของ Fisher สำหรับแนวคิดที่ว่าการประมาณค่าช่วงสามารถทำได้โดยไม่ต้องอ้างอิงถึงทฤษฎีบทของ Bayes และวิธีแก้ปัญหานั้นเป็นอิสระจากความน่าจะเป็นล่วงหน้าในขณะเดียวกัน ฉันได้แนะนำอย่างสุภาพว่าแนวทางของ Fisher ในการแก้ปัญหานั้นเกี่ยวข้องกับความเข้าใจผิดเล็กน้อย
ในวารสารทางการแพทย์ ช่วงความเชื่อมั่นได้รับการส่งเสริมในช่วงทศวรรษ 1970 แต่เพิ่งมีการใช้งานอย่างแพร่หลายในช่วงทศวรรษ 1980 [ 25 ]ภายในปี 1988 วารสารทางการแพทย์กำหนดให้ต้องรายงานช่วงความเชื่อมั่น[ 26 ]
ช่วงความเชื่อมั่นสำหรับการแจกแจงเฉพาะ
- ช่วงความเชื่อมั่นสำหรับการแจกแจงทวินาม
- ช่วงความเชื่อมั่นสำหรับเลขชี้กำลังของการแจกแจงกฎกำลัง
- ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของการแจกแจงแบบเอกซ์โปเนนเชียล
- ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของการแจกแจงปัวซง
- ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยและความแปรปรวนของการแจกแจงปกติ ( ดูที่นี่ ด้วย )
- ช่วงความเชื่อมั่นสำหรับพารามิเตอร์ของการถดถอยเชิงเส้นอย่างง่าย
- ช่วงความเชื่อมั่นสำหรับความแตกต่างของค่าเฉลี่ย (อ้างอิงจากข้อมูลที่มีการแจกแจงแบบปกติ โดยไม่สมมติว่าความแปรปรวนเท่ากัน)
- ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วนสองค่า
ดูเพิ่มเติม
- ขีดจำกัดบนของ CL (ฟิสิกส์อนุภาค)
- กฎ 68–95–99.7
- ช่วงความเชื่อมั่นคือช่วงประมาณค่าสำหรับเส้นโค้ง
- การกระจายความเชื่อมั่น – แนวคิดในทางสถิติ
- ขอบเขตความเชื่อมั่น – รูปแบบหลายมิติของช่วงความเชื่อมั่น ซึ่งเป็นการขยายความในมิติที่สูงกว่า
- ความน่าเชื่อถือ (ทางสถิติ) – มาตรวัดความเข้มแข็งของความเชื่อที่ใช้ในทางสถิติ
- ช่วงความน่าเชื่อถือ (Credible interval ) ทางเลือกแบบเบย์เซียนสำหรับการประมาณช่วง
- ช่วงความเชื่อมั่นแบบไม่ใช้พารามิเตอร์ตามฟังก์ชันการกระจายสะสม – กลุ่มของช่วงความเชื่อมั่นรอบฟังก์ชันทางสถิติของการกระจาย
- แถบแสดงความคลาดเคลื่อน – การแสดงผลเชิงกราฟของความแปรปรวนของข้อมูล
- สถิติการประมาณค่า – แนวทางการวิเคราะห์ข้อมูลในสถิติแบบความถี่
- ค่าความคลาดเคลื่อนความกว้างครึ่งหนึ่งของช่วงความเชื่อมั่น
- ค่า p – ฟังก์ชันของผลลัพธ์ตัวอย่างที่สังเกตได้
- ช่วงการทำนายคือช่วงประมาณค่าสำหรับตัวแปรสุ่ม
- ข้อผิดพลาดที่อาจเกิดขึ้น
- ช่วงความเชื่อมั่นที่แข็งแกร่ง – ตัวชี้วัดทางสถิติของการเบี่ยงเบนของตัวอย่าง
บรรณานุกรม
- "การประมาณความเชื่อมั่น" , สารานุกรมคณิตศาสตร์ , EMS Press , 2001 [1994]
- Fisher, RA (1956) วิธีการทางสถิติและการอนุมานทางวิทยาศาสตร์ Oliver and Boyd, Edinburgh (ดูหน้า 32)
- Freund, JE (1962) สถิติทางคณิตศาสตร์ Prentice Hall, Englewood Cliffs, NJ. (ดูหน้า 227–228)
- แฮคกิ้ง, ไอ. (1965) ตรรกศาสตร์ของการอนุมานทางสถิติสำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ เคมบริดจ์ISBN 0-521-05165-7
- Keeping, ES (1962) บทนำสู่การอนุมานทางสถิติ D. Van Nostrand, Princeton, NJ.
- Kiefer, J. (1977). "ข้อความแสดงความเชื่อมั่นแบบมีเงื่อนไขและตัวประมาณความเชื่อมั่น (พร้อมการอภิปราย)". วารสารสมาคมสถิติอเมริกัน 72 ( 360a): 789– 827. doi : 10.1080/01621459.1977.10479956 . JSTOR 2286460 .
- Mayo, DG (1981) "ในการปกป้องทฤษฎีช่วงความเชื่อมั่นของ Neyman–Pearson"ปรัชญาของวิทยาศาสตร์ 48 (2), 269–280 . JSTOR 187185
- เมห์ตา, เอส. ( 2014) หัวข้อสถิติ ISBN 978-1-4992-7353-3.
- Morey, RD; Hoekstra, R.; Rouder, JN; Lee, MD; Wagenmakers, E.-J. (2016). "ความผิดพลาดในการวางความเชื่อมั่นในช่วงความเชื่อมั่น" Psychonomic Bulletin & Review . 23 (1): 103– 123. doi : 10.3758/s13423-015-0947-8 . PMC 4742505 . PMID 26450628 .
- เนย์แมน, เจ. (1937) "โครงร่างทฤษฎีการประมาณค่าทางสถิติโดยอิงจากทฤษฎีความน่าจะเป็นแบบคลาสสิก" วารสารปรัชญาของราชสมาคมแห่งลอนดอน A, 236 , 333–380 (ผลงานสำคัญ)
- Robinson, GK (1975). "ตัวอย่างคัดค้านบางประการต่อทฤษฎีช่วงความเชื่อมั่น" Biometrika . 62 (1): 155– 161. doi : 10.1093/biomet/62.1.155 . JSTOR 2334498 .
- Savage, LJ (1962), รากฐานของการอนุมานทางสถิติ Methuen, London.
- Smithson, M. (2003) ช่วงความเชื่อมั่นชุดการประยุกต์ใช้เชิงปริมาณในสังคมศาสตร์ เล่มที่ 140 เบลมอนต์ รัฐแคลิฟอร์เนีย: สำนักพิมพ์ SAGE ISBN 978-0-7619-2499-9.
ลิงก์ภายนอก
- โปรแกรมสาธิตการใช้งานซอฟต์แวร์สำรวจเพื่อคำนวณช่วงความเชื่อมั่นที่ทำงานภายใต้โปรแกรม Excel
- เครื่องคำนวณช่วงความเชื่อมั่นสำหรับค่า R-squared , สัมประสิทธิ์การถดถอยและจุดตัดแกน y ของการถดถอย
- ไวส์สไตน์, เอริค ดับเบิลยู. "ช่วงความเชื่อมั่น" . แมธเวิลด์ .
- CAUSEweb.orgมีแหล่งข้อมูลมากมายสำหรับการสอนสถิติ รวมถึงเรื่องช่วงความเชื่อมั่น
- บทนำเชิงโต้ตอบเกี่ยวกับช่วงความเชื่อมั่น
- ช่วงความเชื่อมั่น: ระดับความเชื่อมั่น ขนาดตัวอย่าง และค่าความคลาดเคลื่อนโดย เอริค ชูลซ์ จากโครงการสาธิตของวูล์ฟแรม
- ช่วงความเชื่อมั่นในสาธารณสุข (Confidence Intervals in Public Health) เก็บถาวรเมื่อ 2016-08-09 ที่Wayback Machineคำอธิบายที่เข้าใจง่ายพร้อมตัวอย่าง และสิ่งที่ควรทำเมื่อขนาดตัวอย่างเล็ก หรืออัตราใกล้เคียง 0
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ช่วงความเชื่อมั่น
ตามการอนุมานแบบความถี่ช่วงความเชื่อ มั่น ( CI ) คือช่วงของค่าที่น่าจะครอบคลุม (ในการสุ่มตัวอย่างซ้ำ) ค่าที่แท้จริงของพารามิเตอร์ทางสถิติ ที่ไม่ทราบค่า เช่นค่าเฉลี่ยของ ประชากร...
คำนิยาม
ให้เป็น ตัวอย่างสุ่ม จาก1 การแจกแจงความน่า จะ เป็นที่มี พารามิเตอร์ทางสถิติ โดยที่คือปริมาณที่ต้องการประมาณค่า ในขณะที่รวมถึงพารามิเตอร์อื่นๆ (ถ้ามี) ที่กำหนดการแจกแจง ช่วงความเชื่อมั่นสำหรับพารามิเตอร์ที่มีระดับความเชื่อมั่นหรือสัมประสิทธิ์คือช่วงที่กำหนดโดย...
วิธีการหาอนุพันธ์
มีหลายวิธีในการคำนวณช่วงความเชื่อมั่น และวิธีที่ดีที่สุดจะขึ้นอยู่กับสถานการณ์ สองวิธีที่ใช้กันอย่างแพร่หลายคือ บูตสแตรปปิ้ง และทฤษฎีบท ขีดจำกัดกลาง [ 2 ] วิธีหลังนี้ใช้ได้เฉพาะเมื่อตัวอย่างมีขนาดใหญ่...
ตัวอย่าง
สมมติว่าเป็น ตัวอย่าง อิสระ จาก ประชากร ที่มีการแจกแจงแบบปกติ โดยมีพารามิเตอร์ที่ไม่ทราบค่า คือ ค่าเฉลี่ย และ ความแปรปรวน กำหนด ค่าเฉลี่ยของตัวอย่าง และ ความแปรปรวนของตัวอย่างที่ไม่เอนเอียง ดังนี้ X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}} μ...