อ่าน 30 นาที
ทฤษฎีบทลิมิตกลาง
ใน ทฤษฎีความน่าจะเป็น ทฤษฎีบท ลิมิตกลาง ( CLT ) กล่าวว่า ภายใต้เงื่อนไขที่เหมาะสม การแจกแจง ของค่าเฉลี่ยตัวอย่างที่ถูกทำให้เป็นมาตรฐานจะลู่เข้าสู่ การแจกแจงปกติมาตรฐาน...
ทฤษฎีบทลิมิตกลาง
| พิมพ์ | ทฤษฎีบท |
|---|---|
| สนาม | ทฤษฎีความน่าจะเป็น |
| คำแถลง | ผลรวมที่ปรับขนาดแล้วของลำดับ ตัวแปรสุ่มอิสระ ที่มีการแจกแจงเหมือนกัน(iid)และ มี ค่าความแปรปรวน บวกจำกัด จะลู่เข้าสู่การแจกแจง ปกติใน เชิงการแจกแจง |
| การสรุปโดยทั่วไป | CLT ของลินเดเบิร์ก |
ในทฤษฎีความน่าจะเป็นทฤษฎีบทลิมิตกลาง ( CLT ) กล่าวว่า ภายใต้เงื่อนไขที่เหมาะสมการแจกแจงของค่าเฉลี่ยตัวอย่างที่ถูกทำให้เป็นมาตรฐานจะลู่เข้าสู่การแจกแจงปกติมาตรฐานแม้ว่าตัวแปรดั้งเดิมเองจะไม่ใช่ตัวแปรที่มีการแจกแจงปกติ ก็ตาม มีทฤษฎีบท CLT หลายเวอร์ชัน แต่ละเวอร์ชันใช้ในบริบทของเงื่อนไขที่แตกต่างกัน
ทฤษฎีบทนี้เป็นแนวคิดสำคัญในทฤษฎีความน่าจะเป็น เพราะมันบ่งชี้ว่าวิธีการทางความน่าจะเป็นและสถิติที่ใช้ได้กับการแจกแจงแบบปกติ สามารถนำไปประยุกต์ใช้กับปัญหาหลายอย่างที่เกี่ยวข้องกับการแจกแจงประเภทอื่นๆ ได้
ทฤษฎีบทนี้มีการเปลี่ยนแปลงหลายครั้งในระหว่างการพัฒนาทฤษฎีความน่าจะเป็นอย่างเป็นทางการ ทฤษฎีบทเวอร์ชันก่อนหน้านี้มีมาตั้งแต่ปี 1811 แต่ในรูปแบบที่ทันสมัยเพิ่งได้รับการระบุอย่างแม่นยำในช่วงทศวรรษ 1920 [ 1 ]
ในทางสถิติทฤษฎีบทขีดจำกัดส่วนกลาง (CLT) สามารถระบุได้ดังนี้: ให้แทนตัวอย่างทางสถิติขนาดจากประชากรที่มีค่าเฉลี่ยและความแปรปรวน บวกจำกัด และให้แทนค่าเฉลี่ยของตัวอย่าง (ซึ่งเป็นตัวแปรสุ่ม ) แล้วลิมิตเมื่อของการกระจายของจะเป็นการกระจายแบบปกติที่มีค่าเฉลี่ยและความแปรปรวน[ 2 ]
กล่าวอีกนัยหนึ่ง สมมติว่าได้ตัวอย่างข้อมูล จำนวนมาก โดยแต่ละค่าได้มาจากการสุ่มโดยไม่ขึ้นอยู่กับค่าของข้อมูลอื่นๆ และคำนวณค่าเฉลี่ย ( ค่าเฉลี่ยเลขคณิต ) ของค่าที่สังเกตได้ หากทำกระบวนการนี้ซ้ำหลายครั้งจนได้ค่าเฉลี่ยที่สังเกตได้จำนวนมาก ทฤษฎีบทลิมิตกลางกล่าวว่า หากขนาดตัวอย่างมีขนาดใหญ่พอการแจกแจงความน่าจะเป็นของค่าเฉลี่ยเหล่านี้จะใกล้เคียงกับการแจกแจงปกติ
ทฤษฎีบทลิมิตกลางมีหลายรูปแบบ ในรูปแบบทั่วไป ตัวแปรสุ่มต้องเป็นอิสระและมีการแจกแจงเหมือนกัน (iid) ข้อกำหนดนี้สามารถผ่อนปรนได้ การลู่เข้าของค่าเฉลี่ยไปยังการแจกแจงปกติเกิดขึ้นได้กับการแจกแจงที่ไม่เหมือนกันหรือกับการสังเกตที่ไม่เป็นอิสระ หากเป็นไปตามเงื่อนไขบางประการ
ทฤษฎีบทที่เก่าแก่ที่สุดที่กล่าวว่าการแจกแจงปกติสามารถใช้เป็นค่าประมาณของการแจกแจงทวินามได้คือทฤษฎีบทเดอ มัวร์-ลาปลาส
ลำดับอิสระ

CLT แบบคลาสสิก
ให้เป็นลำดับของตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกัน (iid) โดยมีค่าเฉลี่ยกำหนดโดยและความแปรปรวน จำกัด กำหนดโดยสมมติว่าเราสนใจค่าเฉลี่ยของตัวอย่าง
ตามกฎของจำนวนมากค่าเฉลี่ยของตัวอย่าง จะลู่เข้าสู่ ค่าที่คาดหวังเกือบแน่นอน (และดังนั้นจึงลู่เข้าในเชิงความน่าจะเป็น ด้วย) เมื่อ
ทฤษฎีบทลิมิตกลางแบบคลาสสิกอธิบายขนาดและรูปแบบการกระจายตัวของ ความผันผวน แบบสุ่มรอบ ๆ จำนวนเชิงกำหนดในระหว่างการลู่เข้าดังกล่าว กล่าวคือ ทฤษฎีบทนี้ระบุว่า เมื่อมีค่ามากขึ้น การกระจายตัวของค่าเฉลี่ยปกติ (normalized mean ) ซึ่งก็คือผลต่างระหว่างค่าเฉลี่ยของตัวอย่างกับลิมิตที่ปรับขนาดด้วยตัวประกอบจะเข้าใกล้การกระจายแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนสำหรับค่า ที่มากพอการกระจายตัวของจะเข้าใกล้การกระจายแบบปกติที่มีค่าเฉลี่ยและความแปรปรวน อย่างไม่จำกัด
ประโยชน์ของทฤษฎีบทนี้คือ การกระจายตัวจะเข้าใกล้การกระจายแบบปกติโดยไม่คำนึงถึงรูปร่างของการกระจายตัวของแต่ละบุคคลในทางทฤษฎีบทนี้สามารถกล่าวได้ดังนี้:
ทฤษฎีบทขีดจำกัดกลางของ Lindeberg–Lévy —สมมติว่าเป็นลำดับของตัวแปรสุ่มอิสระที่มีและจากนั้น เมื่อเข้าใกล้อนันต์ ตัวแปรสุ่ม จะลู่เข้า สู่การแจกแจงปกติ : [ 4 ]
ในกรณีของการลู่เข้าในการกระจาย หมายความว่าฟังก์ชันการกระจายสะสมลู่เข้าแบบจุดต่อจุดไปยังฟังก์ชันการกระจายสะสมของการกระจาย: สำหรับจำนวนจริงทุกจำนวน
ฟังก์ชันการกระจายสะสมปกติมาตรฐานที่ประเมินค่า ณจุดใดการลู่เข้าเป็นแบบสม่ำเสมอในแง่ที่ว่า
โดยที่หมายถึงค่าสูงสุด (เช่น ขอบเขตบนที่น้อยที่สุด) ของเซต[ 5 ]
Lyapunov CLT
ในทฤษฎีบทลิมิตกลางรูปแบบนี้ ตัวแปรสุ่มต้องเป็นอิสระต่อกัน แต่ไม่จำเป็นต้องมีการกระจายแบบเดียวกัน ทฤษฎีบทนี้ยังต้องการให้ตัวแปรสุ่มมีโมเมนต์ลำดับใดลำดับหนึ่งและอัตราการเติบโตของโมเมนต์เหล่านี้ถูกจำกัดโดยเงื่อนไขของ Lyapunov ที่ระบุไว้ด้านล่าง
ทฤษฎีบทขีดจำกัด ส่วนกลาง ของ Lyapunov [ 6 ] —สมมติว่าเป็นลำดับของตัวแปรสุ่มอิสระ แต่ละตัวมีค่าคาดหวังจำกัดและค่าความแปรปรวนกำหนด
หากสำหรับบางคนเงื่อนไขของ Lyapunov
หากเป็นไปตามเงื่อนไข ผลรวมของค่าจะลู่เข้าสู่ตัวแปรสุ่มปกติมาตรฐานเมื่อค่าเข้าสู่อนันต์:
ในทางปฏิบัติ วิธีที่ง่ายที่สุดมักจะเป็นการตรวจสอบเงื่อนไขของ Lyapunov สำหรับ
หากลำดับของตัวแปรสุ่มเป็นไปตามเงื่อนไขของ Lyapunov แล้ว ลำดับนั้นก็จะเป็นไปตามเงื่อนไขของ Lindeberg ด้วย อย่างไรก็ตาม ข้อสรุปในทางกลับกันนั้นไม่เป็นจริง
ลินเดเบิร์ก (-เฟลเลอร์) ซีแอลที
ในบริบทเดียวกันและใช้สัญลักษณ์เดียวกันกับข้างต้น เงื่อนไขของ Lyapunov สามารถแทนที่ด้วยเงื่อนไขที่อ่อนกว่าต่อไปนี้ (จากLindebergในปี 1920)
สมมติว่าสำหรับทุกๆ
ฟังก์ชันตัวบ่งชี้อยู่ที่ไหนจากนั้นการกระจายของผลรวมมาตรฐาน
ลู่เข้าสู่การแจกแจงปกติมาตรฐาน
ทฤษฎีบทขีดจำกัดส่วนกลางสำหรับผลรวมของตัวแปรสุ่มจำนวนหนึ่ง
แทนที่จะบวกจำนวนเต็มของตัวแปรสุ่มแล้วเลือกค่าสุดท้าย การบวกนั้นอาจเป็นการบวกจำนวนสุ่มของตัวแปรสุ่ม โดยมีเงื่อนไขเกี่ยวกับค่าสุดท้ายตัวอย่างเช่น ทฤษฎีบทต่อไปนี้เป็นบทสรุปที่ 4 ของ Robbins (1948) ซึ่งสมมติว่าค่าสุดท้ายมีการแจกแจงแบบปกติเชิงอะซิมโทติก (Robbins ยังได้พัฒนาเงื่อนไขอื่นๆ ที่นำไปสู่ผลลัพธ์เดียวกันด้วย)
Robbins CLT [ 7 ] [ 8 ] —ให้เป็นตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกัน โดยที่และและให้เป็นลำดับของตัวแปรสุ่มที่มีค่าเป็นจำนวนเต็มที่ไม่เป็นลบซึ่งเป็นอิสระจากสมมติว่าสำหรับแต่ละที่และ
โดยที่หมายถึงการลู่เข้าในการกระจาย และคือการกระจายแบบปกติที่มีค่าเฉลี่ย 0 และความแปรปรวน 1 ดังนั้น
CLT แบบหลายมิติ
บทพิสูจน์ที่ใช้ฟังก์ชันลักษณะเฉพาะสามารถขยายไปยังกรณีที่แต่ละบุคคลเป็นเวกเตอร์สุ่มในโดยมีเวกเตอร์ค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วม (ระหว่างส่วนประกอบของเวกเตอร์) และเวกเตอร์สุ่มเหล่านี้เป็นอิสระและมีการกระจายเหมือนกัน ทฤษฎีบทขีดจำกัดกลางหลายมิติระบุว่าเมื่อปรับขนาด ผลรวมจะลู่เข้าสู่การกระจายปกติหลายตัวแปร [ 9 ] การรวมเวกเตอร์เหล่านี้ทำทีละส่วนประกอบ
เพื่อปล่อย
เป็นเวกเตอร์สุ่มอิสระ ผลรวมของเวกเตอร์สุ่มคือ
และค่าเฉลี่ยของพวกเขาคือ
ดังนั้น,
ทฤษฎีบทลิมิตกลางแบบหลายตัวแปรกล่าวว่า
โดยที่เมทริกซ์ความแปรปรวน ร่วมเท่ากับ
ทฤษฎีบทขีดจำกัดกลางแบบหลายตัวแปรสามารถพิสูจน์ได้โดยใช้ทฤษฎีบทCramér–Wold [ 9 ]
อัตราการลู่เข้าแสดงโดยผลลัพธ์ประเภท Berry–Esseen ดังต่อไปนี้:
ทฤษฎีบท[ 10 ] —ให้เป็นเวกเตอร์สุ่มอิสระที่มีค่าเป็นศูนย์ โดยแต่ละเวกเตอร์มีค่าเฉลี่ยเป็นศูนย์ เขียนและสมมติว่าสามารถผกผันได้ ให้เป็นเกาส์เซียนมิติ ที่มีค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วมเดียวกันกับ แล้วสำหรับ เซตเว้าทั้งหมด
โดยที่เป็นค่าคงที่สากลและแทนค่าบรรทัดฐานยุคลิดบน
ยังไม่ทราบว่าปัจจัยนี้จำเป็นหรือไม่[ 11 ]
ทฤษฎีบทลิมิตกลางทั่วไป
ทฤษฎีบทขีดจำกัดกลางทั่วไป (GCLT) เป็นความพยายามของนักคณิตศาสตร์หลายคน ( เซอร์เกย์ เบิร์นสไตน์ , จาร์ล วัลเดมาร์ ลินเดเบิร์ก , พอล เลวี , วิลเลียม เฟลเลอ ร์ , อังเดรย์ โคลโมโกโรฟและคนอื่นๆ) ในช่วงระหว่างปี 1920 ถึง 1937 [ 12 ]การพิสูจน์ GCLT ฉบับสมบูรณ์ที่ตีพิมพ์ครั้งแรกคือในปี 1937 โดยพอล เลวี เป็นภาษาฝรั่งเศส[ 13 ]ฉบับภาษาอังกฤษของการพิสูจน์ GCLT ฉบับสมบูรณ์มีอยู่ในหนังสือแปลของบอริส วลาดิมิโรวิช กเนเดนโกและโคลโมโกโรฟในปี 1954 [ 14 ]
คำแถลงของ GCLT มีดังนี้: [ 15 ]
คำกล่าวของGCLT —ตัวแปรสุ่มที่ไม่เสื่อมสภาพZมีเสถียรภาพαสำหรับบาง0 < α ≤ 2ก็ต่อเมื่อมีลำดับของตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกันX 1 , X 2 , X 3 , ... และค่าคงที่a n > 0 , b n ∈ ℝโดย ที่' → 'หมายความว่าลำดับของผลรวมของตัวแปรสุ่มลู่เข้าในการแจกแจง กล่าวคือ การแจกแจงที่สอดคล้องกันเป็นไปตามF n ( y ) → F ( y )ที่จุดต่อเนื่องทั้งหมดของ F
กล่าวอีกนัยหนึ่ง ถ้าผลรวมของตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกันลู่เข้าสู่การแจกแจงZ ใดๆ แล้วZจะต้องเป็นการแจกแจงแบบเสถียร
กระบวนการที่ขึ้นอยู่กัน
CLT ภายใต้การพึ่งพาที่อ่อนแอ
การสรุปทั่วไปที่มีประโยชน์ของลำดับของตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกัน คือ กระบวนการสุ่มแบบ ผสมในเวลาแบบไม่ต่อเนื่อง "การผสม" หมายความว่า ตัวแปรสุ่มที่อยู่ห่างกันในเชิงเวลาจะมีความเป็นอิสระต่อกันเกือบทั้งหมด มีการใช้การผสมหลายประเภทในทฤษฎีเออร์โกดิกและทฤษฎีความน่าจะเป็น โดยเฉพาะอย่างยิ่งการผสมแบบเข้มข้น (เรียกอีกอย่างว่า α-mixing) ซึ่งกำหนดโดย โดยที่คือ สัมประสิทธิ์การผสม แบบ เข้มข้น
การกำหนดสูตรอย่างง่ายของทฤษฎีบทขีดจำกัดกลางภายใต้การผสมที่แข็งแกร่งคือ: [ 16 ]
ทฤษฎีบท—สมมติว่าอยู่กับที่และผสม โดยที่ และ. กำหนดให้แล้วลิมิต
มีอยู่จริง และถ้ามีอยู่จริงก็จะลู่เข้าสู่การกระจายตัวที่
ในความเป็นจริง,
โดยที่อนุกรมนี้มาบรรจบกันอย่างสมบูรณ์
ข้อสมมติฐานนี้ไม่สามารถละเว้นได้ เนื่องจากความเป็นปกติเชิงอะซิมโทติกไม่เป็นจริงสำหรับกรณีที่ เป็น ลำดับคงที่ อีก ชุด หนึ่ง
มีทฤษฎีบทเวอร์ชันที่แข็งแกร่งกว่า: [ 17 ]สมมติฐานถูกแทนที่ด้วยและสมมติฐานถูกแทนที่ด้วย
การมีอยู่ของสิ่งดังกล่าวทำให้มั่นใจได้ถึงข้อสรุป สำหรับการศึกษาเชิงลึกเกี่ยวกับทฤษฎีบทลิมิตภายใต้เงื่อนไขการผสม โปรดดู ( Bradley 2007 )
ผลต่างมาร์ติงเกล CLT
ทฤษฎีบท—ให้มาร์ติงเกล สอดคล้องกับเงื่อนไขต่อไปนี้
- ในความน่าจะเป็นเมื่อn → ∞
- สำหรับทุกε > 0 เมื่อn → ∞
หมายเหตุ
การพิสูจน์ทฤษฎีบทขีดจำกัดกลางแบบคลาสสิก
ทฤษฎีบทลิมิตกลางมีการพิสูจน์โดยใช้ฟังก์ชันลักษณะเฉพาะ [ 20 ] ซึ่งคล้ายกับการพิสูจน์กฎจำนวนมาก (แบบอ่อน )
สมมติให้และ เป็นตัวแปรสุ่มอิสระและมีการแจกแจงเหมือนกัน โดยแต่ละตัวมีค่าเฉลี่ยและค่าความแปรปรวนจำกัดผลรวมของมีค่าเฉลี่ยและค่าความแปรปรวนพิจารณาตัวแปรสุ่ม
โดยขั้นตอนสุดท้ายจะกำหนดตัวแปรสุ่มใหม่แต่ละตัวซึ่งมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง( )ฟังก์ชันลักษณะเฉพาะของจะกำหนดโดย
โดยขั้นตอนสุดท้ายอาศัยข้อเท็จจริงที่ว่าตัวแปรทั้งหมดมีการแจกแจงแบบเดียวกัน ฟังก์ชันลักษณะเฉพาะของตัวแปรคือ ตามทฤษฎีบทของเทย์เลอร์
โดยที่" สัญลักษณ์oเล็ก " หมายถึงฟังก์ชันบางอย่างของ ที่เข้าใกล้ศูนย์ เร็วกว่าโดยลิมิตของฟังก์ชันเลขชี้กำลัง( )ฟังก์ชันลักษณะเฉพาะของเท่ากับ
พจน์ลำดับสูงทั้งหมดจะหายไปในลิมิตด้านขวามือเท่ากับฟังก์ชันลักษณะเฉพาะของการแจกแจงปกติมาตรฐานซึ่งหมายความว่าตามทฤษฎีบทความต่อเนื่องของเลวีการแจกแจงของจะเข้าใกล้เมื่อดังนั้น ค่าเฉลี่ย ของตัวอย่าง
เป็นเช่นนั้น
ลู่เข้าสู่การแจกแจงปกติซึ่งเป็นที่มาของทฤษฎีบทลิมิตกลาง
การลู่เข้าสู่ลิมิต
ทฤษฎีบทลิมิตกลางให้การแจกแจงเชิงอะซิมโทติก เท่านั้น ในฐานะการประมาณค่าสำหรับจำนวนข้อมูลที่จำกัด มันให้การประมาณค่าที่เหมาะสมเฉพาะเมื่ออยู่ใกล้จุดสูงสุดของการแจกแจงปกติเท่านั้น ต้องใช้จำนวนข้อมูลที่มากอย่างยิ่งจึงจะครอบคลุมไปถึงส่วนหางของการแจกแจงได้
การลู่เข้าในทฤษฎีบทลิมิตกลางเป็นแบบสม่ำเสมอเนื่องจากฟังก์ชันการกระจายสะสมลิมิตมีความต่อเนื่อง หากโมเมนต์ กลางที่สาม มีอยู่และมีค่าจำกัด ความเร็วของการลู่เข้าจะอย่างน้อยก็อยู่ในลำดับของ(ดูทฤษฎีบท Berry–Esseen ) วิธีของ Stein [ 21 ]ไม่เพียงแต่ใช้เพื่อพิสูจน์ทฤษฎีบทลิมิตกลางเท่านั้น แต่ยังใช้เพื่อกำหนดขอบเขตของอัตราการลู่เข้าสำหรับเมตริกที่เลือกอีกด้วย[ 22 ]
การลู่เข้าสู่การแจกแจงปกติเป็นแบบโมโนโทนิก ในแง่ที่ว่าเอนโทรปีจะเพิ่มขึ้นแบบโมโนโทนิกไปสู่เอนโทรปีของการแจกแจงปกติ[ 23 ]
ทฤษฎีบทลิมิตกลางใช้ได้โดยเฉพาะกับผลรวมของตัวแปรสุ่มแบบไม่ ต่อเนื่องที่เป็นอิสระและมีการแจกแจงเหมือนกัน ผลรวมของตัวแปรสุ่มแบบไม่ต่อเนื่องยังคงเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องดังนั้นเราจึงเผชิญกับลำดับของตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งฟังก์ชันการแจกแจงความน่าจะเป็นสะสมลู่เข้าสู่ฟังก์ชันการแจกแจงความน่าจะเป็นสะสมที่สอดคล้องกับตัวแปรต่อเนื่อง (นั่นคือการแจกแจงปกติ ) ซึ่งหมายความว่าถ้าเราสร้างฮิสโตแกรม ของค่าที่เกิดขึ้นจริง ของผลรวมของ ตัวแปรสุ่มแบบไม่ต่อเนื่องที่เป็นอิสระและเหมือนกัน nตัว เส้นโค้งเชิงเส้นแบบเป็นช่วงที่เชื่อมจุดศูนย์กลางของหน้าด้านบนของสี่เหลี่ยมผืนผ้าที่ประกอบเป็นฮิสโตแกรมจะลู่เข้าสู่เส้นโค้งเกาส์เซียนเมื่อnเข้าใกล้ค่าอนันต์ ความสัมพันธ์นี้เรียกว่าทฤษฎีบทเดอ มัวร์-ลาปลา ซ บทความเกี่ยวกับ การแจกแจงทวินามได้อธิบายรายละเอียดการประยุกต์ใช้ทฤษฎีบทลิมิตกลางในกรณีง่ายๆ ของตัวแปรแบบไม่ต่อเนื่องที่มีค่าที่เป็นไปได้เพียงสองค่า
ความเข้าใจผิดทั่วไป
การศึกษาแสดงให้เห็นว่าทฤษฎีบทลิมิตกลางมีความเข้าใจผิดที่พบได้ทั่วไปแต่ร้ายแรงหลายประการ ซึ่งบางส่วนปรากฏอยู่ในตำราเรียนที่ใช้กันอย่างแพร่หลาย[ 24 ] [ 25 ] [ 26 ]ซึ่งรวมถึง:
- ความเชื่อที่ผิดพลาดที่ว่าทฤษฎีบทนี้ใช้ได้กับการสุ่มตัวอย่างตัวแปรใดๆ เท่านั้น ไม่ใช่ค่าเฉลี่ย (หรือผลรวม) ของ ตัวแปรสุ่ม อิสระและ มีการกระจายเหมือนกัน (iid) ที่ได้จากการสุ่มตัวอย่างซ้ำๆ ในประชากร กล่าวคือ ทฤษฎีบทนี้สมมติว่าการสุ่มตัวอย่างทำให้เกิดการกระจายตัวอย่างที่เกิดจากค่าเฉลี่ย (หรือผลรวม) ที่แตกต่างกันของตัวแปรสุ่มเหล่านั้น
- ความเชื่อที่ผิดพลาดที่ว่าทฤษฎีบทนี้รับประกันว่าการสุ่มตัวอย่างจะนำไปสู่การเกิดการแจกแจงแบบปกติสำหรับตัวอย่างที่มีขนาดใหญ่เพียงพอของตัวแปรสุ่มใดๆ โดยไม่คำนึงถึงการแจกแจงของประชากร ในความเป็นจริง การสุ่มตัวอย่างดังกล่าวจะจำลองคุณสมบัติของประชากรในเชิงอนุกรม ซึ่งเป็นผลลัพธ์ที่เข้าใจได้ง่ายซึ่งได้รับการสนับสนุนโดยทฤษฎีบทของ Glivenko– Cantelli
- ความเชื่อที่ผิดพลาดที่ว่าทฤษฎีบทนำไปสู่การประมาณค่าที่ดีของการกระจายแบบปกติสำหรับขนาดตัวอย่างที่มากกว่าประมาณ 30 [ 27 ]ทำให้สามารถอนุมานได้อย่างน่าเชื่อถือโดยไม่คำนึงถึงลักษณะของประชากร ในความเป็นจริง กฎเกณฑ์เชิงประจักษ์นี้ไม่มีเหตุผลที่ถูกต้อง และอาจนำไปสู่การอนุมานที่ผิดพลาดอย่างร้ายแรง ดูการทดสอบ Zสำหรับกรณีที่การประมาณค่านี้ใช้ได้
ความสัมพันธ์กับกฎของจำนวนมาก
กฎของจำนวนมากและทฤษฎีบทลิมิตกลางเป็นเพียงคำตอบบางส่วนของปัญหาทั่วไปที่ว่า "พฤติกรรมลิมิตของS nเมื่อnเข้าใกล้อินฟินิตี้เป็นอย่างไร" ในการวิเคราะห์ทางคณิตศาสตร์อนุกรมเชิงเส้นกำกับเป็นหนึ่งในเครื่องมือที่นิยมใช้มากที่สุดในการตอบคำถามดังกล่าว
สมมติว่าเรามีการขยายอนุกรมเชิงอะซิมโทติกของ:
การหารทั้งสองส่วนด้วยφ 1 ( n )และการหาลิมิตจะทำให้ได้ค่า a 1ซึ่งเป็นสัมประสิทธิ์ของพจน์ลำดับสูงสุดในการขยาย ซึ่งแสดงถึงอัตราที่f ( n )เปลี่ยนแปลงในพจน์นำหน้า
โดยคร่าวๆ อาจกล่าวได้ว่า " f ( n ) เติบโตโดยประมาณเป็น1φ1 ( n ) "เมื่อนำผลต่างระหว่างf ( n )กับค่าประมาณของมัน แล้วหารด้วยพจน์ถัดไปในการกระจาย เราจะได้ข้อความที่ละเอียดขึ้นเกี่ยวกับf ( n ) ดังนี้ :
ในที่นี้อาจกล่าวได้ว่าความแตกต่างระหว่างฟังก์ชันและค่าประมาณของฟังก์ชันนั้นเพิ่มขึ้นโดยประมาณเป็น2φ2 ( n )แนวคิด ก็คือ การหารฟังก์ชันด้วยฟังก์ชันมาตรฐาน ที่ เหมาะสม และการพิจารณาพฤติกรรมลิมิตของผลลัพธ์ สามารถบอกเรา ได้มากเกี่ยวกับพฤติกรรมลิมิตของฟังก์ชันดั้งเดิมเอง
โดยคร่าวๆ แล้ว สิ่งทำนองนี้เกิดขึ้นเมื่อศึกษา ผลรวม S nของตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกันX 1 , ..., X n ในทฤษฎีความน่าจะเป็นแบบคลาสสิก ถ้าแต่ละ X iมีค่าเฉลี่ยจำกัดμแล้วตามกฎของจำนวนมากสน/n→ μ . [ 28 ] นอกจากนี้ หากแต่ละ X i มีความ แปรปรวนจำกัด σ 2แล้วโดยทฤษฎีบทขีดจำกัดกลาง
โดยที่ξมีการแจกแจงแบบN (0, σ 2 )ซึ่งจะให้ค่าคงที่สองค่าแรกในการขยายแบบไม่เป็นทางการ
ในกรณีที่X iไม่มีค่าเฉลี่ยหรือความแปรปรวนที่จำกัด การลู่เข้าของผลรวมที่เลื่อนและปรับขนาดใหม่สามารถเกิดขึ้นได้ด้วยปัจจัยการจัดศูนย์กลางและการปรับขนาดที่แตกต่างกัน:
หรืออย่างไม่เป็นทางการ
การแจกแจงΞที่สามารถเกิดขึ้นได้ในลักษณะนี้เรียกว่า การ แจกแจงเสถียร[ 29 ] เห็นได้ชัดว่าการแจกแจงปกติเป็นการแจกแจงเสถียร แต่ยังมีรูปแบบการแจกแจงเสถียรอื่นๆ อีก เช่นการแจกแจงโคชีซึ่งค่าเฉลี่ยหรือความแปรปรวนไม่ได้ถูกกำหนดไว้ ปัจจัยการปรับขนาดb nอาจเป็นสัดส่วนกับn cสำหรับc ≥ ใดๆ1/2;นอกจากนี้ยังสามารถคูณด้วยฟังก์ชันที่เปลี่ยนแปลงช้าๆของ nได้ อีกด้วย [ 30 ] [ 31 ]
กฎของลอการิทึมซ้ำระบุสิ่งที่เกิดขึ้น "ระหว่าง" กฎของจำนวนมากและทฤษฎีบทลิมิตกลาง โดยเฉพาะอย่างยิ่งกล่าวว่าฟังก์ชันปรับค่ามาตรฐาน√n log log nซึ่งมีขนาดอยู่ระหว่างnของกฎของจำนวนมากและ√nของทฤษฎีบทลิมิตกลาง ให้พฤติกรรมลิมิตที่ไม่ธรรมดา
ข้อความทางเลือกของทฤษฎีบท
ฟังก์ชันความหนาแน่น
ความหนาแน่นของผลรวมของตัวแปรอิสระสองตัวขึ้นไปคือการสังเคราะห์ของความหนาแน่นของตัวแปรเหล่านั้น (ถ้าความหนาแน่นเหล่านี้มีอยู่) ดังนั้นทฤษฎีบทลิมิตกลางจึงสามารถตีความได้ว่าเป็นข้อความเกี่ยวกับคุณสมบัติของฟังก์ชันความหนาแน่นภายใต้การสังเคราะห์: การสังเคราะห์ของฟังก์ชันความหนาแน่นจำนวนหนึ่งมีแนวโน้มที่จะเป็นความหนาแน่นปกติเมื่อจำนวนฟังก์ชันความหนาแน่นเพิ่มขึ้นอย่างไม่มีขอบเขต ทฤษฎีบทเหล่านี้ต้องการสมมติฐานที่แข็งแกร่งกว่ารูปแบบของทฤษฎีบทลิมิตกลางที่กล่าวมาข้างต้น ทฤษฎีบทประเภทนี้มักเรียกว่าทฤษฎีบทลิมิตเฉพาะที่ ดู Petrov [ 32 ]สำหรับทฤษฎีบทลิมิตเฉพาะที่สำหรับผลรวมของตัวแปรสุ่มอิสระและมีการแจกแจงเหมือนกัน
ฟังก์ชันลักษณะเฉพาะ
เนื่องจากฟังก์ชันลักษณะเฉพาะของการสังเคราะห์คือผลคูณของฟังก์ชันลักษณะเฉพาะของความหนาแน่นที่เกี่ยวข้อง ทฤษฎีบทลิมิตกลางจึงมีการกล่าวซ้ำอีกแบบหนึ่งคือ ผลคูณของฟังก์ชันลักษณะเฉพาะของฟังก์ชันความหนาแน่นจำนวนหนึ่งจะเข้าใกล้ฟังก์ชันลักษณะเฉพาะของความหนาแน่นปกติเมื่อจำนวนฟังก์ชันความหนาแน่นเพิ่มขึ้นอย่างไม่มีขีดจำกัด ภายใต้เงื่อนไขที่กล่าวไว้ข้างต้น โดยเฉพาะอย่างยิ่ง ต้องใช้ตัวประกอบการปรับขนาดที่เหมาะสมกับอาร์กิวเมนต์ของฟังก์ชันลักษณะเฉพาะ
สามารถกล่าวในทำนองเดียวกันได้เกี่ยวกับการแปลงฟูริเยร์เนื่องจากฟังก์ชันลักษณะเฉพาะนั้นโดยพื้นฐานแล้วคือการแปลงฟูริเยร์
การคำนวณความแปรปรวน
ให้S nเป็นผลรวมของ ตัวแปรสุ่ม nตัว ทฤษฎีบทลิมิตกลางหลายทฤษฎีให้เงื่อนไขที่ทำให้S n / √ Var( S n )ลู่เข้าสู่การแจกแจงN (0,1) (การแจกแจงปกติที่มีค่าเฉลี่ย 0 และความแปรปรวน 1) เมื่อn → ∞ในบางกรณี อาจสามารถหาค่าคงที่σ 2และฟังก์ชันf(n)ได้ที่ทำให้S n /(σ √ n⋅f ( n ) )ลู่เข้าสู่การแจกแจงN (0,1)เมื่อn → ∞
เลมมา[ 33 ] —สมมติว่าเป็นลำดับของตัวแปรสุ่มที่มีค่าจริงและคงที่อย่างเคร่งครัด โดยที่สำหรับทุก, ,และ.สร้าง
- ถ้าลู่เข้าอย่างสมบูรณ์และแล้วเมื่อโดยที่
- ถ้านอกจากนี้แล้วและลู่เข้าสู่การกระจายตัวแบบas แล้วก็จะลู่เข้าสู่การกระจายตัวแบบas เช่นกัน
ส่วนขยาย
ผลคูณของตัวแปรสุ่มบวก
ลอการิทึม ของผลคูณก็คือผลรวมของลอการิทึมของตัวประกอบ นั่นเองดังนั้น เมื่อลอการิทึมของผลคูณของตัวแปรสุ่มที่รับค่าบวกเท่านั้นเข้าใกล้การแจกแจงแบบปกติ ผลคูณนั้นเองก็จะเข้าใกล้การแจกแจงแบบลอการิทึมปกติด้วย ปริมาณทางกายภาพหลายอย่าง (โดยเฉพาะมวลหรือความยาว ซึ่งเป็นเรื่องของขนาดและไม่สามารถเป็นค่าลบได้) เป็นผลคูณของ ตัวประกอบ สุ่ม ต่างๆ ดังนั้นจึงมีการแจกแจงแบบลอการิทึมปกติ กฎการคูณนี้ซึ่งเป็นเวอร์ชันของทฤษฎีบทขีดจำกัดกลาง บางครั้งเรียกว่ากฎของกิบรัต
ในขณะที่ทฤษฎีบทขีดจำกัดกลางสำหรับผลรวมของตัวแปรสุ่มต้องการเงื่อนไขของความแปรปรวนที่จำกัด ทฤษฎีบทที่สอดคล้องกันสำหรับผลคูณต้องการเงื่อนไขที่สอดคล้องกันว่าฟังก์ชันความหนาแน่นสามารถหาปริพันธ์กำลังสองได้[ 34 ]
นอกเหนือจากกรอบแนวคิดแบบดั้งเดิม
ความปกติเชิงอะซิมโทติก กล่าวคือการลู่เข้าสู่การแจกแจงปกติหลังจากมีการเลื่อนและการปรับขนาดที่เหมาะสม เป็นปรากฏการณ์ที่ทั่วไปกว่ากรอบแนวคิดแบบคลาสสิกที่กล่าวถึงข้างต้นมาก นั่นคือ ผลรวมของตัวแปรสุ่มอิสระ (หรือเวกเตอร์) กรอบแนวคิดใหม่ๆ ถูกเปิดเผยออกมาเป็นระยะๆ ปัจจุบันยังไม่มีกรอบแนวคิดที่เป็นเอกภาพเพียงกรอบเดียว
วัตถุนูน
ทฤษฎีบท—มีลำดับε n ↓ 0 อยู่ ซึ่งเป็นไปตามเงื่อนไขต่อไปนี้ ให้n ≥ 1และให้ตัวแปรสุ่มX 1 , ..., X nมีความหนาแน่นร่วมแบบ log-concave fโดยที่f ( x 1 , ..., x n ) = f (| x 1 |, ..., | x n |)สำหรับทุกx 1 , ..., x nและE( X )2k) = 1สำหรับทุกk = 1, ..., nจากนั้นการแจกแจงของ
การแจกแจง εn - close ทั้งสองนี้มีฟังก์ชันความหนาแน่น (อันที่จริงคือฟังก์ชันความหนาแน่นแบบ log-concave) ดังนั้น ระยะห่างของความแปรปรวนรวมระหว่างการแจกแจงทั้งสองนี้จึงเป็นปริพันธ์ของค่าสัมบูรณ์ของผลต่างระหว่างฟังก์ชันความหนาแน่น การลู่เข้าในความแปรปรวนรวมนั้นแข็งแกร่งกว่าการลู่เข้าแบบอ่อน
ตัวอย่างที่สำคัญของฟังก์ชันความหนาแน่นแบบลอการิทึมเว้า คือ ฟังก์ชันที่มีค่าคงที่ภายในทรงนูนที่กำหนด และมีค่าเป็นศูนย์ภายนอก ซึ่งสอดคล้องกับการกระจายแบบสม่ำเสมอบนทรงนูน และเป็นที่มาของคำว่า "ทฤษฎีบทขีดจำกัดกลางสำหรับทรงนูน"
อีกตัวอย่างหนึ่ง: f ( x 1 , ..., x n ) = const · exp(−(| x 1 | α + ⋯ + | x n | α ) β )โดยที่α > 1และαβ > 1ถ้าβ = 1แล้วf ( x 1 , ..., x n )สามารถแยกตัวประกอบได้เป็นconst · exp (−| x 1 | α ) ... exp(−| x n | α )ซึ่งหมายความว่าX 1 , ..., X nเป็นอิสระต่อกัน อย่างไรก็ตาม โดยทั่วไปแล้ว พวกมันขึ้นต่อกัน
เงื่อนไขf ( x 1 , ..., x n ) = f (| x 1 |, ..., | x n |)รับประกันว่าX 1 , ..., X nมีค่าเฉลี่ยเป็นศูนย์และไม่มีความสัมพันธ์กันอย่างไรก็ตาม พวกมันไม่จำเป็นต้องเป็นอิสระต่อกัน หรือแม้แต่เป็นอิสระต่อกันเป็นคู่ๆอย่างไรก็ตาม ความเป็นอิสระต่อกันเป็นคู่ๆ ไม่สามารถแทนที่ความเป็นอิสระในทฤษฎีบทขีดจำกัดกลางแบบคลาสสิกได้[ 36 ]
นี่คือผลลัพธ์ประเภท Berry–Esseen
ทฤษฎีบท—ให้X 1 , ..., X nเป็นไปตามสมมติฐานของทฤษฎีบทก่อนหน้านี้ แล้ว[ 37 ]
สำหรับทุกa < bโดยที่Cเป็นค่าคงที่สากล (สัมบูรณ์)ยิ่งไปกว่านั้น สำหรับทุกc 1 , ..., c n ∈ Rที่c2 1+ ⋯ + c2 น.= 1 ,
การกระจายตัวของX 1 + ⋯ + X n/√nไม่จำเป็นต้องเป็นปกติโดยประมาณ (อันที่จริง อาจเป็นแบบสม่ำเสมอ) [ 38 ]อย่างไรก็ตาม การกระจายของ c 1 X 1 + ⋯ + c n X nนั้นใกล้เคียงกับ(ในระยะทางความแปรผันทั้งหมด) สำหรับเวกเตอร์ส่วนใหญ่ ( c 1 , ..., c n )ตามการกระจายแบบสม่ำเสมอบนทรงกลม c2 1+ ⋯ + c2 น.= 1 .
อนุกรมตรีโกณมิติแบบช่องว่าง
ทฤษฎีบท ( Salem – Zygmund ) —ให้Uเป็นตัวแปรสุ่มที่มีการแจกแจงแบบเอกรูปบน(0,2π)และX k = r k cos( n k U + a k )โดยที่
- n kสอดคล้องกับเงื่อนไขช่องว่าง: มีq > 1 อยู่จริง โดยที่n k + 1 ≥ qn kสำหรับทุกk
- r kเป็นเช่นนั้น
- 0 ≤ a k < 2π .
ลู่เข้าสู่การกระจายตัวที่.
โพลีโทปเกาส์เซียน
ทฤษฎีบท—ให้A 1 , ..., A nเป็นจุดสุ่มอิสระบนระนาบR 2แต่ละจุดมีการกระจายปกติมาตรฐานสองมิติ ให้K nเป็นขอบนูนของจุดเหล่านี้ และX nเป็นพื้นที่ของK nแล้ว[ 41 ]
ลู่เข้าสู่การกระจายตัวเมื่อnมีค่าเข้าสู่∞
หลักการเดียวกันนี้ใช้ได้กับมิติทั้งหมดที่มากกว่า 2 ด้วยเช่นกัน
โพลีโทปK nเรียกว่าโพลีโทปสุ่มแบบ เกาส์ เซียน
ผลลัพธ์ที่คล้ายกันนี้ใช้ได้กับจำนวนจุดยอด (ของรูปหลายเหลี่ยมเกาส์เซียน) จำนวนขอบ และในความเป็นจริง จำนวนหน้าของทุกมิติ[ 42 ]
ฟังก์ชันเชิงเส้นของเมทริกซ์เชิงตั้งฉาก
ฟังก์ชันเชิงเส้นของเมทริกซ์Mคือผลรวมเชิงเส้นขององค์ประกอบในเมทริกซ์ (โดยมีสัมประสิทธิ์ที่กำหนดให้) M ↦ tr( AM )โดยที่Aคือเมทริกซ์ของสัมประสิทธิ์ ดู Trace (linear algebra) #Inner product
กล่าวได้ว่าเมทริกซ์เชิงตั้งฉากแบบสุ่ม มีการกระจายแบบสม่ำเสมอ หากการกระจายของมันคือ การวัด Haar ที่เป็นมาตรฐาน บนกลุ่มเชิงตั้งฉากO( n , R )ดูที่ เมทริกซ์การหมุน#เมทริก ซ์ การหมุนแบบสุ่มสม่ำเสมอ
ทฤษฎีบท—ให้Mเป็นเมทริกซ์ตั้งฉากแบบสุ่มขนาดn × nที่กระจายอย่างสม่ำเสมอ และAเป็นเมทริกซ์คงที่ขนาดn × nโดยที่tr( AA *) = nและให้X = tr( AM )แล้ว[ 43 ]การกระจายของXจะใกล้เคียงกับในเมตริกความแปรผันรวมจนถึง2 √ 3/n − 1 .
ลำดับย่อย
ทฤษฎีบท—ให้ตัวแปรสุ่มX 1 , X 2 , ... ∈ L 2 (Ω)เป็นเช่นนั้นX n → 0 อย่างอ่อนในL 2 (Ω)และXn→ 1อย่างอ่อนในL 1 (Ω) ดังนั้นจึงมีจำนวนเต็ม n 1 < n 2 < ⋯อยู่ซึ่ง
การเดินแบบสุ่มบนโครงตาข่ายผลึก
ทฤษฎีบทขีดจำกัดกลางสามารถสร้างขึ้นสำหรับการเดินสุ่มแบบ ง่าย บนโครงตาข่ายผลึก (กราฟคลุมแบบอาเบลแบบอนันต์เท่าบนกราฟจำกัด) และใช้สำหรับการออกแบบโครงสร้างผลึก[ 45 ] [ 46 ]
การประยุกต์ใช้และตัวอย่าง
ตัวอย่างง่ายๆ ของทฤษฎีบทขีดจำกัดกลางคือ การทอยลูกเต๋าที่เหมือนกันและไม่มีอคติหลายๆ ลูก การกระจายของผลรวม (หรือค่าเฉลี่ย) ของตัวเลขที่ทอยได้จะประมาณได้ดีด้วยการกระจายแบบปกติ เนื่องจากปริมาณในโลกแห่งความเป็นจริงมักเป็นผลรวมที่สมดุลของเหตุการณ์สุ่มที่ไม่สามารถสังเกตได้จำนวนมาก ทฤษฎีบทขีดจำกัดกลางจึงให้คำอธิบายบางส่วนเกี่ยวกับความแพร่หลายของการกระจายความน่าจะเป็นแบบปกติ นอกจากนี้ยังให้เหตุผลในการประมาณค่าสถิติ ของตัวอย่างขนาดใหญ่ ด้วยการกระจายแบบปกติในการทดลองที่มีการควบคุม อีกด้วย
การถดถอย
การวิเคราะห์การถดถอยโดยเฉพาะอย่างยิ่งวิธีการกำลังสองน้อยที่สุดแบบธรรมดาระบุว่าตัวแปรตามขึ้นอยู่กับตัวแปรอิสระ หนึ่งตัวหรือมากกว่านั้นตามฟังก์ชันบางอย่าง โดยมี พจน์ความคลาดเคลื่อนแบบบวกการอนุมานทางสถิติประเภทต่างๆ เกี่ยวกับการถดถอยนั้นถือว่าพจน์ความคลาดเคลื่อนมีการกระจายแบบปกติ ข้อสมมตินี้สามารถพิสูจน์ได้โดยการสมมติว่าพจน์ความคลาดเคลื่อนนั้นเป็นผลรวมของพจน์ความคลาดเคลื่อนอิสระหลายๆ พจน์ แม้ว่าพจน์ความคลาดเคลื่อนแต่ละตัวจะไม่มีการกระจายแบบปกติ แต่ตามทฤษฎีบทขีดจำกัดกลาง ผลรวมของพจน์เหล่านั้นสามารถประมาณได้ด้วยการกระจายแบบปกติได้เป็นอย่างดี
ภาพประกอบอื่นๆ
เนื่องจากมีความสำคัญต่อสถิติ จึงมีเอกสารและแพ็กเกจคอมพิวเตอร์จำนวนมากที่แสดงให้เห็นถึงการบรรจบกันที่เกี่ยวข้องกับทฤษฎีบทขีดจำกัดกลาง[ 47 ]
ประวัติศาสตร์
Henk Tijmsนักคณิตศาสตร์ชาวดัตช์เขียนว่า: [ 48 ]
ทฤษฎีบทลิมิตกลางมีประวัติความเป็นมาที่น่าสนใจ ทฤษฎีบทฉบับแรกนั้นถูกเสนอโดยนักคณิตศาสตร์ชาวฝรั่งเศสชื่ออับราฮัม เดอ มัวร์ซึ่งในบทความที่โดดเด่นซึ่งตีพิมพ์ในปี 1733 ได้ใช้การแจกแจงปกติเพื่อประมาณการแจกแจงของจำนวนหัวที่ได้จากการโยนเหรียญที่ยุติธรรมหลายครั้ง การค้นพบนี้ล้ำหน้ากว่ายุคสมัยของเขามาก และเกือบจะถูกลืมไปจนกระทั่งนักคณิตศาสตร์ชาวฝรั่งเศสชื่อดังปิแอร์-ซีมง ลาปลาซ ได้ช่วยกอบกู้มันจากความลืมเลือนในงานชิ้นสำคัญของเขาคือ Théorie analytique des probabilitésซึ่งตีพิมพ์ในปี 1812 ลาปลาซได้ขยายการค้นพบของเดอ มัวร์ โดยการประมาณการแจกแจงปกติจากการแจกแจงทวินาม แต่เช่นเดียวกับเดอ มัวร์ การค้นพบของลาปลาซก็ไม่ได้รับความสนใจมากนักในยุคสมัยของเขาเอง ความสำคัญของทฤษฎีบทลิมิตกลางเพิ่งปรากฏชัดเมื่อปลายศตวรรษที่สิบเก้า ในปี 1901 เมื่ออเล็กซานเดอร์ เลียปูนอฟ นักคณิตศาสตร์ชาวรัสเซีย ได้นิยามทฤษฎีบทนี้ในเชิงทั่วไปและพิสูจน์อย่างแม่นยำว่ามันทำงานอย่างไรในทางคณิตศาสตร์ ปัจจุบัน ทฤษฎีบทลิมิตกลางถือเป็นทฤษฎีบทที่สำคัญที่สุดอย่างไม่เป็นทางการในทฤษฎีความน่าจะเป็น
เซอร์ฟรานซิส กัลตันอธิบายทฤษฎีบทขีดจำกัดกลางในลักษณะนี้: [ 49 ]
ฉันแทบไม่รู้จักสิ่งใดที่จะสร้างความประทับใจให้กับจินตนาการได้มากเท่ากับรูปแบบอันน่าอัศจรรย์ของระเบียบจักรวาลที่แสดงออกโดย "กฎแห่งความถี่ของความผิดพลาด" หากชาวกรีกรู้จักกฎนี้ พวกเขาคงจะยกย่องและบูชาให้เป็นเทพเจ้าไปแล้ว มันปกครองด้วยความสงบและถ่อมตนอย่างสมบูรณ์ท่ามกลางความสับสนวุ่นวายที่สุด ยิ่งฝูงชนมีขนาดใหญ่และยิ่งความอนาธิปไตยปรากฏมากเท่าใด อำนาจของมันก็ยิ่งสมบูรณ์แบบมากขึ้นเท่านั้น มันคือกฎสูงสุดแห่งความไร้เหตุผล เมื่อใดก็ตามที่นำตัวอย่างขนาดใหญ่ขององค์ประกอบที่วุ่นวายมาจัดเรียงตามลำดับขนาดของมัน รูปแบบของความสม่ำเสมอที่สวยงามและไม่คาดคิดก็จะปรากฏขึ้นมาโดยตลอด
คำว่า "ทฤษฎีบทขีดจำกัดกลาง" (ในภาษาเยอรมัน: "zentraler Grenzwertsatz") ถูกใช้ครั้งแรกโดยGeorge Pólyaในปี 1920 ในชื่อบทความ[ 50 ] [ 51 ] Pólya เรียกทฤษฎีบทนี้ว่า "กลาง" เนื่องจากความสำคัญของมันในทฤษฎีความน่าจะเป็น ตามที่ Le Cam กล่าว โรงเรียนความน่าจะเป็นของฝรั่งเศสตีความคำว่ากลางในความหมายว่า "มันอธิบายพฤติกรรมของจุดศูนย์กลางของการกระจายเมื่อเทียบกับส่วนหาง" [ 51 ]บทคัดย่อของบทความเรื่อง"เกี่ยวกับทฤษฎีบทขีดจำกัดกลางของแคลคูลัสความน่าจะเป็นและปัญหาของโมเมนต์"โดย Pólya [ 50 ]ในปี 1920 แปลได้ดังนี้
การปรากฏของความหนาแน่นความน่าจะเป็นแบบเกาส์เซียน1 = e − x 2ในการทดลองซ้ำๆ ในข้อผิดพลาดของการวัด ซึ่งส่งผลให้เกิดการรวมกันของข้อผิดพลาดพื้นฐานจำนวนมากและเล็กน้อยมาก ในกระบวนการแพร่กระจาย ฯลฯ สามารถอธิบายได้ ดังที่ทราบกันดีอยู่แล้ว โดยทฤษฎีบทลิมิตเดียวกัน ซึ่งมีบทบาทสำคัญในแคลคูลัสของความน่าจะเป็น ผู้ค้นพบทฤษฎีบทลิมิตนี้คือลาปลาซ มีความเป็นไปได้ว่าการพิสูจน์อย่างเข้มงวดครั้งแรกนั้นมาจากเชบีเชฟ และสูตรที่ชัดเจนที่สุดเท่าที่ฉันทราบ สามารถพบได้ในบทความของเลียปูนอฟฟ์ ...
Hald ได้ให้รายละเอียดอย่างครบถ้วนเกี่ยวกับประวัติของทฤษฎีบท โดยกล่าวถึงงานพื้นฐานของ Laplace รวมถึง ผลงานของ Cauchy , BesselและPoisson [ 52 ] Hans Fischer ได้ให้ข้อมูลทางประวัติศาสตร์สองส่วน ส่วนหนึ่งครอบคลุมการพัฒนาจาก Laplace ไปจนถึง Cauchy และอีกส่วนหนึ่ง กล่าวถึงผลงานของvon Mises , Pólya , Lindeberg , LévyและCramér ในช่วงทศวรรษ 1920 [ 53 ] Le Cam อธิบายถึงช่วงเวลาประมาณปี 1935 [ 51 ] Bernstein [ 54 ]นำเสนอการอภิปรายทางประวัติศาสตร์โดยเน้นที่ผลงานของPafnuty ChebyshevและนักเรียนของเขาAndrey MarkovและAleksandr Lyapunovซึ่งนำไปสู่การพิสูจน์ CLT ครั้งแรกในบริบททั่วไป
เกร็ดความรู้ที่น่าสนใจเกี่ยวกับประวัติศาสตร์ของทฤษฎีบทขีดจำกัดกลางคือ การพิสูจน์ผลลัพธ์ที่คล้ายกับ CLT ของ Lindeberg ในปี 1922 เป็นหัวข้อวิทยานิพนธ์ของAlan Turing ในปี 1934 สำหรับ King's Collegeที่มหาวิทยาลัยเคมบริดจ์หลังจากส่งงานแล้ว Turing จึงได้รู้ว่ามีการพิสูจน์ไปแล้ว ดังนั้นวิทยานิพนธ์ของ Turing จึงไม่ได้รับการตีพิมพ์[ 55 ]
ดูเพิ่มเติม
- คุณสมบัติการแบ่งส่วนเท่าๆ กันแบบเชิงอะซิมโทติก
- การกระจายเชิงเส้นกำกับ
- การจัดจำหน่ายของเบตส์
- กฎของเบนฟอร์ด – ผลลัพธ์จากการขยายทฤษฎีบทขีดจำกัดส่วนกลาง (CLT) ไปสู่ผลคูณของตัวแปรสุ่ม
- ทฤษฎีบทเบอร์รี-เอสซีน
- ทฤษฎีบทลิมิตกลางสำหรับสถิติเชิงทิศทาง – การประยุกต์ใช้ทฤษฎีบทลิมิตกลางกับกรณีของสถิติเชิงทิศทาง
- วิธีเดลต้า – ใช้ในการคำนวณการแจกแจงลิมิตของฟังก์ชันของตัวแปรสุ่ม
- ทฤษฎีบท Erdős–Kacเชื่อมโยงจำนวนตัวประกอบเฉพาะของจำนวนเต็มกับความน่าจะเป็นแบบปกติ
- ทฤษฎีบท Fisher–Tippett–Gnedenko – ทฤษฎีบทลิมิตสำหรับค่าสุดขีด (เช่นmax{ X n } )
- การแจกจ่ายของเออร์วิน-ฮอลล์
- ทฤษฎีบทลิมิตกลางของลูกโซ่มาร์คอฟ
- การกระจายแบบปกติ
- ทฤษฎีบทการลู่เข้าของทวีดี้ – ทฤษฎีบทที่สามารถถือได้ว่าเป็นสะพานเชื่อมระหว่างทฤษฎีบทลิมิตกลางและทฤษฎีบทการลู่เข้าของปัวซง[ 56 ]
- ทฤษฎีบทของดอนสเกอร์
หมายเหตุ
- ^ฟิชเชอร์ (2011) , หน้า .
- ^มอนต์โกเมอรี, ดักลาส ซี.; รันเกอร์, จอร์จ ซี. (2014). สถิติประยุกต์และความน่าจะเป็นสำหรับวิศวกร (ฉบับที่ 6). ไวลีย์. หน้า 241. ISBN 9781118539712.
- ^ Rouaud, Mathieu (2013). ความน่าจะเป็น สถิติ และการประมาณค่า (PDF)หน้า 10. เก็บถาวร(PDF)จากต้นฉบับเมื่อ 2022-10-09
- ^บิลลิงสลีย์ (1995)หน้า 357
- ↑บาวเออร์ (2001) , หน้า. 199 ทฤษฎีบท 30.13
- ^บิลลิงสลีย์ (1995)หน้า 362
- ^ Robbins, Herbert (1948). "การแจกแจงเชิงอะซิมโทติกของผลรวมของตัวแปรสุ่มจำนวนหนึ่ง" . Bull. Amer. Math. Soc . 54 (12): 1151– 1161. doi : 10.1090/S0002-9904-1948-09142-X .
- ^ Chen, Louis HY; Goldstein, Larry; Shao, Qi-Man (2011). การประมาณค่าปกติด้วยวิธีของ Stein . เบอร์ลิน ไฮเดลเบิร์ก: Springer-Verlag. หน้า 270–271 .
- อรรถ เป็นขฟานเดอร์ ฟาร์ต, AW (1998) สถิติเชิงเส้นกำกับ นิวยอร์ก รัฐนิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. ไอเอสบีเอ็น 978-0-521-49603-2. ลคซีเอ็น 98015176 .
- ^ O'Donnell, Ryan (2014). "ทฤษฎีบท 5.38" . เก็บถาวรจากต้นฉบับเมื่อ 2019-04-08 . เรียกดูเมื่อ2017-10-18 .
- ^ Bentkus, V. (2005). "ขอบเขตแบบ Lyapunov ใน". Theory Probab. Appl . 49 (2): 311– 323. doi : 10.1137/S0040585X97981123 .
- ^ Le Cam, L. (กุมภาพันธ์ 1986). "ทฤษฎีบทลิมิตกลางราวปี 1935" วิทยาศาสตร์สถิติ 1 ( 1): 78– 91. JSTOR 2245503 .
- ↑เลวี, พอล (1937) Theorie de l'addition des Variables aleatoires [ ทฤษฎีการรวมกันของตัวแปรที่คาดเดาไม่ได้ ] (ในภาษาฝรั่งเศส) ปารีส: Gauthier-Villars.
- ^ Gnedenko, Boris Vladimirovich; Kologorov, Andreĭ Nikolaevich; Doob, Joseph L.; Hsu, Pao-Lu (1968). การแจกแจงลิมิตสำหรับผลรวมของตัวแปรสุ่มอิสระ เรดดิง, แมสซาชูเซตส์: Addison-wesley.
- ^ Nolan, John P. (2020). การแจกแจงแบบเสถียรของตัวแปรเดี่ยว โมเดลสำหรับข้อมูลที่มีหางหนัก Springer Series in Operations Research and Financial Engineering. สวิตเซอร์แลนด์: Springer. doi : 10.1007/978-3-030-52915-4 . ISBN 978-3-030-52914-7S2CID 226648987
- ^บิลลิงสลีย์ (1995)ทฤษฎีบท 27.4
- ^ Durrett (2004) , มาตรา 7.7(c), ทฤษฎีบท 7.8
- ^ Durrett (2004) , มาตรา 7.7, ทฤษฎีบท 7.4.
- ^บิลลิงสลีย์ (1995)ทฤษฎีบท 35.12
- ^เลมอนส์, ดอน (2003). บทนำเกี่ยวกับกระบวนการสุ่มในฟิสิกส์ . สำนักพิมพ์มหาวิทยาลัยจอห์นส์ ฮอปกินส์. doi : 10.56021/9780801868665 . ISBN 9780801876387สืบค้นเมื่อ2016-08-11
- ^ Stein, C. (1972). "ขอบเขตของข้อผิดพลาดในการประมาณค่าปกติของการแจกแจงผลรวมของตัวแปรสุ่มที่ขึ้นอยู่กัน" Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability . 6 (2): 583– 602. MR 0402873 . Zbl 0278.60026 .
- ^ Chen, LHY; Goldstein, L.; Shao, QM (2011). การประมาณค่าปกติด้วยวิธีของ Stein . Springer. ISBN 978-3-642-15006-7.
- ^ Artstein, S. ; Ball, K. ; Barthe, F. ; Naor, A. (2004). "การแก้ปัญหาของ Shannon เกี่ยวกับความเป็นเอกภาคของเอนโทรปี"วารสารของสมาคมคณิตศาสตร์อเมริกัน 17 ( 4): 975– 982. doi : 10.1090/S0894-0347-04-00459-X .
- ^ Brewer, JK (1985). "ตำราสถิติเชิงพฤติกรรม: แหล่งที่มาของความเชื่อผิดๆ และความเข้าใจผิด?" วารสารสถิติการศึกษา 10 ( 3): 252– 268. doi : 10.3102/10769986010003252 . S2CID 119611584 .
- ^ Yu, C.; Behrens, J.; Spencer, A. การระบุความเข้าใจผิดในทฤษฎีบทลิมิตกลางและแนวคิดที่เกี่ยวข้อง การบรรยายของสมาคมวิจัยการศึกษาแห่งอเมริกา 19 เมษายน 1995
- ^ Sotos, AEC; Vanhoof, S.; Van den Noortgate, W.; Onghena, P. (2007). "ความเข้าใจผิดของนักเรียนเกี่ยวกับการอนุมานทางสถิติ: การทบทวนหลักฐานเชิงประจักษ์จากการวิจัยเกี่ยวกับการศึกษาสถิติ" . Educational Research Review . 2 (2): 98– 113. doi : 10.1016/j.edurev.2007.04.001 .
- ^ "การแจกแจงตัวอย่างของค่าเฉลี่ยตัวอย่าง" Khan Academy 2 มิถุนายน 2023 เก็บถาวรจากต้นฉบับ(วิดีโอ)เมื่อ 2 มิถุนายน 2023 เรียกดูเมื่อ 8 ตุลาคม 2023
- ^ Rosenthal, Jeffrey Seth (2000). การพิจารณาทฤษฎีความน่าจะเป็นอย่างเข้มงวดในเบื้องต้น World Scientific. ทฤษฎีบท 5.3.4, หน้า 47. ISBN 981-02-4322-7.
- ^จอห์นสัน, โอลิเวอร์ โทมัส (2004). ทฤษฎีสารสนเทศและทฤษฎีบทขีดจำกัดกลาง . สำนักพิมพ์อิมพีเรียลคอลเลจ. หน้า 88. ISBN 1-86094-473-6.
- ^ Uchaikin, Vladimir V.; Zolotarev, VM (1999). โอกาสและความเสถียร: การแจกแจงแบบเสถียรและการประยุกต์ใช้ VSP. หน้า 61–62 . ISBN 90-6764-301-7.
- ^ Borodin, AN; Ibragimov, IA; Sudakov, VN (1995). ทฤษฎีบทลิมิตสำหรับฟังก์ชันของการเดินสุ่ม . ร้านหนังสือ AMS. ทฤษฎีบท 1.1, หน้า 8. ISBN 0-8218-0438-3.
- ^ Petrov, VV (1976). ผลรวมของตัวแปรสุ่มอิสระ . นิวยอร์ก-ไฮเดลเบิร์ก: Springer-Verlag. บทที่ 7. ISBN 9783642658099.
- ^ Hew, Patrick Chisan (2017). "การกระจายตัวเชิงอะซิมโทติกของรางวัลที่สะสมโดยกระบวนการต่ออายุแบบสลับ" จดหมายสถิติและความน่าจะเป็น 129 : 355– 359. doi : 10.1016 /j.spl.2017.06.027 .
- ^ Rempala, G.; Wesolowski, J. (2002). "Asymptotics of products of sums and U -statistics" (PDF) . Electronic Communications in Probability . 7 : 47– 54. doi : 10.1214/ecp.v7-1046 .
- ↑คลาร์แท็ก (2007) , ทฤษฎีบท 1.2.
- ^ Durrett (2004) , ส่วนที่ 2.4, ตัวอย่าง 4.5
- ^ Klartag (2008) , ทฤษฎีบทที่ 1.
- ↑คลาร์แท็ก (2007) , ทฤษฎีบท 1.1.
- ^ Zygmund, Antoni (2003) [1959]. อนุกรมตรีโกณมิติสำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ เล่มที่ II ส่วนที่ XVI.5 ทฤษฎีบท 5-5 ISBN 0-521-89053-5.
- ^ Gaposhkin (1966) , ทฤษฎีบท 2.1.13.
- ↑ Bárány & Vu (2007) , ทฤษฎีบท 1.1.
- ↑ Bárány & Vu (2007) , ทฤษฎีบท 1.2.
- ^ Meckes, Elizabeth (2008). "ฟังก์ชันเชิงเส้นบนกลุ่มเมทริกซ์คลาสสิก". ธุรกรรมของสมาคมคณิตศาสตร์อเมริกัน 360 ( 10): 5355– 5366. arXiv : math/0509441 . doi : 10.1090/S0002-9947-08-04444-9 . S2CID 11981408 .
- ^ Gaposhkin (1966) , มาตรา 1.5.
- ^ Kotani, M.; Sunada, Toshikazu (2003). เรขาคณิตเชิงสเปกตรัมของโครงสร้างผลึก . Vol. 338. Contemporary Math. หน้า 271–305 . ISBN 978-0-8218-4269-0.
- ^ Sunada, Toshikazu (2012). Topological Crystallography – With a View Towards Discrete Geometric Analysis . Surveys and Tutorials in the Applied Mathematical Sciences. Vol. 6. Springer. ISBN 978-4-431-54177-6.
- ^ Marasinghe, M.; Meeker, W.; Cook, D.; Shin, TS (สิงหาคม 1994). การใช้กราฟิกและการจำลองเพื่อสอนแนวคิดทางสถิติการประชุมประจำปีของสมาคมนักสถิติแห่งอเมริกา โทรอนโต ประเทศแคนาดา
- ^ Henk, Tijms (2004). Understanding Probability: Chance Rules in Everyday Life . Cambridge: Cambridge University Press. หน้า 169. ISBN 0-521-54036-4.
- ^กัลตัน, เอฟ. (1889). การสืบทอดทางธรรมชาติ . หน้า 66.
- อรรถ เป็นข โป เลีย , จอร์จ (1920) "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem" [เกี่ยวกับทฤษฎีบทขีดจำกัดกลางของการคำนวณความน่าจะเป็นและปัญหาของโมเมนต์] Mathematische Zeitschrift (ภาษาเยอรมัน) 8 ( 3– 4): 171– 181. ดอย : 10.1007/BF01206525 . S2CID 123063388 .
- ^ a b c Le Cam, Lucien (1986). "ทฤษฎีบทลิมิตกลางราวปี 1935" . วิทยาศาสตร์สถิติ . 1 (1): 78– 91. doi : 10.1214/ss/1177013818 .
- ^ Hald, Andreas (22 เมษายน 1998). ประวัติศาสตร์ของสถิติทางคณิตศาสตร์ตั้งแต่ปี 1750 ถึง 1930 (PDF) . Wiley. บทที่ 17. ISBN 978-0471179122จัดเก็บในรูปแบบไฟล์ PDFจากต้นฉบับเมื่อวันที่ 9 ตุลาคม 2022
- ^ฟิชเชอร์ (2011)บทที่ 2; บทที่ 5.2
- ^ Bernstein, SN (1945). "เกี่ยวกับผลงานของ PL Chebyshev ในทฤษฎีความน่าจะเป็น". ใน Bernstein., SN (บรรณาธิการ). Nauchnoe Nasledie PL Chebysheva. Vypusk Pervyi: Matematika [ มรดกทางวิทยาศาสตร์ของ PL Chebyshev ตอนที่ 1: คณิตศาสตร์ ] (เป็นภาษารัสเซีย). มอสโกและเลนินกราด: Academiya Nauk SSSR. หน้า 174.
- ^ Zabell, SL (1995). "Alan Turing and the Central Limit Theorem". American Mathematical Monthly . 102 (6): 483– 494. doi : 10.1080/00029890.1995.12004608 .
- ^ Jørgensen, Bent (1997). ทฤษฎีของแบบจำลองการกระจายตัว . Chapman & Hall. ISBN 978-0412997112.
ลิงก์ภายนอก
- ทฤษฎีบทลิมิตกลางที่ Khan Academy
- " ทฤษฎีบทลิมิตกลาง" สารานุกรมคณิตศาสตร์สำนักพิมพ์ EMS 2001 [1994]
- ไวส์สไตน์, เอริค ดับเบิลยู. "ทฤษฎีบทลิมิตกลาง" . MathWorld .
- มิวสิกวิดีโอสาธิตทฤษฎีบทลิมิตกลางโดยใช้กระดานกัลตันโดย คาร์ล แม็กแท็ก
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ทฤษฎีบทลิมิตกลาง
ใน ทฤษฎีความน่าจะเป็น ทฤษฎีบท ลิมิตกลาง ( CLT ) กล่าวว่า ภายใต้เงื่อนไขที่เหมาะสม การแจกแจง ของค่าเฉลี่ยตัวอย่างที่ถูกทำให้เป็นมาตรฐานจะลู่เข้าสู่ การแจกแจงปกติมาตรฐาน...
ลำดับอิสระ
ไม่ว่ารูปแบบการกระจายของประชากรจะเป็นอย่างไร การกระจายตัวอย่างมักจะเป็นแบบเกาส์เซียน และการกระจายตัวของมันจะได้รับจากทฤษฎีบทขีดจำกัดกลาง [ 3 ]
CLT แบบคลาสสิก
ให้เป็นลำดับของ ตัวแปรสุ่มอิสระ ที่มีการแจกแจงเหมือนกัน (iid) โดยมี ค่าเฉลี่ย กำหนดโดยและ ความแปรปรวน จำกัด กำหนดโดยสมมติว่าเราสนใจ ค่าเฉลี่ยของตัวอย่าง ( X n ) n ≥ 1 {\displaystyle (X_{n})_{n\geq 1}} μ {\displaystyle \mu } σ 2 . {\displaystyle \sigma ^{2}.}
Lyapunov CLT
ในทฤษฎีบทลิมิตกลางรูปแบบนี้ ตัวแปรสุ่มต้องเป็นอิสระต่อกัน แต่ไม่จำเป็นต้องมีการกระจายแบบเดียวกัน ทฤษฎีบทนี้ยังต้องการให้ตัวแปรสุ่มมี โมเมนต์ลำดับ ใดลำดับหนึ่ง และ อัตราการเติบโตของโมเมนต์เหล่านี้ถูกจำกัดโดยเงื่อนไขของ Lyapunov ที่ระบุไว้ด้านล่าง X i...