กลับไปหน้าบทความ

อ่าน 69 นาที

การกระจายแบบปกติ

ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจง แบบปกติ หรือ การแจกแจงแบบเกาส์เซียน เป็นการ แจกแจงความน่าจะเป็นแบบต่อเนื่อง ชนิดหนึ่งสำหรับ ตัวแปรสุ่ม ค่าจริง รูปแบบทั่วไปของ...

การกระจายแบบปกติ

การกระจายแบบปกติ
ฟังก์ชันความหนาแน่นความน่าจะเป็น
เส้นโค้งสีแดงแสดงถึงการแจกแจงปกติมาตรฐาน
ฟังก์ชันการกระจายสะสม
สัญกรณ์
พารามิเตอร์= ค่าเฉลี่ย ( ตำแหน่ง ) = ความแปรปรวน ( มาตราส่วน ยกกำลังสอง )
สนับสนุน
พีดี
ซีดีเอฟ
ควอนไทล์
หมายถึง
ค่ามัธยฐาน
โหมด
ความแปรปรวน
โกรธ
เอเอดี
ความเบี่ยงเบน
ความโค้งส่วนเกิน
เอนโทรปี
เอ็มจีเอฟ
ซีเอฟ
ข้อมูลของฟิชเชอร์

ความแตกต่าง Kullback–Leibler

ในทฤษฎีความน่าจะเป็นและสถิติ การ แจกแจงแบบปกติหรือการแจกแจงแบบเกาส์เซียน เป็นการ แจกแจงความน่าจะเป็นแบบต่อเนื่องชนิดหนึ่งสำหรับตัวแปรสุ่มค่าจริง รูปแบบทั่วไปของฟังก์ชันความหนาแน่นความน่าจะ เป็น คือ[ 2 ] [ 3 ] [ 4 ] พารามิเตอร์คือค่าเฉลี่ยหรือค่าคาดหวังของการแจกแจง (รวมถึง ค่า มัธยฐานและค่าฐานนิยม ด้วย ) ในขณะที่พารามิเตอร์คือค่าความแปรปรวน ค่าเบี่ยงเบนมาตรฐานของการแจกแจงคือค่าบวก (ซิกมา) ตัวแปรสุ่มที่มีการแจกแจงแบบเกาส์เซียนเรียกว่ามีการแจกแจงแบบปกติและเรียกว่า ค่าเบี่ยง เบน ปกติ

การแจกแจงแบบปกติมีความสำคัญในทางสถิติและมักใช้ใน วิทยาศาสตร์ ธรรมชาติและสังคม เพื่อแสดง ตัวแปรสุ่มที่มีค่าจริงซึ่งไม่ทราบการแจกแจง[ 5 ] [ 6 ]ความสำคัญของการแจกแจงแบบปกติส่วนหนึ่งมาจากทฤษฎีบทขีดจำกัดกลางซึ่งระบุว่าค่าเฉลี่ยของ ตัวอย่าง (การสังเกต) ที่ เป็นอิสระทางสถิติ จำนวนมาก ของตัวแปรสุ่มที่มีค่าเฉลี่ยและความแปรปรวนจำกัดนั้นเป็นตัวแปรสุ่มเช่นกัน ซึ่งการแจกแจงจะลู่เข้าสู่การแจกแจงแบบปกติเมื่อจำนวนตัวอย่างเพิ่มขึ้น ดังนั้นปริมาณทางกายภาพที่คาดว่าจะเป็นผลรวมของกระบวนการอิสระจำนวนมาก เช่นข้อผิดพลาดในการวัดมักมีการแจกแจงที่ใกล้เคียงกับแบบปกติ[ 7 ]

ยิ่งไปกว่านั้น การแจกแจงแบบเกาส์เซียนยังมีคุณสมบัติเฉพาะบางประการที่มีคุณค่าในการศึกษาเชิงวิเคราะห์ ตัวอย่างเช่นการรวมเชิงเส้น ใดๆ ของชุดค่าเบี่ยงเบนปกติอิสระที่กำหนดไว้ ถือเป็นค่าเบี่ยงเบนปกติ ผลลัพธ์และวิธีการต่างๆ มากมาย เช่นการแพร่กระจายของความไม่แน่นอนและ การปรับพารามิเตอร์ กำลังสองน้อยที่สุด[ 8 ]สามารถหาได้ในรูปแบบที่ชัดเจนในเชิงวิเคราะห์เมื่อตัวแปรที่เกี่ยวข้องมีการแจกแจงแบบปกติ

บางครั้งการแจกแจงแบบปกติก็เรียกกันอย่างไม่เป็นทางการว่าเส้นโค้งระฆัง [ 9 ] [ 10 ] อย่างไรก็ตามการแจกแจงอื่นๆ อีกมากมายก็มีรูปร่างคล้ายระฆัง (เช่น การแจกแจงCauchy , Student's tและ การแจกแจง โลจิสติก ) (สำหรับชื่ออื่นๆ โปรดดูที่ การตั้งชื่อ )

การแจกแจงความน่าจะเป็นแบบตัวแปรเดียวได้รับการขยายความสำหรับเวกเตอร์ในการแจกแจงปกติแบบหลายตัวแปรและสำหรับเมทริกซ์ในการแจกแจงปกติแบบเมทริกซ์

คำจำกัดความ

การแจกแจงปกติมาตรฐาน

กรณีที่ง่ายที่สุดของการแจกแจงปกติเรียกว่าการแจกแจงปกติมาตรฐานหรือการแจกแจงปกติหน่วยนี่เป็นกรณีพิเศษเมื่อและและอธิบายโดยฟังก์ชันความหนาแน่นความน่าจะเป็น (หรือความหนาแน่น) ดังนี้: [ 11 ] ตัวแปรมีค่าเฉลี่ยเป็น 0 และความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานเป็น 1 ความหนาแน่น มี ค่า สูงสุดที่และจุดเปลี่ยนที่และ

แม้ว่าความหนาแน่นข้างต้นจะเป็นที่รู้จักกันทั่วไปว่าเป็นแบบปกติมาตรฐาน แต่ผู้เขียนบางคนได้ใช้คำนี้เพื่ออธิบายรูปแบบอื่นของการแจกแจงปกติ ตัวอย่างเช่น คาร์ล ฟรีดริช เกาส์เคยนิยามแบบปกติมาตรฐานว่าซึ่งมีค่าความแปรปรวนเท่ากับและสตีเฟน สติกล์เลอร์เคยนิยามแบบปกติมาตรฐานว่าซึ่งมีรูปแบบฟังก์ชันที่เรียบง่ายและมีค่าความแปรปรวนเท่ากับ[ 12 ]

การกระจายปกติทั่วไป

ถ้า⁠ ⁠เป็นค่าเบี่ยงเบนมาตรฐานของการแจกแจงปกติแล้วจะมีค่าคาดหวังและค่าเบี่ยงเบนมาตรฐานซึ่งเทียบเท่ากับการกล่าวว่า การแจกแจงปกติมาตรฐาน สามารถปรับขนาด/ยืดออก ได้ ด้วยปัจจัยและเลื่อนไปเพื่อให้ได้การแจกแจงปกติอีกแบบหนึ่ง เรียกว่า

ในทางกลับกัน ถ้า⁠ ⁠เป็นค่าเบี่ยงเบนปกติที่มีพารามิเตอร์⁠ ⁠และ, แล้ว การแจกแจง นี้ สามารถปรับขนาดและเลื่อนได้โดยใช้สูตร เพื่อแปลงให้เป็นการแจกแจงปกติมาตรฐาน ตัวแปรนี้เรียกอีกอย่าง ว่า รูปแบบมาตรฐานของ

โดยเฉพาะอย่างยิ่ง ฟังก์ชันความหนาแน่นความน่าจะเป็นสำหรับสามารถเขียนได้ในรูปของการแจกแจงปกติมาตรฐาน( ที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง): ความหนาแน่นความน่าจะเป็นจะต้องถูกปรับขนาดด้วยเพื่อให้ปริพันธ์ยังคงเป็น 1

สัญกรณ์

ความหนาแน่นของความน่าจะเป็นของการแจกแจงแบบเกาส์เซียนมาตรฐาน (การแจกแจงแบบปกติมาตรฐาน โดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง) มักจะแสดงด้วยอักษรกรีก⁠ ⁠ ( phi ) [ 13 ]รูปแบบอื่นของอักษรกรีก phi คือ⁠ ⁠ก็ถูกใช้บ่อยเช่นกัน

การแจกแจงแบบปกติมักเรียกว่าหรือ [ 14 ] ดังนั้นเมื่อตัวแปรสุ่มมีการแจกแจงแบบปกติโดยมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเราอาจเขียนได้ ว่า

การกำหนดพารามิเตอร์ทางเลือก

ผู้เขียนบางคนสนับสนุนให้ใช้ความแม่นยำเป็นพารามิเตอร์ที่กำหนดความกว้างของการกระจาย แทนที่จะใช้ค่าเบี่ยงเบนมาตรฐานหรือความแปรปรวนความแม่นยำมักจะถูกกำหนดให้เป็นส่วนกลับของความแปรปรวน[ 15 ]สูตรสำหรับการกระจาย จึงกลายเป็น

มีการอ้างว่าตัวเลือกนี้มีข้อดีในการคำนวณเชิงตัวเลขเมื่อ⁠ ⁠มีค่าใกล้เคียงกับศูนย์มาก และช่วยลดความซับซ้อนของสูตรในบางบริบท เช่น ในการอนุมานแบบเบย์เซียนของตัวแปรที่มีการกระจายแบบปกติหลายตัวแปร

อีกทางเลือกหนึ่งคือ อาจกำหนดให้ส่วนกลับของค่าเบี่ยงเบนมาตรฐาน เป็น ความแม่นยำซึ่งในกรณีนี้ การแสดงออกของการแจกแจงปกติจะกลายเป็น

ตามที่สติกลอร์กล่าว การกำหนดสูตรนี้มีข้อดีคือสูตรนั้นง่ายกว่าและจำง่ายกว่ามาก อีกทั้งยังมีสูตรประมาณค่าควอนไทล์ของการกระจายตัว ที่เรียบง่ายอีกด้วย

การแจกแจงปกติเป็นตระกูลเอกซ์โพเนนเชียลที่มีพารามิเตอร์ธรรมชาติμและσและสถิติธรรมชาติx และพารามิเตอร์ความคาดหวังคู่สำหรับการแจกแจงปกติคือ η₁ = μและη₂ = μ² + σ²

ฟังก์ชันการกระจายสะสม

ฟังก์ชันการกระจายสะสม (CDF) ของการกระจายปกติมาตรฐาน ซึ่งโดยทั่วไปจะใช้ตัวอักษรกรีกตัวใหญ่⁠ ⁠แทน คือปริพันธ์

ฟังก์ชันความคลาดเคลื่อน ที่เกี่ยวข้องจะให้ความน่าจะเป็นที่ตัวแปรสุ่ม ซึ่งมีการแจกแจงแบบปกติโดยมีค่าเฉลี่ย 0 และความแปรปรวน 1/2 จะตกอยู่ในช่วงนั่นคือ:

อินทิกรัลเหล่านี้ไม่สามารถแสดงในรูปของฟังก์ชันพื้นฐานได้ และมักถูกเรียกว่าฟังก์ชันพิเศษอย่างไรก็ตาม มีวิธีการประมาณค่าเชิงตัวเลขมากมายที่เป็นที่รู้จัก โปรดดูรายละเอียดเพิ่มเติม ด้านล่าง

หน้าที่ทั้งสองมีความสัมพันธ์กันอย่างใกล้ชิด กล่าวคือ

สำหรับการแจกแจงปกติทั่วไปที่มีความหนาแน่น⁠ ⁠ค่าเฉลี่ย⁠ ⁠และความแปรปรวนฟังก์ชันการแจกแจงสะสมคือ

ความน่าจะเป็นที่xอยู่ระหว่างaและbโดยที่a < bคือ[ 16 ] : 84

ส่วนเติมเต็มของฟังก์ชันการกระจายสะสมปกติมาตรฐานมักเรียกว่าฟังก์ชัน Qโดยเฉพาะในตำราวิศวกรรม[ 17 ] [ 18 ] มันให้ความน่าจะเป็นที่ค่าของตัวแปรสุ่มปกติมาตรฐานจะเกิน : คำจำกัดความอื่นของฟังก์ชันซึ่งทั้งหมดเป็นการแปลงอย่างง่ายของก็ถูกนำมาใช้บ้างเป็นครั้งคราว[ 19 ]

กราฟของฟังก์ชันการกระจายสะสมปกติมาตรฐาน มี สมมาตรการหมุน 2 เท่ารอบจุด (0,1/2) นั่นคือ⁠ อนุพันธ์ ผกผัน (ปริพันธ์ไม่จำกัด) ของ กราฟนี้สามารถแสดงได้ดังนี้:

การขยายอนุกรมเชิงอะซิมโทติกของฟังก์ชันการกระจายสะสมสำหรับx ขนาดใหญ่ สามารถหาได้โดยใช้การอินทิเกรตโดยส่วน : โดยที่หมายถึงแฟกทอเรียลคู่สำหรับข้อมูลเพิ่มเติม โปรดดูที่ ฟังก์ชันข้อผิดพลาด § การขยายอนุกรมเชิงอะซิมโทติก[ 20 ]

การแสดงผลแบบอนุกรมเทย์เลอร์

อนุกรม เทย์ เลอร์สำหรับการกระจายปกติสามารถหาได้โดยการแทนที่ลงในอนุกรมเท ย์เลอ ร์สำหรับฟังก์ชันเลขชี้กำลัง : [ 21 ]

อนุกรมนี้สามารถบูรณาการทีละเทอมเพื่อให้ได้อนุกรมเทย์เลอร์สำหรับฟังก์ชันการกระจายสะสม: [ 22 ]

อย่างไรก็ตาม อนุกรมนี้ไม่มีประสิทธิภาพในการคำนวณเนื่องจากการลู่เข้าช้า ยกเว้นเมื่อ⁠ ⁠มีขนาดเล็ก[ 22 ]

อนุกรมทั้งสองนี้อธิบายฟังก์ชันทั้งหมดซึ่งลู่เข้าสำหรับค่าจริงและค่าเชิงซ้อนทั้งหมดของ ⁠ ⁠

การคำนวณแบบเรียกซ้ำด้วยอนุกรมเทย์เลอร์

ความสัมพันธ์เวียนเกิดสำหรับพหุนามเฮอร์ไมต์He n ( x )สามารถใช้สร้าง การขยายอนุกรม เทย์เลอร์ รอบจุด x 0ใดๆ ได้อย่างมีประสิทธิภาพ โดย ที่:

ค่าเบี่ยงเบนมาตรฐานและความครอบคลุม

สำหรับการแจกแจงแบบปกติ ค่าที่น้อยกว่าหนึ่งส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยคิดเป็น 68.27% ของชุดข้อมูล ในขณะที่ค่าที่สองส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยคิดเป็น 95.45% และค่าที่สามส่วนเบี่ยงเบนมาตรฐานคิดเป็น 99.73%

ประมาณ 68% ของค่าที่ดึงมาจากการแจกแจงปกติจะอยู่ภายในหนึ่งส่วนเบี่ยงเบนมาตรฐานσจากค่าเฉลี่ย ประมาณ 95% ของค่าจะอยู่ภายในสองส่วนเบี่ยงเบนมาตรฐาน และประมาณ 99.7% จะอยู่ภายในสามส่วนเบี่ยงเบนมาตรฐาน[ 9 ]นี่เป็นที่รู้จักกันในชื่อกฎ 68–95–99.7 (เชิงประจักษ์)หรือกฎ 3 ซิกมา

กล่าวโดยละเอียด ความน่าจะเป็นที่ค่าเบี่ยงเบนมาตรฐานจะอยู่ในช่วงระหว่างและนั้นกำหนดโดย สูตร โดยปัดเศษให้เหลือ 12 หลักสำคัญ ค่าของคือ:

⁠ ⁠โออีไอเอส
10.682 689 492 1370.317 310 507 863
3.151 487 187 53
OEISA178647
20.954 499 736 1040.045 500 263 896
21.977 894 5080
OEISA110894
30.997 300 203 9370.002 699 796 063
370.398 347 345
OEISA270712
40.999 936 657 5160.000 063 342 484
15 787.192 7673
50.999 999 426 6970.000 000 573 303
1 744 277.893 62
60.999 999 998 0270.000 000 001 973
506 797 345.897

สำหรับค่า ⁠ ⁠ ขนาดใหญ่ สามารถใช้การประมาณค่าได้

ฟังก์ชันควอนไทล์

ฟังก์ชันควอนไทล์ของการแจกแจงคือส่วนกลับของฟังก์ชันการแจกแจงสะสม ฟังก์ชันควอนไทล์ของการแจกแจงปกติมาตรฐานเรียกว่าฟังก์ชันโพรบิตและสามารถแสดงได้ในรูปของฟังก์ชันความคลาดเคลื่อน ผกผัน : สำหรับตัวแปรสุ่มปกติที่มีค่าเฉลี่ยและความแปรปรวนฟังก์ชันควอนไทล์คือ ควอนไทล์ของการแจกแจงปกติมาตรฐานมักใช้สัญลักษณ์ค่าเหล่านี้ใช้ในการทดสอบสมมติฐานการสร้างช่วงความเชื่อมั่นและแผนภาพ Q–Qตัวแปรสุ่มปกติจะมีค่าเกินช่วงด้วยความน่าจะเป็นและจะมีค่าอยู่นอกช่วงด้วยความน่าจะเป็นโดยเฉพาะอย่างยิ่ง ควอนไทล์คือ1.96ดังนั้นตัวแปรสุ่มปกติจะมีค่าอยู่นอกช่วงเพียง 5% ของกรณีเท่านั้น

ตารางต่อไปนี้แสดงควอนไทล์ที่จะอยู่ในช่วงด้วยความน่าจะเป็นที่ระบุค่าเหล่านี้มีประโยชน์ในการกำหนดช่วงความคลาดเคลื่อนสำหรับค่าเฉลี่ยตัวอย่างและตัวประมาณ ทางสถิติอื่นๆ ที่มีการแจกแจงแบบปกติ (หรือ แบบปกติ เชิงอะซิมโทติก ) [ 23 ]ตารางต่อไปนี้แสดงไม่ใช่ตามที่กำหนดไว้ข้างต้น

⁠ ⁠  ⁠ ⁠
0.801.281 551 565 5450.9993.290 526 731 492
0.901.644 853 626 9510.99993.890 591 886 413
0.951.959 963 984 5400.999994.417 173 413 469
0.982.326 347 874 0410.9999994.891 638 475 699
0.992.575 829 303 5490.99999995.326 723 886 384
0.9952.807 033 768 3440.999999995.730 728 868 236
0.9983.090 232 306 1680.9999999996.109 410 204 869

สำหรับค่า ⁠ ⁠ เล็กๆ ฟังก์ชันควอนไทล์จะมีการขยายอนุกรมเชิงอะซิมโทติก ที่มีประโยชน์ดังนี้

การใช้การหาค่ารากเพื่อคำนวณฟังก์ชันควอนไทล์

วิธีการใดๆ ที่อธิบายไว้สำหรับการคำนวณฟังก์ชันการกระจายสะสมสามารถใช้ร่วมกับวิธีของนิวตัน (หรืออัลกอริธึมการหาค่าราก อื่นๆ เช่นวิธีของฮัลลีย์ ) เพื่อหาค่าของสำหรับสำหรับควอนไทล์ที่ต้องการตัวอย่างเช่น เริ่มต้นด้วยการคาดเดาเบื้องต้นที่ถูกต้องโดยประมาณ จากนั้น สามารถคำนวณ ค่าประมาณที่ดีขึ้นเรื่อยๆ , ⁠ , ... ได้แบบวนซ้ำโดยใช้วิธีของนิวตันด้วย

คุณสมบัติ

การแจกแจงปกติเป็นการแจกแจงเดียวที่ค่าสะสมนอกเหนือจากสองค่าแรก (เช่น นอกเหนือจากค่าเฉลี่ยและความแปรปรวน ) เป็นศูนย์ นอกจากนี้ยังเป็นการแจกแจงต่อเนื่องที่มีเอนโทรปีสูงสุดสำหรับค่าเฉลี่ยและความแปรปรวนที่กำหนด[ 24 ] [ 25 ] Gearyได้แสดงให้เห็นแล้วว่า หากสมมติว่าค่าเฉลี่ยและความแปรปรวนมีค่าจำกัด การแจกแจงปกติเป็นการแจกแจงเดียวที่ค่าเฉลี่ยและความแปรปรวนที่คำนวณจากชุดของการสุ่มตัวอย่างอิสระจะเป็นอิสระต่อกัน[ 26 ] [ 27 ]

การแจกแจงปกติเป็นกลุ่มย่อยของการแจกแจงแบบวงรีการแจกแจงปกติมีความสมมาตรเกี่ยวกับค่าเฉลี่ย และมีค่าไม่เป็นศูนย์ตลอดช่วงเส้นจำนวนจริง ดังนั้นจึงอาจไม่ใช่แบบจำลองที่เหมาะสมสำหรับตัวแปรที่มีค่าเป็นบวกโดยธรรมชาติหรือมีการเบี่ยงเบนอย่างมาก เช่นน้ำหนักของบุคคลหรือราคาหุ้นตัวแปรดังกล่าวอาจอธิบายได้ดีกว่าด้วยการแจกแจงอื่นๆ เช่นการแจกแจงแบบลอการิทึมปกติหรือการแจกแจงแบบพาเรโต

ค่าของความหนาแน่นปกติจะมีค่าเกือบเป็นศูนย์เมื่อค่าอยู่ ห่างจากค่า เฉลี่ยมากกว่าสองสามส่วนเบี่ยงเบนมาตรฐาน (เช่น การกระจายตัวสามส่วนเบี่ยงเบนมาตรฐานครอบคลุมเกือบทั้งหมด ยกเว้น 0.27% ของการกระจายตัวทั้งหมด) ดังนั้น จึงอาจไม่ใช่แบบจำลองที่เหมาะสมเมื่อคาดว่าจะมีค่าผิดปกติ จำนวนมาก —ค่าที่อยู่ห่างจากค่าเฉลี่ยหลายส่วนเบี่ยงเบนมาตรฐาน— และวิธีการกำลังสองน้อยที่สุดและ วิธี การอนุมานทางสถิติ อื่นๆ ที่เหมาะสมที่สุดสำหรับตัวแปรที่มีการกระจายแบบปกติ มักจะไม่น่าเชื่อถืออย่างยิ่งเมื่อนำไปใช้กับข้อมูลดังกล่าว ในกรณีเหล่านั้นควรสันนิษฐานว่าเป็นการกระจายแบบหางหนัก กว่า และ ใช้วิธี การอนุมานทางสถิติที่แข็งแกร่ง ที่เหมาะสม

การแจกแจงแบบเกาส์เซียนจัดอยู่ในกลุ่มของการแจกแจงแบบเสถียรซึ่งเป็นตัวดึงดูดของผลรวมของ การแจกแจง แบบอิสระที่เหมือนกันไม่ว่าค่าเฉลี่ยหรือความแปรปรวนจะมีค่าจำกัดหรือไม่ก็ตาม ยกเว้นการแจกแจงแบบเกาส์เซียนซึ่งเป็นกรณีจำกัด การแจกแจงแบบเสถียรทั้งหมดจะมีหางที่หนาและมีความแปรปรวนอนันต์ การแจกแจงแบบเกาส์เซียนเป็นหนึ่งในไม่กี่การแจกแจงแบบเสถียรที่มีฟังก์ชันความหนาแน่นความน่าจะเป็นที่สามารถแสดงออกมาในเชิงวิเคราะห์ได้ การแจกแจงแบบอื่น ๆ ได้แก่การแจกแจงแบบโคชีและการแจกแจงแบบเลวี

สมมาตรและอนุพันธ์

การแจกแจงปกติที่มีความหนาแน่น(ค่าเฉลี่ยและความแปรปรวน) มีคุณสมบัติดังต่อไปนี้:

  • มันมีความสมมาตรรอบจุด ซึ่ง เป็นทั้งโหมดมัธยฐานและค่าเฉลี่ยของการกระจาย[ 28 ]
  • ฟังก์ชัน นี้ มีลักษณะเป็นโมดอลเดียว กล่าว คือ อนุพันธ์ อันดับแรกมีค่าเป็นบวกเมื่อเป็นลบเมื่อและมีค่าเป็นศูนย์เฉพาะเมื่อ
  • พื้นที่ที่ล้อมรอบด้วยเส้นโค้งและแกน x มีค่าเท่ากับหนึ่ง (กล่าวคือเท่ากับหนึ่ง)
  • อนุพันธ์อันดับแรกของมันคือ
  • อนุพันธ์อันดับสองของมันคือ
  • ความหนาแน่นของมันมีจุดเปลี่ยนความโค้ง สองจุด (ซึ่งอนุพันธ์อันดับสองของ⁠ ⁠เป็นศูนย์และเปลี่ยนเครื่องหมาย) ซึ่งอยู่ห่างจากค่าเฉลี่ยหนึ่งส่วนเบี่ยงเบนมาตรฐาน กล่าวคือที่และ[ 28 ]
  • ความหนาแน่นของมันเป็นลอการิทึมเว้า[ 28 ]
  • ความหนาแน่นของมันสามารถหาอนุพันธ์ได้ ไม่จำกัดครั้ง จริงๆ แล้วเรียบมากเป็นอันดับ 2 [ 29 ]

นอกจากนี้ ความหนาแน่นของการแจกแจงปกติมาตรฐาน (เช่นและ) ยังมีคุณสมบัติดังต่อไปนี้:

  • อนุพันธ์อันดับแรกของมันคือ
  • อนุพันธ์อันดับสองของมันคือ
  • โดยทั่วไปแล้ว อนุพันธ์ลำดับที่ n ของมัน คือโดยที่คือพหุนามเฮอร์ไมต์ลำดับที่ n (ความน่าจะเป็น) [ 30 ]
  • ความน่าจะเป็นที่ตัวแปร ที่มีการแจกแจงแบบปกติโดยที่ทราบค่าและอยู่ในเซตใดเซตหนึ่ง สามารถคำนวณได้ โดยที่เศษส่วนนั้นมีการแจกแจงแบบปกติมาตรฐาน

ช่วงเวลา

โมเมนต์ธรรมดาและโมเมนต์สัมบูรณ์ของตัวแปรคือค่าคาดหวังของและตามลำดับ ถ้าค่าคาดหวังของเป็นศูนย์พารามิเตอร์เหล่านี้เรียกว่าโมเมนต์กลางมิฉะนั้นจะเรียกว่าโมเมนต์ ไม่กลางโดยปกติแล้วเราจะสนใจเฉพาะโมเมนต์ที่มีอันดับเป็นจำนวนเต็มเท่านั้น

ถ้า⁠ ⁠มีการกระจายแบบปกติ โมเมนต์ที่ไม่ใช่ศูนย์กลางจะมีอยู่และมีค่าจำกัดสำหรับ⁠ ⁠ ใดๆ ที่ส่วนจริงมีค่ามากกว่า −1 สำหรับจำนวนเต็มที่ไม่เป็นลบใดๆ⁠ ⁠โมเมนต์ศูนย์กลางธรรมดาคือ: [ 31 ] ในที่นี้หมายถึงแฟกทอเรียลคู่นั่นคือ ผลคูณของจำนวนทั้งหมดตั้งแต่ถึง 1 ที่มีพาริตีเดียวกันกับ

โมเมนต์สัมบูรณ์ส่วนกลางจะตรงกับโมเมนต์ธรรมดาสำหรับลำดับคู่ทั้งหมด แต่จะไม่เป็นศูนย์สำหรับลำดับคี่ สำหรับจำนวนเต็มที่ไม่เป็นลบใดๆ

สูตรสุดท้ายใช้ได้กับค่าที่ไม่ใช่จำนวนเต็มใดๆเมื่อค่าเฉลี่ยของโมเมนต์ธรรมดาและสัมบูรณ์สามารถแสดงได้ในรูปของฟังก์ชันไฮเปอร์จีโอเมตริกที่ต่อเนื่องกันและ[ 32 ]

นิพจน์เหล่านี้ยังคงใช้ได้แม้ว่า⁠ ⁠จะไม่ใช่จำนวนเต็มก็ตาม ดูเพิ่มเติมที่พหุ นามเฮอร์ไมต์แบบทั่วไป

คำสั่งช่วงเวลาที่ไม่เป็นศูนย์กลางช่วงเวลาสำคัญ
0 ⁠ ⁠⁠ ⁠
1 ⁠ ⁠⁠ ⁠
2
3 ⁠ ⁠
4
5 ⁠ ⁠
6
7 ⁠ ⁠
8

ค่าคาดหวังของ⁠ ⁠โดยมีเงื่อนไขว่าเหตุการณ์⁠ ⁠อยู่ในช่วงจะกำหนดโดย โดย ที่และคือฟังก์ชันความหนาแน่นและฟังก์ชันการกระจายสะสมของ ตามลำดับ สำหรับกรณีนี้เรียกว่าอัตราส่วนมิลส์ผกผันโปรดสังเกตว่าข้างต้น ความหนาแน่นของถูกนำมาใช้แทนความหนาแน่นปกติมาตรฐานดังเช่นในอัตราส่วนมิลส์ผกผัน ดังนั้นในที่นี้เราจึงมีแทนที่จะ เป็น

การแปลงฟูริเยร์และฟังก์ชันลักษณะเฉพาะ

การแปลงฟูริเยร์ของความหนาแน่นปกติที่มีค่าเฉลี่ยและความแปรปรวนคือ[ 33 ]

โดยที่⁠ ⁠คือหน่วยจินตนาการถ้าค่าเฉลี่ยปัจจัยแรกคือ 1 และการแปลงฟูริเยร์ นอกเหนือจากปัจจัยคงที่แล้ว จะเป็นความหนาแน่นปกติในโดเมนความถี่โดยมีค่าเฉลี่ย 0 และความแปรปรวนโดยเฉพาะอย่างยิ่ง การแจกแจงปกติมาตรฐานเป็นฟังก์ชันลักษณะเฉพาะของการแปลงฟูริเยร์

ในทฤษฎีความน่าจะเป็น การแปลงฟู ริเยร์ของการกระจายความน่าจะเป็นของตัวแปรสุ่มค่าจริงนั้นเชื่อมโยงอย่างใกล้ชิดกับฟังก์ชันลักษณะเฉพาะของตัวแปรนั้น ซึ่งกำหนดเป็นค่าที่คาดหวังของเป็นฟังก์ชันของตัวแปรจริง(พารามิเตอร์ความถี่ ของการ แปลงฟูริเยร์) คำจำกัดความนี้สามารถขยายเชิงวิเคราะห์ไปยังตัวแปรค่าเชิงซ้อนได้ [ 34 ]ความสัมพันธ์ระหว่างทั้งสองคือ :

ส่วนจริงและส่วนจินตนาการของคำว่า "ให้": และ

ในทำนองเดียวกัน และ

สูตรเหล่านี้เมื่อประเมินค่าแล้ว จะให้ค่าที่คาดหวังของฟังก์ชันตรีโกณมิติและไฮเปอร์โบลิกพื้นฐานเหล่านี้เหนือตัวแปรสุ่มแบบเกาส์เซียนซึ่งอาจมองได้ว่าเป็นผลสืบเนื่องมาจากทฤษฎีบทของอิสเซอร์ลิส ด้วย เช่น กัน

ฟังก์ชันสร้างโมเมนต์และคูมูลันต์

ฟังก์ชันสร้างโมเมนต์ของตัวแปรสุ่มจริงคือค่าคาดหวังของ ตัวแปร สุ่มจริงนั้นโดยเป็นฟังก์ชันของพารามิเตอร์จริงสำหรับการแจกแจงปกติที่มีความหนาแน่นค่าเฉลี่ยและความแปรปรวนฟังก์ชันสร้างโมเมนต์มีอยู่และเท่ากับ

สำหรับค่าใดๆ⁠ ⁠ค่าสัมประสิทธิ์ของ⁠ ⁠ ในฟังก์ชัน สร้าง โมเมนต์ (แสดงในรูปอนุกรมกำลังเลขชี้กำลังใน⁠ ⁠ ) คือค่าคาดหวังของการแจกแจงปกติ⁠ ⁠

ฟังก์ชันก่อกำเนิดคูมูลันต์คือลอการิทึมของฟังก์ชันก่อกำเนิดโมเมนต์ กล่าวคือ

สัมประสิทธิ์ของอนุกรมกำลังเลขชี้กำลังนี้กำหนดค่าคิวมูลันต์ แต่เนื่องจากนี่เป็นพหุนามกำลังสองใน ⁠ ⁠ดังนั้น ค่าคิวมูลันต์สองค่าแรกเท่านั้นที่ไม่เป็นศูนย์ ได้แก่ ค่าเฉลี่ย  ⁠ ⁠และความแปรปรวน  ⁠ ⁠

ผู้เขียนบางท่านนิยมใช้ฟังก์ชันลักษณะ เฉพาะ E[ e itX ] = e iμtσ 2 t 2 /2และln E[ e itX ] = iμt⁠ แทน1/2σ 2 t 2 .

ตัวดำเนินการและคลาสของสไตน์

ในวิธีการของ Steinตัวดำเนินการ Stein และคลาสของตัวแปรสุ่ม คือและคลาสของฟังก์ชันต่อเนื่องสัมบูรณ์ทั้งหมดเช่นนั้น

ขีดจำกัดความแปรปรวนเป็นศูนย์

ในขีดจำกัดเมื่อเข้าใกล้ศูนย์ ความหนาแน่นของความน่าจะเป็นจะเข้าใกล้ศูนย์ทุกที่ยกเว้นที่ซึ่งมันจะเข้าใกล้ในขณะที่ปริพันธ์ของมันยังคงเท่ากับ 1 การขยายการแจกแจงปกติไปยังกรณีที่มีความแปรปรวนเป็นศูนย์สามารถกำหนดได้โดยใช้มาตรวัดเดลต้าของ Diracแม้ว่าตัวแปรสุ่มที่ได้จะไม่ต่อเนื่องอย่างสมบูรณ์และดังนั้นจึงไม่มีฟังก์ชันความหนาแน่นของความน่าจะเป็นฟังก์ชันการแจกแจงสะสมของตัวแปรสุ่มดังกล่าวคือฟังก์ชันขั้นบันไดของ Heavisideที่เลื่อนโดยค่าเฉลี่ยกล่าวคือ

เอนโทรปีสูงสุด

จากการแจกแจงความน่าจะเป็นทั้งหมดบนจำนวนจริงที่มีค่าเฉลี่ยจำกัดที่กำหนดไว้และความแปรปรวนจำกัดการแจกแจงปกติเป็นการแจกแจงที่มีเอนโทรปีสูงสุด[ 24 ]เพื่อให้เห็นเช่นนี้ ให้เป็นตัวแปรสุ่มต่อเนื่องที่มีความหนาแน่นความน่าจะ เป็น เอนโทรปีของถูกกำหนดเป็น[ 35 ] [ 36 ] [ 37 ] โดยที่ ⁠ ⁠ เข้าใจว่าเป็นศูนย์เมื่อใดก็ตามที่ฟังก์ชันนี้สามารถเพิ่มค่าสูงสุดได้ ภายใต้ข้อจำกัดที่ว่าการแจกแจงได้รับการทำให้เป็นมาตรฐานอย่างเหมาะสมและมีค่าเฉลี่ยและความแปรปรวนที่กำหนดไว้ โดยใช้แคลคูลัสแปรผัน ฟังก์ชันที่มีตัวคูณลากรางจ์สามตัวถูกกำหนดไว้ดังนี้:

ที่ระดับเอนโทรปีสูงสุด การเปลี่ยนแปลงเล็กน้อยเกี่ยวกับจะทำให้เกิดการเปลี่ยนแปลงเกี่ยวกับซึ่งเท่ากับ 0 :

เนื่องจากเงื่อนไขนี้ต้องเป็นจริงสำหรับ ค่า ⁠ ⁠ เล็กๆ ใดๆ ดังนั้นตัวคูณ⁠ ⁠ต้องเป็นศูนย์ และเมื่อแก้หา⁠ ⁠ จะได้ ผลลัพธ์ดังนี้:

ข้อจำกัดของลากรางจ์ที่ว่า⁠ ⁠ ได้รับการทำให้เป็นมาตรฐานอย่างเหมาะสมและมีค่าเฉลี่ยและความแปรปรวนที่ระบุไว้ จะเป็นไปตาม เงื่อนไข ก็ต่อเมื่อ⁠ ⁠ , ⁠ ⁠และ⁠ ⁠ถูกเลือกเพื่อให้ เอนโทรปีของการแจกแจงปกติเท่ากับ ซึ่งเป็นอิสระจากค่าเฉลี่ย

คุณสมบัติอื่นๆ

  1. ถ้าฟังก์ชันลักษณะเฉพาะของตัวแปรสุ่มบางตัวมีรูปแบบในบริเวณใกล้เคียงศูนย์ โดยที่เป็นพหุนาม ทฤษฎีบท ของMarcinkiewicz (ตั้งชื่อตามJózef Marcinkiewicz ) ยืนยันว่าจะ เป็นพหุนามกำลังสอง ได้มากที่สุดเท่านั้น ดังนั้น จึงเป็นตัวแปรสุ่มปกติ[ 38 ] ผลที่ตามมาของผลลัพธ์นี้คือ การแจกแจงปกติเป็นการแจกแจงเดียวที่มีจำนวนจำกัด (สอง) ของ ค่าสะสมที่ไม่เป็นศูนย์
  2. ถ้า⁠ ⁠และ⁠ ⁠มีการแจกแจงแบบปกติร่วมกันและไม่มีความสัมพันธ์กันแสดงว่าตัวแปรสุ่มทั้งสองเป็น อิสระต่อกัน เงื่อนไขที่ว่า⁠ ⁠และ⁠ ⁠ควรมีการ แจกแจงแบบปกติ ร่วมกันนั้นมีความสำคัญอย่างยิ่ง หากไม่มีเงื่อนไขนี้ คุณสมบัติดังกล่าวจะไม่เป็นจริง[ 39 ] [ 40 ] [พิสูจน์]สำหรับตัวแปรสุ่มที่ไม่เป็นแบบปกติ การไม่มีความสัมพันธ์กันไม่ได้หมายความถึงความเป็นอิสระ
  3. ความแตกต่าง ของKullback–Leiblerระหว่างการแจกแจงปกติหนึ่งกับอีก การแจกแจงหนึ่ง กำหนดโดย: [ 41 ] ระยะทาง Hellingerระหว่างการแจกแจงเดียวกันเท่ากับ
  4. เมทริกซ์ข้อมูลของฟิชเชอร์สำหรับการแจกแจงปกติเทียบกับ⁠ ⁠และเป็นเมทริกซ์แนวทแยงและมีรูปแบบดังนี้
  5. ไพรเออร์คู่ควบของค่าเฉลี่ยของการแจกแจงปกติคือการแจกแจงปกติอีกแบบหนึ่ง[ 42 ]โดยเฉพาะอย่างยิ่ง ถ้าเป็น iid และไพรเออร์คือแล้วการแจกแจงโพสทีเรียร์สำหรับตัวประมาณค่าของจะเป็น
  6. กลุ่มการแจกแจงปกติไม่เพียงแต่ก่อตัวเป็นกลุ่มการแจกแจงเอกซ์โพเน นเชียล (EF) เท่านั้น แต่ยังก่อตัวเป็นกลุ่มการแจกแจงเอกซ์โพเนนเชียลธรรมชาติ (NEF) ที่มีฟังก์ชันความแปรปรวน กำลังสอง ( NEF-QVF ) อีกด้วย คุณสมบัติหลายอย่างของการแจกแจงปกติสามารถนำไปใช้กับคุณสมบัติของการแจกแจง NEF-QVF, การแจกแจง NEF หรือการแจกแจง EF ได้โดยทั่วไป การแจกแจง NEF-QVF ประกอบด้วย 6 กลุ่ม ได้แก่ การแจกแจงปัวซง, แกมมา, ทวินาม และทวินามเชิงลบ ในขณะที่กลุ่มการแจกแจงทั่วไปที่ศึกษาในวิชาความน่าจะเป็นและสถิติส่วนใหญ่เป็น NEF หรือ EF
  7. ในเรขาคณิตสารสนเทศตระกูลของการแจกแจงปกติก่อให้เกิด แม นิ โฟ ลด์ทางสถิติที่มีความโค้งคงที่ตระกูลเดียวกันนี้แบนราบเมื่อเทียบกับการเชื่อมต่อ (±1) และ[ 43 ]
  8. ถ้ามีการแจกแจงตามแล้ว. โปรดทราบว่าไม่มีสมมติฐานเรื่องความเป็นอิสระ[ 44 ]

ทฤษฎีบทลิมิตกลาง

เมื่อจำนวนเหตุการณ์ที่ไม่ต่อเนื่องเพิ่มขึ้น ฟังก์ชันจะเริ่มมีลักษณะคล้ายกับการแจกแจงแบบปกติ
การเปรียบเทียบฟังก์ชันความหนาแน่นความน่าจะเป็นp ( k )สำหรับผลรวมของลูกเต๋า 6 ด้านที่ยุติธรรมจำนวนn ลูก เพื่อแสดงให้เห็นถึงการลู่เข้าสู่การแจกแจงปกติเมื่อ na เพิ่มขึ้น ตามทฤษฎีบทขีดจำกัดกลาง ในกราฟด้านล่างขวา โปรไฟล์ที่ปรับเรียบของกราฟก่อนหน้าจะถูกปรับขนาด ซ้อนทับ และเปรียบเทียบกับการแจกแจงปกติ (เส้นโค้งสีดำ)

ทฤษฎีบทลิมิตกลางกล่าวว่า ภายใต้เงื่อนไขบางประการ (ซึ่งค่อนข้างพบได้ทั่วไป) ผลรวมของตัวแปรสุ่มจำนวนมากจะมีลักษณะการแจกแจงแบบปกติโดยประมาณ กล่าวคือ โดยที่ เป็นตัวแปร สุ่ม อิสระและมีการแจกแจงเหมือนกันมีการแจกแจงแบบสุ่มเดียวกัน มีค่าเฉลี่ยเป็นศูนย์ และความแปรปรวน σ และคือค่าเฉลี่ยของตัวแปรสุ่มเหล่านั้นที่ปรับขนาดด้วย ⁠ ⁠ ดังนั้น เมื่อเพิ่มขึ้น การแจกแจงความน่าจะเป็นของจะมีแนวโน้มเข้าสู่การแจกแจงแบบปกติที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวน

ทฤษฎีบทนี้สามารถขยายไปใช้กับตัวแปรที่ไม่เป็นอิสระต่อกันและ/หรือไม่ได้มีการแจกแจงเหมือนกันได้ หากมีการกำหนดข้อจำกัดบางประการเกี่ยวกับระดับความสัมพันธ์และโมเมนต์ของการแจกแจง

สถิติการทดสอบคะแนนและตัวประมาณค่าจำนวนมากที่พบในทางปฏิบัติ ล้วนประกอบด้วยผลรวมของตัวแปรสุ่มบางอย่าง และตัวประมาณค่าจำนวนมากสามารถแสดงได้ในรูปผลรวมของตัวแปรสุ่มโดยใช้ฟังก์ชันอิทธิพลทฤษฎีบทลิมิตกลางบ่งชี้ว่าพารามิเตอร์ทางสถิติเหล่านั้นจะมีการกระจายแบบปกติเชิงอะซิมโทติก

ทฤษฎีบทลิมิตกลางยังบ่งชี้ว่าการแจกแจงบางอย่างสามารถประมาณได้ด้วยการแจกแจงปกติ ตัวอย่างเช่น:

  • การแจกแจงทวินาม มีลักษณะใกล้เคียงกับการแจกแจงปกติโดยมีค่าเฉลี่ยและความแปรปรวนสำหรับค่า ⁠ ที่มีขนาดใหญ่ และสำหรับค่า ⁠ ที่ไม่ใกล้เคียงกับ 0 หรือ 1 มากเกินไป
  • การแจกแจงปัวซงที่มีพารามิเตอร์⁠ ⁠มีลักษณะใกล้เคียงกับการแจกแจงปกติ โดยมีค่าเฉลี่ย⁠ ⁠และความแปรปรวน⁠ ⁠สำหรับค่า⁠ ⁠ที่ มีค่ามาก [ 45 ]
  • การแจกแจงไคกำลังสอง มีลักษณะใกล้เคียงกับการแจกแจงปกติ โดยมีค่าเฉลี่ยและความแปรปรวนสำหรับค่า⁠ ขนาดใหญ่
  • การแจกแจงแบบ t ของนักเรียน จะมีลักษณะใกล้เคียงกับการแจกแจงแบบปกติ โดยมีค่าเฉลี่ย 0 และความแปรปรวน 1 เมื่อมีค่ามาก

ความแม่นยำของการประมาณค่าเหล่านี้เพียงพอหรือไม่นั้น ขึ้นอยู่กับวัตถุประสงค์ที่ต้องการใช้ และอัตราการลู่เข้าสู่การแจกแจงแบบปกติ โดยทั่วไปแล้ว การประมาณค่าเหล่านี้มักมีความแม่นยำน้อยกว่าในส่วนปลายของการแจกแจง

ขอบเขตบนทั่วไปสำหรับข้อผิดพลาดในการประมาณค่าในทฤษฎีบทลิมิตกลางนั้นกำหนดโดยทฤษฎีบทเบอร์รี-เอสซีนส่วนการปรับปรุงการประมาณค่านั้นกำหนดโดยการขยายแบบเอ็ดจ์เวิร์

ทฤษฎีบทนี้ยังสามารถใช้เพื่อพิสูจน์การจำลองผลรวมของแหล่งกำเนิดสัญญาณรบกวนแบบสม่ำเสมอจำนวนมากเป็นสัญญาณรบกวนแบบเกาส์เซียนได้ ดูAWGN

การดำเนินการและหน้าที่ของตัวแปรปกติ

การดำเนินการกับตัวแปรปกติตัวเดียว

ถ้า⁠ ⁠มีการกระจายแบบปกติ โดยมีค่าเฉลี่ย⁠ ⁠และความแปรปรวนแล้ว

การดำเนินการกับตัวแปรปกติอิสระสองตัว
  • ถ้าและเป็นตัวแปรสุ่มปกติอิสระสองตัว โดยมีค่าเฉลี่ย,และความแปรปรวน, , แล้วผลรวมของตัวแปรทั้งสองนี้จะมีการแจกแจงแบบปกติเช่นกัน[พิสูจน์]โดยมีค่าเฉลี่ยและความแปรปรวน
  • โดยเฉพาะอย่างยิ่ง ถ้า⁠ ⁠และ⁠ ⁠เป็นค่าเบี่ยงเบนปกติอิสระที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนแล้วและก็จะเป็นอิสระและมีการกระจายแบบปกติเช่นกัน โดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนนี่เป็นกรณีพิเศษของเอกลักษณ์โพลาไรเซชัน[ 46 ]
  • ถ้าและเป็นตัวแปรสุ่มปกติอิสระสองตัวที่มีค่าเฉลี่ยและความแปรปรวนและ และ เป็นจำนวน จริงใดแล้วตัวแปร ก็จะมีการแจกแจงแบบ ปกติเช่นกัน โดยมีค่าเฉลี่ยและความแปรปรวนดังนั้น การแจกแจงแบบปกติจึงมีเสถียรภาพ (โดยมีเลขชี้กำลัง)
  • ถ้าและเป็นการแจกแจงแบบปกติค่าเฉลี่ยเรขาคณิต แบบนอร์มาไลซ์ของพวกมัน จะเป็นการแจกแจงแบบปกติที่มีและ.
การดำเนินการกับตัวแปรปกติมาตรฐานอิสระสองตัว

ถ้าและเป็นตัวแปรสุ่มปกติมาตรฐานอิสระสองตัวที่มีค่าเฉลี่ย 0 และความแปรปรวน 1 แล้ว

การดำเนินการกับตัวแปรปกติอิสระหลายตัว

  • การรวมกันเชิงเส้นใดๆของค่าเบี่ยงเบนปกติที่เป็นอิสระต่อกัน ถือเป็นค่าเบี่ยงเบนปกติ
  • ถ้าเป็นตัวแปรสุ่มปกติมาตรฐานที่เป็นอิสระต่อกัน ผลรวมของกำลังสองของตัวแปรเหล่านั้นจะมีการแจกแจงแบบไคกำลังสองโดยมีองศาอิสระ
  • ถ้าตัวแปรสุ่มที่มีการแจกแจงแบบปกติที่เป็นอิสระต่อกัน โดยมีค่าเฉลี่ยและความแปรปรวนแล้วค่าเฉลี่ยของตัวอย่างจะเป็นอิสระจากค่าเบี่ยงเบนมาตรฐานของตัวอย่าง[ 48 ]ซึ่งสามารถพิสูจน์ได้โดยใช้ทฤษฎีบทของ Basuหรือทฤษฎีบทของ Cochran [ 49 ]อัตราส่วนของปริมาณทั้งสองนี้จะมีการแจกแจงแบบ t ของ Studentโดยมีองศาอิสระ:
  • ถ้า, เป็นตัวแปรสุ่มปกติมาตรฐานอิสระ อัตราส่วนของผลรวมกำลังสองปกติของตัวแปรสุ่มทั้งสองจะมีการกระจายแบบ Fโดยมีองศาอิสระ( n , m ) ดังนี้ [ 50 ]

การดำเนินการกับตัวแปรปกติที่มีความสัมพันธ์กันหลายตัว

  • รูปแบบกำลังสองของเวกเตอร์ปกติ กล่าวคือ ฟังก์ชันกำลังสองของตัวแปรปกติอิสระหลายตัวหรือตัวแปรปกติที่มีความสัมพันธ์กัน คือตัวแปรไคกำลังสองแบบทั่วไป

การดำเนินการกับฟังก์ชันความหนาแน่น

การแจกแจงปกติแบบแยกส่วน (Split Normal Distribution)นั้น นิยามได้โดยตรงที่สุดโดยการนำส่วนที่ปรับขนาดแล้วของฟังก์ชันความหนาแน่นของการแจกแจงปกติที่แตกต่างกันมาเชื่อมต่อกัน และปรับขนาดความหนาแน่นใหม่เพื่อให้ค่าอินทิเกรตเท่ากับหนึ่ง ส่วนการแจกแจงปกติแบบตัดทอน (Truncated Normal Distribution) นั้น ได้มาจากการปรับขนาดส่วนหนึ่งของฟังก์ชันความหนาแน่นเดียว

การหารลงตัวอย่างไม่จำกัดและทฤษฎีบทของเครเมอร์

สำหรับจำนวนเต็มบวกn ใดๆ การแจกแจงปกติใดๆ ที่มีค่าเฉลี่ย⁠ ⁠และความแปรปรวนคือการแจกแจงของผลรวมของ ค่าเบี่ยงเบนปกติอิสระ nค่า โดยแต่ละค่ามีค่าเฉลี่ย ⁠ และความแปรปรวนⁿ คุณสมบัตินี้เรียกว่า การ หารลงตัวอย่างไม่มีที่สิ้นสุด[ 51 ]

ในทางกลับกัน ถ้าและเป็นตัวแปรสุ่มอิสระและผลรวมของตัวแปรสุ่มทั้งสองมีการกระจายแบบปกติ ดังนั้นทั้งและจะต้องเป็นค่าเบี่ยงเบนปกติ[ 52 ]

ผลลัพธ์นี้เรียกว่าทฤษฎีบทการแยกส่วนของ Cramérและเทียบเท่ากับการกล่าวว่าการสังเคราะห์ของสองการแจกแจงจะเป็นแบบปกติก็ต่อเมื่อทั้งสองเป็นการแจกแจงแบบปกติเท่านั้น ทฤษฎีบทของ Cramér บ่งชี้ว่าการรวมเชิงเส้นของตัวแปรอิสระที่ไม่ใช่แบบเกาส์เซียนจะไม่มีการแจกแจงแบบปกติอย่างแท้จริง แม้ว่าจะเข้าใกล้มากเท่าที่ต้องการก็ตาม[ 38 ]

ทฤษฎีบท Kac–Bernstein

ทฤษฎีบท Kac –Bernsteinระบุว่า ถ้าและเป็นอิสระต่อกัน และและก็เป็นอิสระต่อกันเช่นกัน แล้วทั้งXและYจะต้องมีการแจกแจงแบบปกติอย่างแน่นอน[ 53 ] [ 54 ]

โดยทั่วไป หากเป็นตัวแปรสุ่มอิสระ การรวมเชิงเส้นสองแบบที่แตกต่างกันและจะเป็นอิสระต่อกันก็ต่อเมื่อทั้งหมดเป็นแบบปกติ และโดยที่แสดงถึงความแปรปรวนของ[ 53 ]

ส่วนขยาย

แนวคิดของการแจกแจงปกติ ซึ่งเป็นหนึ่งในการแจกแจงที่สำคัญที่สุดในทฤษฎีความน่าจะเป็น ได้ถูกขยายออกไปไกลเกินกว่ากรอบมาตรฐานของกรณีตัวแปรเดียว (นั่นคือหนึ่งมิติ) (กรณีที่ 1) การขยายเหล่านี้ทั้งหมดก็เรียกว่า กฎ ปกติหรือ กฎ เกาส์เซียน เช่นกัน ดังนั้นจึงมีความกำกวมในชื่อเรียกอยู่บ้าง

ตัวแปรสุ่มXมีการแจกแจงแบบปกติสองส่วน ถ้ามีการแจกแจง ที่μคือค่าเฉลี่ยและσ คือส่วนเบี่ยงเบนมาตรฐาน2 1 และσ2 2 คือค่าความแปรปรวนของการกระจายตัวทางด้านซ้ายและด้านขวาของค่าเฉลี่ยตามลำดับ

ค่าเฉลี่ยE( X )ความแปรปรวนV( X )และโมเมนต์กลางลำดับที่สามT( X )ของการแจกแจงนี้ได้รับการกำหนดแล้ว[ 55 ]

หนึ่งในประโยชน์หลักของการใช้กฎเกาส์เซียนในทางปฏิบัติคือการสร้างแบบจำลองการแจกแจงเชิงประจักษ์ของตัวแปรสุ่มต่างๆ มากมายที่พบเจอในทางปฏิบัติ ในกรณีเช่นนี้ การขยายเพิ่มเติมที่เป็นไปได้คือตระกูลการแจกแจงที่สมบูรณ์ยิ่งขึ้น ซึ่งมีพารามิเตอร์มากกว่าสองตัว และด้วยเหตุนี้จึงสามารถปรับให้เข้ากับการแจกแจงเชิงประจักษ์ได้อย่างแม่นยำยิ่งขึ้น ตัวอย่างของการขยายเพิ่มเติมดังกล่าว ได้แก่:

  • การแจกแจงแบบเพียร์สัน — ตระกูลการแจกแจงความน่าจะเป็นที่มีพารามิเตอร์สี่ตัว ซึ่งขยายกฎการแจกแจงปกติเพื่อรวมค่าความเบี่ยงเบนและความโค้งที่แตกต่างกัน
  • การแจกแจงปกติทั่วไปหรือที่รู้จักกันในชื่อการแจกแจงกำลังเอกซ์โปเนนเชียล อนุญาตให้ส่วนหางของการแจกแจงมีลักษณะเชิงอะซิมโทติกที่หนาหรือบางกว่าได้

การอนุมานทางสถิติ

การประมาณค่าพารามิเตอร์

บ่อยครั้งที่เราไม่ทราบค่าพารามิเตอร์ของการแจกแจงปกติ แต่ต้องการประมาณค่าพารามิเตอร์เหล่านั้น กล่าวคือ เมื่อมีตัวอย่างจากประชากรที่มีการแจกแจงปกติ เราต้องการทราบค่าโดยประมาณของพารามิเตอร์และวิธีการมาตรฐานในการแก้ปัญหานี้คือ วิธี ความน่าจะเป็นสูงสุดซึ่งต้องทำการหาค่าสูงสุดของฟังก์ชันลอการิทึมความน่าจะเป็น : การหาอนุพันธ์เทียบกับ⁠ ⁠และและการแก้ระบบเงื่อนไขอันดับแรกที่ได้จะให้ค่าประมาณความน่าจะเป็นสูงสุดดังนี้ :

ดังนั้นจึงมีรายละเอียดดังนี้:

ค่าเฉลี่ยตัวอย่าง

ตัวประมาณค่านี้เรียกว่าค่าเฉลี่ยตัวอย่าง เนื่องจากเป็นค่าเฉลี่ยเลขคณิตของ การสังเกตทั้งหมด สถิตินี้สมบูรณ์และเพียงพอสำหรับและด้วยเหตุนี้ ตามทฤษฎีบท ของ Lehmann–Schefféจึงเป็น ตัวประมาณ ค่าที่ไม่เอนเอียงที่มีความแปรปรวนต่ำสุดอย่างสม่ำเสมอ (UMVU) [ 56 ]ในตัวอย่างขนาดจำกัด จะมีการกระจายแบบปกติ: ความแปรปรวนของตัวประมาณค่านี้เท่ากับ องค์ประกอบ μμของเมทริกซ์ข้อมูล Fisher ผกผัน ซึ่งหมายความว่าตัวประมาณค่านี้มีประสิทธิภาพในตัวอย่างขนาดจำกัดสิ่งสำคัญในทางปฏิบัติคือค่าความคลาดเคลื่อนมาตรฐานของเป็นสัดส่วนกับนั่นคือ หากต้องการลดค่าความคลาดเคลื่อนมาตรฐานลง 10 เท่า จะต้องเพิ่มจำนวนจุดในตัวอย่างขึ้น 100 เท่า ข้อเท็จจริงนี้ถูกนำมาใช้กันอย่างแพร่หลายในการกำหนดขนาดตัวอย่างสำหรับการสำรวจความคิดเห็นและจำนวนการทดลองในการจำลอง Monte Carlo

จากมุมมองของทฤษฎีเชิงอะซิมโทติก นั้น มีความสอดคล้องนั่นคือ มัน ลู่เข้าสู่ ในความน่าจะเป็น เมื่อ ตัวประมาณค่านี้ยังเป็นแบบปกติเชิงอะ ซิมโทติกด้วย ซึ่งเป็นผลลัพธ์ง่ายๆ จาก การที่มันเป็นแบบปกติในตัวอย่างจำกัด:

ความแปรปรวนของตัวอย่าง

ตัวประมาณค่านี้เรียกว่าความแปรปรวนของตัวอย่างเนื่องจากเป็นความแปรปรวนของตัวอย่าง ( ) ในทางปฏิบัติ มักใช้ตัวประมาณค่าอื่นแทน ตัวประมาณค่าอื่นนี้เรียกว่า และเรียกอีกอย่างว่าความแปรปรวนของตัวอย่างซึ่งมีความกำกวมในคำศัพท์อยู่บ้าง รากที่สองของมันเรียกว่าส่วนเบี่ยงเบนมาตรฐานของตัวอย่างตัวประมาณค่าแตกต่างจากตรงที่มี( n − 1)แทน  nในตัวส่วน (ที่เรียกว่าการแก้ไขของเบสเซล ) ความแตกต่างระหว่างและจะมีค่าน้อยมากจนแทบไม่มีนัยสำคัญสำหรับn ที่ มี ค่ามาก อย่างไรก็ตาม ในตัวอย่างที่มีขนาดจำกัด แรงจูงใจในการใช้คือมันเป็นตัวประมาณค่าที่ไม่เอนเอียงของพารามิเตอร์พื้นฐานในขณะที่เอนเอียง นอกจากนี้ ตามทฤษฎีบทของ Lehmann–Scheffé ตัวประมาณค่าจะเป็นตัวประมาณค่าที่ไม่เอนเอียงที่มีความแปรปรวนต่ำสุดอย่างสม่ำเสมอ ( UMVU ) [ 56 ]ซึ่งทำให้เป็นตัวประมาณค่าที่ดีที่สุดในบรรดาตัวประมาณค่าที่ไม่เอนเอียงทั้งหมด อย่างไรก็ตาม สามารถแสดงได้ว่าตัวประมาณค่าที่เอนเอียงนั้นดีกว่าในแง่ของ เกณฑ์ ความคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) ในตัวอย่างขนาดจำกัด ทั้งและมีการแจกแจงไคกำลังสองแบบ ปรับขนาด ที่มีองศาอิสระ ( n − 1) นิพจน์แรกเหล่านี้แสดงให้เห็นว่าความแปรปรวนของเท่ากับซึ่งมากกว่า องค์ประกอบ σσของเมทริกซ์ข้อมูล Fisher ผกผัน เล็กน้อย ซึ่งคือดังนั้น จึงไม่ใช่ตัวประมาณค่าที่มีประสิทธิภาพสำหรับและยิ่งไปกว่านั้น เนื่องจากเป็น UMVU เราจึงสรุปได้ว่าตัวประมาณค่าที่มีประสิทธิภาพสำหรับตัวอย่างขนาดจำกัดนั้นไม่มีอยู่จริง

เมื่อใช้ทฤษฎีเชิงอะซิมโทติก ตัวประมาณค่าทั้งและมีความสอดคล้องกัน กล่าวคือ ลู่เข้าสู่ค่า ด้วยความน่าจะเป็นเมื่อขนาดตัวอย่างเพิ่มขึ้นตัวประมาณค่าทั้งสองยังเป็นแบบปกติเชิงอะซิมโทติกด้วย โดยเฉพาะอย่างยิ่ง ตัวประมาณค่าทั้งสองมีประสิทธิภาพเชิงอะซิมโทติก สำหรับ

ช่วงความเชื่อมั่น

ตามทฤษฎีบทของ Cochranสำหรับการแจกแจงแบบปกติ ค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างเป็นอิสระต่อกัน ซึ่งหมายความ ว่าไม่มีประโยชน์ที่จะพิจารณาการแจกแจงร่วมกัน ของพวกมัน นอกจากนี้ยังมีทฤษฎีบทผกผัน: ถ้าในตัวอย่าง ค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างเป็นอิสระต่อกัน ตัวอย่างนั้นจะต้องมาจากการแจกแจงแบบปกติ ความเป็นอิสระระหว่าง s² และsสามารถนำมาใช้สร้างสถิติ t ได้ : ปริมาณt นี้ มีการแจกแจงแบบ Student's tที่มี องศาอิสระ ( n − 1)และเป็นสถิติเสริม (เป็นอิสระจากค่าของพารามิเตอร์) การกลับการแจกแจงของ สถิติ t นี้ จะทำให้เราสามารถสร้างช่วงความเชื่อมั่นสำหรับμได้[ 57 ] ใน ทำนองเดียวกัน การกลับ การแจกแจง χ²ของสถิติs² จะทำให้เรา ได้ช่วงความเชื่อมั่นสำหรับ σ² [ 58 ] โดย ที่t k , pและχ 2 k,p μ และσ²คือควอนไทล์ที่pของ การแจกแจง tและχ²ตามลำดับ ช่วงความเชื่อมั่นเหล่านี้มีระดับความเชื่อมั่น 1 − αซึ่งหมายความว่าค่าจริงμและσ²จะอยู่นอกช่วงเหล่านี้ด้วยความน่าจะเป็น (หรือระดับนัยสำคัญ ) αในทางปฏิบัติ ผู้คนมักจะใช้α = 5% ส่งผลให้ได้ช่วงความเชื่อมั่น 95 %ช่วงความเชื่อมั่นสำหรับσ²สามารถหาได้โดยการถอดรากที่สองของขอบเขตช่วงสำหรับ σ²

สูตรโดยประมาณสามารถหาได้จากการกระจายเชิงอะซิมโทติกของและs 2 : สูตรโดยประมาณจะใช้ได้สำหรับค่าn ที่มาก และสะดวกกว่าสำหรับการคำนวณด้วยตนเอง เนื่องจากควอนไทล์ปกติมาตรฐานz α /2ไม่ขึ้นอยู่กับnโดยเฉพาะอย่างยิ่ง ค่าα ที่นิยมใช้มากที่สุด คือ 5%ซึ่งจะได้ผลลัพธ์เป็น| z 0.025 | = 1.96

การทดสอบความปกติ

การทดสอบความปกติจะประเมินโอกาสที่ชุดข้อมูลที่กำหนด{ x 1 , ..., x n }จะมาจากการกระจายแบบปกติ โดยทั่วไปสมมติฐานว่างH 0คือ ข้อมูลมีการกระจายแบบปกติโดยมีค่าเฉลี่ยμและความแปรปรวนσ 2 ที่ไม่ระบุ ในขณะที่สมมติฐานทางเลือกH aคือ การกระจายนั้นเป็นไปโดยพลการ มีการทดสอบมากมาย (มากกว่า 40 แบบ) ที่ถูกคิดค้นขึ้นสำหรับปัญหานี้ การทดสอบที่โดดเด่นกว่านั้นมีรายละเอียดดังต่อไปนี้:

แผนภาพการวินิจฉัยนั้นดูน่าสนใจกว่าในเชิงสัญชาตญาณ แต่ในขณะเดียวกันก็มีความเป็นอัตวิสัยสูง เนื่องจากอาศัยการตัดสินใจอย่างไม่เป็นทางการของมนุษย์ในการยอมรับหรือปฏิเสธสมมติฐานว่าง

  • แผนภูมิ Q–Qหรือที่รู้จักกันในชื่อแผนภูมิความน่าจะเป็นปกติหรือ แผนภูมิ แรงค์กิตคือแผนภูมิที่แสดงค่าที่เรียงลำดับแล้วจากชุดข้อมูลเทียบกับค่าที่คาดหวังของควอนไทล์ที่สอดคล้องกันจากการแจกแจงปกติมาตรฐาน กล่าวคือ เป็นแผนภูมิของจุดในรูปแบบ( Φ −1 ( p k ), x ( k ) )โดยที่จุดพล็อตp kเท่ากับp k = ( kα )/( n + 1 − 2 α )และαเป็นค่าคงที่ปรับแก้ ซึ่งสามารถเป็นอะไรก็ได้ระหว่าง 0 ถึง 1 หากสมมติฐานว่างเป็นจริง จุดที่พล็อตควรจะอยู่บนเส้นตรงโดยประมาณ
  • แผนภูมิ P–P – คล้ายกับแผนภูมิ Q–Q แต่ใช้ไม่บ่อยนัก วิธีนี้ประกอบด้วยการพล็อตจุด( Φ ( z ( k ) ), p k )โดยที่สำหรับข้อมูลที่มีการกระจายแบบปกติ แผนภูมินี้ควรอยู่บนเส้นตรงระหว่าง(0, 0)และ  (1, 1 )

การทดสอบความเหมาะสมของแบบจำลอง :

การทดสอบตามช่วงเวลา :

  • การทดสอบ K-squared ของ D'Agostino
  • การทดสอบ Jarque–Bera
  • การทดสอบ Shapiro–Wilk : การทดสอบนี้อิงจากเส้นในกราฟ Q–Q ที่มีค่าความชันเท่ากับσการทดสอบจะเปรียบเทียบค่าประมาณกำลังสองน้อยที่สุดของค่าความชันนั้นกับค่าความแปรปรวนของตัวอย่าง และจะปฏิเสธสมมติฐานว่างหากค่าทั้งสองนี้แตกต่างกันอย่างมีนัยสำคัญ

การทดสอบโดยใช้ฟังก์ชันการกระจายเชิงประจักษ์ :

การวิเคราะห์แบบเบย์เซียนของการแจกแจงปกติ

การวิเคราะห์แบบเบย์เซียนของข้อมูลที่มีการแจกแจงแบบปกติมีความซับซ้อน เนื่องจากมีปัจจัยที่เป็นไปได้มากมายที่อาจนำมาพิจารณาได้:

สูตรสำหรับกรณีการถดถอยแบบไม่เชิงเส้นได้สรุปไว้ในบทความ ก่อนหน้าที่เกี่ยวข้องแล้ว

ผลรวมของกำลังสองสองจำนวน

รูปแบบสเกลาร์

สูตรเสริมต่อไปนี้มีประโยชน์ในการทำให้สม การการปรับปรุงค่า ภายหลัง ง่ายขึ้น ซึ่งหากไม่ใช้สูตรนี้จะค่อนข้างยุ่งยาก

สมการนี้เป็นการเขียนผลรวมของพหุคูณกำลังสองสองตัวใน ตัวแปร x ใหม่ โดยการกระจายกำลังสอง จัดกลุ่มพจน์ในตัวแปรxและทำให้เป็นกำลังสองสมบูรณ์โปรดสังเกตสิ่งต่อไปนี้เกี่ยวกับตัวประกอบคงที่เชิงซ้อนที่แนบมากับบางพจน์:

  1. ปัจจัยดังกล่าวมีรูปแบบเป็นค่าเฉลี่ยถ่วงน้ำหนักของyและz
  2. สิ่งนี้แสดงให้เห็นว่าปัจจัยนี้สามารถคิดได้ว่าเป็นผลมาจากสถานการณ์ที่ส่วนกลับของปริมาณaและbบวกกันโดยตรง ดังนั้นในการรวมaและbเข้าด้วยกัน จึงจำเป็นต้องหาค่าส่วนกลับ บวก และหาค่าส่วนกลับอีกครั้งเพื่อให้ได้หน่วยเดิมกลับคืนมา นี่คือการดำเนินการแบบเดียวกับที่ค่าเฉลี่ยฮาร์มอนิก ทำ ดังนั้นจึงไม่น่าแปลกใจที่ มี ค่าเท่ากับครึ่งหนึ่งของค่าเฉลี่ยฮาร์มอนิกของaและb
รูปแบบเวกเตอร์

สามารถเขียนสูตรที่คล้ายกันสำหรับผลรวมของเวกเตอร์กำลังสองสองตัวได้ดังนี้: ถ้าx , y , zเป็นเวกเตอร์ที่มีความยาวkและAและBเป็นเมทริกซ์สมมาตรที่ผกผันได้และมีขนาดn แล้ว

ที่ไหน

รูปแบบxA xเรียกว่ารูปแบบกำลังสองและเป็นสเกลาร์กล่าว คือ มันเป็นการรวมผลรวมของการคูณที่เป็นไปได้ทั้งหมดของคู่ขององค์ประกอบจากxโดยมีสัมประสิทธิ์แยกกันสำหรับแต่ละคู่ นอกจากนี้ เนื่องจาก ดังนั้นผลรวมเท่านั้นที่มีความสำคัญสำหรับองค์ประกอบนอกแนวทแยงของAและไม่มีการสูญเสียความเป็นทั่วไปในการสมมติว่าAเป็นเมทริกซ์สมมาตรยิ่งไปกว่านั้น ถ้าAเป็นเมทริกซ์สมมาตรแล้ว รูปแบบ x ′ A x จะเป็น

ผลรวมของความแตกต่างจากค่าเฉลี่ย

สูตรที่มีประโยชน์อีกสูตรหนึ่งมีดังนี้: โดยที่

โดยทราบค่าความแปรปรวนแล้ว

สำหรับชุดข้อมูลX ที่มีการกระจายแบบปกติแบบอิสระและเหมือน กัน (iid)ขนาดnโดยที่แต่ละจุดxมี ค่า ความแปรปรวนσ²ที่ทราบแล้วการกระจายความน่าจะเป็นก่อนหน้าแบบสังยุคก็จะมีการกระจายแบบปกติเช่นกัน

สามารถแสดงให้เห็นได้ง่ายขึ้นโดยการเขียนค่าความแปรปรวนใหม่เป็นค่าความแม่นยำกล่าวคือใช้τ = 1/ σ 2จากนั้นถ้าและเราดำเนินการดังต่อไปนี้

ขั้นแรกฟังก์ชันความน่าจะเป็นคือ (โดยใช้สูตรข้างต้นสำหรับผลรวมของความแตกต่างจากค่าเฉลี่ย):

จากนั้น เราจะดำเนินการดังต่อไปนี้:

ในการพิสูจน์ข้างต้น เราใช้สูตรข้างต้นสำหรับผลรวมของกำลังสองสองจำนวน และกำจัดค่าคงที่ทั้งหมดที่ไม่เกี่ยวข้องกับ  μผลลัพธ์ที่ได้คือเคอร์เนลของการแจกแจงปกติ โดยมีค่าเฉลี่ยและความแม่นยำนั่นคือ

สามารถเขียนสิ่งนี้ได้ในรูปของชุดสมการปรับปรุงแบบเบย์เซียนสำหรับพารามิเตอร์ภายหลัง โดยพิจารณาจากพารามิเตอร์ก่อนหน้า:

กล่าวคือ การรวม จุดข้อมูล nจุดที่มีความแม่นยำรวม (หรือเทียบเท่ากับความแปรปรวนรวมn / σ² ) และค่าเฉลี่ยของค่าต่างๆจะได้ความแม่นยำรวมใหม่โดยการเพิ่มความแม่นยำรวมของข้อมูลเข้ากับความแม่นยำรวมก่อนหน้า และสร้างค่าเฉลี่ยใหม่ผ่านค่าเฉลี่ยถ่วงน้ำหนักด้วยความแม่นยำ กล่าวคือค่าเฉลี่ยถ่วงน้ำหนักของค่าเฉลี่ยของข้อมูลและค่าเฉลี่ยก่อนหน้า โดยแต่ละค่าถ่วงน้ำหนักด้วยความแม่นยำรวมที่เกี่ยวข้อง วิธีนี้สมเหตุสมผลหากมองว่าความแม่นยำบ่งบอกถึงความแน่นอนของการสังเกต: ในการกระจายของค่าเฉลี่ยภายหลัง แต่ละองค์ประกอบของข้อมูลนำเข้าจะถูกถ่วงน้ำหนักด้วยความแน่นอน และความแน่นอนของการกระจายนี้คือผลรวมของความแน่นอนแต่ละส่วน (เพื่อให้เข้าใจได้ง่ายขึ้น ลองเปรียบเทียบกับวลี "ทั้งหมดมีค่ามากกว่าผลรวมของส่วนต่างๆ" นอกจากนี้ ลองพิจารณาว่าความรู้เกี่ยวกับค่าเฉลี่ยภายหลังมาจากการรวมกันของความรู้เกี่ยวกับค่าเฉลี่ยก่อนหน้าและความน่าจะเป็น ดังนั้นจึงสมเหตุสมผลที่เราจะมีความแน่นอนในค่าเฉลี่ยภายหลังมากกว่าในองค์ประกอบใดองค์ประกอบหนึ่ง)

สูตรข้างต้นแสดงให้เห็นว่าเหตุใดการวิเคราะห์แบบเบย์เซียนของไพรเออร์คู่ควบสำหรับการแจกแจงปกติจึงสะดวกกว่าในแง่ของความแม่นยำ ความแม่นยำของโพสทีเรียร์คือผลรวมของความแม่นยำของไพรเออร์และความน่าจะเป็น และค่าเฉลี่ยของโพสทีเรียร์คำนวณโดยใช้ค่าเฉลี่ยถ่วงน้ำหนักด้วยความแม่นยำ ดังที่ได้อธิบายไว้ข้างต้น สูตรเดียวกันนี้สามารถเขียนในแง่ของความแปรปรวนได้โดยการผกผันความแม่นยำทั้งหมด ซึ่งจะได้สูตรที่ซับซ้อนกว่า

ด้วยค่าเฉลี่ยที่ทราบ

สำหรับชุดข้อมูลX ที่มีการกระจายแบบปกติแบบอิสระและเหมือนกัน (iid)ขนาดnโดยที่แต่ละจุดxมีค่าเฉลี่ยμ ที่ทราบแล้ว ไพรเออร์แบบ คอนจูเกต ของความแปรปรวนจะมีการกระจายแบบอินเวอร์สแกมมาหรือการกระจายแบบสเกลดอินเวอร์สไคกำลัง สอง การกระจาย ทั้งสองแบบนี้เทียบเท่ากัน ยกเว้นมีพารามิเตอร์ที่ แตกต่างกัน แม้ว่าอินเวอร์สแกมมาจะถูกใช้บ่อยกว่า แต่เราใช้สเกลดอินเวอร์สไคกำลัง สองเพื่อความสะดวก ไพรเออร์สำหรับσ²มีดังนี้:

ฟังก์ชันความน่าจะเป็นจากข้างต้น เมื่อเขียนในรูปของความแปรปรวน จะได้ว่า: โดยที่

แล้ว:

ข้างต้นเป็นการแจกแจงไคกำลังสองผกผันแบบปรับขนาดเช่นกัน โดยที่ หรือเทียบเท่ากัน

เมื่อกำหนดพารามิเตอร์ใหม่โดยใช้การแจกแจงแกมมาผกผันผลลัพธ์ที่ได้คือ:

โดยที่ค่าเฉลี่ยและความแปรปรวนไม่ทราบค่า

สำหรับชุดข้อมูล X ที่มีการกระจายแบบปกติแบบอิสระและ เหมือนกัน ( iid ) ขนาดnโดยที่แต่ละจุดxมี ค่าเฉลี่ย μที่ไม่ทราบค่าและความแปรปรวนσ² ที่ไม่ทราบค่า จะมีการวาง ไพรเออร์แบบคอนจูเกตแบบผสม (หลายตัวแปร) ไว้เหนือค่าเฉลี่ยและความแปรปรวน ซึ่งประกอบด้วยการกระจายแบบปกติผกผันแกมมาตามหลักตรรกะแล้ว มีที่มาดังนี้:

  1. จากการวิเคราะห์กรณีที่มีค่าเฉลี่ยไม่ทราบค่าแต่ทราบค่าความแปรปรวน เราพบว่าสมการปรับปรุงนั้นเกี่ยวข้องกับสถิติที่เพียงพอซึ่งคำนวณจากข้อมูล โดยประกอบด้วยค่าเฉลี่ยของจุดข้อมูลและความแปรปรวนทั้งหมดของจุดข้อมูล ซึ่งคำนวณได้จากค่าความแปรปรวนที่ทราบหารด้วยจำนวนจุดข้อมูล
  2. จากการวิเคราะห์กรณีที่มีค่าความแปรปรวนไม่ทราบค่าแต่ทราบค่าเฉลี่ย เราพบว่าสมการปรับปรุงนั้นเกี่ยวข้องกับสถิติที่เพียงพอสำหรับข้อมูล ซึ่งประกอบด้วยจำนวนจุดข้อมูลและผลรวมของค่าเบี่ยงเบนกำลังสอง
  3. โปรดจำไว้ว่าค่าอัปเดตภายหลังจะทำหน้าที่เป็นค่าการแจกแจงก่อนหน้าเมื่อมีการประมวลผลข้อมูลเพิ่มเติม ดังนั้น เราควรคิดถึงค่าก่อนหน้าของเราอย่างมีเหตุผลโดยใช้สถิติเพียงพอที่ได้อธิบายไปแล้ว โดยคำนึงถึงความหมายเดียวกันให้มากที่สุดเท่าที่จะเป็นไปได้
  4. เพื่อจัดการกับกรณีที่ทั้งค่าเฉลี่ยและความแปรปรวนไม่ทราบค่า เราอาจกำหนดค่าความน่าจะเป็นล่วงหน้า (prior) ที่เป็นอิสระต่อกันสำหรับค่าเฉลี่ยและความแปรปรวน โดยมีค่าประมาณคงที่ของค่าเฉลี่ย ความแปรปรวนทั้งหมด จำนวนจุดข้อมูลที่ใช้ในการคำนวณค่าความน่าจะเป็นล่วงหน้าของความแปรปรวน และผลรวมของกำลังสองของส่วนเบี่ยงเบน อย่างไรก็ตาม โปรดทราบว่าในความเป็นจริง ความแปรปรวนทั้งหมดของค่าเฉลี่ยขึ้นอยู่กับความแปรปรวนที่ไม่ทราบค่า และผลรวมของกำลังสองของส่วนเบี่ยงเบนที่ใช้ในค่าความน่าจะเป็นล่วงหน้าของความแปรปรวน (ดูเหมือนว่าจะ) ขึ้นอยู่กับค่าเฉลี่ยที่ไม่ทราบค่า ในทางปฏิบัติ ความสัมพันธ์หลังนี้ค่อนข้างไม่สำคัญ: การเปลี่ยนแปลงค่าเฉลี่ยจริงจะทำให้จุดที่สร้างขึ้นเปลี่ยนแปลงไปในปริมาณที่เท่ากัน และโดยเฉลี่ยแล้วกำลังสองของส่วนเบี่ยงเบนจะยังคงเท่าเดิม อย่างไรก็ตาม นี่ไม่ใช่กรณีของความแปรปรวนทั้งหมดของค่าเฉลี่ย: เมื่อความแปรปรวนที่ไม่ทราบค่าเพิ่มขึ้น ความแปรปรวนทั้งหมดของค่าเฉลี่ยจะเพิ่มขึ้นตามสัดส่วน และเราต้องการที่จะจับความสัมพันธ์นี้ไว้
  5. แนวคิด นี้ชี้ให้เห็นว่าเราควรสร้าง ค่าความ น่าจะเป็นล่วงหน้าแบบมีเงื่อนไขของค่าเฉลี่ยโดยอิงจากค่าความแปรปรวนที่ไม่ทราบค่า โดยมีพารามิเตอร์ตัวหนึ่งระบุค่าเฉลี่ยของข้อมูลจำลองที่เกี่ยวข้องกับค่าความน่าจะเป็นล่วงหน้า และอีกพารามิเตอร์หนึ่งระบุจำนวนข้อมูลจำลอง จำนวนนี้ทำหน้าที่เป็นพารามิเตอร์การปรับขนาดของค่าความแปรปรวน ทำให้สามารถควบคุมค่าความแปรปรวนโดยรวมของค่าเฉลี่ยเมื่อเทียบกับค่าความแปรปรวนจริงได้ ค่าความน่าจะเป็นล่วงหน้าสำหรับค่าความแปรปรวนก็มีพารามิเตอร์สองตัวเช่นกัน ตัวหนึ่งระบุผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลจำลองที่เกี่ยวข้องกับค่าความน่าจะเป็นล่วงหน้า และอีกตัวหนึ่งระบุจำนวนข้อมูลจำลองอีกครั้ง ค่าความน่าจะเป็นล่วงหน้าแต่ละค่ามีพารามิเตอร์ที่ระบุจำนวนข้อมูลจำลอง และในแต่ละกรณีนี้จะควบคุมค่าความแปรปรวนสัมพัทธ์ของค่าความน่าจะเป็นล่วงหน้านั้น พารามิเตอร์เหล่านี้ถูกกำหนดเป็นสองตัวแยกกัน เพื่อให้สามารถควบคุมค่าความแปรปรวน (หรือความเชื่อมั่น) ของค่าความน่าจะเป็นล่วงหน้าทั้งสองแยกกันได้
  6. ซึ่งนำไปสู่การแจกแจงแบบนอร์มัล-อินเวอร์ส-แกมมา โดยทันที ซึ่งเป็นผลคูณของการแจกแจงสองแบบที่เพิ่งกำหนดไป โดย ใช้ ไพรเออร์แบบคอนจูเกต ( การแจกแจงอินเวอร์สแกมมาเหนือความแปรปรวน และการแจกแจงแบบนอร์มัลเหนือค่าเฉลี่ย โดยมีเงื่อนไขตามความแปรปรวน) และมีพารามิเตอร์สี่ตัวเดียวกันกับที่เพิ่งกำหนดไป

โดยปกติแล้ว ค่าความน่าจะเป็นล่วงหน้าจะถูกกำหนดดังนี้:

สมการการปรับปรุงสามารถหาได้และมีลักษณะดังนี้: จำนวนการสังเกตเสมือนที่เกี่ยวข้องจะถูกบวกเข้ากับจำนวนการสังเกตจริง พารามิเตอร์ค่าเฉลี่ยใหม่จะเป็นค่าเฉลี่ยถ่วงน้ำหนักอีกครั้ง โดยครั้งนี้ถ่วงน้ำหนักด้วยจำนวนการสังเกตสัมพัทธ์ สุดท้าย การปรับปรุงสำหรับ จะคล้ายกับกรณีที่มีค่าเฉลี่ยที่ทราบแล้ว แต่ในกรณีนี้ ผลรวมของกำลังสองของส่วนเบี่ยงเบนจะถูกคำนวณโดยอ้างอิงจากค่าเฉลี่ยของข้อมูลที่สังเกตได้ แทนที่จะเป็นค่าเฉลี่ยที่แท้จริง และเป็นผลให้ต้องเพิ่มพจน์ปฏิสัมพันธ์ใหม่เพื่อจัดการกับแหล่งที่มาของข้อผิดพลาดเพิ่มเติมที่เกิดจากส่วนเบี่ยงเบนระหว่างค่าเฉลี่ยก่อนหน้าและค่าเฉลี่ยของข้อมูล

การเกิดขึ้นและการประยุกต์ใช้

การปรากฏของการกระจายแบบปกติในปัญหาเชิงปฏิบัติสามารถแบ่งออกได้คร่าวๆ เป็น 4 ประเภท:

  1. การกระจายแบบปกติอย่างแท้จริง;
  2. กฎเกณฑ์ปกติโดยประมาณ เช่น เมื่อการประมาณค่าดังกล่าวได้รับการพิสูจน์โดยทฤษฎีบทขีดจำกัดกลางและ
  3. การแจกแจงที่จำลองเป็นแบบปกติ – การแจกแจงแบบปกติเป็นการแจกแจงที่มีเอนโทรปีสูงสุดสำหรับค่าเฉลี่ยและความแปรปรวนที่กำหนด
  4. ปัญหาการถดถอย – การกระจายแบบปกติที่พบหลังจากที่ได้สร้างแบบจำลองผลกระทบที่เป็นระบบไว้อย่างดีเพียงพอแล้ว

ความปกติที่แน่นอน

สถานะพื้นฐานของควอนตัมฮาร์มอนิกออสซิลเลเตอร์มีการกระจายแบบเกาส์เซียน

การแจกแจงแบบปกติเกิดขึ้นใน ทฤษฎีทางฟิสิกส์บาง ทฤษฎี :

ความปกติโดยประมาณ

การแจกแจงแบบปกติ โดยประมาณเกิดขึ้นในหลายสถานการณ์ ดังที่อธิบายไว้ในทฤษฎีบทขีดจำกัดกลางเมื่อผลลัพธ์เกิดจากผลกระทบเล็กๆ จำนวนมากที่กระทำแบบบวกและเป็นอิสระการแจกแจงของผลลัพธ์จะใกล้เคียงกับการแจกแจงแบบปกติ การประมาณค่าแบบปกติจะไม่ถูกต้องหากผลกระทบกระทำแบบคูณ (แทนที่จะเป็นแบบบวก) หรือหากมีอิทธิพลภายนอกเพียงอย่างเดียวที่มีขนาดใหญ่กว่าผลกระทบอื่นๆ อย่างมาก

ถือว่าปกติ

ฮิสโตแกรมของความกว้างกลีบเลี้ยงของIris versicolorจากชุดข้อมูลดอกไอริส ของ Fisher โดยมีการซ้อนทับด้วยการกระจายแบบปกติที่เหมาะสมที่สุด

ผมมองว่าการปรากฏของเส้นโค้งปกติ – เส้นโค้งลาปลาเซียนของข้อผิดพลาด – เป็นปรากฏการณ์ที่ผิดปกติอย่างมาก มันถูกประมาณค่าคร่าวๆ ในบางการแจกแจง ด้วยเหตุนี้ และเนื่องจากความเรียบง่ายที่สวยงามของมัน เราอาจใช้มันเป็นค่าประมาณเบื้องต้น โดยเฉพาะอย่างยิ่งในการศึกษาเชิงทฤษฎี

มีวิธีการทางสถิติเพื่อทดสอบสมมติฐานนั้นในเชิงประจักษ์ โปรดดูส่วน " การทดสอบภาวะปกติ" ด้านบน

  • ในทางชีววิทยาค่าลอการิทึมของตัวแปรต่างๆ มักมีการกระจายแบบปกติ กล่าวคือ มักมีการกระจายแบบลอการิทึมปกติ (หลังจากแยกตามกลุ่มประชากรชาย/หญิง) โดยมีตัวอย่างเช่น:
    • การวัดขนาดของเนื้อเยื่อที่มีชีวิต (ความยาว ความสูง พื้นที่ผิว น้ำหนัก) [ 62 ]
    • ความยาวของ ส่วนประกอบ ที่ไม่เคลื่อนไหว (เช่น เส้นผม กรงเล็บ เล็บ ฟัน) ของสิ่งมีชีวิตในทิศทางการเจริญเติบโตซึ่งสันนิษฐานได้ว่าความหนาของเปลือกไม้ก็จัดอยู่ในประเภทนี้เช่นกัน
    • การวัดค่าทางสรีรวิทยาบางอย่าง เช่น ความดันโลหิตของผู้ใหญ่
  • ในด้านการเงิน โดยเฉพาะอย่างยิ่งในแบบจำลอง Black–Scholesนั้น การเปลี่ยนแปลงของ ค่า ลอการิทึมของอัตราแลกเปลี่ยน ดัชนีราคา และดัชนีตลาดหุ้น จะถูกสมมติว่ามีการกระจายแบบปกติ (ตัวแปรเหล่านี้มีพฤติกรรมเหมือนดอกเบี้ยทบต้นไม่ใช่ดอกเบี้ยธรรมดา และดังนั้นจึงเป็นการกระจายแบบทวีคูณ) นักคณิตศาสตร์บางคน เช่นBenoit Mandelbrotได้โต้แย้งว่าการกระจายแบบ log-Levyซึ่งมีหางหนาจะเป็นแบบจำลองที่เหมาะสมกว่า โดยเฉพาะอย่างยิ่งสำหรับการวิเคราะห์การตกต่ำของตลาดหุ้นการใช้สมมติฐานของการกระจายแบบปกติในแบบจำลองทางการเงินนั้น ยังถูกวิพากษ์วิจารณ์โดยNassim Nicholas Talebในงานเขียนของเขา ด้วย
  • ข้อผิดพลาดในการวัดในการทดลองทางกายภาพมักจะถูกจำลองโดยการแจกแจงแบบปกติ การใช้การแจกแจงแบบปกติไม่ได้หมายความว่าเรากำลังสมมติว่าข้อผิดพลาดในการวัดมีการแจกแจงแบบปกติ แต่การใช้การแจกแจงแบบปกติจะสร้างการคาดการณ์ที่อนุรักษ์นิยมที่สุดเท่าที่จะเป็นไปได้ โดยอาศัยเพียงความรู้เกี่ยวกับค่าเฉลี่ยและความแปรปรวนของข้อผิดพลาด[ 63 ]
  • ในการทดสอบมาตรฐานผลลัพธ์สามารถทำให้มีการกระจายแบบปกติได้โดยการเลือกจำนวนและความยากของคำถาม (เช่นในการทดสอบ IQ ) หรือการแปลงคะแนนดิบของการทดสอบให้เป็นคะแนนผลลัพธ์โดยการปรับให้เข้ากับการกระจายแบบปกติ ตัวอย่างเช่น ช่วงคะแนนมาตรฐานของ SATที่ 200–800 นั้นอิงตามการกระจายแบบปกติที่มีค่าเฉลี่ย 500 และส่วนเบี่ยงเบนมาตรฐาน 100
ใช้การแจกแจงปกติสะสมที่เหมาะสมกับปริมาณน้ำฝนในเดือนตุลาคม ดูวิธีการปรับการแจกแจงได้ที่นี่

ปัญหาเชิงวิธีวิจัยและการตรวจสอบโดยผู้ทรงคุณวุฒิ

จอห์น ไอโออันนิดิสแย้งว่า การใช้ค่าเบี่ยงเบนมาตรฐานที่มีการกระจายแบบปกติเป็นมาตรฐานในการตรวจสอบความถูกต้องของผลการวิจัย ทำให้การคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดเกี่ยวกับปรากฏการณ์ที่ไม่มีการกระจายแบบปกติไม่ได้รับการทดสอบ ตัวอย่างเช่น ปรากฏการณ์ที่ปรากฏขึ้นเฉพาะเมื่อมีเงื่อนไขที่จำเป็นทั้งหมดครบถ้วน และปรากฏการณ์หนึ่งไม่สามารถใช้แทนอีกปรากฏการณ์หนึ่งได้ในลักษณะการบวก และปรากฏการณ์ที่ไม่มีการกระจายแบบสุ่ม ไอโออันนิดิสกล่าวว่า การตรวจสอบความถูกต้องโดยใช้ค่าเบี่ยงเบนมาตรฐานเป็นศูนย์กลาง ทำให้สมมติฐานและทฤษฎีดูเหมือนมีความถูกต้องอย่างผิดๆ ในกรณีที่การคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดบางส่วนแต่ไม่ใช่ทั้งหมดมีการกระจายแบบปกติ เนื่องจากส่วนของการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดซึ่งมีหลักฐานขัดแย้งอยู่นั้น อาจและในบางกรณีก็อยู่ในส่วนที่ไม่มีการกระจายแบบปกติของช่วงของการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิด รวมถึงการปฏิเสธสมมติฐานที่ไม่มีการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดใดๆ มีการกระจายแบบปกติอย่างไม่มีมูลความจริง ราวกับว่าสมมติฐานเหล่านั้นไม่สามารถพิสูจน์ได้ว่าผิด ทั้งๆ ที่ความจริงแล้วสมมติฐานเหล่านั้นมีการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิด Ioannidis โต้แย้งว่ากรณีทฤษฎีที่ขัดแย้งกันเองหลายกรณีได้รับการยอมรับว่าถูกต้องโดยวารสารวิจัยนั้นเกิดจากความล้มเหลวของวารสารในการนำเอาการพิสูจน์เชิงประจักษ์ที่ผิดพลาดของการคาดการณ์ที่ไม่กระจายตัวตามปกติเข้ามาพิจารณา และไม่ใช่เพราะทฤษฎีที่ขัดแย้งกันเองนั้นเป็นจริง ซึ่งเป็นไปไม่ได้ แม้ว่าทฤษฎีที่ขัดแย้งกันเองสองทฤษฎีอาจผิดทั้งคู่และทฤษฎีที่สามอาจถูกต้องก็ตาม[ 65 ]

วิธีการคำนวณ

การสร้างค่าจากการกระจายแบบปกติ

เครื่องโยนลูกบอล (Bean Machine)ซึ่งเป็นอุปกรณ์ที่ฟรานซิส กัลตัน คิดค้นขึ้น อาจเรียกได้ว่าเป็นเครื่องกำเนิดตัวแปรสุ่มปกติเครื่องแรก เครื่องนี้ประกอบด้วยแผ่นไม้แนวตั้งที่มีแถวของหมุดสลับกัน ลูกบอลขนาดเล็กจะถูกปล่อยลงมาจากด้านบน แล้วจะกระเด้งไปทางซ้ายหรือขวาอย่างสุ่มเมื่อกระทบกับหมุด ลูกบอลจะถูกรวบรวมลงในถังที่ด้านล่างและค่อยๆ เรียงตัวเป็นรูปแบบที่คล้ายกับเส้นโค้งเกาส์เซียน

ในการจำลองด้วยคอมพิวเตอร์ โดยเฉพาะอย่างยิ่งในการประยุกต์ใช้วิธีมอนเตคาร์โลมักเป็นที่พึงปรารถนาที่จะสร้างค่าที่มีการกระจายแบบปกติ อัลกอริทึมที่ระบุไว้ด้านล่างทั้งหมดสร้างค่าเบี่ยงเบนมาตรฐานปกติ เนื่องจากN ( μ , σ² )สามารถสร้างได้เป็นX = μ + σZโดยที่Zคือค่าเบี่ยงเบนมาตรฐานปกติ อัลกอริทึมทั้งหมดนี้อาศัยความพร้อมใช้งานของตัวสร้างเลขสุ่มUที่สามารถสร้างตัวแปรสุ่ม แบบเอกรูปได้

  • วิธีที่ตรงไปตรงมาที่สุดคือการใช้ คุณสมบัติ การแปลงอินทิกรัลความน่าจะเป็น : ถ้าUกระจายอย่างสม่ำเสมอในช่วง (0,1) แล้วΦ −1 ( U )จะมีการกระจายแบบปกติมาตรฐาน ข้อเสียของวิธีนี้คือต้องอาศัยการคำนวณฟังก์ชัน probit Φ −1ซึ่งไม่สามารถทำได้ในเชิงวิเคราะห์ วิธีการโดยประมาณบางวิธีได้อธิบายไว้ในHart (1968)และใน บทความ erf Wichura ได้นำเสนออัลกอริทึมที่รวดเร็วสำหรับการคำนวณฟังก์ชันนี้ถึง 16 ตำแหน่งทศนิยม[ 66 ] ซึ่ง Rใช้ในการคำนวณตัวแปรสุ่มของการกระจายแบบปกติ
  • วิธีการประมาณค่าที่ง่ายต่อการเขียนโปรแกรมซึ่งอาศัยทฤษฎีบทขีดจำกัดกลางมีดังนี้: สร้างค่าเบี่ยงเบนU (0,1) ที่เป็นเอกรูป 12 ค่า นำมารวมกันทั้งหมด แล้วลบด้วย 6 ค่า – ตัวแปรสุ่มที่ได้จะมีค่าประมาณการกระจายแบบปกติมาตรฐาน ในความเป็นจริง การกระจายจะเป็นแบบIrwin–Hallซึ่งเป็นการประมาณค่าพหุนามลำดับที่ 11 แบบ 12 ส่วนสำหรับการกระจายแบบปกติ ค่าเบี่ยงเบนสุ่มนี้จะมีช่วงจำกัดที่(−6, 6) [ 67 ]โปรดทราบว่าในการกระจายแบบปกติที่แท้จริง มีเพียง 0.00034% ของตัวอย่างทั้งหมดเท่านั้นที่จะตกอยู่นอกช่วง  ± 6 σ
  • วิธี Box –Mullerใช้ตัวเลขสุ่มอิสระสองตัวUและVที่กระจายอย่างสม่ำเสมอในช่วง (0,1) จากนั้นตัวแปรสุ่มสองตัวXและY จะมีการกระจายแบบปกติมาตรฐาน และจะเป็นอิสระต่อกันการกำหนดสูตรนี้เกิดขึ้นเนื่องจากสำหรับเวกเตอร์สุ่มปกติแบบสองตัวแปร( X , Y )ค่ากำลังสองของนอร์ม+ จะมีการกระจายแบบไคกำลังสองที่มีสององศาอิสระ ซึ่งเป็นตัวแปรสุ่มเอกซ์โพเนนเชียล ที่สร้างได้ง่าย ซึ่งสอดคล้องกับปริมาณ−2 ln( U ) ในสมการเหล่านี้ และมุมจะกระจายอย่างสม่ำเสมอรอบวงกลมที่ เลือกโดยตัวแปรสุ่มV
  • วิธีการเชิงขั้วของ Marsagliaเป็นการดัดแปลงวิธีการของ Box–Muller ซึ่งไม่จำเป็นต้องคำนวณฟังก์ชันไซน์และโคไซน์ ในวิธีการนี้UและVจะถูกสุ่มมาจากการแจกแจงเอกรูป (−1,1) จากนั้นจะคำนวณS = + ถ้า Sมากกว่าหรือเท่ากับ 1 วิธีการจะเริ่มต้นใหม่ มิฉะนั้นจะส่งคืนค่าทั้งสองค่าอีกครั้งXและYเป็นตัวแปรสุ่มปกติมาตรฐานที่เป็นอิสระต่อกัน
  • วิธีอัตราส่วน[ 68 ]เป็นวิธีการปฏิเสธ อัลกอริทึมดำเนินไปดังนี้:
    • สร้างค่าเบี่ยงเบนสม่ำเสมออิสระสองค่า คือUและV ;
    • คำนวณX = 8/ e ( V − 0.5)/ U ;
    • ตัวเลือกเสริม: ถ้าX 2 ≤ 5 − 4 e 1/4 Uให้ยอมรับXและยุติอัลกอริทึม
    • ตัวเลือกเสริม: ถ้าX 2 ≥ 4 e −1.35 / U + 1.4ให้ปฏิเสธXและเริ่มต้นใหม่ตั้งแต่ขั้นตอนที่ 1
    • ถ้าX 2 ≤ −4 ln Uให้ยอมรับXมิฉะนั้นให้เริ่มอัลกอริทึมใหม่
    ขั้นตอนเสริมสองขั้นตอนช่วยให้สามารถหลีกเลี่ยงการประเมินลอการิทึมในขั้นตอนสุดท้ายได้ในกรณีส่วนใหญ่ ขั้นตอนเหล่านี้สามารถปรับปรุงได้อย่างมาก[ 69 ]เพื่อให้การประเมินลอการิทึมเกิดขึ้นได้น้อยมาก
  • อัลกอริทึมซิกกูแรต[ 70 ]เร็วกว่าการแปลงบ็อกซ์-มุลเลอร์และยังคงแม่นยำ ในประมาณ 97% ของทุกกรณี จะใช้เพียงตัวเลขสุ่มสองตัว ตัวเลขสุ่มจำนวนเต็มหนึ่งตัวและตัวเลขสุ่มแบบเอกรูปหนึ่งตัว การคูณหนึ่งครั้ง และการทดสอบเงื่อนไข เฉพาะใน 3% ของกรณีที่การรวมกันของทั้งสองนั้นอยู่นอก "แกนกลางของซิกกูแรต" (การสุ่มตัวอย่างแบบปฏิเสธโดยใช้ลอการิทึม) เท่านั้นที่ต้องใช้เลขชี้กำลังและตัวเลขสุ่มแบบเอกรูปเพิ่มเติม
  • สามารถใช้เลขคณิตจำนวนเต็มเพื่อสุ่มตัวอย่างจากการกระจายปกติมาตรฐานได้[ 71 ] [ 72 ]วิธีนี้มีความแม่นยำในแง่ที่ว่ามันตรงตามเงื่อนไขของ การประมาณค่า ในอุดมคติ[ 73 ]กล่าวคือ มันเทียบเท่ากับการสุ่มตัวอย่างจำนวนจริงจากการกระจายปกติมาตรฐานและปัดเศษให้เป็นจำนวนจุดลอยตัวที่ใกล้ที่สุดที่สามารถแสดงได้
  • นอกจากนี้ยังมีการตรวจสอบ[ 74 ] บางส่วน เกี่ยวกับความเชื่อมโยงระหว่างการแปลง Hadamard แบบเร็ว กับการกระจายแบบปกติ เนื่องจากการแปลงใช้เพียงการบวกและการลบ และตามทฤษฎีบทขีดจำกัดกลาง ตัวเลขสุ่มจากการกระจายเกือบทุกแบบจะถูกแปลงเป็นการกระจายแบบปกติ ในแง่นี้ ชุดของการแปลง Hadamard สามารถรวมเข้ากับการเรียงสับเปลี่ยนแบบสุ่มเพื่อเปลี่ยนชุดข้อมูลใดๆ ให้เป็นข้อมูลที่มีการกระจายแบบปกติได้

การประมาณค่าเชิงตัวเลขสำหรับฟังก์ชันการกระจายสะสมปกติและฟังก์ชันควอนไทล์ปกติ

ฟังก์ชันการแจกแจงสะสมแบบปกติมาตรฐานถูกนำมาใช้กันอย่างแพร่หลายในการคำนวณทางวิทยาศาสตร์และสถิติ

ค่าΦ ( x )สามารถประมาณได้อย่างแม่นยำมากด้วยวิธีการต่างๆ เช่นการอินทิเกรตเชิงตัวเลขอนุกรมเทย์เลอร์อนุกรมเชิงเส้นกำกับและเศษส่วนต่อเนื่องมีการใช้การประมาณค่าที่แตกต่างกันไปตามระดับความแม่นยำที่ต้องการ

  • Zelen & Severo (1964)ให้ค่าประมาณสำหรับΦ ( x )สำหรับx > 0โดยมีข้อผิดพลาดสัมบูรณ์| ε ( x ) | < 7.5·10 −8 (อัลกอริทึม26.2.17 ): โดยที่ϕ ( x ) คือฟังก์ชันความ หนาแน่นความน่าจะเป็นปกติมาตรฐาน และb 0 = 0.2316419 , b 1 = 0.319381530 , b 2 = −0.356563782 , b 3 = 1.781477937 , b 4 = −1.821255978 , b 5 = 1.330274429
  • ฮาร์ท (1968)แสดงรายการการประมาณค่าหลายสิบวิธีโดยใช้ฟังก์ชันตรรกยะ ทั้งแบบมีและไม่มีเลขชี้กำลัง สำหรับ ฟังก์ชัน erfc()โดยที่ erfc(x) = 1 - erf(x) อัลกอริทึมของเขามีความซับซ้อนและความแม่นยำแตกต่างกันไป โดยมีความแม่นยำสัมบูรณ์สูงสุด 24 หลัก อัลกอริทึมของเวสต์ (2009)ได้รวมอัลกอริทึม 5666 ของฮาร์ทเข้ากับ การประมาณ ค่าเศษส่วนต่อเนื่องในส่วนท้าย เพื่อให้ได้อัลกอริทึมการคำนวณที่รวดเร็วและมีความแม่นยำ 16 หลัก
  • Cody (1969)หลังจากระลึกได้ว่าวิธีแก้ปัญหาของ Hart68 ไม่เหมาะสมสำหรับ erf จึงได้เสนอวิธีแก้ปัญหาสำหรับทั้ง erf และ erfc โดยมีขอบเขตข้อผิดพลาดสัมพัทธ์สูงสุด ผ่านการประมาณค่า Chebyshev แบบมีเหตุผล
  • Marsaglia (2004)เสนออัลกอริทึมง่ายๆ[หมายเหตุ 1 ]โดยอิงจากการขยายอนุกรมเทย์เลอร์สำหรับการคำนวณΦ ( x )ด้วยความแม่นยำตามอำเภอใจ ข้อเสียของอัลกอริทึมนี้คือเวลาในการคำนวณค่อนข้างช้า (ตัวอย่างเช่น ต้องใช้การวนซ้ำมากกว่า 300 ครั้งในการคำนวณฟังก์ชันด้วยความแม่นยำ 16 หลักเมื่อx = 10 )
  • ไลบรารีวิทยาศาสตร์ของ GNUคำนวณค่าของฟังก์ชันการกระจายสะสมปกติมาตรฐานโดยใช้อัลกอริทึมของ Hart และการประมาณค่าด้วย พหุ นามChebyshev
  • Dia (2023)เสนอการประมาณค่าต่อไปนี้โดยมีข้อผิดพลาดสัมพัทธ์สูงสุดน้อยกว่าในค่าสัมบูรณ์: สำหรับและสำหรับ

Shore (1982) ได้นำเสนอการประมาณค่าอย่างง่ายที่อาจนำไปใช้ในแบบจำลองการเพิ่มประสิทธิภาพเชิงสุ่มของวิศวกรรมและการวิจัยการดำเนินงาน เช่น วิศวกรรมความน่าเชื่อถือและการวิเคราะห์สินค้าคงคลัง โดยกำหนดให้p = Φ ( z )การประมาณค่าที่ง่ายที่สุดสำหรับฟังก์ชันควอนไทล์คือ:

การประมาณค่านี้ให้ค่าความคลาดเคลื่อนสัมบูรณ์สูงสุด สำหรับ z ที่ 0.026 (สำหรับ 0.5 ≤ p ≤ 0.9999ซึ่งสอดคล้องกับ0 ≤ z ≤ 3.719 ) สำหรับp < 1/2ให้แทนpด้วย1 − pแล้วเปลี่ยนเครื่องหมาย การประมาณค่าอีกวิธีหนึ่งซึ่งมีความแม่นยำน้อยกว่าเล็กน้อย คือการประมาณค่าแบบพารามิเตอร์เดียว:

วิธีการหลังนี้ใช้เพื่อหาค่าประมาณอย่างง่ายสำหรับปริพันธ์การสูญเสียของการแจกแจงปกติ ซึ่งกำหนดโดย

การประมาณค่านี้มีความแม่นยำเป็นพิเศษสำหรับส่วนปลายด้านขวา (ข้อผิดพลาดสูงสุด 10 −3สำหรับz ≥ 1.4 ) การประมาณค่าที่มีความแม่นยำสูงสำหรับฟังก์ชันการกระจายสะสม โดยอิงตามระเบียบวิธีแบบจำลองการตอบสนอง (RMM, Shore, 2011, 2012) แสดงไว้ใน Shore (2005)

สามารถค้นหาค่าประมาณเพิ่มเติมได้ที่: ฟังก์ชันข้อผิดพลาด#การประมาณค่าด้วยฟังก์ชันพื้นฐานโดยเฉพาะอย่างยิ่ง ข้อผิดพลาด สัมพัทธ์ เล็กน้อย ในโดเมนทั้งหมดสำหรับฟังก์ชันการกระจายสะสมและฟังก์ชันควอนไทล์นั้นสามารถทำได้โดยใช้สูตรผกผันที่ชัดเจนซึ่งคิดค้นโดย Sergei Winitzki ในปี 2008

ประวัติศาสตร์

การพัฒนา

ผู้เขียนบางท่าน[ 75 ] [ 76 ]ระบุว่าการค้นพบการแจกแจงปกติเป็นผลงานของเดอ มัวฟร์ซึ่งในปี 1738 [หมายเหตุ 2 ] ได้ตีพิมพ์ผล การศึกษาเกี่ยวกับสัมประสิทธิ์ในการขยายทวินามของ( a + b ) n ในฉบับพิมพ์ครั้งที่สองของหนังสือ The Doctrine of Chancesของเขาเดอ มัวฟร์พิสูจน์ว่าพจน์กลางในการขยายนี้มีขนาดโดยประมาณเท่ากับและว่า "ถ้าmหรือ1/2ถ้าnเป็นปริมาณที่มากอย่างไม่มีที่สิ้นสุด ลอการิทึมของอัตราส่วนที่พจน์ที่อยู่ห่างจากตรงกลางด้วยช่วงมีต่อพจน์ตรงกลางคือ” [ 77 ]แม้ว่าทฤษฎีบทนี้สามารถตีความได้ว่าเป็นการแสดงออกที่ไม่ชัดเจนครั้งแรกสำหรับกฎความน่าจะเป็นปกติ แต่ Stiglerชี้ให้เห็นว่า de Moivre เองก็ไม่ได้ตีความผลลัพธ์ของเขาว่าเป็นอะไรมากไปกว่ากฎโดยประมาณสำหรับสัมประสิทธิ์ทวินาม และโดยเฉพาะอย่างยิ่ง de Moivre ขาดแนวคิดของฟังก์ชันความหนาแน่นความน่าจะเป็น [ 78 ]

ในปี ค.ศ. 1809 คาร์ล ฟรีดริช เกาส์ได้แสดงให้เห็นว่าการแจกแจงแบบปกติช่วยให้สามารถใช้วิธีการกำลังสองน้อยที่สุดได้ อย่างมีเหตุผล

ในปี ค.ศ. 1823 เกาส์ได้ตีพิมพ์งานวิจัยเรื่อง" Theoria combinationis observationum erroribus minimis obnoxiae "ซึ่งในงานวิจัยนี้ เขาได้แนะนำแนวคิดทางสถิติที่สำคัญหลายประการ เช่นวิธีการกำลังสองน้อยที่สุดวิธีการความน่าจะเป็นสูงสุดและการแจกแจงแบบปกติเกาส์ใช้M , M , M ″, ...แทนการวัดปริมาณที่ไม่ทราบค่า  Vและพยายามหาตัวประมาณค่าที่มีความน่าจะเป็นสูงสุดของปริมาณนั้น นั่นคือ ตัวประมาณค่าที่ทำให้ความน่าจะเป็นφ ( MV ) · φ ( M ′ − V ) · φ ( M ″ − V ) · ...ของการได้ผลการทดลองที่สังเกตได้สูงสุด ในสัญลักษณ์ของเขา φΔ คือฟังก์ชันความหนาแน่นความน่าจะเป็นของข้อผิดพลาดในการวัดที่มีขนาด Δ เนื่องจากไม่ทราบว่าฟังก์ชันφคืออะไร เกาส์จึงต้องการให้วิธีการของเขาลดลงเหลือคำตอบที่รู้จักกันดี นั่นคือ ค่าเฉลี่ยเลขคณิตของค่าที่วัดได้[หมายเหตุ 3 ]จากหลักการเหล่านี้ เกาส์แสดงให้เห็นว่ากฎเดียวที่อธิบายเหตุผลของการเลือกค่าเฉลี่ยเลขคณิตเป็นตัวประมาณค่าพารามิเตอร์ตำแหน่งได้คือกฎปกติของข้อผิดพลาด: [ 79 ] โดยที่hคือ "การวัดความแม่นยำของการสังเกต" การใช้กฎปกตินี้เป็นแบบจำลองทั่วไปสำหรับข้อผิดพลาดในการทดลอง เกาส์ได้กำหนดสิ่งที่ปัจจุบันรู้จักกันในชื่อวิธีการถ่วงน้ำหนักกำลังสองน้อยที่สุด แบบ ไม่เชิงเส้น[ 80 ]

ปิแอร์-ซีมอง ลาปลาซ พิสูจน์ทฤษฎีบทลิมิตกลางในปี ค.ศ. 1810 ซึ่งเป็นการตอกย้ำความสำคัญของการแจกแจงแบบปกติในทางสถิติ

แม้ว่าเกาส์จะเป็นคนแรกที่เสนอแนวคิดเรื่องกฎการแจกแจงแบบปกติ แต่ลาปลาซก็มีส่วนสำคัญอย่างมาก[หมายเหตุ 4 ]ลาปลาซเป็นคนแรกที่ตั้งปัญหาการรวมการสังเกตหลายๆ ครั้งในปี 1774 [ 81 ]แม้ว่าวิธีแก้ปัญหาของเขาเองจะนำไปสู่การแจกแจงแบบลาปลาซก็ตาม ลาปลาซเป็นคนแรกที่คำนวณค่าของอินทิกรัลe t 2 dt = πในปี 1782 ซึ่งให้ค่าคงที่ของการทำให้เป็นมาตรฐานสำหรับการแจกแจงแบบปกติ[ 82 ]ด้วยความสำเร็จนี้ เกาส์จึงยอมรับความสำคัญของลาปลาซ[ 83 ] สุดท้าย ลาปลาซเป็นผู้ที่พิสูจน์และนำเสนอ ทฤษฎีบทขีดจำกัดกลางพื้นฐานต่อวงการวิชาการในปี 1810 ซึ่งเน้นย้ำถึงความสำคัญทางทฤษฎีของการแจกแจงแบบปกติ[ 84 ]

เป็นที่น่าสนใจที่จะสังเกตว่าในปี พ.ศ. 2352 นักคณิตศาสตร์ชาวไอริช-อเมริกันชื่อRobert Adrainได้ตีพิมพ์ผลงานที่ลึกซึ้งแต่มีข้อบกพร่องสองชิ้นเกี่ยวกับกฎความน่าจะเป็นปกติ พร้อมกันและเป็นอิสระจาก Gauss [ 85 ] ผลงานของเขาส่วนใหญ่ไม่เป็นที่รู้จักของชุมชนวิทยาศาสตร์ จนกระทั่งในปี พ.ศ. 2314 Abbeได้นำผลงานเหล่านั้นกลับมาศึกษาอีกครั้ง[ 86 ]

ในช่วงกลางศตวรรษที่ 19 แม็กซ์เวลล์ได้แสดงให้เห็นว่าการแจกแจงแบบปกติไม่ได้เป็นเพียงเครื่องมือทางคณิตศาสตร์ที่สะดวกเท่านั้น แต่ยังอาจเกิดขึ้นในปรากฏการณ์ทางธรรมชาติได้อีกด้วย: [ 59 ]จำนวนอนุภาคที่มีความเร็วซึ่งถูกวิเคราะห์ในทิศทางใดทิศทางหนึ่งอยู่ระหว่างxและx + dxคือ

การตั้งชื่อ

ในปัจจุบัน แนวคิดนี้มักเรียกกันในภาษาอังกฤษว่าการแจกแจงปกติหรือการแจกแจงแบบเกาส์เซียนชื่ออื่นๆ ที่ใช้กันน้อยกว่า ได้แก่ การแจกแจงแบบเกาส์ การแจกแจงแบบลาปลาซ-เกาส์ กฎแห่งความคลาดเคลื่อน กฎแห่งความง่ายของความคลาดเคลื่อน กฎข้อที่สองของลาปลาซ และกฎแบบเกาส์เซียน

ดูเหมือนว่าเกาส์เองจะเป็นผู้บัญญัติศัพท์นี้โดยอ้างอิงถึง "สมการปกติ" ที่เกี่ยวข้องกับการประยุกต์ใช้ โดยคำว่าปกติในเชิงเทคนิคหมายถึงตั้งฉากกัน ไม่ใช่ปกติ[ 87 ]อย่างไรก็ตาม ในช่วงปลายศตวรรษที่ 19 ผู้เขียนบางคน[หมายเหตุ 5 ]ได้เริ่มใช้ชื่อการแจกแจงปกติโดยใช้คำว่า "ปกติ" เป็นคำคุณศัพท์ ซึ่งในขณะนั้นคำนี้ถูกมองว่าเป็นการสะท้อนให้เห็นว่าการแจกแจงนี้เป็นเรื่องปกติ ทั่วไป และจึงถือว่าปกติเพียร์ซ (หนึ่งในผู้เขียนเหล่านั้น) เคยให้คำจำกัดความของ "ปกติ" ไว้ดังนี้: "... 'ปกติ' ไม่ใช่ค่าเฉลี่ย (หรือค่าเฉลี่ยประเภทอื่นใด) ของสิ่งที่เกิดขึ้นจริง แต่เป็นสิ่งที่ในระยะยาวจะ เกิดขึ้นภายใต้สถานการณ์บางอย่าง" [ 88 ]ประมาณช่วงเปลี่ยนศตวรรษที่ 20 เพียร์สันได้ทำให้คำว่าปกติ เป็นที่นิยม ในฐานะคำที่ใช้เรียกการแจกแจงนี้[ 89 ]

หลายปีที่แล้ว ผมเคยเรียกเส้นโค้งลาปลาซ-เกาส์เซียนว่า เส้นโค้ง ปกติซึ่งชื่อนี้ถึงแม้จะช่วยหลีกเลี่ยงประเด็นเรื่องความได้เปรียบในระดับนานาชาติ แต่ก็มีข้อเสียคือทำให้ผู้คนเข้าใจผิดว่าการแจกแจงความถี่แบบอื่นๆ ทั้งหมดนั้น 'ผิดปกติ' ในแง่ใดแง่หนึ่ง

นอกจากนี้ เพียร์สันเป็นคนแรกที่เขียนการแจกแจงในรูปของค่าเบี่ยงเบนมาตรฐานσดังเช่นสัญลักษณ์ที่ใช้ในปัจจุบัน ไม่นานหลังจากนั้น ในปี 1915 ฟิชเชอร์ได้เพิ่มพารามิเตอร์ตำแหน่งเข้าไปในสูตรการแจกแจงปกติ โดยแสดงออกมาในรูปแบบที่เขียนกันในปัจจุบัน:

คำว่าการแจกแจงปกติมาตรฐานซึ่งหมายถึงการแจกแจงปกติที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง เริ่มใช้กันอย่างแพร่หลายในช่วงทศวรรษ 1950 โดยปรากฏในตำราเรียนยอดนิยมของ P. G. Hoel (1947) Introduction to Mathematical StatisticsและAlexander M. Mood (1950) Introduction to the Theory of Statistics [ 90 ] [ 91 ] [ 92 ]

ดูเพิ่มเติม

หมายเหตุ

  1. ^ตัวอย่างเช่น อัลกอริทึมนี้มีอยู่ในบทความเรื่องภาษาโปรแกรม Bc
  2. เดอ มัวร์ตีพิมพ์ผลการค้นพบของเขาครั้งแรกในปี 1733 ในจุลสารชื่อ Approximatio ad Summam Terminorum Binomii ( a + b ) n in Seriem Expansiซึ่งกำหนดไว้สำหรับการเผยแพร่ภายในเท่านั้น แต่เขาไม่ได้เปิดเผยผลลัพธ์ต่อสาธารณะจนกระทั่งปี 1738 จุลสารฉบับดั้งเดิมได้รับการพิมพ์ซ้ำหลายครั้ง ดูตัวอย่างเช่น Walker (1985 )
  3. ^ "โดยทั่วไปแล้ว มักถือว่าสมมติฐานที่ว่า หากปริมาณใดๆ ได้รับการกำหนดโดยการสังเกตโดยตรงหลายครั้ง ภายใต้สถานการณ์เดียวกันและด้วยความระมัดระวังเท่าเทียมกัน ค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้จะให้ค่าที่มีความน่าจะเป็นมากที่สุด หากไม่ถูกต้องอย่างเคร่งครัด แต่ก็ใกล้เคียงมากที่สุด ดังนั้นจึงปลอดภัยที่สุดที่จะยึดถือค่าเฉลี่ยเลขคณิตนี้เสมอ" —เกาส์ (1809 , มาตรา 177)
  4. ^ "ธรรมเนียมของผมในการเรียกเส้นโค้งนี้ว่าเส้นโค้งเกาส์-ลาปลาเซียนหรือ เส้นโค้ง ปกติช่วยให้เราไม่ต้องแบ่งสัดส่วนคุณูปการในการค้นพบระหว่างนักดาราศาสตร์และนักคณิตศาสตร์ผู้ยิ่งใหญ่ทั้งสองท่าน" อ้างอิงจากเพียร์สัน (1905 , หน้า 189)
  5. ^นอกจากที่อ้างอิงไว้โดยเฉพาะในที่นี้แล้ว ยังพบการใช้งานในลักษณะนี้ในงานของ Peirce , Galton ( Galton (1889 , บทที่ V)) และ Lexis ( Lexis (1878) , Rohrbasser & Véron (2003) ) ประมาณปี 1875
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=1360516498 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การกระจายแบบปกติ

ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจง แบบปกติ หรือ การแจกแจงแบบเกาส์เซียน เป็นการ แจกแจงความน่าจะเป็นแบบต่อเนื่อง ชนิดหนึ่งสำหรับ ตัวแปรสุ่ม ค่าจริง รูปแบบทั่วไปของ...

การแจกแจงปกติมาตรฐาน

กรณีที่ง่ายที่สุดของการแจกแจงปกติเรียกว่า การแจกแจงปกติมาตรฐาน หรือ การแจกแจงปกติหน่วย นี่เป็นกรณีพิเศษเมื่อและและอธิบายโดย ฟังก์ชันความหนาแน่นความน่าจะเป็น (หรือความหนาแน่น) ดังนี้: [ 11 ] ตัวแปร ⁠ ⁠ มีค่าเฉลี่ยเป็น 0...

การกระจายปกติทั่วไป

ถ้า ⁠ ⁠ Z {\displaystyle Z} เป็นค่า เบี่ยงเบนมาตรฐานของการแจกแจงปกติ แล้วจะมีค่าคาดหวัง ⁠ ⁠ และค่าเบี่ยงเบนมาตรฐาน ⁠ ⁠ ซึ่งเทียบเท่ากับการกล่าวว่า การแจกแจงปกติมาตรฐาน ⁠ ⁠ สามารถปรับขนาด/ยืดออก ได้ ด้วยปัจจัย ⁠ ⁠ และเลื่อนไป ⁠ ⁠...

สัญกรณ์

ความหนาแน่นของความน่าจะเป็นของการแจกแจงแบบเกาส์เซียนมาตรฐาน (การแจกแจงแบบปกติมาตรฐาน โดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง) มักจะแสดงด้วยอักษรกรีก ⁠ ⁠ ϕ {\displaystyle \phi } ( phi ) [ 13 ] รูปแบบอื่นของอักษรกรีก phi คือ ⁠ ⁠ φ {\displaystyle \varphi...