การกระจายแบบปกติ

การกระจายแบบปกติ
การกระจายแบบปกติ
	ฟังก์ชันความหนาแน่นความน่าจะเป็น เส้นโค้งสีแดงแสดงถึงการแจกแจงปกติมาตรฐาน
	ฟังก์ชันการกระจายสะสม
สัญกรณ์
พารามิเตอร์	= ค่าเฉลี่ย ( ตำแหน่ง ) = ความแปรปรวน ( มาตราส่วน ยกกำลังสอง )
สนับสนุน
พีดี
ซีดีเอฟ
ควอนไทล์
หมายถึง
ค่ามัธยฐาน
โหมด
ความแปรปรวน
โกรธ
เอเอดี
ความเบี่ยงเบน
ความโค้งส่วนเกิน
เอนโทรปี
เอ็มจีเอฟ
ซีเอฟ
ข้อมูลของฟิชเชอร์
ความแตกต่าง Kullback–Leibler

ในทฤษฎีความน่าจะเป็นและสถิติ การ แจกแจงแบบปกติหรือการแจกแจงแบบเกาส์เซียน เป็นการ แจกแจงความน่าจะเป็นแบบต่อเนื่องชนิดหนึ่งสำหรับตัวแปรสุ่ม ค่าจริง รูปแบบทั่วไปของฟังก์ชันความหนาแน่นความน่าจะ เป็น คือ^[²^]^[³^]^[⁴^] พารามิเตอร์⁠ ⁠คือค่าเฉลี่ยหรือค่าคาดหวังของการแจกแจง (รวมถึง ค่า มัธยฐานและค่าฐานนิยม ด้วย ) ในขณะที่พารามิเตอร์คือค่าความ แปรปรวน ค่าเบี่ยงเบนมาตรฐานของการแจกแจงคือค่าบวก⁠ ⁠ (ซิกมา) ตัวแปรสุ่มที่มีการแจกแจงแบบเกาส์เซียนเรียกว่ามีการแจกแจงแบบปกติและเรียกว่า ค่าเบี่ยง เบน ปกติ $f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\exp {\left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)}\,.$ $\mu$ ${\textstyle \sigma ^{2}}$ $\sigma$

การแจกแจงแบบปกติมีความสำคัญในทางสถิติและมักใช้ใน วิทยาศาสตร์ ธรรมชาติและสังคม เพื่อแสดง ตัวแปรสุ่มที่มีค่าจริงซึ่งไม่ทราบการแจกแจง^{[ 5 ]}^{[ 6 ]}ความสำคัญของการแจกแจงแบบปกติส่วนหนึ่งมาจากทฤษฎีบทขีดจำกัดกลางซึ่งระบุว่าค่าเฉลี่ยของ ตัวอย่าง (การสังเกต) ที่ เป็นอิสระทางสถิติ จำนวนมาก ของตัวแปรสุ่มที่มีค่าเฉลี่ยและความแปรปรวนจำกัดนั้นเป็นตัวแปรสุ่มเช่นกัน ซึ่งการแจกแจงจะลู่เข้าสู่การแจกแจงแบบปกติเมื่อจำนวนตัวอย่างเพิ่มขึ้น ดังนั้นปริมาณทางกายภาพที่คาดว่าจะเป็นผลรวมของกระบวนการอิสระจำนวนมาก เช่นข้อผิดพลาดในการวัดมักมีการแจกแจงที่ใกล้เคียงกับแบบปกติ^{[ 7 ]}

ยิ่งไปกว่านั้น การแจกแจงแบบเกาส์เซียนยังมีคุณสมบัติเฉพาะบางประการที่มีคุณค่าในการศึกษาเชิงวิเคราะห์ ตัวอย่างเช่นการรวมเชิงเส้น ใดๆ ของชุดค่าเบี่ยงเบนปกติอิสระที่กำหนดไว้ ถือเป็นค่าเบี่ยงเบนปกติ ผลลัพธ์และวิธีการต่างๆ มากมาย เช่นการแพร่กระจายของความไม่แน่นอนและ การปรับพารามิเตอร์ กำลังสองน้อยที่สุด^{[ 8 ]}สามารถหาได้ในรูปแบบที่ชัดเจนในเชิงวิเคราะห์เมื่อตัวแปรที่เกี่ยวข้องมีการแจกแจงแบบปกติ

บางครั้งการแจกแจงแบบปกติก็เรียกกันอย่างไม่เป็นทางการว่าเส้นโค้งระฆัง [ ^{9 ] [}^{10 ] อย่างไรก็ตาม}การแจกแจงอื่นๆ อีกมากมายก็มีรูปร่างคล้ายระฆัง (เช่น การแจกแจงCauchy , Student's $t$ และ การแจกแจง โลจิสติก ) (สำหรับชื่ออื่นๆ โปรดดูที่ การตั้งชื่อ )

การแจกแจงความน่าจะเป็นแบบตัวแปรเดียวได้รับการขยายความสำหรับเวกเตอร์ในการแจกแจงปกติแบบหลายตัวแปรและสำหรับเมทริกซ์ในการแจกแจงปกติแบบเมทริกซ์

คำจำกัดความ

การแจกแจงปกติมาตรฐาน

กรณีที่ง่ายที่สุดของการแจกแจงปกติเรียกว่าการแจกแจงปกติมาตรฐานหรือการแจกแจงปกติหน่วยนี่เป็นกรณีพิเศษเมื่อและและอธิบายโดยฟังก์ชันความหนาแน่นความน่าจะเป็น (หรือความหนาแน่น) ดังนี้: ^[¹¹^] ตัวแปร⁠ ⁠มีค่าเฉลี่ยเป็น 0 และความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานเป็น 1 ความหนาแน่น มี ค่า สูงสุดที่และจุดเปลี่ยนที่และ⁠ ⁠ ${\textstyle \mu =0}$ ${\textstyle \sigma ^{2}=1}$ $\varphi (z)={\frac {e^{-z^{2}/2}}{\sqrt {2\pi }}}\,.$ $z$ ${\textstyle \varphi (z)}$ ${\textstyle {\frac {1}{\sqrt {2\pi }}}}$ ${\textstyle z=0}$ ${\textstyle z=+1}$ $z=-1$

แม้ว่าความหนาแน่นข้างต้นจะเป็นที่รู้จักกันทั่วไปว่าเป็นแบบปกติมาตรฐาน แต่ผู้เขียนบางคนได้ใช้คำนี้เพื่ออธิบายรูปแบบอื่นของการแจกแจงปกติ ตัวอย่างเช่น คาร์ล ฟรีดริช เกาส์เคยนิยามแบบปกติมาตรฐานว่าซึ่งมีค่าความแปรปรวนเท่ากับ⁠ ⁠และสตีเฟน สติกล์เลอร์เคยนิยามแบบปกติมาตรฐานว่าซึ่งมีรูปแบบฟังก์ชันที่เรียบง่ายและมีค่าความแปรปรวนเท่ากับ^[¹²^] ${\textstyle \varphi (z)={\frac {1}{\sqrt {\pi }}}e^{-z^{2}},}$ ${\tfrac {1}{2}}$ ${\textstyle \varphi (z)=e^{-\pi z^{2}},}$ ${\textstyle \sigma ^{2}={\frac {1}{2\pi }}.}$

การกระจายปกติทั่วไป

ถ้า⁠ ⁠ $Z$ เป็นค่าเบี่ยงเบนมาตรฐานของการแจกแจงปกติแล้วจะมีค่าคาดหวัง⁠ ⁠และค่าเบี่ยงเบนมาตรฐาน⁠ ⁠ซึ่งเทียบเท่ากับการกล่าวว่า การแจกแจงปกติมาตรฐาน⁠ ⁠ สามารถปรับขนาด/ยืดออก ได้ ด้วยปัจจัย⁠ ⁠และเลื่อนไป⁠ ⁠เพื่อให้ได้การแจกแจงปกติอีกแบบหนึ่ง เรียกว่า⁠ ⁠ ${\textstyle X=\sigma Z+\mu }$ $\mu$ $\sigma$ $Z$ $\sigma$ $\mu$ $X$

ในทางกลับกัน ถ้า⁠ ⁠ $X$ เป็นค่าเบี่ยงเบนปกติที่มีพารามิเตอร์⁠ ⁠ $\mu$ และ, แล้ว การแจกแจง ⁠ ⁠ นี้ สามารถปรับขนาดและเลื่อนได้โดยใช้สูตร เพื่อแปลงให้เป็นการแจกแจงปกติมาตรฐาน ตัวแปรนี้เรียกอีกอย่าง ว่า รูปแบบมาตรฐานของ⁠ ⁠ ${\textstyle \sigma ^{2}}$ $X$ ${\textstyle Z=(X-\mu )/\sigma }$ $X$

โดยเฉพาะอย่างยิ่ง ฟังก์ชันความหนาแน่นความน่าจะเป็นสำหรับสามารถเขียน $X$ ได้ในรูปของการแจกแจงปกติมาตรฐาน( ที่ $\varphi$ มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง): ความหนาแน่นความน่าจะเป็นจะต้องถูกปรับขนาดด้วยเพื่อให้ปริพันธ์ยังคงเป็น 1 $f(x\mid \mu ,\sigma ^{2})={\frac {1}{\sigma }}\varphi \left({\frac {x-\mu }{\sigma }}\right)\,.$ ${\textstyle 1/\sigma }$

สัญกรณ์

ความหนาแน่นของความน่าจะเป็นของการแจกแจงแบบเกาส์เซียนมาตรฐาน (การแจกแจงแบบปกติมาตรฐาน โดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง) มักจะแสดงด้วยอักษรกรีก⁠ ⁠ $\phi$ ( phi ) ^{[ 13 ]}รูปแบบอื่นของอักษรกรีก phi คือ⁠ ⁠ $\varphi$ ก็ถูกใช้บ่อยเช่นกัน

การแจกแจงแบบปกติมักเรียกว่าหรือ [ 14 ] ^{ดังนั้น}เมื่อตัวแปรสุ่มมีการแจกแจงแบบปกติโดยมีค่าเฉลี่ย^และส่วนเบี่ยงเบนมาตรฐานเราอาจเขียนได้ ^ว่า ${\textstyle N(\mu ,\sigma ^{2})}$ ${\mathcal {N}}(\mu ,\sigma ^{2})$ $X$ $\mu$ $\sigma$

$X\sim {\mathcal {N}}(\mu ,\sigma ^{2}).$

การกำหนดพารามิเตอร์ทางเลือก

ผู้เขียนบางคนสนับสนุนให้ใช้ความแม่นยำเป็นพารามิเตอร์ที่กำหนดความกว้างของการกระจาย แทนที่จะใช้ค่าเบี่ยงเบนมาตรฐานหรือความแปรปรวนความแม่นยำมักจะถูกกำหนดให้เป็นส่วนกลับของความแปรปรวน^[¹⁵^]สูตรสำหรับการกระจาย จึงกลายเป็น $\tau$ $\sigma$ $\sigma ^{2}$ $1/\sigma ^{2}$ $f(x)={\sqrt {\frac {\tau }{2\pi }}}e^{-\tau (x-\mu )^{2}/2}.$

มีการอ้างว่าตัวเลือกนี้มีข้อดีในการคำนวณเชิงตัวเลขเมื่อ⁠ ⁠ $\sigma$ มีค่าใกล้เคียงกับศูนย์มาก และช่วยลดความซับซ้อนของสูตรในบางบริบท เช่น ในการอนุมานแบบเบย์เซียนของตัวแปรที่มีการกระจายแบบปกติหลายตัวแปร

อีกทางเลือกหนึ่งคือ อาจกำหนดให้ส่วนกลับของค่าเบี่ยงเบนมาตรฐาน เป็น ความแม่นยำซึ่งในกรณีนี้ การแสดงออกของการแจกแจงปกติจะกลายเป็น ${\textstyle \tau '=1/\sigma }$ $f(x)={\frac {\tau '}{\sqrt {2\pi }}}e^{-(\tau ')^{2}(x-\mu )^{2}/2}.$

ตามที่สติกลอร์กล่าว การกำหนดสูตรนี้มีข้อดีคือสูตรนั้นง่ายกว่าและจำง่ายกว่ามาก อีกทั้งยังมีสูตรประมาณค่าควอนไทล์ของการกระจายตัว ที่เรียบง่ายอีกด้วย

การแจกแจงปกติเป็นตระกูลเอกซ์โพเนนเชียล $ที่$ $มี$ พารามิเตอร์ธรรมชาติ $μ$ และ $σ$ และสถิติธรรมชาติ $x$ $และ$ x² $พารามิเตอร์$ ความคาดหวังคู่สำหรับการแจกแจงปกติคือ $η₁$ $=$ $μ$ และ $η₂$ $=$ $μ²$ $+$ $σ²$ ${\textstyle \textstyle \theta _{1}={\frac {\mu }{\sigma ^{2}}}}$ ${\textstyle \textstyle \theta _{2}=-{\frac {1}{2\sigma ^{2}}}}$

ฟังก์ชันการกระจายสะสม

ฟังก์ชันการกระจายสะสม (CDF) ของการกระจายปกติมาตรฐาน ซึ่งโดยทั่วไปจะใช้ตัวอักษรกรีกตัวใหญ่⁠ ⁠ $\Phi$ แทน คือปริพันธ์ $\Phi (x)={\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{x}e^{-t^{2}/2}\,dt\,.$

ฟังก์ชันความคลาดเคลื่อน ที่เกี่ยวข้องจะให้ความน่าจะเป็นที่ตัวแปรสุ่ม ซึ่งมีการแจกแจงแบบปกติโดยมีค่าเฉลี่ย 0 และความแปรปรวน 1/2 จะตกอยู่ในช่วง⁠ ⁠นั่นคือ: ${\textstyle \operatorname {erf} (x)}$ $[-x,x]$ $\operatorname {erf} (x)={\frac {1}{\sqrt {\pi }}}\int _{-x}^{x}e^{-t^{2}}\,dt={\frac {2}{\sqrt {\pi }}}\int _{0}^{x}e^{-t^{2}}\,dt\,.$

อินทิกรัลเหล่านี้ไม่สามารถแสดงในรูปของฟังก์ชันพื้นฐานได้ และมักถูกเรียกว่าฟังก์ชันพิเศษอย่างไรก็ตาม มีวิธีการประมาณค่าเชิงตัวเลขมากมายที่เป็นที่รู้จัก โปรดดูรายละเอียดเพิ่มเติม ด้านล่าง

หน้าที่ทั้งสองมีความสัมพันธ์กันอย่างใกล้ชิด กล่าวคือ $\Phi (x)={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x}{\sqrt {2}}}\right)\right].$

สำหรับการแจกแจงปกติทั่วไปที่มีความหนาแน่น⁠ ⁠ $f$ ค่าเฉลี่ย⁠ ⁠ $\mu$ และความแปรปรวนฟังก์ชันการแจกแจงสะสมคือ ${\textstyle \sigma ^{2}}$ $F(x)=\Phi {\left({\frac {x-\mu }{\sigma }}\right)}={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\right].$

ความน่าจะเป็นที่ $x$ อยู่ระหว่าง $a$ และ $b$ โดยที่ $a < b$ คือ^{[ 16 ]}^{: 84} $\operatorname {P} (a<x\leq b)={\frac {1}{2}}\left[\operatorname {erf} \left({\frac {b-\mu }{\sigma {\sqrt {2}}}}\right)-\operatorname {erf} \left({\frac {a-\mu }{\sigma {\sqrt {2}}}}\right)\right]$

ส่วนเติมเต็มของฟังก์ชันการกระจายสะสมปกติมาตรฐานมักเรียกว่าฟังก์ชัน Qโดยเฉพาะในตำราวิศวกรรม[ 17 ] [ 18 ] มันให้ความน่าจะเป็นที่ค่าของตัวแปรสุ่มปกติมาตรฐานจะเกิน : ^คำ^{จำกัดความ}^อื่น^ๆ^ของ^{ฟังก์ชัน}ซึ่งทั้งหมดเป็นการแปลงอย่างง่ายของก็ถูกนำมาใช้บ้างเป็นครั้ง^คราว^[ 19 ^] ${\textstyle Q(x)=1-\Phi (x)}$ $X$ $x$ $P(X>x)$ $Q$ $\Phi$

กราฟของฟังก์ชันการกระจายสะสมปกติมาตรฐาน มี สมมาตรการหมุน 2 เท่ารอบจุด (0,1/2) นั่นคือ⁠ ⁠ อนุพันธ์ ผกผัน (ปริพันธ์ไม่จำกัด) ของ กราฟนี้สามารถแสดงได้ดังนี้: $\Phi$ $\Phi (-x)=1-\Phi (x)$ $\int \Phi (x)\,dx=x\Phi (x)+\varphi (x)+C.$

การขยายอนุกรมเชิงอะซิมโทติกของฟังก์ชันการกระจายสะสมสำหรับ $x$ ขนาดใหญ่ สามารถหาได้โดยใช้การอินทิเกรตโดยส่วน : โดยที่หมายถึงแฟกทอเรียลคู่สำหรับข้อมูลเพิ่มเติม โปรดดูที่ ฟังก์ชันข้อผิดพลาด § การขยายอนุกรมเชิงอะซิมโทติก^[²⁰^] $\Phi (x)={\frac {1}{2}}+{\frac {1}{\sqrt {2\pi }}}e^{-x^{2}/2}\sum _{n=0}^{\infty }{\frac {1}{(2n+1)!!}}x^{2n+1}\,.$ ${\textstyle !!}$

การแสดงผลแบบอนุกรมเทย์เลอร์

อนุกรม เทย์ เลอร์สำหรับการกระจายปกติสามารถหาได้โดยการแทนที่ลงในอนุกรมเท ย์เลอ ร์สำหรับฟังก์ชันเลขชี้กำลัง : ^[²¹^] $\varphi$ $-{\tfrac {1}{2}}x^{2}$

$\varphi (x)={\frac {1}{\sqrt {2\pi }}}\sum _{n=0}^{\infty }{\frac {(-1)^{n}}{n!\,2^{n}}}x^{2n}$

อนุกรมนี้สามารถบูรณาการทีละเทอมเพื่อให้ได้อนุกรมเทย์เลอร์สำหรับฟังก์ชันการกระจายสะสม: ^{[ 22 ]}

$\Phi (x)={\frac {1}{2}}+{\frac {1}{\sqrt {2\pi }}}\sum _{n=0}^{\infty }{\frac {(-1)^{n}}{n!\,2^{n}(2n+1)}}x^{2n+1}.$ อย่างไรก็ตาม อนุกรมนี้ไม่มีประสิทธิภาพในการคำนวณเนื่องจากการลู่เข้าช้า ยกเว้นเมื่อ⁠ ⁠ $x$ มีขนาดเล็ก^{[ 22 ]}

อนุกรมทั้งสองนี้อธิบายฟังก์ชันทั้งหมดซึ่งลู่เข้าสำหรับค่าจริงและค่าเชิงซ้อนทั้งหมดของ ⁠ ⁠ $x$

การคำนวณแบบเรียกซ้ำด้วยอนุกรมเทย์เลอร์

ความสัมพันธ์เวียนเกิดสำหรับพหุนามเฮอร์ไมต์ $He n (x)$ สามารถใช้สร้าง การขยายอนุกรม เทย์เลอร์ รอบจุด $x 0$ ใดๆ ได้อย่างมีประสิทธิภาพ โดย ที่: $\Phi (x)=\sum _{n=0}^{\infty }{\frac {\Phi ^{(n)}(x_{0})}{n!}}(x-x_{0})^{n}\,,$ ${\begin{aligned}\Phi ^{(0)}(x_{0})&={\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{x_{0}}e^{-t^{2}/2}\,dt\\\Phi ^{(1)}(x_{0})&={\frac {1}{\sqrt {2\pi }}}e^{-x_{0}^{2}/2}\\\Phi ^{(n)}(x_{0})&=-\left(x_{0}\Phi ^{(n-1)}(x_{0})+(n-2)\Phi ^{(n-2)}(x_{0})\right),&n\geq 2\,.\end{aligned}}$

ค่าเบี่ยงเบนมาตรฐานและความครอบคลุม

ประมาณ 68% ของค่าที่ดึงมาจากการแจกแจงปกติจะอยู่ภายในหนึ่งส่วนเบี่ยงเบนมาตรฐาน $σ$ จากค่าเฉลี่ย ประมาณ 95% ของค่าจะอยู่ภายในสองส่วนเบี่ยงเบนมาตรฐาน และประมาณ 99.7% จะอยู่ภายในสามส่วนเบี่ยงเบนมาตรฐาน^{[ 9 ]}นี่เป็นที่รู้จักกันในชื่อกฎ 68–95–99.7 (เชิงประจักษ์)หรือกฎ 3 ซิกมา

กล่าวโดยละเอียด ความน่าจะเป็นที่ค่าเบี่ยงเบนมาตรฐานจะอยู่ในช่วงระหว่างและนั้นกำหนดโดย สูตร โดยปัดเศษให้เหลือ 12 หลักสำคัญ ค่าของคือ: ${\textstyle \mu -n\sigma }$ ${\textstyle \mu +n\sigma }$ $F(\mu +n\sigma )-F(\mu -n\sigma )=\Phi (n)-\Phi (-n)=\operatorname {erf} \left({\frac {n}{\sqrt {2}}}\right).$ ${\textstyle n=1,2,\ldots ,6}$

⁠ ⁠

n

{\textstyle p=F(\mu +n\sigma )-F(\mu -n\sigma )}

{\textstyle 1-p}

{\textstyle {\text{or }}1{\text{ in }}(1-p)}

โออีไอเอส

1

0.682 689 492 137

0.317 310 507 863

3	.151 487 187 53

OEIS : A178647

2

0.954 499 736 104

0.045 500 263 896

21	.977 894 5080

OEIS : A110894

3

0.997 300 203 937

0.002 699 796 063

370	.398 347 345

OEIS : A270712

4

0.999 936 657 516

0.000 063 342 484

15 787

.192 7673

5

0.999 999 426 697

0.000 000 573 303

1 744 277

.893 62

6

0.999 999 998 027

0.000 000 001 973

506 797 345

.897

สำหรับค่า ⁠ ⁠ $n$ ขนาดใหญ่ สามารถใช้การประมาณค่าได้ $1-p\approx {\frac {\sqrt {2}}{n{\sqrt {\pi e^{n^{2}}}}}}$

ฟังก์ชันควอนไทล์

ฟังก์ชันควอนไทล์ของการแจกแจงคือส่วนกลับของฟังก์ชันการแจกแจงสะสม ฟังก์ชันควอนไทล์ของการแจกแจงปกติมาตรฐานเรียกว่าฟังก์ชันโพรบิตและสามารถแสดงได้ในรูปของฟังก์ชันความคลาดเคลื่อน ผกผัน : สำหรับตัวแปรสุ่มปกติที่มีค่าเฉลี่ย⁠ ⁠และความแปรปรวนฟังก์ชันควอนไทล์คือ ควอนไทล์ของการแจกแจงปกติมาตรฐานมักใช้สัญลักษณ์⁠ ⁠ค่าเหล่านี้ใช้ในการทดสอบสมมติฐานการสร้างช่วงความเชื่อมั่นและแผนภาพ Q–Qตัวแปรสุ่มปกติ⁠ ⁠จะมีค่าเกินช่วงด้วยความน่าจะเป็นและจะมีค่าอยู่นอกช่วงด้วยความน่าจะเป็น⁠ ⁠โดยเฉพาะอย่างยิ่ง ควอนไทล์คือ1.96ดังนั้นตัวแปรสุ่มปกติจะมีค่าอยู่นอกช่วงเพียง 5% ของกรณีเท่านั้น $\Phi ^{-1}(p)={\sqrt {2}}\operatorname {erf} ^{-1}(2p-1),\quad p\in (0,1).$ $\mu$ ${\textstyle \sigma ^{2}}$ $F^{-1}(p)=\mu +\sigma \Phi ^{-1}(p)=\mu +\sigma {\sqrt {2}}\operatorname {erf} ^{-1}(2p-1),\quad p\in (0,1).$ ${\textstyle \Phi ^{-1}(p)}$ $z_{p}$ $X$ ${\textstyle \mu +z_{p}\sigma }$ ${\textstyle 1-p}$ ${\textstyle \mu \pm z_{p}\sigma }$ $2(1-p)$ ${\textstyle z_{0.975}}$ ${\textstyle \mu \pm 1.96\sigma }$

ตารางต่อไปนี้แสดงควอนไทล์ที่⁠ ⁠จะอยู่ในช่วงด้วยความน่าจะเป็นที่ระบุ⁠ ⁠ค่าเหล่านี้มีประโยชน์ในการกำหนดช่วงความคลาดเคลื่อนสำหรับค่าเฉลี่ยตัวอย่างและตัวประมาณ ทางสถิติอื่นๆ ที่มีการแจกแจงแบบปกติ (หรือ แบบปกติ เชิงอะซิมโทติก ) ^[²³^]ตารางต่อไปนี้แสดงไม่ใช่ตามที่กำหนดไว้ข้างต้น ${\textstyle z_{p}}$ $X$ ${\textstyle \mu \pm z_{p}\sigma }$ $p$ ${\textstyle {\sqrt {2}}\operatorname {erf} ^{-1}(p)=\Phi ^{-1}\left({\frac {p+1}{2}}\right)}$ ${\textstyle \Phi ^{-1}(p)}$

⁠ ⁠ $p$	${\textstyle z_{p}}$	⁠ ⁠ $p$	${\textstyle z_{p}}$
0.80	1.281 551 565 545	0.999	3.290 526 731 492
0.90	1.644 853 626 951	0.9999	3.890 591 886 413
0.95	1.959 963 984 540	0.99999	4.417 173 413 469
0.98	2.326 347 874 041	0.999999	4.891 638 475 699
0.99	2.575 829 303 549	0.9999999	5.326 723 886 384
0.995	2.807 033 768 344	0.99999999	5.730 728 868 236
0.998	3.090 232 306 168	0.999999999	6.109 410 204 869

สำหรับค่า ⁠ ⁠ $p$ เล็กๆ ฟังก์ชันควอนไทล์จะมีการขยายอนุกรมเชิงอะซิมโทติก ที่มีประโยชน์ดังนี้ ${\textstyle \Phi ^{-1}(p)=-{\sqrt {\ln {\frac {1}{p^{2}}}-\ln \ln {\frac {1}{p^{2}}}-\ln(2\pi )}}+{\mathcal {o}}(1).}$

การใช้การหาค่ารากเพื่อคำนวณฟังก์ชันควอนไทล์

วิธีการใดๆ ที่อธิบายไว้สำหรับการคำนวณฟังก์ชันการกระจายสะสมสามารถใช้ร่วมกับวิธีของนิวตัน (หรืออัลกอริธึมการหาค่าราก อื่นๆ เช่นวิธีของฮัลลีย์ ) เพื่อหาค่าของ⁠ ⁠สำหรับ⁠ ⁠สำหรับควอนไทล์ที่ต้องการ⁠ ⁠ตัวอย่างเช่น เริ่มต้นด้วยการคาดเดาเบื้องต้นที่ถูกต้องโดยประมาณ⁠ ⁠ จากนั้น สามารถคำนวณ ค่าประมาณที่ดีขึ้นเรื่อยๆ⁠ ⁠ , ⁠ ⁠ , ... ได้แบบวนซ้ำโดยใช้วิธีของนิวตันด้วย ${\textstyle \Phi (x)}$ $x$ $\Phi (x)=q$ $q$ $x_{0}$ $x_{1}$ $x_{2}$ $x_{n}=x_{n-1}-{\frac {\Phi (x_{n-1})-q}{\varphi (x_{n-1})}}\,.$

คุณสมบัติ

การแจกแจงปกติเป็นการแจกแจงเดียวที่ค่าสะสมนอกเหนือจากสองค่าแรก (เช่น นอกเหนือจากค่าเฉลี่ยและความแปรปรวน ) เป็นศูนย์ นอกจากนี้ยังเป็นการแจกแจงต่อเนื่องที่มีเอนโทรปีสูงสุดสำหรับค่าเฉลี่ยและความแปรปรวนที่กำหนด^{[ 24 ]}^{[ 25 ]} Gearyได้แสดงให้เห็นแล้วว่า หากสมมติว่าค่าเฉลี่ยและความแปรปรวนมีค่าจำกัด การแจกแจงปกติเป็นการแจกแจงเดียวที่ค่าเฉลี่ยและความแปรปรวนที่คำนวณจากชุดของการสุ่มตัวอย่างอิสระจะเป็นอิสระต่อกัน^{[ 26 ]}^{[ 27 ]}

การแจกแจงปกติเป็นกลุ่มย่อยของการแจกแจงแบบวงรีการแจกแจงปกติมีความสมมาตรเกี่ยวกับค่าเฉลี่ย และมีค่าไม่เป็นศูนย์ตลอดช่วงเส้นจำนวนจริง ดังนั้นจึงอาจไม่ใช่แบบจำลองที่เหมาะสมสำหรับตัวแปรที่มีค่าเป็นบวกโดยธรรมชาติหรือมีการเบี่ยงเบนอย่างมาก เช่นน้ำหนักของบุคคลหรือราคาหุ้นตัวแปรดังกล่าวอาจอธิบายได้ดีกว่าด้วยการแจกแจงอื่นๆ เช่นการแจกแจงแบบลอการิทึมปกติหรือการแจกแจงแบบพาเรโต

ค่าของความหนาแน่นปกติจะมีค่าเกือบเป็นศูนย์เมื่อค่าอยู่ ห่างจากค่า เฉลี่ย $x$ มากกว่าสองสามส่วนเบี่ยงเบนมาตรฐาน (เช่น การกระจายตัวสามส่วนเบี่ยงเบนมาตรฐานครอบคลุมเกือบทั้งหมด ยกเว้น 0.27% ของการกระจายตัวทั้งหมด) ดังนั้น จึงอาจไม่ใช่แบบจำลองที่เหมาะสมเมื่อคาดว่าจะมีค่าผิดปกติ จำนวนมาก —ค่าที่อยู่ห่างจากค่าเฉลี่ยหลายส่วนเบี่ยงเบนมาตรฐาน— และวิธีการกำลังสองน้อยที่สุดและ วิธี การอนุมานทางสถิติ อื่นๆ ที่เหมาะสมที่สุดสำหรับตัวแปรที่มีการกระจายแบบปกติ มักจะไม่น่าเชื่อถืออย่างยิ่งเมื่อนำไปใช้กับข้อมูลดังกล่าว ในกรณีเหล่านั้นควรสันนิษฐานว่าเป็นการกระจายแบบหางหนัก กว่า และ ใช้วิธี การอนุมานทางสถิติที่แข็งแกร่ง ที่เหมาะสม

การแจกแจงแบบเกาส์เซียนจัดอยู่ในกลุ่มของการแจกแจงแบบเสถียรซึ่งเป็นตัวดึงดูดของผลรวมของ การแจกแจง แบบอิสระที่เหมือนกันไม่ว่าค่าเฉลี่ยหรือความแปรปรวนจะมีค่าจำกัดหรือไม่ก็ตาม ยกเว้นการแจกแจงแบบเกาส์เซียนซึ่งเป็นกรณีจำกัด การแจกแจงแบบเสถียรทั้งหมดจะมีหางที่หนาและมีความแปรปรวนอนันต์ การแจกแจงแบบเกาส์เซียนเป็นหนึ่งในไม่กี่การแจกแจงแบบเสถียรที่มีฟังก์ชันความหนาแน่นความน่าจะเป็นที่สามารถแสดงออกมาในเชิงวิเคราะห์ได้ การแจกแจงแบบอื่น ๆ ได้แก่การแจกแจงแบบโคชีและการแจกแจงแบบเลวี

สมมาตรและอนุพันธ์

การแจกแจงปกติที่มีความหนาแน่น(ค่าเฉลี่ยและความแปรปรวน) มีคุณสมบัติดังต่อไปนี้: ${\textstyle f(x)}$ $\mu$ ${\textstyle \sigma ^{2}>0}$

มันมีความสมมาตรรอบจุด ซึ่ง ^เป็นทั้งโหมดมัธยฐานและค่าเฉลี่ยของการกระจาย^[²⁸ ] ${\textstyle x=\mu ,}$
ฟังก์ชัน นี้ มีลักษณะเป็นโมดอลเดียว กล่าว คือ อนุพันธ์ อันดับแรกมีค่าเป็นบวกเมื่อเป็นลบเมื่อและมีค่าเป็นศูนย์เฉพาะเมื่อ ${\textstyle x<\mu ,}$ ${\textstyle x>\mu ,}$ ${\textstyle x=\mu .}$
พื้นที่ที่ล้อมรอบด้วยเส้นโค้งและแกน x มี $x$ ค่าเท่ากับหนึ่ง (กล่าวคือเท่ากับหนึ่ง)
อนุพันธ์อันดับแรกของมันคือ ${\textstyle f'(x)=-{\frac {x-\mu }{\sigma ^{2}}}f(x).}$
อนุพันธ์อันดับสองของมันคือ ${\textstyle f''(x)={\frac {(x-\mu )^{2}-\sigma ^{2}}{\sigma ^{4}}}f(x).}$
ความหนาแน่นของมันมีจุดเปลี่ยนความโค้ง สองจุด (ซึ่งอนุพันธ์อันดับสองของ⁠ ⁠ $f$ เป็นศูนย์และเปลี่ยนเครื่องหมาย) ซึ่งอยู่ห่างจากค่าเฉลี่ยหนึ่งส่วนเบี่ยงเบนมาตรฐาน กล่าวคือที่และ^[²⁸^] ${\textstyle x=\mu -\sigma }$ ${\textstyle x=\mu +\sigma .}$
ความหนาแน่นของมันเป็นลอการิทึมเว้า^{[ 28 ]}
ความหนาแน่นของมันสามารถหาอนุพันธ์ได้ ไม่จำกัดครั้ง จริงๆ แล้วเรียบมากเป็นอันดับ 2 ^{[ 29 ]}

นอกจากนี้ ความหนาแน่นของการ $\varphi$ แจกแจงปกติมาตรฐาน (เช่นและ) ยังมีคุณสมบัติดังต่อไปนี้: ${\textstyle \mu =0}$ ${\textstyle \sigma =1}$

อนุพันธ์อันดับแรกของมันคือ ${\textstyle \varphi '(x)=-x\varphi (x).}$
อนุพันธ์อันดับสองของมันคือ ${\textstyle \varphi ''(x)=(x^{2}-1)\varphi (x)}$
โดยทั่วไปแล้ว อนุพันธ์ลำดับที่ $n$ ของมัน คือโดยที่คือพหุนามเฮอร์ไมต์ลำดับที่ n $($ ความน่าจะเป็น) ^[³⁰^] ${\textstyle \varphi ^{(n)}(x)=(-1)^{n}\operatorname {He} _{n}(x)\varphi (x),}$ ${\textstyle \operatorname {He} _{n}(x)}$
ความน่าจะเป็นที่ตัวแปร ที่ $X$ มีการแจกแจงแบบปกติโดยที่ทราบค่าและอยู่ $\mu$ ในเซตใดเซตหนึ่ง สามารถคำนวณได้ โดยที่เศษส่วนนั้นมีการแจกแจงแบบปกติมาตรฐาน ${\textstyle \sigma ^{2}}$ ${\textstyle Z=(X-\mu )/\sigma }$

ช่วงเวลา

โมเมนต์ธรรมดาและโมเมนต์สัมบูรณ์ของตัวแปร $X$ คือค่าคาดหวังของและตามลำดับ ถ้าค่าคาดหวังของเป็นศูนย์พารามิเตอร์เหล่านี้เรียกว่าโมเมนต์กลางมิฉะนั้นจะเรียกว่าโมเมนต์ ไม่กลางโดยปกติแล้วเราจะสนใจเฉพาะโมเมนต์ที่มีอันดับเป็นจำนวนเต็มเท่านั้น ${\textstyle X^{p}}$ ${\textstyle |X|^{p}}$ $\mu$ $X$ $p$

ถ้า⁠ ⁠ $X$ มีการกระจายแบบปกติ โมเมนต์ที่ไม่ใช่ศูนย์กลางจะมีอยู่และมีค่าจำกัดสำหรับ⁠ ⁠ $p$ ใดๆ ที่ส่วนจริงมีค่ามากกว่า −1 สำหรับจำนวนเต็มที่ไม่เป็นลบใดๆ⁠ ⁠ $p$ โมเมนต์ศูนย์กลางธรรมดาคือ: ^{[ 31 ]} ในที่นี้หมายถึงแฟกทอเรียลคู่นั่นคือ ผลคูณของจำนวนทั้งหมดตั้งแต่⁠ ⁠ถึง 1 ที่มีพาริตีเดียวกันกับ $\operatorname {E} \left[(X-\mu )^{p}\right]={\begin{cases}0&{\text{if }}p{\text{ is odd,}}\\\sigma ^{p}(p-1)!!&{\text{if }}p{\text{ is even.}}\end{cases}}$ ${\textstyle n!!}$ $n$ ${\textstyle n.}$

โมเมนต์สัมบูรณ์ส่วนกลางจะตรงกับโมเมนต์ธรรมดาสำหรับลำดับคู่ทั้งหมด แต่จะไม่เป็นศูนย์สำหรับลำดับคี่ สำหรับจำนวนเต็มที่ไม่เป็นลบใดๆ ${\textstyle p,}$

${\begin{aligned}\operatorname {E} \left[|X-\mu |^{p}\right]&=\sigma ^{p}(p-1)!!\cdot {\begin{cases}{\sqrt {\frac {2}{\pi }}}&{\text{if }}p{\text{ is odd}}\\1&{\text{if }}p{\text{ is even}}\end{cases}}\\[8pt]&=\sigma ^{p}\cdot {\frac {2^{p/2}\Gamma \left({\frac {p+1}{2}}\right)}{\sqrt {\pi }}}.\end{aligned}}$ สูตรสุดท้ายใช้ได้กับค่าที่ไม่ใช่จำนวนเต็มใดๆเมื่อค่าเฉลี่ยของโมเมนต์ธรรมดาและสัมบูรณ์สามารถแสดงได้ในรูปของฟังก์ชันไฮเปอร์จีโอเมตริกที่ต่อเนื่องกันและ^[³²^] ${\textstyle p>-1.}$ ${\textstyle \mu \neq 0,}$ ${\textstyle {}_{1}F_{1}}$ ${\textstyle U.}$ ${\begin{aligned}\operatorname {E} \left[X^{p}\right]&=\sigma ^{p}\cdot {\left(-i{\sqrt {2}}\right)}^{p}\,U{\left(-{\frac {p}{2}},{\frac {1}{2}},-{\frac {\mu ^{2}}{2\sigma ^{2}}}\right)},\\\operatorname {E} \left[|X|^{p}\right]&=\sigma ^{p}\cdot 2^{p/2}{\frac {\Gamma {\left({\frac {1+p}{2}}\right)}}{\sqrt {\pi }}}\,{}_{1}F_{1}{\left(-{\frac {p}{2}},{\frac {1}{2}},-{\frac {\mu ^{2}}{2\sigma ^{2}}}\right)}.\end{aligned}}$

นิพจน์เหล่านี้ยังคงใช้ได้แม้ว่า⁠ ⁠ $p>-1$ จะไม่ใช่จำนวนเต็มก็ตาม ดูเพิ่มเติมที่พหุ นามเฮอร์ไมต์แบบทั่วไป

คำสั่ง	ช่วงเวลาที่ไม่เป็นศูนย์กลาง $\operatorname {E} \left[X^{p}\right]$	ช่วงเวลาสำคัญ $\operatorname {E} \left[(X-\mu )^{p}\right]$
0	⁠ ⁠ $1$	⁠ ⁠ $1$
1	⁠ ⁠ $\mu$	⁠ ⁠ $0$
2	${\textstyle \mu ^{2}+\sigma ^{2}}$	${\textstyle \sigma ^{2}}$
3	${\textstyle \mu ^{3}+3\mu \sigma ^{2}}$	⁠ ⁠ $0$
4	${\textstyle \mu ^{4}+6\mu ^{2}\sigma ^{2}+3\sigma ^{4}}$	${\textstyle 3\sigma ^{4}}$
5	${\textstyle \mu ^{5}+10\mu ^{3}\sigma ^{2}+15\mu \sigma ^{4}}$	⁠ ⁠ $0$
6	${\textstyle \mu ^{6}+15\mu ^{4}\sigma ^{2}+45\mu ^{2}\sigma ^{4}+15\sigma ^{6}}$	${\textstyle 15\sigma ^{6}}$
7	${\textstyle \mu ^{7}+21\mu ^{5}\sigma ^{2}+105\mu ^{3}\sigma ^{4}+105\mu \sigma ^{6}}$	⁠ ⁠ $0$
8	${\textstyle \mu ^{8}+28\mu ^{6}\sigma ^{2}+210\mu ^{4}\sigma ^{4}+420\mu ^{2}\sigma ^{6}+105\sigma ^{8}}$	${\textstyle 105\sigma ^{8}}$

ค่าคาดหวังของ⁠ ⁠ $X$ โดยมีเงื่อนไขว่าเหตุการณ์⁠ ⁠ $X$ อยู่ในช่วงจะกำหนดโดย โดย ที่⁠ ⁠และ⁠ ⁠คือฟังก์ชันความหนาแน่นและฟังก์ชันการกระจายสะสมของ⁠ ⁠ ตามลำดับ สำหรับกรณีนี้เรียกว่าอัตราส่วนมิลส์ผกผันโปรดสังเกตว่าข้างต้น ความหนาแน่น⁠ ⁠ของ⁠ ⁠ถูกนำมาใช้แทนความหนาแน่นปกติมาตรฐานดังเช่นในอัตราส่วนมิลส์ผกผัน ดังนั้นในที่นี้เราจึงมีแทนที่จะ เป็น⁠ ⁠ ${\textstyle [a,b]}$ $\operatorname {E} \left[X\mid a<X<b\right]=\mu -\sigma ^{2}{\frac {f(b)-f(a)}{F(b)-F(a)}}\,,$ $f$ $F$ $X$ ${\textstyle b=\infty }$ $f$ $X$ ${\textstyle \sigma ^{2}}$ $\sigma$

การแปลงฟูริเยร์และฟังก์ชันลักษณะเฉพาะ

การแปลงฟูริเยร์ของความหนาแน่นปกติที่มี $f$ ค่าเฉลี่ยและความ $\mu$ แปรปรวนคือ^[³³^] ${\textstyle \sigma ^{2}}$

${\hat {f}}(t)=\int _{-\infty }^{\infty }f(x)e^{-itx}\,dx=e^{-i\mu t}e^{-{\frac {1}{2}}\sigma ^{2}t^{2}}\,,$

โดยที่⁠ ⁠ $i$ คือหน่วยจินตนาการถ้าค่าเฉลี่ยปัจจัยแรกคือ 1 และการแปลงฟูริเยร์ นอกเหนือจากปัจจัยคงที่แล้ว จะเป็นความหนาแน่นปกติในโดเมนความถี่โดยมีค่าเฉลี่ย 0 และความแปรปรวน⁠ ⁠โดยเฉพาะอย่างยิ่ง การแจกแจงปกติมาตรฐาน⁠ ⁠เป็นฟังก์ชันลักษณะเฉพาะของการแปลงฟูริเยร์ ${\textstyle \mu =0}$ $1/\sigma ^{2}$ $\varphi$

ในทฤษฎีความน่าจะเป็น การแปลงฟู ริเยร์ของการกระจายความน่าจะเป็นของตัวแปรสุ่มค่าจริงนั้น $X$ เชื่อมโยงอย่างใกล้ชิดกับฟังก์ชันลักษณะเฉพาะของตัวแปรนั้น ซึ่งกำหนดเป็นค่าที่คาดหวังของเป็นฟังก์ชันของตัวแปรจริง(พารามิเตอร์ความถี่ ของการ ^{แปลงฟูริเยร์) คำจำกัดความนี้สามารถขยายเชิงวิเคราะห์ไปยังตัวแปรค่าเชิงซ้อนได้ [ 34 ]}ความสัมพันธ์ระหว่าง^ทั้งสอง^คือ : ${\textstyle \varphi _{X}(t)}$ ${\textstyle e^{itX}}$ $t$ $t$ $\varphi _{X}(t)={\hat {f}}(-t)\,.$

ส่วนจริงและส่วนจินตนาการของคำว่า "ให้": และ ${\hat {f}}(t)=\operatorname {E} [e^{-itx}]=e^{-i\mu t}e^{-{\frac {1}{2}}\sigma ^{2}t^{2}}$ $\operatorname {E} [\cos(tx)]=\cos(\mu t)e^{-{\frac {1}{2}}\sigma ^{2}t^{2}}$ $\operatorname {E} [\sin(tx)]=\sin(\mu t)e^{-{\frac {1}{2}}\sigma ^{2}t^{2}}.$

ในทำนองเดียวกัน และ $\operatorname {E} [\cosh(tx)]=\cosh(\mu t)e^{{\frac {1}{2}}\sigma ^{2}t^{2}}$ $\operatorname {E} [\sinh(tx)]=\sinh(\mu t)e^{{\frac {1}{2}}\sigma ^{2}t^{2}}.$

สูตรเหล่านี้เมื่อประเมินค่าแล้ว จะให้ค่าที่คาดหวังของฟังก์ชันตรีโกณมิติและไฮเปอร์โบลิกพื้นฐานเหล่านี้เหนือตัวแปรสุ่มแบบเกาส์เซียนซึ่งอาจมองได้ว่าเป็นผลสืบเนื่องมาจากทฤษฎีบทของอิสเซอร์ลิส ด้วย เช่น กัน $t=1$ $X\sim N(\mu ,\sigma ^{2})$

ฟังก์ชันสร้างโมเมนต์และคูมูลันต์

ฟังก์ชันสร้างโมเมนต์ของตัวแปรสุ่มจริงคือค่าคาดหวังของ ตัวแปร สุ่มจริงนั้น $X$ โดยเป็นฟังก์ชันของพารามิเตอร์จริงสำหรับการแจกแจงปกติที่มีความหนาแน่นค่าเฉลี่ยและความแปรปรวนฟังก์ชันสร้างโมเมนต์มีอยู่และเท่ากับ ${\textstyle e^{tX}}$ $t$ $f$ $\mu$ ${\textstyle \sigma ^{2}}$

$M(t)=\operatorname {E} \left[e^{tX}\right]={\hat {f}}(it)=e^{\mu t}e^{\sigma ^{2}t^{2}/2}\,.$ สำหรับค่าใดๆ⁠ ⁠ $k$ ค่าสัมประสิทธิ์ของ⁠ ⁠ $t^{k}/k!$ ในฟังก์ชัน สร้าง โมเมนต์ (แสดงในรูปอนุกรมกำลังเลขชี้กำลังใน⁠ ⁠ $t$ ) คือค่าคาดหวังของการแจกแจงปกติ⁠ ⁠ $\operatorname {E} [X^{k}]$

ฟังก์ชันก่อกำเนิดคูมูลันต์คือลอการิทึมของฟังก์ชันก่อกำเนิดโมเมนต์ กล่าวคือ $g(t)=\ln M(t)=\mu t+{\tfrac {1}{2}}\sigma ^{2}t^{2}\,.$

สัมประสิทธิ์ของอนุกรมกำลังเลขชี้กำลังนี้กำหนดค่าคิวมูลันต์ แต่เนื่องจากนี่เป็นพหุนามกำลังสองใน ⁠ ⁠ $t$ ดังนั้น ค่าคิวมูลันต์สองค่าแรกเท่านั้นที่ไม่เป็นศูนย์ ได้แก่ ค่าเฉลี่ย ⁠ ⁠ $\mu$ และความแปรปรวน ⁠ ⁠ $\sigma ^{2}$

ผู้เขียนบางท่านนิยมใช้ฟังก์ชันลักษณะ เฉพาะ $E[e itX] = e iμt - σ 2 t 2 /2$ และ $ln E[e itX] = iμt - ⁠ แทน 1 / 2 ⁠ σ 2 t 2$ .

ตัวดำเนินการและคลาสของสไตน์

ในวิธีการของ Steinตัวดำเนินการ Stein และคลาสของตัวแปรสุ่ม คือและคลาสของฟังก์ชันต่อเนื่องสัมบูรณ์ทั้งหมด⁠ ⁠เช่นนั้น ⁠ ⁠ ${\textstyle X\sim {\mathcal {N}}(\mu ,\sigma ^{2})}$ ${\textstyle {\mathcal {A}}f(x)=\sigma ^{2}f'(x)-(x-\mu )f(x)}$ ${\textstyle {\mathcal {F}}}$ $\textstyle f:\mathbb {R} \to \mathbb {R}$ $\operatorname {E} [\vert f'(X)\vert ]<\infty$

ขีดจำกัดความแปรปรวนเป็นศูนย์

ในขีดจำกัดเมื่อเข้าใกล้ศูนย์ ความหนาแน่นของความน่าจะเป็นจะเข้าใกล้ศูนย์ทุกที่ยกเว้นที่ซึ่งมันจะเข้าใกล้ในขณะที่ปริพันธ์ของมันยังคงเท่ากับ 1 การขยายการแจกแจงปกติไปยังกรณีที่มีความแปรปรวนเป็นศูนย์สามารถกำหนดได้โดยใช้มาตรวัดเดลต้าของ Diracแม้ว่าตัวแปรสุ่มที่ได้จะไม่ต่อเนื่องอย่างสมบูรณ์และดังนั้นจึงไม่มีฟังก์ชันความหนาแน่นของความน่าจะเป็นฟังก์ชันการแจกแจงสะสมของตัวแปรสุ่มดังกล่าวคือฟังก์ชันขั้นบันไดของ Heavisideที่เลื่อนโดยค่าเฉลี่ยกล่าวคือ ${\textstyle \sigma ^{2}}$ ${\textstyle f}$ ${\textstyle \mu }$ ${\textstyle \infty }$ ${\textstyle \delta _{\mu }}$ ${\textstyle \mu }$ $F(x)={\begin{cases}0&{\text{if }}x<\mu \\1&{\text{if }}x\geq \mu .\end{cases}}$

เอนโทรปีสูงสุด

จากการแจกแจงความน่าจะเป็นทั้งหมดบนจำนวนจริงที่มีค่าเฉลี่ยจำกัดที่กำหนดไว้และความ $\mu$ แปรปรวนจำกัดการแจกแจง $\sigma ^{2}$ ปกติเป็นการแจกแจงที่มีเอนโทรปีสูงสุด^[²⁴^]เพื่อให้เห็นเช่นนี้ ให้⁠ ⁠เป็นตัวแปรสุ่มต่อเนื่องที่มีความหนาแน่นความน่าจะ เป็น ⁠ ⁠เอนโทรปีของ⁠ ⁠ถูกกำหนดเป็น^[³⁵^]^[³⁶^]^[³⁷^] โดยที่ ⁠ ⁠ เข้าใจว่าเป็นศูนย์เมื่อใดก็ตามที่⁠ ⁠ฟังก์ชันนี้สามารถเพิ่มค่าสูงสุดได้ ภายใต้ข้อจำกัดที่ว่าการแจกแจงได้รับการทำให้เป็นมาตรฐานอย่างเหมาะสมและมีค่าเฉลี่ยและความแปรปรวนที่กำหนดไว้ โดยใช้แคลคูลัส แปรผัน ฟังก์ชันที่มีตัวคูณลากรางจ์สามตัวถูกกำหนดไว้ดังนี้: ${\textstyle N(\mu ,\sigma ^{2})}$ $X$ $f(x)$ $X$ $H(X)=-\int _{-\infty }^{\infty }f(x)\ln f(x)\,dx\,,$ ${\textstyle f(x)\log f(x)}$ $f(x)=0$ $L=-\int _{-\infty }^{\infty }f(x)\ln f(x)\,dx-\lambda _{0}\left(1-\int _{-\infty }^{\infty }f(x)\,dx\right)-\lambda _{1}\left(\mu -\int _{-\infty }^{\infty }f(x)x\,dx\right)-\lambda _{2}\left(\sigma ^{2}-\int _{-\infty }^{\infty }f(x)(x-\mu )^{2}\,dx\right)\,.$

ที่ระดับเอนโทรปีสูงสุด การเปลี่ยนแปลงเล็กน้อยเกี่ยวกับจะทำให้เกิดการเปลี่ยนแปลงเกี่ยวกับซึ่งเท่ากับ 0 : ${\textstyle \delta f(x)}$ ${\textstyle f(x)}$ ${\textstyle \delta L}$ $L$ $0=\delta L=\int _{-\infty }^{\infty }\delta f(x)\left(-\ln f(x)-1+\lambda _{0}+\lambda _{1}x+\lambda _{2}(x-\mu )^{2}\right)\,dx\,.$

เนื่องจากเงื่อนไขนี้ต้องเป็นจริงสำหรับ ค่า ⁠ ⁠ $\delta f(x)$ เล็กๆ ใดๆ ดังนั้นตัวคูณ⁠ ⁠ $\delta f(x)$ ต้องเป็นศูนย์ และเมื่อแก้หา⁠ ⁠ $f(x)$ จะได้ ผลลัพธ์ดังนี้: $f(x)=\exp \left(-1+\lambda _{0}+\lambda _{1}x+\lambda _{2}(x-\mu )^{2}\right)\,.$

ข้อจำกัดของลากรางจ์ที่ว่า⁠ ⁠ $f(x)$ ได้รับการทำให้เป็นมาตรฐานอย่างเหมาะสมและมีค่าเฉลี่ยและความแปรปรวนที่ระบุไว้ จะเป็นไปตาม เงื่อนไข ก็ต่อเมื่อ⁠ ⁠ $\lambda _{0}$ , ⁠ ⁠ $\lambda _{1}$ และ⁠ ⁠ $\lambda _{2}$ ถูกเลือกเพื่อให้ เอนโทรปีของการแจกแจงปกติเท่ากับ ซึ่งเป็นอิสระจากค่าเฉลี่ย⁠ ⁠ $f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}\,.$ ${\textstyle X\sim N(\mu ,\sigma ^{2})}$ $H(X)={\tfrac {1}{2}}(1+\ln 2\sigma ^{2}\pi )\,,$ $\mu$

คุณสมบัติอื่นๆ

ถ้าฟังก์ชันลักษณะเฉพาะของตัวแปรสุ่มบางตัวมีรูปแบบในบริเวณใกล้เคียงศูนย์ โดยที่เป็นพหุนาม ทฤษฎีบท ของMarcinkiewicz (ตั้งชื่อตามJózef Marcinkiewicz ) ยืนยันว่าจะ เป็นพหุนามกำลังสอง ได้มากที่สุดเท่านั้น ดังนั้น จึงเป็นตัวแปรสุ่มปกติ^[ 38 ^{] ผลที่ตามมาของผลลัพธ์นี้คือ การแจกแจงปกติเป็นการแจกแจงเดียวที่มีจำนวนจำกัด (สอง) ของ}^ค่าสะสมที่ไม่เป็นศูนย์ ${\textstyle \phi _{X}}$ $X$ ${\textstyle \phi _{X}(t)=\exp Q(t)}$ ${\textstyle Q(t)}$ $Q$ $X$
ถ้า⁠ ⁠ $X$ และ⁠ ⁠ $Y$ มีการแจกแจงแบบปกติร่วมกันและไม่มีความ สัมพันธ์กันแสดงว่าตัวแปรสุ่มทั้งสองเป็น อิสระต่อกัน เงื่อนไขที่ว่า⁠ ⁠ $X$ และ⁠ ⁠ $Y$ ควรมีการ แจกแจงแบบปกติ ร่วมกันนั้นมีความสำคัญอย่างยิ่ง หากไม่มีเงื่อนไขนี้ คุณสมบัติดังกล่าวจะไม่เป็นจริง^{[ 39 ]}^{[ 40 ]}^{[พิสูจน์]}สำหรับตัวแปรสุ่มที่ไม่เป็นแบบปกติ การไม่มีความสัมพันธ์กันไม่ได้หมายความถึงความเป็นอิสระ
ความแตกต่าง ของKullback–Leiblerระหว่างการแจกแจงปกติหนึ่งกับอีก การแจกแจงหนึ่ง กำหนดโดย: ^[⁴¹^] ระยะทาง Hellingerระหว่างการแจกแจงเดียวกันเท่ากับ ${\textstyle X_{1}\sim N(\mu _{1},\sigma _{1}^{2})}$ ${\textstyle X_{2}\sim N(\mu _{2},\sigma _{2}^{2})}$ $D_{\mathrm {KL} }(X_{1}\parallel X_{2})={\frac {(\mu _{1}-\mu _{2})^{2}}{2\sigma _{2}^{2}}}+{\frac {1}{2}}\left({\frac {\sigma _{1}^{2}}{\sigma _{2}^{2}}}-1-\ln {\frac {\sigma _{1}^{2}}{\sigma _{2}^{2}}}\right)$ $H^{2}(X_{1},X_{2})=1-{\sqrt {\frac {2\sigma _{1}\sigma _{2}}{\sigma _{1}^{2}+\sigma _{2}^{2}}}}\exp \left(-{\frac {1}{4}}{\frac {(\mu _{1}-\mu _{2})^{2}}{\sigma _{1}^{2}+\sigma _{2}^{2}}}\right)$
เมทริกซ์ข้อมูลของฟิชเชอร์สำหรับการแจกแจงปกติเทียบกับ⁠ ⁠ $\mu$ และเป็นเมทริกซ์แนวทแยงและมีรูปแบบดังนี้ ${\textstyle \sigma ^{2}}$ ${\mathcal {I}}(\mu ,\sigma ^{2})={\begin{pmatrix}{\frac {1}{\sigma ^{2}}}&0\\0&{\frac {1}{2\sigma ^{4}}}\end{pmatrix}}$
ไพรเออร์คู่ควบของค่าเฉลี่ยของการแจกแจงปกติคือการแจกแจงปกติอีกแบบหนึ่ง^{[ 42 ]}โดยเฉพาะอย่างยิ่ง ถ้าเป็น iid และไพรเออร์คือแล้วการแจกแจงโพสทีเรียร์สำหรับตัวประมาณค่าของ⁠ ⁠จะเป็น ${\textstyle x_{1},\ldots ,x_{n}}$ ${\textstyle \sim N(\mu ,\sigma ^{2})}$ ${\textstyle \mu \sim N(\mu _{0},\sigma _{0}^{2})}$ $\mu$ $\mu \mid x_{1},\ldots ,x_{n}\sim {\mathcal {N}}\left({\frac {{\frac {\sigma ^{2}}{n}}\mu _{0}+\sigma _{0}^{2}{\bar {x}}}{{\frac {\sigma ^{2}}{n}}+\sigma _{0}^{2}}},\left({\frac {n}{\sigma ^{2}}}+{\frac {1}{\sigma _{0}^{2}}}\right)^{-1}\right)$
กลุ่มการแจกแจงปกติไม่เพียงแต่ก่อตัวเป็นกลุ่มการแจกแจงเอกซ์โพเน นเชียล (EF) เท่านั้น แต่ยังก่อตัวเป็นกลุ่มการแจกแจงเอกซ์โพเนนเชียลธรรมชาติ (NEF) ที่มีฟังก์ชันความแปรปรวน กำลังสอง ( NEF-QVF ) อีกด้วย คุณสมบัติหลายอย่างของการแจกแจงปกติสามารถนำไปใช้กับคุณสมบัติของการแจกแจง NEF-QVF, การแจกแจง NEF หรือการแจกแจง EF ได้โดยทั่วไป การแจกแจง NEF-QVF ประกอบด้วย 6 กลุ่ม ได้แก่ การแจกแจงปัวซง, แกมมา, ทวินาม และทวินามเชิงลบ ในขณะที่กลุ่มการแจกแจงทั่วไปที่ศึกษาในวิชาความน่าจะเป็นและสถิติส่วนใหญ่เป็น NEF หรือ EF
ในเรขาคณิตสารสนเทศตระกูลของการแจกแจงปกติก่อให้เกิด แม ^นิ โฟ ลด์ทางสถิติที่มีความโค้งคงที่ตระกูลเดียวกันนี้แบนราบเมื่อเทียบกับการเชื่อมต่อ (±1) และ[ ⁴³^] $-1$ ${\textstyle \nabla ^{(e)}}$ ${\textstyle \nabla ^{(m)}}$
ถ้ามีการแจกแจงตามแล้ว. โปรดทราบว่าไม่มีสมมติฐานเรื่องความเป็นอิสระ^[⁴⁴^] ${\textstyle X_{1},\dots ,X_{n}}$ ${\textstyle N(0,\sigma ^{2})}$ ${\textstyle E[\max _{i}X_{i}]\leq \sigma {\sqrt {2\ln n}}}$

การแจกแจงที่เกี่ยวข้อง

ทฤษฎีบทลิมิตกลาง

เมื่อจำนวนเหตุการณ์ที่ไม่ต่อเนื่องเพิ่มขึ้น ฟังก์ชันจะเริ่มมีลักษณะคล้ายกับการแจกแจงแบบปกติ

ทฤษฎีบทลิมิตกลางกล่าวว่า ภายใต้เงื่อนไขบางประการ (ซึ่งค่อนข้างพบได้ทั่วไป) ผลรวมของตัวแปรสุ่มจำนวนมากจะมีลักษณะการแจกแจงแบบปกติโดยประมาณ กล่าวคือ โดยที่ เป็นตัวแปร สุ่ม อิสระและมีการแจกแจงเหมือนกันมีการแจกแจงแบบสุ่มเดียวกัน มีค่าเฉลี่ยเป็นศูนย์ และความแปรปรวน σ และ⁠ ⁠คือค่าเฉลี่ยของตัวแปรสุ่มเหล่านั้นที่ปรับขนาดด้วย ⁠ ⁠ ดังนั้น เมื่อ⁠ ⁠เพิ่มขึ้น การแจกแจงความน่าจะเป็นของ⁠ ⁠จะมีแนวโน้มเข้าสู่การแจกแจงแบบปกติที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวน⁠ ⁠ ${\textstyle X_{1},\ldots ,X_{n}}$ ${\textstyle \sigma ^{2}}$ $Z$ ${\textstyle {\sqrt {n}}}$ $Z={\sqrt {n}}{\biggl (}{\frac {1}{n}}\sum _{i=1}^{n}X_{i}{\biggr )}$ $n$ $Z$ $\sigma ^{2}$

ทฤษฎีบทนี้สามารถขยายไปใช้กับตัวแปรที่ไม่เป็นอิสระต่อกันและ/หรือไม่ได้มีการแจกแจงเหมือนกันได้ หากมีการกำหนดข้อจำกัดบางประการเกี่ยวกับระดับความสัมพันธ์และโมเมนต์ของการแจกแจง ${\textstyle (X_{i})}$

สถิติการทดสอบคะแนนและตัวประมาณค่า จำนวนมากที่พบในทางปฏิบัติ ล้วนประกอบด้วยผลรวมของตัวแปรสุ่มบางอย่าง และตัวประมาณค่าจำนวนมากสามารถแสดงได้ในรูปผลรวมของตัวแปรสุ่มโดยใช้ฟังก์ชันอิทธิพลทฤษฎีบทลิมิตกลางบ่งชี้ว่าพารามิเตอร์ทางสถิติเหล่านั้นจะมีการกระจายแบบปกติเชิงอะซิมโทติก

ทฤษฎีบทลิมิตกลางยังบ่งชี้ว่าการแจกแจงบางอย่างสามารถประมาณได้ด้วยการแจกแจงปกติ ตัวอย่างเช่น:

การแจกแจงทวินาม มีลักษณะใกล้เคียงกับการแจกแจงปกติโดยมีค่าเฉลี่ยและความแปรปรวนสำหรับค่า ⁠ ⁠ ที่มีขนาดใหญ่ และสำหรับค่า ⁠ ⁠ที่ไม่ใกล้เคียงกับ 0 หรือ 1 มากเกินไป ${\textstyle B(n,p)}$ ${\textstyle np}$ ${\textstyle np(1-p)}$ $n$ $p$
การแจกแจงปัวซงที่มีพารามิเตอร์⁠ ⁠ $\lambda$ มีลักษณะใกล้เคียงกับการแจกแจงปกติ โดยมีค่าเฉลี่ย⁠ ⁠ $\lambda$ และความแปรปรวน⁠ ⁠ $\lambda$ สำหรับค่า⁠ ⁠ $\lambda$ ที่ มีค่ามาก ^{[ 45 ]}
การแจกแจงไคกำลังสอง มีลักษณะใกล้เคียงกับการแจกแจงปกติ โดยมีค่าเฉลี่ย⁠ ⁠และความแปรปรวนสำหรับค่า⁠ ⁠ ขนาดใหญ่ ${\textstyle \chi ^{2}(k)}$ $k$ ${\textstyle 2k}$ $k$
การแจกแจงแบบ t ของนักเรียน จะมีลักษณะใกล้เคียงกับการแจกแจงแบบปกติ โดยมีค่าเฉลี่ย 0 และความแปรปรวน 1 เมื่อ⁠ ⁠มีค่ามาก ${\textstyle t(\nu )}$ $\nu$

ความแม่นยำของการประมาณค่าเหล่านี้เพียงพอหรือไม่นั้น ขึ้นอยู่กับวัตถุประสงค์ที่ต้องการใช้ และอัตราการลู่เข้าสู่การแจกแจงแบบปกติ โดยทั่วไปแล้ว การประมาณค่าเหล่านี้มักมีความแม่นยำน้อยกว่าในส่วนปลายของการแจกแจง

ขอบเขตบนทั่วไปสำหรับข้อผิดพลาดในการประมาณค่าในทฤษฎีบทลิมิตกลางนั้นกำหนดโดยทฤษฎีบทเบอร์รี-เอสซีนส่วนการปรับปรุงการประมาณค่านั้นกำหนดโดยการขยายแบบเอ็ดจ์เวิร์ธ

ทฤษฎีบทนี้ยังสามารถใช้เพื่อพิสูจน์การจำลองผลรวมของแหล่งกำเนิดสัญญาณรบกวนแบบสม่ำเสมอจำนวนมากเป็นสัญญาณรบกวนแบบเกาส์เซียนได้ ดูAWGN

การดำเนินการและหน้าที่ของตัวแปรปกติ

การดำเนินการกับตัวแปรปกติตัวเดียว

ถ้า⁠ ⁠ $X$ มีการกระจายแบบปกติ โดยมีค่าเฉลี่ย⁠ ⁠ $\mu$ และความแปรปรวนแล้ว ${\textstyle \sigma ^{2}}$

${\textstyle aX+b}$ สำหรับจำนวนจริงใดๆและก็ $a$ มีการแจกแจง $b$ แบบปกติเช่นกัน โดยมีค่าเฉลี่ยและความแปรปรวนนั่นคือ ตระกูลของการแจกแจงแบบปกติปิดภายใต้การแปลงเชิงเส้น ${\textstyle a\mu +b}$ ${\textstyle a^{2}\sigma ^{2}}$
ค่าเลขชี้กำลังของ⁠ ⁠ $X$ มีการกระจายแบบลอการิทมิกปกติ : . ${\textstyle e^{X}\sim \ln(N(\mu ,\sigma ^{2}))}$
ค่าซิกมอยด์มาตรฐานของ⁠ ⁠ $X$ มีการกระจายแบบ logit-normal : . ${\textstyle \sigma (X)\sim P({\mathcal {N}}(\mu ,\,\sigma ^{2}))}$
ค่าสัมบูรณ์ของ⁠ ⁠ $X$ มีการกระจายแบบปกติพับ : . ถ้าเรียกสิ่งนี้ว่าการกระจายแบบปกติครึ่งทาง ${\textstyle {\left|X\right|\sim N_{f}(\mu ,\sigma ^{2})}}$ ${\textstyle \mu =0}$
ค่าสัมบูรณ์ของค่าตกค้างที่ปรับให้เป็นมาตรฐานมีการกระจายแบบไคโดยมีหนึ่งองศาอิสระ: . ${\textstyle |X-\mu |/\sigma }$ ${\textstyle |X-\mu |/\sigma \sim \chi _{1}}$
กำลังสองของมีการแจกแจงไคกำลังสองแบบไม่ศูนย์กลางที่มีองศาอิสระหนึ่งองศา: . ถ้าการแจกแจงนี้เรียกว่าการแจกแจงไคกำลังสองเฉยๆ ${\textstyle X/\sigma }$ ${\textstyle X^{2}/\sigma ^{2}\sim \chi _{1}^{2}(\mu ^{2}/\sigma ^{2})}$ ${\textstyle \mu =0}$
ค่าลอการิทึมความน่าจะเป็นของตัวแปรปกติคือ $x$ ค่าลอการิทึมของฟังก์ชันความหนาแน่นความน่าจะเป็น ของตัวแปร นั้น เนื่องจากตัวแปรนี้เป็นค่ากำลังสองที่ปรับขนาดและเลื่อนตำแหน่งของตัวแปรปกติมาตรฐาน จึงมีการแจกแจงแบบ เดียว กับ ตัวแปรไคกำลังสองที่ปรับขนาดและเลื่อน ตำแหน่ง $\ln p(x)=-{\frac {1}{2}}\left({\frac {x-\mu }{\sigma }}\right)^{2}-\ln \left(\sigma {\sqrt {2\pi }}\right).$
การแจกแจงของตัวแปรที่ $X$ จำกัดอยู่ในช่วงใดช่วงหนึ่งเรียกว่าการแจกแจงปกติแบบตัดทอน (Truncated Normal Distribution ) ${\textstyle [a,b]}$
${\textstyle (X-\mu )^{-2}}$ มีการกระจายแบบ Lévyโดยมีตำแหน่ง 0 และมาตราส่วน. ${\textstyle \sigma ^{-2}}$

การดำเนินการกับตัวแปรปกติอิสระสองตัว

ถ้าและเป็นตัวแปรสุ่มปกติอิสระสองตัว โดยมีค่าเฉลี่ย,และความแปรปรวน, , แล้วผลรวมของตัวแปรทั้งสองนี้จะมีการแจกแจงแบบปกติเช่นกัน^{[พิสูจน์]}โดยมีค่าเฉลี่ยและความแปรปรวน ${\textstyle X_{1}}$ ${\textstyle X_{2}}$ ${\textstyle \mu _{1}}$ ${\textstyle \mu _{2}}$ ${\textstyle \sigma _{1}^{2}}$ ${\textstyle \sigma _{2}^{2}}$ ${\textstyle X_{1}+X_{2}}$ ${\textstyle \mu _{1}+\mu _{2}}$ ${\textstyle \sigma _{1}^{2}+\sigma _{2}^{2}}$
โดยเฉพาะอย่างยิ่ง ถ้า⁠ ⁠ $X$ และ⁠ ⁠ $Y$ เป็นค่าเบี่ยงเบนปกติอิสระที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนแล้วและก็จะเป็นอิสระและมีการกระจายแบบปกติเช่นกัน โดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนนี่เป็นกรณีพิเศษของเอกลักษณ์โพลาไรเซชัน^[⁴⁶^] ${\textstyle \sigma ^{2}}$ ${\textstyle X+Y}$ ${\textstyle X-Y}$ ${\textstyle 2\sigma ^{2}}$
ถ้าและเป็นตัวแปรสุ่มปกติอิสระสองตัวที่มีค่าเฉลี่ยและความแปรปรวนและ และ เป็นจำนวน จริงใดๆแล้วตัวแปร ก็จะมีการแจกแจงแบบ ปกติเช่นกัน โดยมีค่าเฉลี่ยและความแปรปรวนดังนั้น การแจกแจงแบบปกติจึงมีเสถียรภาพ (โดยมีเลขชี้กำลัง) ${\textstyle X_{1}}$ ${\textstyle X_{2}}$ $\mu$ ${\textstyle \sigma ^{2}}$ $a$ $b$ $X_{3}={\frac {aX_{1}+bX_{2}-(a+b)\mu }{\sqrt {a^{2}+b^{2}}}}+\mu$ $\mu$ ${\textstyle \sigma ^{2}}$ ${\textstyle \alpha =2}$
ถ้าและเป็นการแจกแจงแบบปกติค่าเฉลี่ยเรขาคณิต แบบนอร์มาไลซ์ของพวกมัน จะเป็นการแจกแจงแบบปกติที่มีและ. ${\textstyle X_{k}\sim {\mathcal {N}}(m_{k},\sigma _{k}^{2})}$ ${\textstyle k\in \{0,1\}}$ ${\textstyle {\frac {1}{\int _{\mathbb {R} ^{n}}X_{0}^{\alpha }(x)X_{1}^{1-\alpha }(x)\,{\text{d}}x}}X_{0}^{\alpha }X_{1}^{1-\alpha }}$ ${\textstyle {\mathcal {N}}(m_{\alpha },\sigma _{\alpha }^{2})}$ ${\textstyle m_{\alpha }={\frac {\alpha m_{0}\sigma _{1}^{2}+(1-\alpha )m_{1}\sigma _{0}^{2}}{\alpha \sigma _{1}^{2}+(1-\alpha )\sigma _{0}^{2}}}}$ ${\textstyle \sigma _{\alpha }^{2}={\frac {\sigma _{0}^{2}\sigma _{1}^{2}}{\alpha \sigma _{1}^{2}+(1-\alpha )\sigma _{0}^{2}}}}$

การดำเนินการกับตัวแปรปกติมาตรฐานอิสระสองตัว

ถ้าและเป็นตัวแปรสุ่มปกติมาตรฐานอิสระสองตัวที่มีค่าเฉลี่ย 0 และความแปรปรวน 1 แล้ว ${\textstyle X_{1}}$ ${\textstyle X_{2}}$

ผลรวมและผลต่างของทั้งสองค่ามีการกระจายแบบปกติ โดยมีค่าเฉลี่ยเป็นศูนย์และค่าความแปรปรวนเป็นสอง: . ${\textstyle X_{1}\pm X_{2}\sim {\mathcal {N}}(0,2)}$
ผลิตภัณฑ์ของพวกเขาเป็นไปตามการกระจายผลิตภัณฑ์^[⁴⁷^]โดยมีฟังก์ชันความหนาแน่นโดยที่เป็นฟังก์ชันเบสเซลที่ดัดแปลงชนิดที่สองการกระจายนี้สมมาตรรอบศูนย์ ไม่จำกัดที่และมีฟังก์ชันลักษณะเฉพาะ ${\textstyle Z=X_{1}X_{2}}$ ${\textstyle f_{Z}(z)=\pi ^{-1}K_{0}(|z|)}$ ${\textstyle K_{0}}$ ${\textstyle z=0}$ ${\textstyle \phi _{Z}(t)=(1+t^{2})^{-1/2}}$
อัตราส่วนของพวกเขานั้นเป็นไปตาม การแจกแจงแบบโคชีมาตรฐาน: . ${\textstyle X_{1}/X_{2}\sim \operatorname {Cauchy} (0,1)}$
ค่ามาตรฐานแบบยุคลิดของพวกเขามีลักษณะการกระจายแบบเรย์ลี ${\textstyle {\sqrt {X_{1}^{2}+X_{2}^{2}}}}$

การดำเนินการกับตัวแปรปกติอิสระหลายตัว

การรวมกันเชิงเส้นใดๆของค่าเบี่ยงเบนปกติที่เป็นอิสระต่อกัน ถือเป็นค่าเบี่ยงเบนปกติ
ถ้าเป็นตัวแปรสุ่มปกติมาตรฐานที่เป็นอิสระต่อกัน ผลรวมของกำลังสองของตัวแปรเหล่านั้นจะมีการแจกแจงแบบไคกำลังสองโดยมีองศาอิสระ⁠ ⁠ ${\textstyle X_{1},X_{2},\ldots ,X_{n}}$ $n$ $X_{1}^{2}+\cdots +X_{n}^{2}\sim \chi _{n}^{2}.$
ถ้าตัวแปรสุ่มที่มีการแจกแจงแบบปกติที่เป็นอิสระต่อกัน โดยมีค่าเฉลี่ย⁠ ⁠และความแปรปรวนแล้วค่าเฉลี่ยของตัวอย่างจะเป็นอิสระจากค่าเบี่ยงเบนมาตรฐานของตัวอย่าง^[⁴⁸^]ซึ่งสามารถพิสูจน์ได้โดยใช้ทฤษฎีบทของ Basuหรือทฤษฎีบทของ Cochran ^[⁴⁹^]อัตราส่วนของปริมาณทั้งสองนี้จะมีการแจกแจงแบบ t ของ Studentโดยมีองศาอิสระ: ${\textstyle X_{1},X_{2},\ldots ,X_{n}}$ $\mu$ ${\textstyle \sigma ^{2}}$ ${\textstyle n-1}$ $t={\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}}={\frac {{\frac {1}{n}}(X_{1}+\cdots +X_{n})-\mu }{\sqrt {{\frac {1}{n(n-1)}}\left[(X_{1}-{\overline {X}})^{2}+\cdots +(X_{n}-{\overline {X}})^{2}\right]}}}\sim t_{n-1}.$
ถ้า, เป็นตัวแปรสุ่มปกติมาตรฐานอิสระ อัตราส่วนของผลรวมกำลังสองปกติของตัวแปรสุ่มทั้งสองจะมีการกระจายแบบ Fโดยมีองศาอิสระ $($ $n$ $,$ $m$ $) ดังนี้$ ^[⁵⁰^] ${\textstyle X_{1},X_{2},\ldots ,X_{n}}$ ${\textstyle Y_{1},Y_{2},\ldots ,Y_{m}}$ $F={\frac {\left(X_{1}^{2}+X_{2}^{2}+\cdots +X_{n}^{2}\right)/n}{\left(Y_{1}^{2}+Y_{2}^{2}+\cdots +Y_{m}^{2}\right)/m}}\sim F_{n,m}.$

การดำเนินการกับตัวแปรปกติที่มีความสัมพันธ์กันหลายตัว

รูปแบบกำลังสองของเวกเตอร์ปกติ กล่าวคือ ฟังก์ชันกำลังสองของตัวแปรปกติอิสระหลายตัวหรือตัวแปรปกติที่มีความสัมพันธ์กัน คือตัวแปรไคกำลังสองแบบทั่วไป ${\textstyle q=\sum x_{i}^{2}+\sum x_{j}+c}$

การดำเนินการกับฟังก์ชันความหนาแน่น

การแจกแจงปกติแบบแยกส่วน (Split Normal Distribution)นั้น นิยามได้โดยตรงที่สุดโดยการนำส่วนที่ปรับขนาดแล้วของฟังก์ชันความหนาแน่นของการแจกแจงปกติที่แตกต่างกันมาเชื่อมต่อกัน และปรับขนาดความหนาแน่นใหม่เพื่อให้ค่าอินทิเกรตเท่ากับหนึ่ง ส่วนการแจกแจงปกติแบบตัดทอน (Truncated Normal Distribution) นั้น ได้มาจากการปรับขนาดส่วนหนึ่งของฟังก์ชันความหนาแน่นเดียว

การหารลงตัวอย่างไม่จำกัดและทฤษฎีบทของเครเมอร์

สำหรับจำนวนเต็มบวก $n$ ใดๆ การแจกแจงปกติใดๆ ที่มีค่าเฉลี่ย⁠ ⁠ $\mu$ และความแปรปรวนคือการแจกแจงของผลรวมของ ค่าเบี่ยงเบนปกติอิสระ $n$ ค่า โดยแต่ละค่ามีค่าเฉลี่ย ⁠ และความแปรปรวนⁿ คุณสมบัตินี้เรียกว่า การ หารลงตัวอย่างไม่มีที่สิ้นสุด^[⁵¹^] ${\textstyle \sigma ^{2}}$ ${\textstyle {\frac {\mu }{n}}}$ ${\textstyle {\frac {\sigma ^{2}}{n}}}$

ในทางกลับกัน ถ้าและเป็นตัวแปรสุ่มอิสระและผลรวมของตัวแปรสุ่มทั้งสองมีการกระจายแบบปกติ ดังนั้นทั้งและจะต้องเป็นค่าเบี่ยงเบนปกติ^[⁵²^] ${\textstyle X_{1}}$ ${\textstyle X_{2}}$ ${\textstyle X_{1}+X_{2}}$ ${\textstyle X_{1}}$ ${\textstyle X_{2}}$

ผลลัพธ์นี้เรียกว่าทฤษฎีบทการแยกส่วนของ Cramérและเทียบเท่ากับการกล่าวว่าการสังเคราะห์ของสองการแจกแจงจะเป็นแบบปกติก็ต่อเมื่อทั้งสองเป็นการแจกแจงแบบปกติเท่านั้น ทฤษฎีบทของ Cramér บ่งชี้ว่าการรวมเชิงเส้นของตัวแปรอิสระที่ไม่ใช่แบบเกาส์เซียนจะไม่มีการแจกแจงแบบปกติอย่างแท้จริง แม้ว่าจะเข้าใกล้มากเท่าที่ต้องการก็ตาม^{[ 38 ]}

ทฤษฎีบท Kac–Bernstein

ทฤษฎีบท Kac –Bernsteinระบุว่า ถ้าและเป็นอิสระต่อกัน และและก็เป็นอิสระต่อกันเช่นกัน แล้วทั้ง $X$ และ $Y$ จะต้องมีการแจกแจงแบบปกติอย่างแน่นอน^[⁵³^]^[⁵⁴^] ${\textstyle X}$ $Y$ ${\textstyle X+Y}$ ${\textstyle X-Y}$

โดยทั่วไป หากเป็นตัวแปรสุ่มอิสระ การรวมเชิงเส้นสองแบบที่แตกต่างกันและจะเป็นอิสระต่อกันก็ต่อเมื่อทั้งหมดเป็นแบบปกติ และโดยที่แสดงถึงความแปรปรวนของ^[⁵³^] ${\textstyle X_{1},\ldots ,X_{n}}$ ${\textstyle \sum {a_{k}X_{k}}}$ ${\textstyle \sum {b_{k}X_{k}}}$ ${\textstyle X_{k}}$ ${\textstyle \sum {a_{k}b_{k}\sigma _{k}^{2}=0}}$ ${\textstyle \sigma _{k}^{2}}$ ${\textstyle X_{k}}$

ส่วนขยาย

แนวคิดของการแจกแจงปกติ ซึ่งเป็นหนึ่งในการแจกแจงที่สำคัญที่สุดในทฤษฎีความน่าจะเป็น ได้ถูกขยายออกไปไกลเกินกว่ากรอบมาตรฐานของกรณีตัวแปรเดียว (นั่นคือหนึ่งมิติ) (กรณีที่ 1) การขยายเหล่านี้ทั้งหมดก็เรียกว่า กฎ ปกติหรือ กฎ เกาส์เซียน เช่นกัน ดังนั้นจึงมีความกำกวมในชื่อเรียกอยู่บ้าง

การแจกแจงปกติแบบหลายตัวแปรอธิบายกฎของเกาส์ในปริภูมิยูคลิด $k$ มิติเวกเตอร์ $X$ $\in$ $R$ $k$ มีการแจกแจงปกติแบบหลายตัวแปรก็ต่อเมื่อผลรวมเชิงเส้นใดๆ ของส่วนประกอบ $Σ ของมัน$ $k j =1 เซต xj มีการแจกแจงแบบปกติ (แบบตัวแปรเดียว)$ ความแปรปรวนของ $xj$ คือเมทริกซ์สมมาตรบวกแน่นอน $V$ $ขนาด$ $k \times k$ การแจกแจงแบบปกติหลายตัวแปรเป็นกรณีพิเศษของการแจกแจงแบบวงรีดังนั้น เส้นความหนาแน่นเท่ากันใน $กรณี k$ $= 2$ จะเป็นรูปวงรีและในกรณี $k$ ใดๆ จะเป็นรูปทรงรี
การแจกแจงแบบเกาส์เซียนปรับแก้คือการแจกแจงแบบปกติที่ถูกปรับแก้ โดยกำหนดค่าลบทั้งหมดให้เป็น 0
การแจกแจงปกติเชิงซ้อนเกี่ยวข้องกับเวกเตอร์ปกติเชิงซ้อน เวกเตอร์เชิงซ้อน $X \in C k$ จะเรียกว่าเป็นเวกเตอร์ปกติ ถ้าทั้งส่วนจริงและส่วนจินตนาการของมันมี การแจกแจงปกติหลายตัวแปรแบบ $2 k$ มิติร่วมกัน โครงสร้างความแปรปรวนร่วมของ $X$ อธิบายได้ด้วยเมทริกซ์สองตัว คือเมทริกซ์ความแปรปรวน $Γ$ และเมทริกซ์ความสัมพันธ์ $C$
การแจกแจงปกติของเมทริกซ์อธิบายถึงกรณีของเมทริกซ์ที่มีการแจกแจงแบบปกติ
กระบวนการเกาส์เซียนเป็นกระบวนการสุ่ม ที่มีการแจกแจงแบบปกติ สามารถมองได้ว่าเป็นองค์ประกอบของปริภูมิฮิลเบิร์ต อนันต์มิติ Hและดังนั้นจึงเป็นอนาล็อกของเวกเตอร์ปกติหลายตัวแปรสำหรับกรณีk = ∞องค์ประกอบสุ่มh ∈ Hกล่าวได้ว่าเป็นปกติ ถ้าสำหรับค่าคงที่a ∈ H ใดๆ ผลคูณเชิงสเกลาร์( a , h )มีการแจกแจงแบบปกติ (ตัวแปรเดียว) โครงสร้างความแปรปรวนขององค์ประกอบสุ่มเกาส์เซียนดังกล่าวสามารถอธิบายได้ในแง่ของตัวดำเนินการความแปรปรวน ร่วมเชิงเส้น K : H → Hกระบวนการเกาส์เซียนหลายกระบวนการได้รับความนิยมมากพอที่จะมีชื่อเฉพาะของตนเอง:
การแจกแจงแบบเกาส์เซียน qเป็นโครงสร้างทางคณิตศาสตร์เชิงนามธรรมที่แสดงถึงการแจกแจงแบบปกติในรูปแบบ q
การแจกแจงแบบ q-Gaussianเป็นการแจกแจงแบบอนาล็อกของการแจกแจงแบบ Gaussian ในแง่ที่ว่ามันทำให้ค่าเอนโทรปีของ Tsallis สูงสุด และเป็นการแจกแจงแบบ Tsallis ประเภทหนึ่ง การแจกแจงนี้แตกต่างจากการแจกแจงแบบ q-Gaussianที่กล่าวถึงข้างต้น
การ แจกแจงแบบ Kaniadakis $κ$ -Gaussianเป็นการขยายความของการแจกแจงแบบ Gaussian ซึ่งเกิดขึ้นจากสถิติของ Kaniadakisโดยเป็นหนึ่งในการแจกแจงของ Kaniadakis

ตัวแปรสุ่ม $X$ มีการแจกแจงแบบปกติสองส่วน ถ้ามีการแจกแจง ที่ $μ$ คือค่าเฉลี่ยและ $σ คือส่วนเบี่ยงเบนมาตรฐาน$ $f_{X}(x)={\begin{cases}N(\mu ,\sigma _{1}^{2}),&{\text{ if }}x\leq \mu \\N(\mu ,\sigma _{2}^{2}),&{\text{ if }}x\geq \mu \end{cases}}$ $2 1$ และ $σ 2 2$ คือค่าความแปรปรวนของการกระจายตัวทางด้านซ้ายและด้านขวาของค่าเฉลี่ยตามลำดับ

ค่าเฉลี่ย $E(X)$ ความแปรปรวน $V(X)$ และโมเมนต์กลางลำดับที่สาม $T(X)$ ของการแจกแจงนี้ได้รับการกำหนดแล้ว^{[ 55 ]} ${\begin{aligned}\operatorname {E} (X)&=\mu +{\sqrt {\frac {2}{\pi }}}(\sigma _{2}-\sigma _{1}),\\\operatorname {V} (X)&=\left(1-{\frac {2}{\pi }}\right)(\sigma _{2}-\sigma _{1})^{2}+\sigma _{1}\sigma _{2},\\\operatorname {T} (X)&={\sqrt {\frac {2}{\pi }}}(\sigma _{2}-\sigma _{1})\left[\left({\frac {4}{\pi }}-1\right)(\sigma _{2}-\sigma _{1})^{2}+\sigma _{1}\sigma _{2}\right].\end{aligned}}$

หนึ่งในประโยชน์หลักของการใช้กฎเกาส์เซียนในทางปฏิบัติคือการสร้างแบบจำลองการแจกแจงเชิงประจักษ์ของตัวแปรสุ่มต่างๆ มากมายที่พบเจอในทางปฏิบัติ ในกรณีเช่นนี้ การขยายเพิ่มเติมที่เป็นไปได้คือตระกูลการแจกแจงที่สมบูรณ์ยิ่งขึ้น ซึ่งมีพารามิเตอร์มากกว่าสองตัว และด้วยเหตุนี้จึงสามารถปรับให้เข้ากับการแจกแจงเชิงประจักษ์ได้อย่างแม่นยำยิ่งขึ้น ตัวอย่างของการขยายเพิ่มเติมดังกล่าว ได้แก่:

การแจกแจงแบบเพียร์สัน — ตระกูลการแจกแจงความน่าจะเป็นที่มีพารามิเตอร์สี่ตัว ซึ่งขยายกฎการแจกแจงปกติเพื่อรวมค่าความเบี่ยงเบนและความโค้งที่แตกต่างกัน
การแจกแจงปกติทั่วไปหรือที่รู้จักกันในชื่อการแจกแจงกำลังเอกซ์โปเนนเชียล อนุญาตให้ส่วนหางของการแจกแจงมีลักษณะเชิงอะซิมโทติกที่หนาหรือบางกว่าได้

การอนุมานทางสถิติ

การประมาณค่าพารามิเตอร์

บ่อยครั้งที่เราไม่ทราบค่าพารามิเตอร์ของการแจกแจงปกติ แต่ต้องการประมาณค่าพารามิเตอร์เหล่านั้น กล่าวคือ เมื่อมีตัวอย่างจากประชากรที่มีการแจกแจงปกติ เราต้องการทราบค่าโดยประมาณของพารามิเตอร์⁠ ⁠และวิธีการมาตรฐานในการแก้ปัญหานี้คือ วิธี ความน่าจะเป็นสูงสุดซึ่งต้องทำการหาค่าสูงสุดของฟังก์ชันลอการิทึมความน่าจะเป็น : ${\textstyle (x_{1},\ldots ,x_{n})}$ ${\textstyle {\mathcal {N}}(\mu ,\sigma ^{2})}$ $\mu$ ${\textstyle \sigma ^{2}}$ ${\begin{aligned}\ln {\mathcal {L}}(\mu ,\sigma ^{2})&=\sum _{i=1}^{n}\ln f(x_{i}\mid \mu ,\sigma ^{2})\\&=-{\frac {n}{2}}\ln(2\pi )-{\frac {n}{2}}\ln \sigma ^{2}-{\frac {1}{2\sigma ^{2}}}\sum _{i=1}^{n}(x_{i}-\mu )^{2}.\end{aligned}}$ การหาอนุพันธ์เทียบกับ⁠ ⁠ $\mu$ และและการแก้ระบบเงื่อนไขอันดับแรกที่ได้จะให้ค่าประมาณความน่าจะเป็นสูงสุดดังนี้ : ${\textstyle \sigma ^{2}}$ ${\hat {\mu }}={\overline {x}}\equiv {\frac {1}{n}}\sum _{i=1}^{n}x_{i},\qquad {\hat {\sigma }}^{2}={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}.$

ดังนั้นจึงมีรายละเอียดดังนี้: ${\textstyle \ln {\mathcal {L}}({\hat {\mu }},{\hat {\sigma }}^{2})}$ $\ln {\mathcal {L}}({\hat {\mu }},{\hat {\sigma }}^{2})=-{\frac {n}{2}}[\ln \left(2\pi {\hat {\sigma }}^{2}\right)+1]$

ค่าเฉลี่ยตัวอย่าง

ตัวประมาณค่านี้เรียกว่าค่าเฉลี่ยตัวอย่าง เนื่องจากเป็นค่าเฉลี่ยเลขคณิตของ การสังเกตทั้งหมด สถิตินี้สมบูรณ์และเพียงพอสำหรับและด้วยเหตุนี้ ตามทฤษฎีบท ของ Lehmann–Schefféจึงเป็น ตัวประมาณ ค่าที่ไม่เอนเอียงที่มีความแปรปรวนต่ำสุดอย่างสม่ำเสมอ (UMVU) ^[⁵⁶^]ในตัวอย่างขนาดจำกัด จะมีการกระจายแบบปกติ: ความแปรปรวนของตัวประมาณค่านี้เท่ากับ องค์ประกอบ μμของเมทริกซ์ข้อมูล Fisher ผกผัน ซึ่งหมายความว่าตัวประมาณค่านี้มีประสิทธิภาพในตัวอย่างขนาดจำกัดสิ่งสำคัญในทางปฏิบัติคือค่าความคลาดเคลื่อนมาตรฐานของเป็นสัดส่วนกับนั่นคือ หากต้องการลดค่าความคลาดเคลื่อนมาตรฐานลง 10 เท่า จะต้องเพิ่มจำนวนจุดในตัวอย่างขึ้น 100 เท่า ข้อเท็จจริงนี้ถูกนำมาใช้กันอย่างแพร่หลายในการกำหนดขนาดตัวอย่างสำหรับการสำรวจความคิดเห็นและจำนวนการทดลองในการจำลอง Monte Carlo $\textstyle {\hat {\mu }}$ $\textstyle {\overline {x}}$ $\mu$ $\textstyle {\hat {\mu }}$ ${\hat {\mu }}\sim {\mathcal {N}}(\mu ,\sigma ^{2}/n).$ $\textstyle {\mathcal {I}}^{-1}$ $\textstyle {\hat {\mu }}$ $\textstyle 1/{\sqrt {n}}$

จากมุมมองของทฤษฎีเชิงอะซิมโทติก นั้น มีความสอดคล้องนั่นคือ มัน ลู่เข้าสู่ ⁠ ⁠ในความน่าจะเป็น เมื่อ ตัวประมาณค่านี้ยังเป็นแบบปกติเชิงอะ ซิมโทติกด้วย ซึ่งเป็นผลลัพธ์ง่ายๆ จาก การที่มันเป็นแบบปกติในตัวอย่างจำกัด: $\textstyle {\hat {\mu }}$ $\mu$ ${\textstyle n\rightarrow \infty }$ ${\sqrt {n}}({\hat {\mu }}-\mu )\,\xrightarrow {d} \,{\mathcal {N}}(0,\sigma ^{2}).$

ความแปรปรวนของตัวอย่าง

ตัวประมาณค่านี้เรียกว่าความแปรปรวนของตัวอย่างเนื่องจากเป็นความแปรปรวนของตัวอย่าง ( ) ในทางปฏิบัติ มักใช้ตัวประมาณค่าอื่นแทน ตัวประมาณค่าอื่นนี้เรียกว่า และเรียกอีกอย่างว่าความแปรปรวนของตัวอย่างซึ่งมีความกำกวมในคำศัพท์อยู่บ้าง รากที่สองของมันเรียกว่าส่วนเบี่ยงเบนมาตรฐานของตัวอย่างตัวประมาณค่าแตกต่างจากตรงที่มี $($ $n$ $- 1)$ แทน $n$ ในตัวส่วน (ที่เรียกว่าการแก้ไขของเบสเซล ) ความแตกต่างระหว่างและจะมีค่าน้อยมากจนแทบไม่มีนัยสำคัญสำหรับ $n$ ที่ มี ค่ามาก อย่างไรก็ตาม ในตัวอย่างที่มีขนาดจำกัด แรงจูงใจในการใช้คือมันเป็นตัวประมาณค่าที่ไม่เอนเอียงของพารามิเตอร์พื้นฐานในขณะที่เอนเอียง นอกจากนี้ ตามทฤษฎีบทของ Lehmann–Scheffé ตัวประมาณค่าจะเป็นตัวประมาณค่าที่ไม่เอนเอียงที่มีความแปรปรวนต่ำสุดอย่างสม่ำเสมอ ( UMVU ) ^[⁵⁶^]ซึ่งทำให้เป็นตัวประมาณค่าที่ดีที่สุดในบรรดาตัวประมาณค่าที่ไม่เอนเอียงทั้งหมด อย่างไรก็ตาม สามารถแสดงได้ว่าตัวประมาณค่าที่เอนเอียงนั้นดีกว่าในแง่ของ เกณฑ์ ความคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) ในตัวอย่างขนาดจำกัด ทั้งและมีการแจกแจงไคกำลังสองแบบ ปรับขนาด ที่มีองศาอิสระ $($ $n$ $- 1)$ นิพจน์แรกเหล่านี้แสดงให้เห็นว่าความแปรปรวนของเท่ากับซึ่งมากกว่า องค์ประกอบ σσของเมทริกซ์ข้อมูล Fisher ผกผัน เล็กน้อย ซึ่งคือดังนั้น จึงไม่ใช่ตัวประมาณค่าที่มีประสิทธิภาพสำหรับและยิ่งไปกว่านั้น เนื่องจากเป็น UMVU เราจึงสรุปได้ว่าตัวประมาณค่าที่มีประสิทธิภาพสำหรับตัวอย่างขนาดจำกัดนั้นไม่มีอยู่จริง $\textstyle {\hat {\sigma }}^{2}$ ${\textstyle (x_{1},\ldots ,x_{n})}$ $\textstyle {\hat {\sigma }}^{2}$ ${\textstyle s^{2}}$ $s$ ${\textstyle s^{2}}$ $\textstyle {\hat {\sigma }}^{2}$ $s^{2}={\frac {n}{n-1}}{\hat {\sigma }}^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}.$ ${\textstyle s^{2}}$ $\textstyle {\hat {\sigma }}^{2}$ ${\textstyle s^{2}}$ ${\textstyle \sigma ^{2}}$ $\textstyle {\hat {\sigma }}^{2}$ ${\textstyle s^{2}}$ $\textstyle {\hat {\sigma }}^{2}$ ${\textstyle s^{2}}$ ${\textstyle s^{2}}$ $\textstyle {\hat {\sigma }}^{2}$ $s^{2}\sim {\frac {\sigma ^{2}}{n-1}}\cdot \chi _{n-1}^{2},\qquad {\hat {\sigma }}^{2}\sim {\frac {\sigma ^{2}}{n}}\cdot \chi _{n-1}^{2}.$ ${\textstyle s^{2}}$ ${\textstyle 2\sigma ^{4}/(n-1)}$ $\textstyle {\mathcal {I}}^{-1}$ ${\textstyle 2\sigma ^{4}/n}$ ${\textstyle s^{2}}$ ${\textstyle \sigma ^{2}}$ ${\textstyle s^{2}}$ ${\textstyle \sigma ^{2}}$

เมื่อใช้ทฤษฎีเชิงอะซิมโทติก ตัวประมาณค่าทั้งและมีความสอดคล้องกัน กล่าวคือ ลู่เข้าสู่ค่า ด้วยความน่าจะเป็นเมื่อขนาดตัวอย่างเพิ่มขึ้นตัวประมาณค่าทั้งสองยังเป็นแบบปกติเชิงอะซิมโทติกด้วย โดยเฉพาะอย่างยิ่ง ตัวประมาณค่าทั้งสองมีประสิทธิภาพเชิงอะซิมโทติก สำหรับ ${\textstyle s^{2}}$ $\textstyle {\hat {\sigma }}^{2}$ ${\textstyle \sigma ^{2}}$ ${\textstyle n\rightarrow \infty }$ ${\sqrt {n}}({\hat {\sigma }}^{2}-\sigma ^{2})\simeq {\sqrt {n}}(s^{2}-\sigma ^{2})\,\xrightarrow {d} \,{\mathcal {N}}(0,2\sigma ^{4}).$ ${\textstyle \sigma ^{2}}$

ช่วงความเชื่อมั่น

ตามทฤษฎีบทของ Cochranสำหรับการแจกแจงแบบปกติ ค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่าง $s²$ เป็นอิสระต่อกัน ซึ่งหมายความ $ว่า$ ไม่มีประโยชน์ที่จะพิจารณาการแจกแจงร่วมกัน ของพวกมัน นอกจากนี้ยังมีทฤษฎีบทผกผัน: ถ้าในตัวอย่าง ค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างเป็นอิสระต่อกัน ตัวอย่างนั้นจะต้องมาจากการแจกแจงแบบปกติ ความเป็นอิสระระหว่าง s² และ $s$ สามารถนำมาใช้สร้างสถิติ t ได้ : ปริมาณ $t$ นี้ มีการแจกแจงแบบ Student's tที่มี องศาอิสระ $($ $n$ $- 1)$ และเป็นสถิติเสริม (เป็นอิสระจากค่าของพารามิเตอร์) การกลับการแจกแจงของ สถิติ $t$ นี้ จะทำให้เราสามารถสร้างช่วงความเชื่อมั่นสำหรับ $μ$ ได้^[⁵⁷^{] ใน}^{ทำนอง}เดียวกัน การกลับ การแจกแจง $χ²$ ของสถิติ $s² จะทำให้เรา$ $ได้$ ช่วงความเชื่อมั่น $สำหรับ$ σ² $[$ ⁵⁸^] $โดย$ ที่ $t$ $k$ $,$ $p$ และχ $\textstyle {\hat {\mu }}$ $\textstyle {\hat {\mu }}$ $t={\frac {{\hat {\mu }}-\mu }{s/{\sqrt {n}}}}={\frac {{\overline {x}}-\mu }{\sqrt {{\frac {1}{n(n-1)}}\sum (x_{i}-{\overline {x}})^{2}}}}\sim t_{n-1}$ $\mu \in \left[{\hat {\mu }}-t_{n-1,1-\alpha /2}{\frac {s}{\sqrt {n}}},\,{\hat {\mu }}+t_{n-1,1-\alpha /2}{\frac {s}{\sqrt {n}}}\right]$ $\sigma ^{2}\in \left[{\frac {n-1}{\chi _{n-1,1-\alpha /2}^{2}}}s^{2},\,{\frac {n-1}{\chi _{n-1,\alpha /2}^{2}}}s^{2}\right]$ 2 k,p $μ และ$ $σ²$ คือควอนไทล์ที่ $p$ ของ การแจกแจง $t$ และ $χ²$ ตามลำดับ ช่วงความเชื่อมั่นเหล่านี้มีระดับความเชื่อมั่น $1 -$ $α$ ซึ่งหมายความว่าค่าจริง $μ$ และ $σ²$ จะอยู่นอกช่วงเหล่านี้ด้วยความน่าจะเป็น (หรือระดับนัยสำคัญ ) $α$ ในทางปฏิบัติ ผู้คนมักจะใช้ $α$ $= 5% ส่งผลให้ได้ช่วงความเชื่อมั่น 95$ $%$ ช่วงความเชื่อมั่นสำหรับ $σ²$ สามารถหาได้โดยการถอดรากที่สองของขอบเขตช่วงสำหรับ $σ²$

สูตรโดยประมาณสามารถหาได้จากการกระจายเชิงอะซิมโทติกของและ $s$ $2$ : สูตรโดยประมาณจะใช้ได้สำหรับค่า $n$ ที่มาก และสะดวกกว่าสำหรับการคำนวณด้วยตนเอง เนื่องจากควอนไทล์ปกติมาตรฐาน $z$ $α$ $/2$ ไม่ขึ้นอยู่กับ $n$ โดยเฉพาะอย่างยิ่ง ค่า $α$ $ที่นิยมใช้มากที่สุด คือ 5%$ ซึ่งจะได้ผลลัพธ์เป็น $|$ $z$ $0.025$ | $=$ $1.96$ $\textstyle {\hat {\mu }}$ $\mu \in \left[{\hat {\mu }}-{\frac {|z_{\alpha /2}|}{\sqrt {n}}}s,\,{\hat {\mu }}+{\frac {|z_{\alpha /2}|}{\sqrt {n}}}s\right]$ $\sigma ^{2}\in \left[s^{2}-{\sqrt {2}}{\frac {|z_{\alpha /2}|}{\sqrt {n}}}s^{2},\,s^{2}+{\sqrt {2}}{\frac {|z_{\alpha /2}|}{\sqrt {n}}}s^{2}\right]$

การทดสอบความปกติ

การทดสอบความปกติจะประเมินโอกาสที่ชุดข้อมูลที่กำหนด ${x 1, ..., x n}$ จะมาจากการกระจายแบบปกติ โดยทั่วไปสมมติฐานว่าง $H 0$ คือ ข้อมูลมีการกระจายแบบปกติโดยมีค่าเฉลี่ย $μ$ และความแปรปรวน $σ 2$ ที่ไม่ระบุ ในขณะที่สมมติฐานทางเลือก $H a$ คือ การกระจายนั้นเป็นไปโดยพลการ มีการทดสอบมากมาย (มากกว่า 40 แบบ) ที่ถูกคิดค้นขึ้นสำหรับปัญหานี้ การทดสอบที่โดดเด่นกว่านั้นมีรายละเอียดดังต่อไปนี้:

แผนภาพการวินิจฉัยนั้นดูน่าสนใจกว่าในเชิงสัญชาตญาณ แต่ในขณะเดียวกันก็มีความเป็นอัตวิสัยสูง เนื่องจากอาศัยการตัดสินใจอย่างไม่เป็นทางการของมนุษย์ในการยอมรับหรือปฏิเสธสมมติฐานว่าง

แผนภูมิ Q–Qหรือที่รู้จักกันในชื่อแผนภูมิความน่าจะเป็นปกติหรือ แผนภูมิ แรงค์กิตคือแผนภูมิที่แสดงค่าที่เรียงลำดับแล้วจากชุดข้อมูลเทียบกับค่าที่คาดหวังของควอนไทล์ที่สอดคล้องกันจากการแจกแจงปกติมาตรฐาน กล่าวคือ เป็นแผนภูมิของจุดในรูปแบบ $(Φ -1 (p k), x (k))$ โดยที่จุดพล็อต $p k$ เท่ากับ $p k = (k - α)/(n + 1 - 2 α)$ และ $α$ เป็นค่าคงที่ปรับแก้ ซึ่งสามารถเป็นอะไรก็ได้ระหว่าง 0 ถึง 1 หากสมมติฐานว่างเป็นจริง จุดที่พล็อตควรจะอยู่บนเส้นตรงโดยประมาณ
แผนภูมิ P–P – คล้ายกับแผนภูมิ Q–Q แต่ใช้ไม่บ่อยนัก วิธีนี้ประกอบด้วยการพล็อตจุด $(Φ (z (k)), p k)$ โดยที่สำหรับข้อมูลที่มีการกระจายแบบปกติ แผนภูมินี้ควรอยู่บนเส้นตรงระหว่าง $(0, 0)$ และ $(1, 1$ ) ${\textstyle \textstyle z_{(k)}=(x_{(k)}-{\hat {\mu }})/{\hat {\sigma }}}$

การทดสอบความเหมาะสมของแบบจำลอง :

การทดสอบตามช่วงเวลา :

การทดสอบ K-squared ของ D'Agostino
การทดสอบ Jarque–Bera
การทดสอบ Shapiro–Wilk : การทดสอบนี้อิงจากเส้นในกราฟ Q–Q ที่มีค่าความชันเท่ากับ $σ$ การทดสอบจะเปรียบเทียบค่าประมาณกำลังสองน้อยที่สุดของค่าความชันนั้นกับค่าความแปรปรวนของตัวอย่าง และจะปฏิเสธสมมติฐานว่างหากค่าทั้งสองนี้แตกต่างกันอย่างมีนัยสำคัญ

การทดสอบโดยใช้ฟังก์ชันการกระจายเชิงประจักษ์ :

การทดสอบแอนเดอร์สัน-ดาร์ลิง
การทดสอบลิลลีฟอร์ส (เป็นการดัดแปลงมาจากการทดสอบโคลโมโกโรฟ-สเมียร์นอฟ )

การวิเคราะห์แบบเบย์เซียนของการแจกแจงปกติ

การวิเคราะห์แบบเบย์เซียนของข้อมูลที่มีการแจกแจงแบบปกติมีความซับซ้อน เนื่องจากมีปัจจัยที่เป็นไปได้มากมายที่อาจนำมาพิจารณาได้:

ค่าเฉลี่ย หรือค่าความแปรปรวน หรือทั้งสองอย่าง อาจถือได้ว่าเป็นปริมาณคงที่
เมื่อไม่ทราบค่าความแปรปรวน การวิเคราะห์อาจทำได้โดยตรงในแง่ของค่าความแปรปรวน หรือในแง่ของความแม่นยำซึ่งเป็นส่วนกลับของค่าความแปรปรวน เหตุผลที่แสดงสูตรในแง่ของความแม่นยำก็เพราะว่าการวิเคราะห์ในกรณีส่วนใหญ่จะง่ายขึ้น
ต้องพิจารณาทั้งกรณีตัวแปรเดียวและหลายตัวแปร
สามารถกำหนดการ แจกแจงความน่าจะเป็นล่วงหน้าแบบคอนจูเกตหรือแบบไม่เหมาะสมให้ กับตัวแปรที่ไม่ทราบค่าได้
ใน แบบจำลองการถดถอยเชิงเส้นแบบเบย์เซียนมีกรณีเพิ่มเติมอีกชุดหนึ่งเกิดขึ้นโดยในแบบจำลองพื้นฐานจะถือว่าข้อมูลมีการกระจายแบบปกติ และมีการกำหนดค่าความน่าจะเป็นล่วงหน้าแบบปกติให้กับสัมประสิทธิ์การถดถอย การวิเคราะห์ที่ได้จะคล้ายกับกรณีพื้นฐานของข้อมูลที่เป็นอิสระและมีการกระจายเหมือนกัน

สูตรสำหรับกรณีการถดถอยแบบไม่เชิงเส้นได้สรุปไว้ในบทความ ก่อนหน้าที่เกี่ยวข้องแล้ว

ผลรวมของกำลังสองสองจำนวน

รูปแบบสเกลาร์

สูตรเสริมต่อไปนี้มีประโยชน์ในการทำให้สม การการปรับปรุงค่า ภายหลัง ง่ายขึ้น ซึ่งหากไม่ใช้สูตรนี้จะค่อนข้างยุ่งยาก

$a(x-y)^{2}+b(x-z)^{2}=(a+b)\left(x-{\frac {ay+bz}{a+b}}\right)^{2}+{\frac {ab}{a+b}}(y-z)^{2}$

สมการนี้เป็นการเขียนผลรวมของพหุคูณกำลังสองสองตัวใน ตัวแปร $x$ ใหม่ โดยการกระจายกำลังสอง จัดกลุ่มพจน์ในตัวแปร $x$ และทำให้เป็นกำลังสองสมบูรณ์โปรดสังเกตสิ่งต่อไปนี้เกี่ยวกับตัวประกอบคงที่เชิงซ้อนที่แนบมากับบางพจน์:

ปัจจัยดังกล่าวมีรูปแบบเป็นค่าเฉลี่ยถ่วงน้ำหนักของ $y$ และ $z$ ${\textstyle {\frac {ay+bz}{a+b}}}$
${\textstyle {\frac {ab}{a+b}}={\frac {1}{{\frac {1}{a}}+{\frac {1}{b}}}}=(a^{-1}+b^{-1})^{-1}.}$ สิ่งนี้แสดงให้เห็นว่าปัจจัยนี้สามารถคิดได้ว่าเป็นผลมาจากสถานการณ์ที่ส่วนกลับของปริมาณ $a$ และ $b$ บวกกันโดยตรง ดังนั้นในการรวม $a$ และ $b$ เข้าด้วยกัน จึงจำเป็นต้องหาค่าส่วนกลับ บวก และหาค่าส่วนกลับอีกครั้งเพื่อให้ได้หน่วยเดิมกลับคืนมา นี่คือการดำเนินการแบบเดียวกับที่ค่าเฉลี่ยฮาร์มอนิก ทำ ดังนั้นจึงไม่น่าแปลกใจที่ มี ค่าเท่ากับครึ่งหนึ่งของค่าเฉลี่ยฮาร์มอนิกของ $a$ และ $b$ ${\textstyle {\frac {ab}{a+b}}}$

รูปแบบเวกเตอร์

สามารถเขียนสูตรที่คล้ายกันสำหรับผลรวมของเวกเตอร์กำลังสองสองตัวได้ดังนี้: ถ้า $x$ , $y$ , $z$ เป็นเวกเตอร์ที่มีความยาว $k$ และ $A$ และ $B$ เป็นเมทริกซ์สมมาตรที่ผกผัน ได้และมีขนาดn แล้ว ${\textstyle k\times k}$

${\begin{aligned}&(\mathbf {y} -\mathbf {x} )'\mathbf {A} (\mathbf {y} -\mathbf {x} )+(\mathbf {x} -\mathbf {z} )'\mathbf {B} (\mathbf {x} -\mathbf {z} )\\={}&(\mathbf {x} -\mathbf {c} )'(\mathbf {A} +\mathbf {B} )(\mathbf {x} -\mathbf {c} )+(\mathbf {y} -\mathbf {z} )'(\mathbf {A} ^{-1}+\mathbf {B} ^{-1})^{-1}(\mathbf {y} -\mathbf {z} )\end{aligned}}$ ที่ไหน $\mathbf {c} =(\mathbf {A} +\mathbf {B} )^{-1}(\mathbf {A} \mathbf {y} +\mathbf {B} \mathbf {z} )$

รูปแบบ $x' A x$ เรียกว่ารูปแบบกำลังสองและเป็นสเกลาร์กล่าว คือ มันเป็นการรวมผลรวมของการคูณที่เป็นไปได้ทั้งหมดของคู่ขององค์ประกอบจาก $x$ โดยมีสัมประสิทธิ์แยกกันสำหรับแต่ละคู่ นอกจากนี้ เนื่องจาก ดังนั้นผลรวมเท่านั้นที่มีความสำคัญสำหรับองค์ประกอบนอกแนวทแยงของ $A$ และไม่มีการสูญเสียความเป็นทั่วไปในการสมมติว่า $A$ เป็นเมทริกซ์สมมาตรยิ่งไปกว่านั้น ถ้า $A$ เป็นเมทริกซ์สมมาตรแล้ว รูปแบบ x ′ A x จะเป็น $\mathbf {x} '\mathbf {A} \mathbf {x} =\sum _{i,j}a_{ij}x_{i}x_{j}$ ${\textstyle x_{i}x_{j}=x_{j}x_{i}}$ ${\textstyle a_{ij}+a_{ji}}$ ${\textstyle \mathbf {x} '\mathbf {A} \mathbf {y} =\mathbf {y} '\mathbf {A} \mathbf {x} .}$

ผลรวมของความแตกต่างจากค่าเฉลี่ย

สูตรที่มีประโยชน์อีกสูตรหนึ่งมีดังนี้: โดยที่ $\sum _{i=1}^{n}(x_{i}-\mu )^{2}=\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}+n({\bar {x}}-\mu )^{2}$ ${\textstyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.}$

โดยทราบค่าความแปรปรวนแล้ว

สำหรับชุดข้อมูล $X$ ที่มีการกระจายแบบปกติแบบอิสระและเหมือน กัน (iid)ขนาด $n$ โดยที่แต่ละจุด $x$ มี ค่า ความแปรปรวน $σ²$ ที่ทราบแล้ว $การ$ กระจายความน่าจะเป็นก่อนหน้าแบบสังยุคก็จะมีการกระจายแบบปกติเช่นกัน ${\textstyle x\sim {\mathcal {N}}(\mu ,\sigma ^{2})}$

สามารถแสดงให้เห็นได้ง่ายขึ้นโดยการเขียนค่าความแปรปรวนใหม่เป็นค่าความแม่นยำกล่าวคือใช้ $τ = 1/ σ 2$ จากนั้นถ้าและเราดำเนินการดังต่อไปนี้ ${\textstyle x\sim {\mathcal {N}}(\mu ,1/\tau )}$ ${\textstyle \mu \sim {\mathcal {N}}(\mu _{0},1/\tau _{0}),}$

ขั้นแรกฟังก์ชันความน่าจะเป็นคือ (โดยใช้สูตรข้างต้นสำหรับผลรวมของความแตกต่างจากค่าเฉลี่ย): ${\begin{aligned}p(\mathbf {X} \mid \mu ,\tau )&=\prod _{i=1}^{n}{\sqrt {\frac {\tau }{2\pi }}}\exp \left(-{\frac {1}{2}}\tau (x_{i}-\mu )^{2}\right)\\&=\left({\frac {\tau }{2\pi }}\right)^{n/2}\exp \left(-{\frac {1}{2}}\tau \sum _{i=1}^{n}(x_{i}-\mu )^{2}\right)\\&=\left({\frac {\tau }{2\pi }}\right)^{n/2}\exp \left[-{\frac {1}{2}}\tau \left(\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}+n({\bar {x}}-\mu )^{2}\right)\right].\end{aligned}}$

จากนั้น เราจะดำเนินการดังต่อไปนี้: ${\begin{aligned}p(\mu \mid \mathbf {X} )&\propto p(\mathbf {X} \mid \mu )p(\mu )\\&=\left({\frac {\tau }{2\pi }}\right)^{n/2}\exp \left[-{\frac {1}{2}}\tau \left(\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}+n({\bar {x}}-\mu )^{2}\right)\right]{\sqrt {\frac {\tau _{0}}{2\pi }}}\exp \left(-{\frac {1}{2}}\tau _{0}(\mu -\mu _{0})^{2}\right)\\&\propto \exp \left(-{\frac {1}{2}}\left(\tau \left(\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}+n({\bar {x}}-\mu )^{2}\right)+\tau _{0}(\mu -\mu _{0})^{2}\right)\right)\\&\propto \exp \left(-{\frac {1}{2}}\left(n\tau ({\bar {x}}-\mu )^{2}+\tau _{0}(\mu -\mu _{0})^{2}\right)\right)\\&=\exp \left(-{\frac {1}{2}}(n\tau +\tau _{0})\left(\mu -{\dfrac {n\tau {\bar {x}}+\tau _{0}\mu _{0}}{n\tau +\tau _{0}}}\right)^{2}+{\frac {n\tau \tau _{0}}{n\tau +\tau _{0}}}({\bar {x}}-\mu _{0})^{2}\right)\\&\propto \exp \left(-{\frac {1}{2}}(n\tau +\tau _{0})\left(\mu -{\dfrac {n\tau {\bar {x}}+\tau _{0}\mu _{0}}{n\tau +\tau _{0}}}\right)^{2}\right)\end{aligned}}$

ในการพิสูจน์ข้างต้น เราใช้สูตรข้างต้นสำหรับผลรวมของกำลังสองสองจำนวน และกำจัดค่าคงที่ทั้งหมดที่ไม่เกี่ยวข้องกับ $μ$ ผลลัพธ์ที่ได้คือเคอร์เนลของการแจกแจงปกติ โดยมีค่าเฉลี่ยและความแม่นยำนั่นคือ ${\textstyle {\frac {n\tau {\bar {x}}+\tau _{0}\mu _{0}}{n\tau +\tau _{0}}}}$ ${\textstyle n\tau +\tau _{0}}$ $p(\mu \mid \mathbf {X} )\sim {\mathcal {N}}\left({\frac {n\tau {\bar {x}}+\tau _{0}\mu _{0}}{n\tau +\tau _{0}}},{\frac {1}{n\tau +\tau _{0}}}\right)$

สามารถเขียนสิ่งนี้ได้ในรูปของชุดสมการปรับปรุงแบบเบย์เซียนสำหรับพารามิเตอร์ภายหลัง โดยพิจารณาจากพารามิเตอร์ก่อนหน้า: ${\begin{aligned}\tau _{0}'&=\tau _{0}+n\tau \\[5pt]\mu _{0}'&={\frac {n\tau {\bar {x}}+\tau _{0}\mu _{0}}{n\tau +\tau _{0}}}\\[5pt]{\bar {x}}&={\frac {1}{n}}\sum _{i=1}^{n}x_{i}\end{aligned}}$

กล่าวคือ การรวม จุดข้อมูล $n$ จุดที่มีความแม่นยำรวม $nτ$ (หรือเทียบเท่ากับความแปรปรวนรวม $n / σ²$ ) และค่าเฉลี่ยของค่าต่างๆจะได้ความแม่นยำรวมใหม่โดยการเพิ่มความแม่นยำรวมของข้อมูลเข้ากับความแม่นยำรวมก่อนหน้า และสร้างค่าเฉลี่ยใหม่ผ่านค่าเฉลี่ยถ่วงน้ำหนักด้วยความแม่นยำ กล่าว $คือ$ ค่าเฉลี่ยถ่วงน้ำหนักของค่าเฉลี่ยของข้อมูลและค่าเฉลี่ยก่อนหน้า โดยแต่ละค่าถ่วงน้ำหนักด้วยความแม่นยำรวมที่เกี่ยวข้อง วิธีนี้สมเหตุสมผลหากมองว่าความแม่นยำบ่งบอกถึงความแน่นอนของการสังเกต: ในการกระจายของค่าเฉลี่ยภายหลัง แต่ละองค์ประกอบของข้อมูลนำเข้าจะถูกถ่วงน้ำหนักด้วยความแน่นอน และความแน่นอนของการกระจายนี้คือผลรวมของความแน่นอนแต่ละส่วน (เพื่อให้เข้าใจได้ง่ายขึ้น ลองเปรียบเทียบกับวลี "ทั้งหมดมีค่ามากกว่าผลรวมของส่วนต่างๆ" นอกจากนี้ ลองพิจารณาว่าความรู้เกี่ยวกับค่าเฉลี่ยภายหลังมาจากการรวมกันของความรู้เกี่ยวกับค่าเฉลี่ยก่อนหน้าและความน่าจะเป็น ดังนั้นจึงสมเหตุสมผลที่เราจะมีความแน่นอนในค่าเฉลี่ยภายหลังมากกว่าในองค์ประกอบใดองค์ประกอบหนึ่ง) ${\textstyle {\bar {x}}}$

สูตรข้างต้นแสดงให้เห็นว่าเหตุใดการวิเคราะห์แบบเบย์เซียนของไพรเออร์คู่ควบสำหรับการแจกแจงปกติจึงสะดวกกว่าในแง่ของความแม่นยำ ความแม่นยำของโพสทีเรียร์คือผลรวมของความแม่นยำของไพรเออร์และความน่าจะเป็น และค่าเฉลี่ยของโพสทีเรียร์คำนวณโดยใช้ค่าเฉลี่ยถ่วงน้ำหนักด้วยความแม่นยำ ดังที่ได้อธิบายไว้ข้างต้น สูตรเดียวกันนี้สามารถเขียนในแง่ของความแปรปรวนได้โดยการผกผันความแม่นยำทั้งหมด ซึ่งจะได้สูตรที่ซับซ้อนกว่า ${\begin{aligned}{\sigma _{0}^{2}}'&={\frac {1}{{\frac {n}{\sigma ^{2}}}+{\frac {1}{\sigma _{0}^{2}}}}}\\[5pt]\mu _{0}'&={\frac {{\frac {n{\bar {x}}}{\sigma ^{2}}}+{\frac {\mu _{0}}{\sigma _{0}^{2}}}}{{\frac {n}{\sigma ^{2}}}+{\frac {1}{\sigma _{0}^{2}}}}}\\[5pt]{\bar {x}}&={\frac {1}{n}}\sum _{i=1}^{n}x_{i}\end{aligned}}$

ด้วยค่าเฉลี่ยที่ทราบ

สำหรับชุดข้อมูล $X$ ที่มีการกระจายแบบปกติแบบอิสระและเหมือนกัน (iid)ขนาด $n$ โดยที่แต่ละจุด $x$ มีค่าเฉลี่ย $μ$ ที่ทราบแล้ว ไพรเออร์แบบ คอนจูเกต ของความแปรปรวนจะมีการกระจายแบบอินเวอร์สแกมมาหรือการกระจายแบบสเกลดอินเวอร์สไคกำลัง สอง การกระจาย ทั้งสองแบบนี้เทียบเท่ากัน ยกเว้นมีพารามิเตอร์ที่ แตกต่างกัน แม้ว่าอินเวอร์สแกมมาจะถูกใช้บ่อยกว่า แต่เราใช้สเกลดอินเวอร์สไคกำลัง $สอง$ เพื่อความสะดวก ไพรเออร์สำหรับ $σ²$ มีดังนี้: ${\textstyle x\sim {\mathcal {N}}(\mu ,\sigma ^{2})}$ $p(\sigma ^{2}\mid \nu _{0},\sigma _{0}^{2})={\frac {(\sigma _{0}^{2}{\frac {\nu _{0}}{2}})^{\nu _{0}/2}}{\Gamma \left({\frac {\nu _{0}}{2}}\right)}}~{\frac {\exp \left[{\frac {-\nu _{0}\sigma _{0}^{2}}{2\sigma ^{2}}}\right]}{(\sigma ^{2})^{1+{\frac {\nu _{0}}{2}}}}}\propto {\frac {\exp \left[{\frac {-\nu _{0}\sigma _{0}^{2}}{2\sigma ^{2}}}\right]}{(\sigma ^{2})^{1+{\frac {\nu _{0}}{2}}}}}$

ฟังก์ชันความน่าจะเป็นจากข้างต้น เมื่อเขียนในรูปของความแปรปรวน จะได้ว่า: โดยที่ ${\begin{aligned}p(\mathbf {X} \mid \mu ,\sigma ^{2})&=\left({\frac {1}{2\pi \sigma ^{2}}}\right)^{n/2}\exp \left[-{\frac {1}{2\sigma ^{2}}}\sum _{i=1}^{n}(x_{i}-\mu )^{2}\right]\\&=\left({\frac {1}{2\pi \sigma ^{2}}}\right)^{n/2}\exp \left[-{\frac {S}{2\sigma ^{2}}}\right]\end{aligned}}$ $S=\sum _{i=1}^{n}(x_{i}-\mu )^{2}.$

แล้ว: ${\begin{aligned}p(\sigma ^{2}\mid \mathbf {X} )&\propto p(\mathbf {X} \mid \sigma ^{2})p(\sigma ^{2})\\&=\left({\frac {1}{2\pi \sigma ^{2}}}\right)^{n/2}\exp \left[-{\frac {S}{2\sigma ^{2}}}\right]{\frac {(\sigma _{0}^{2}{\frac {\nu _{0}}{2}})^{\frac {\nu _{0}}{2}}}{\Gamma \left({\frac {\nu _{0}}{2}}\right)}}~{\frac {\exp \left[{\frac {-\nu _{0}\sigma _{0}^{2}}{2\sigma ^{2}}}\right]}{(\sigma ^{2})^{1+{\frac {\nu _{0}}{2}}}}}\\&\propto \left({\frac {1}{\sigma ^{2}}}\right)^{n/2}{\frac {1}{(\sigma ^{2})^{1+{\frac {\nu _{0}}{2}}}}}\exp \left[-{\frac {S}{2\sigma ^{2}}}+{\frac {-\nu _{0}\sigma _{0}^{2}}{2\sigma ^{2}}}\right]\\&={\frac {1}{(\sigma ^{2})^{1+{\frac {\nu _{0}+n}{2}}}}}\exp \left[-{\frac {\nu _{0}\sigma _{0}^{2}+S}{2\sigma ^{2}}}\right]\end{aligned}}$

ข้างต้นเป็นการแจกแจงไคกำลังสองผกผันแบบปรับขนาดเช่นกัน โดยที่ หรือเทียบเท่ากัน ${\begin{aligned}\nu _{0}'&=\nu _{0}+n\\\nu _{0}'{\sigma _{0}^{2}}'&=\nu _{0}\sigma _{0}^{2}+\sum _{i=1}^{n}(x_{i}-\mu )^{2}\end{aligned}}$ ${\begin{aligned}\nu _{0}'&=\nu _{0}+n\\{\sigma _{0}^{2}}'&={\frac {\nu _{0}\sigma _{0}^{2}+\sum _{i=1}^{n}(x_{i}-\mu )^{2}}{\nu _{0}+n}}\end{aligned}}$

เมื่อกำหนดพารามิเตอร์ใหม่โดยใช้การแจกแจงแกมมาผกผันผลลัพธ์ที่ได้คือ: ${\begin{aligned}\alpha '&=\alpha +{\frac {n}{2}}\\\beta '&=\beta +{\frac {\sum _{i=1}^{n}(x_{i}-\mu )^{2}}{2}}\end{aligned}}$

โดยที่ค่าเฉลี่ยและความแปรปรวนไม่ทราบค่า

สำหรับชุดข้อมูล X ที่มีการกระจายแบบปกติแบบอิสระ $และ เหมือนกัน ($ $iid$ ) ขนาด $n$ โดยที่แต่ละจุด $x$ มี ค่าเฉลี่ย $μ$ ที่ไม่ทราบค่าและความแปรปรวน $σ²$ ที่ไม่ทราบค่า จะมีการวาง ไพรเออร์แบบคอนจูเกตแบบผสม (หลายตัวแปร) ไว้เหนือค่าเฉลี่ยและความแปรปรวน ซึ่งประกอบด้วยการกระจายแบบปกติผกผันแกมมาตามหลักตรรกะแล้ว มีที่มาดังนี้: ${\textstyle x\sim {\mathcal {N}}(\mu ,\sigma ^{2})}$

จากการวิเคราะห์กรณีที่มีค่าเฉลี่ยไม่ทราบค่าแต่ทราบค่าความแปรปรวน เราพบว่าสมการปรับปรุงนั้นเกี่ยวข้องกับสถิติที่เพียงพอซึ่งคำนวณจากข้อมูล โดยประกอบด้วยค่าเฉลี่ยของจุดข้อมูลและความแปรปรวนทั้งหมดของจุดข้อมูล ซึ่งคำนวณได้จากค่าความแปรปรวนที่ทราบหารด้วยจำนวนจุดข้อมูล
จากการวิเคราะห์กรณีที่มีค่าความแปรปรวนไม่ทราบค่าแต่ทราบค่าเฉลี่ย เราพบว่าสมการปรับปรุงนั้นเกี่ยวข้องกับสถิติที่เพียงพอสำหรับข้อมูล ซึ่งประกอบด้วยจำนวนจุดข้อมูลและผลรวมของค่าเบี่ยงเบนกำลังสอง
โปรดจำไว้ว่าค่าอัปเดตภายหลังจะทำหน้าที่เป็นค่าการแจกแจงก่อนหน้าเมื่อมีการประมวลผลข้อมูลเพิ่มเติม ดังนั้น เราควรคิดถึงค่าก่อนหน้าของเราอย่างมีเหตุผลโดยใช้สถิติเพียงพอที่ได้อธิบายไปแล้ว โดยคำนึงถึงความหมายเดียวกันให้มากที่สุดเท่าที่จะเป็นไปได้
เพื่อจัดการกับกรณีที่ทั้งค่าเฉลี่ยและความแปรปรวนไม่ทราบค่า เราอาจกำหนดค่าความน่าจะเป็นล่วงหน้า (prior) ที่เป็นอิสระต่อกันสำหรับค่าเฉลี่ยและความแปรปรวน โดยมีค่าประมาณคงที่ของค่าเฉลี่ย ความแปรปรวนทั้งหมด จำนวนจุดข้อมูลที่ใช้ในการคำนวณค่าความน่าจะเป็นล่วงหน้าของความแปรปรวน และผลรวมของกำลังสองของส่วนเบี่ยงเบน อย่างไรก็ตาม โปรดทราบว่าในความเป็นจริง ความแปรปรวนทั้งหมดของค่าเฉลี่ยขึ้นอยู่กับความแปรปรวนที่ไม่ทราบค่า และผลรวมของกำลังสองของส่วนเบี่ยงเบนที่ใช้ในค่าความน่าจะเป็นล่วงหน้าของความแปรปรวน (ดูเหมือนว่าจะ) ขึ้นอยู่กับค่าเฉลี่ยที่ไม่ทราบค่า ในทางปฏิบัติ ความสัมพันธ์หลังนี้ค่อนข้างไม่สำคัญ: การเปลี่ยนแปลงค่าเฉลี่ยจริงจะทำให้จุดที่สร้างขึ้นเปลี่ยนแปลงไปในปริมาณที่เท่ากัน และโดยเฉลี่ยแล้วกำลังสองของส่วนเบี่ยงเบนจะยังคงเท่าเดิม อย่างไรก็ตาม นี่ไม่ใช่กรณีของความแปรปรวนทั้งหมดของค่าเฉลี่ย: เมื่อความแปรปรวนที่ไม่ทราบค่าเพิ่มขึ้น ความแปรปรวนทั้งหมดของค่าเฉลี่ยจะเพิ่มขึ้นตามสัดส่วน และเราต้องการที่จะจับความสัมพันธ์นี้ไว้
แนวคิด นี้ชี้ให้เห็นว่าเราควรสร้าง ค่าความ น่าจะเป็นล่วงหน้าแบบมีเงื่อนไขของค่าเฉลี่ยโดยอิงจากค่าความแปรปรวนที่ไม่ทราบค่า โดยมีพารามิเตอร์ตัวหนึ่งระบุค่าเฉลี่ยของข้อมูลจำลองที่เกี่ยวข้องกับค่าความน่าจะเป็นล่วงหน้า และอีกพารามิเตอร์หนึ่งระบุจำนวนข้อมูลจำลอง จำนวนนี้ทำหน้าที่เป็นพารามิเตอร์การปรับขนาดของค่าความแปรปรวน ทำให้สามารถควบคุมค่าความแปรปรวนโดยรวมของค่าเฉลี่ยเมื่อเทียบกับค่าความแปรปรวนจริงได้ ค่าความน่าจะเป็นล่วงหน้าสำหรับค่าความแปรปรวนก็มีพารามิเตอร์สองตัวเช่นกัน ตัวหนึ่งระบุผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลจำลองที่เกี่ยวข้องกับค่าความน่าจะเป็นล่วงหน้า และอีกตัวหนึ่งระบุจำนวนข้อมูลจำลองอีกครั้ง ค่าความน่าจะเป็นล่วงหน้าแต่ละค่ามีพารามิเตอร์ที่ระบุจำนวนข้อมูลจำลอง และในแต่ละกรณีนี้จะควบคุมค่าความแปรปรวนสัมพัทธ์ของค่าความน่าจะเป็นล่วงหน้านั้น พารามิเตอร์เหล่านี้ถูกกำหนดเป็นสองตัวแยกกัน เพื่อให้สามารถควบคุมค่าความแปรปรวน (หรือความเชื่อมั่น) ของค่าความน่าจะเป็นล่วงหน้าทั้งสองแยกกันได้
ซึ่งนำไปสู่การแจกแจงแบบนอร์มัล-อินเวอร์ส-แกมมา โดยทันที ซึ่งเป็นผลคูณของการแจกแจงสองแบบที่เพิ่งกำหนดไป โดย ใช้ ไพรเออร์แบบคอนจูเกต ( การแจกแจงอินเวอร์สแกมมาเหนือความแปรปรวน และการแจกแจงแบบนอร์มัลเหนือค่าเฉลี่ย โดยมีเงื่อนไขตามความแปรปรวน) และมีพารามิเตอร์สี่ตัวเดียวกันกับที่เพิ่งกำหนดไป

โดยปกติแล้ว ค่าความน่าจะเป็นล่วงหน้าจะถูกกำหนดดังนี้: ${\begin{aligned}p(\mu \mid \sigma ^{2};\mu _{0},n_{0})&\sim {\mathcal {N}}(\mu _{0},\sigma ^{2}/n_{0})\\p(\sigma ^{2};\nu _{0},\sigma _{0}^{2})&\sim I\chi ^{2}(\nu _{0},\sigma _{0}^{2})=IG(\nu _{0}/2,\nu _{0}\sigma _{0}^{2}/2)\end{aligned}}$

สมการการปรับปรุงสามารถหาได้และมีลักษณะดังนี้: จำนวนการสังเกตเสมือนที่เกี่ยวข้องจะถูกบวกเข้ากับจำนวนการสังเกตจริง พารามิเตอร์ค่าเฉลี่ยใหม่จะเป็นค่าเฉลี่ยถ่วงน้ำหนักอีกครั้ง โดยครั้งนี้ถ่วงน้ำหนักด้วยจำนวนการสังเกตสัมพัทธ์ สุดท้าย การปรับปรุงสำหรับ จะคล้ายกับกรณีที่มีค่าเฉลี่ยที่ทราบแล้ว แต่ในกรณีนี้ ผลรวมของกำลังสองของส่วนเบี่ยงเบนจะถูกคำนวณโดยอ้างอิงจากค่าเฉลี่ยของข้อมูลที่สังเกตได้ แทนที่จะเป็นค่าเฉลี่ยที่แท้จริง และเป็นผลให้ต้องเพิ่มพจน์ปฏิสัมพันธ์ใหม่เพื่อจัดการกับแหล่งที่มาของข้อผิดพลาดเพิ่มเติมที่เกิดจากส่วนเบี่ยงเบนระหว่างค่าเฉลี่ยก่อนหน้าและค่าเฉลี่ยของข้อมูล ${\begin{aligned}{\bar {x}}&={\frac {1}{n}}\sum _{i=1}^{n}x_{i}\\\mu _{0}'&={\frac {n_{0}\mu _{0}+n{\bar {x}}}{n_{0}+n}}\\n_{0}'&=n_{0}+n\\\nu _{0}'&=\nu _{0}+n\\\nu _{0}'{\sigma _{0}^{2}}'&=\nu _{0}\sigma _{0}^{2}+\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}+{\frac {n_{0}n}{n_{0}+n}}(\mu _{0}-{\bar {x}})^{2}\end{aligned}}$ ${\textstyle \nu _{0}'{\sigma _{0}^{2}}'}$

การเกิดขึ้นและการประยุกต์ใช้

การปรากฏของการกระจายแบบปกติในปัญหาเชิงปฏิบัติสามารถแบ่งออกได้คร่าวๆ เป็น 4 ประเภท:

การกระจายแบบปกติอย่างแท้จริง;
กฎเกณฑ์ปกติโดยประมาณ เช่น เมื่อการประมาณค่าดังกล่าวได้รับการพิสูจน์โดยทฤษฎีบทขีดจำกัดกลางและ
การแจกแจงที่จำลองเป็นแบบปกติ – การแจกแจงแบบปกติเป็นการแจกแจงที่มีเอนโทรปีสูงสุดสำหรับค่าเฉลี่ยและความแปรปรวนที่กำหนด
ปัญหาการถดถอย – การกระจายแบบปกติที่พบหลังจากที่ได้สร้างแบบจำลองผลกระทบที่เป็นระบบไว้อย่างดีเพียงพอแล้ว

ความปกติที่แน่นอน

สถานะพื้นฐานของควอนตัมฮาร์มอนิกออสซิลเลเตอร์มีการกระจายแบบเกาส์เซียน

การแจกแจงแบบปกติเกิดขึ้นใน ทฤษฎีทางฟิสิกส์บาง ทฤษฎี :

การกระจายความเร็วของทรงกลมที่เคลื่อนที่อย่างอิสระและยืดหยุ่นได้อย่างสมบูรณ์ ซึ่งเป็นผลมาจากทฤษฎีพลศาสตร์ของก๊าซของแม็กซ์เวลล์ ภาคที่ 1 (พ.ศ. 2403 ) ^{[ 59 ]}^{[ 60 ]}
ฟังก์ชันคลื่นสถานะพื้นฐาน ในปริภูมิตำแหน่งของตัวสั่นฮาร์มอนิกควอนตัม^[⁶¹^]
ตำแหน่งของอนุภาคที่เกิดการแพร่กระจายถ้าในตอนเริ่มต้นอนุภาคอยู่ที่จุดใดจุดหนึ่ง (นั่นคือ การกระจายความน่าจะเป็นของมันคือฟังก์ชันเดลต้าของดิแรก ) แล้วหลังจากเวลา $t$ ตำแหน่งของอนุภาคจะถูกอธิบายด้วยการกระจายแบบปกติที่มีความแปรปรวน $t$ ซึ่งสอดคล้องกับสมการการแพร่กระจาย ถ้าตำแหน่งเริ่มต้นกำหนดโดยฟังก์ชันความหนาแน่นที่แน่นอนความหนาแน่น ณ เวลา $t$ จะเป็นการสังเคราะห์ร่วมกันของ $g$ และฟังก์ชันความหนาแน่นความน่าจะเป็นแบบปกติ ${\textstyle {\frac {\partial }{\partial t}}f(x,t)={\frac {1}{2}}{\frac {\partial ^{2}}{\partial x^{2}}}f(x,t)}$ ${\textstyle g(x)}$

ความปกติโดยประมาณ

การแจกแจงแบบปกติ โดยประมาณเกิดขึ้นในหลายสถานการณ์ ดังที่อธิบายไว้ในทฤษฎีบทขีดจำกัดกลางเมื่อผลลัพธ์เกิดจากผลกระทบเล็กๆ จำนวนมากที่กระทำแบบบวกและเป็นอิสระการแจกแจงของผลลัพธ์จะใกล้เคียงกับการแจกแจงแบบปกติ การประมาณค่าแบบปกติจะไม่ถูกต้องหากผลกระทบกระทำแบบคูณ (แทนที่จะเป็นแบบบวก) หรือหากมีอิทธิพลภายนอกเพียงอย่างเดียวที่มีขนาดใหญ่กว่าผลกระทบอื่นๆ อย่างมาก

ในปัญหาการนับ ซึ่งทฤษฎีบทลิมิตกลางครอบคลุมการประมาณจากแบบไม่ต่อเนื่องไปสู่แบบต่อเนื่อง และเกี่ยวข้องกับ การแจกแจงที่แบ่ง ได้ไม่จำกัดและสามารถแยกส่วนได้เช่น
- ตัวแปรสุ่มทวินามที่เกี่ยวข้องกับตัวแปรตอบสนองแบบไบนารี;
- ตัวแปรสุ่มปัวซงเกี่ยวข้องกับเหตุการณ์ที่เกิดขึ้นได้ยาก
การแผ่รังสีความร้อนมี ลักษณะการกระจายแบบ โบส-ไอน์สไตน์ในช่วงเวลาสั้นมาก และมีการกระจายแบบปกติในช่วงเวลาที่ยาวขึ้นเนื่องจากทฤษฎีบทขีดจำกัดกลาง

ถือว่าปกติ

ผมมองว่าการปรากฏของเส้นโค้งปกติ – เส้นโค้งลาปลาเซียนของข้อผิดพลาด – เป็นปรากฏการณ์ที่ผิดปกติอย่างมาก มันถูกประมาณค่าคร่าวๆ ในบางการแจกแจง ด้วยเหตุนี้ และเนื่องจากความเรียบง่ายที่สวยงามของมัน เราอาจใช้มันเป็นค่าประมาณเบื้องต้น โดยเฉพาะอย่างยิ่งในการศึกษาเชิงทฤษฎี

— เพียร์สัน (1901)

มีวิธีการทางสถิติเพื่อทดสอบสมมติฐานนั้นในเชิงประจักษ์ โปรดดูส่วน " การทดสอบภาวะปกติ" ด้านบน

ในทางชีววิทยาค่าลอการิทึมของตัวแปรต่างๆ มักมีการกระจายแบบปกติ กล่าวคือ มักมีการกระจายแบบลอการิทึมปกติ (หลังจากแยกตามกลุ่มประชากรชาย/หญิง) โดยมีตัวอย่างเช่น:
- การวัดขนาดของเนื้อเยื่อที่มีชีวิต (ความยาว ความสูง พื้นที่ผิว น้ำหนัก) ^{[ 62 ]}
- ความยาวของ ส่วนประกอบ ที่ไม่เคลื่อนไหว (เช่น เส้นผม กรงเล็บ เล็บ ฟัน) ของสิ่งมีชีวิตในทิศทางการเจริญเติบโตซึ่งสันนิษฐานได้ว่าความหนาของเปลือกไม้ก็จัดอยู่ในประเภทนี้เช่นกัน
- การวัดค่าทางสรีรวิทยาบางอย่าง เช่น ความดันโลหิตของผู้ใหญ่
ในด้านการเงิน โดยเฉพาะอย่างยิ่งในแบบจำลอง Black–Scholesนั้น การเปลี่ยนแปลงของ ค่า ลอการิทึมของอัตราแลกเปลี่ยน ดัชนีราคา และดัชนีตลาดหุ้น จะถูกสมมติว่ามีการกระจายแบบปกติ (ตัวแปรเหล่านี้มีพฤติกรรมเหมือนดอกเบี้ยทบต้นไม่ใช่ดอกเบี้ยธรรมดา และดังนั้นจึงเป็นการกระจายแบบทวีคูณ) นักคณิตศาสตร์บางคน เช่นBenoit Mandelbrotได้โต้แย้งว่าการกระจายแบบ log-Levyซึ่งมีหางหนาจะเป็นแบบจำลองที่เหมาะสมกว่า โดยเฉพาะอย่างยิ่งสำหรับการวิเคราะห์การตกต่ำของตลาดหุ้นการใช้สมมติฐานของการกระจายแบบปกติในแบบจำลองทางการเงินนั้น ยังถูกวิพากษ์วิจารณ์โดยNassim Nicholas Talebในงานเขียนของเขา ด้วย
ข้อผิดพลาดในการวัดในการทดลองทางกายภาพมักจะถูกจำลองโดยการแจกแจงแบบปกติ การใช้การแจกแจงแบบปกติไม่ได้หมายความว่าเรากำลังสมมติว่าข้อผิดพลาดในการวัดมีการแจกแจงแบบปกติ แต่การใช้การแจกแจงแบบปกติจะสร้างการคาดการณ์ที่อนุรักษ์นิยมที่สุดเท่าที่จะเป็นไปได้ โดยอาศัยเพียงความรู้เกี่ยวกับค่าเฉลี่ยและความแปรปรวนของข้อผิดพลาด^{[ 63 ]}
ในการทดสอบมาตรฐานผลลัพธ์สามารถทำให้มีการกระจายแบบปกติได้โดยการเลือกจำนวนและความยากของคำถาม (เช่นในการทดสอบ IQ ) หรือการแปลงคะแนนดิบของการทดสอบให้เป็นคะแนนผลลัพธ์โดยการปรับให้เข้ากับการกระจายแบบปกติ ตัวอย่างเช่น ช่วงคะแนนมาตรฐานของ SATที่ 200–800 นั้นอิงตามการกระจายแบบปกติที่มีค่าเฉลี่ย 500 และส่วนเบี่ยงเบนมาตรฐาน 100

ใช้การแจกแจงปกติสะสมที่เหมาะสมกับปริมาณน้ำฝนในเดือนตุลาคม ดูวิธีการปรับการแจกแจงได้ที่นี่

คะแนนหลายอย่างได้มาจากค่าการแจกแจงปกติ รวมถึงอันดับเปอร์เซ็นไทล์ (เปอร์เซ็นไทล์หรือควอนไทล์) ค่า เทียบเท่าเส้นโค้งปกติสแตนไนน์คะแนนz และคะแนน T นอกจากนี้ วิธีการ ทางสถิติเชิงพฤติกรรม บางอย่าง ยังถือว่าคะแนนมีการแจกแจงแบบปกติ เช่นการทดสอบ tและANOVA การให้คะแนนแบบเส้นโค้งระฆังจะกำหนดเกรดสัมพัทธ์โดยอิงจากการแจกแจงปกติของคะแนน
ในทางอุทกวิทยาการกระจายตัวของปริมาณน้ำไหลหรือปริมาณน้ำฝนในระยะยาว เช่น ปริมาณรวมรายเดือนและรายปี มักถูกมองว่าเป็นการกระจายตัวแบบปกติในทางปฏิบัติ ตามทฤษฎีบทขีดจำกัดกลาง^{[ 64 ]}แผนภาพทางด้านขวาแสดงตัวอย่างของการปรับการกระจายตัวแบบปกติให้เข้ากับปริมาณน้ำฝนในเดือนตุลาคมที่จัดอันดับ โดยแสดงแถบความเชื่อมั่น 90% ตามการกระจายตัวแบบทวินามข้อมูลปริมาณน้ำฝนแสดงโดยการพล็อตตำแหน่งเป็นส่วนหนึ่งของการวิเคราะห์ความถี่สะสม

ปัญหาเชิงวิธีวิจัยและการตรวจสอบโดยผู้ทรงคุณวุฒิ

จอห์น ไอโออันนิดิส แย้งว่า การใช้ค่าเบี่ยงเบนมาตรฐานที่มีการกระจายแบบปกติเป็นมาตรฐานในการตรวจสอบความถูกต้องของผลการวิจัย ทำให้การคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดเกี่ยวกับปรากฏการณ์ที่ไม่มีการกระจายแบบปกติไม่ได้รับการทดสอบ ตัวอย่างเช่น ปรากฏการณ์ที่ปรากฏขึ้นเฉพาะเมื่อมีเงื่อนไขที่จำเป็นทั้งหมดครบถ้วน และปรากฏการณ์หนึ่งไม่สามารถใช้แทนอีกปรากฏการณ์หนึ่งได้ในลักษณะการบวก และปรากฏการณ์ที่ไม่มีการกระจายแบบสุ่ม ไอโออันนิดิสกล่าวว่า การตรวจสอบความถูกต้องโดยใช้ค่าเบี่ยงเบนมาตรฐานเป็นศูนย์กลาง ทำให้สมมติฐานและทฤษฎีดูเหมือนมีความถูกต้องอย่างผิดๆ ในกรณีที่การคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดบางส่วนแต่ไม่ใช่ทั้งหมดมีการกระจายแบบปกติ เนื่องจากส่วนของการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดซึ่งมีหลักฐานขัดแย้งอยู่นั้น อาจและในบางกรณีก็อยู่ในส่วนที่ไม่มีการกระจายแบบปกติของช่วงของการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิด รวมถึงการปฏิเสธสมมติฐานที่ไม่มีการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิดใดๆ มีการกระจายแบบปกติอย่างไม่มีมูลความจริง ราวกับว่าสมมติฐานเหล่านั้นไม่สามารถพิสูจน์ได้ว่าผิด ทั้งๆ ที่ความจริงแล้วสมมติฐานเหล่านั้นมีการคาดการณ์ที่สามารถพิสูจน์ได้ว่าผิด Ioannidis โต้แย้งว่ากรณีทฤษฎีที่ขัดแย้งกันเองหลายกรณีได้รับการยอมรับว่าถูกต้องโดยวารสารวิจัยนั้นเกิดจากความล้มเหลวของวารสารในการนำเอาการพิสูจน์เชิงประจักษ์ที่ผิดพลาดของการคาดการณ์ที่ไม่กระจายตัวตามปกติเข้ามาพิจารณา และไม่ใช่เพราะทฤษฎีที่ขัดแย้งกันเองนั้นเป็นจริง ซึ่งเป็นไปไม่ได้ แม้ว่าทฤษฎีที่ขัดแย้งกันเองสองทฤษฎีอาจผิดทั้งคู่และทฤษฎีที่สามอาจถูกต้องก็ตาม^{[ 65 ]}

วิธีการคำนวณ

การสร้างค่าจากการกระจายแบบปกติ

ในการจำลองด้วยคอมพิวเตอร์ โดยเฉพาะอย่างยิ่งในการประยุกต์ใช้วิธีมอนเตคาร์โลมักเป็นที่พึงปรารถนาที่จะสร้างค่าที่มีการกระจายแบบปกติ อัลกอริทึมที่ระบุไว้ด้านล่างทั้งหมดสร้างค่าเบี่ยงเบนมาตรฐานปกติ เนื่องจาก $N$ $(μ, σ²) สามารถ$ สร้างได้เป็น $X = μ + σZ$ โดยที่ $Z$ คือค่าเบี่ยงเบนมาตรฐานปกติ อัลกอริทึมทั้งหมดนี้อาศัยความพร้อมใช้งานของตัวสร้างเลขสุ่ม $U$ ที่สามารถสร้างตัวแปรสุ่ม แบบเอกรูปได้

วิธีที่ตรงไปตรงมาที่สุดคือการใช้ คุณสมบัติ การแปลงอินทิกรัลความน่าจะเป็น : ถ้า $U$ กระจายอย่างสม่ำเสมอในช่วง (0,1) แล้ว $Φ -1 (U)$ จะมีการกระจายแบบปกติมาตรฐาน ข้อเสียของวิธีนี้คือต้องอาศัยการคำนวณฟังก์ชัน probit Φ ⁻¹ซึ่งไม่สามารถทำได้ในเชิงวิเคราะห์ วิธีการโดยประมาณบางวิธีได้อธิบายไว้ในHart (1968)และใน บทความ erf Wichura ได้นำเสนออัลกอริทึมที่รวดเร็วสำหรับการคำนวณฟังก์ชันนี้ถึง 16 ตำแหน่งทศนิยม^{[ 66 ]} ซึ่ง Rใช้ในการคำนวณตัวแปรสุ่มของการกระจายแบบปกติ
วิธีการประมาณค่าที่ง่ายต่อการเขียนโปรแกรมซึ่งอาศัยทฤษฎีบทขีดจำกัดกลางมีดังนี้: สร้างค่าเบี่ยงเบน $U (0,1)$ ที่เป็นเอกรูป 12 ค่า นำมารวมกันทั้งหมด แล้วลบด้วย 6 ค่า – ตัวแปรสุ่มที่ได้จะมีค่าประมาณการกระจายแบบปกติมาตรฐาน ในความเป็นจริง การกระจายจะเป็นแบบIrwin–Hallซึ่งเป็นการประมาณค่าพหุนามลำดับที่ 11 แบบ 12 ส่วนสำหรับการกระจายแบบปกติ ค่าเบี่ยงเบนสุ่มนี้จะมีช่วงจำกัดที่ $(-6, 6)$ ^{[ 67 ]}โปรดทราบว่าในการกระจายแบบปกติที่แท้จริง มีเพียง 0.00034% ของตัวอย่างทั้งหมดเท่านั้นที่จะตกอยู่นอกช่วง ± $6 σ$
วิธี Box –Mullerใช้ตัวเลขสุ่มอิสระสองตัว $U$ และ $V$ ที่กระจายอย่างสม่ำเสมอในช่วง (0,1) จากนั้นตัวแปรสุ่มสองตัว $X$ และ $Y$ จะมีการกระจายแบบปกติมาตรฐาน และจะเป็นอิสระต่อกันการกำหนดสูตรนี้เกิดขึ้นเนื่องจากสำหรับเวกเตอร์สุ่มปกติแบบสองตัวแปร $($ $X$ $,$ $Y$ $)$ ค่ากำลังสองของนอร์ม $X²$ $+$ $Y²$ $จะ$ $มี$ การกระจายแบบไคกำลังสองที่มีสององศาอิสระ ซึ่งเป็นตัวแปรสุ่มเอกซ์โพเนนเชียล ที่สร้างได้ง่าย ซึ่งสอดคล้องกับปริมาณ $-2 ln($ $U$ $)$ ในสมการเหล่านี้ และมุมจะกระจายอย่างสม่ำเสมอรอบวงกลมที่ เลือกโดยตัวแปรสุ่ม $V$ $X={\sqrt {-2\ln U}}\,\cos(2\pi V),\qquad Y={\sqrt {-2\ln U}}\,\sin(2\pi V).$
วิธี $การ$ เชิงขั้วของ Marsagliaเป็นการดัดแปลงวิธีการของ Box–Muller ซึ่งไม่จำเป็นต้องคำนวณฟังก์ชันไซน์และโคไซน์ ในวิธีการนี้ $U$ และ $V$ จะถูกสุ่มมาจากการแจกแจงเอกรูป (−1,1) จากนั้นจะคำนวณ $S = U² + V²$ $ถ้า S$ มากกว่าหรือเท่ากับ 1 วิธีการจะเริ่มต้นใหม่ มิฉะนั้นจะส่งคืนค่าทั้งสองค่า $อีก$ ครั้ง $X$ และ $Y$ เป็นตัวแปรสุ่มปกติมาตรฐานที่เป็นอิสระต่อกัน $X=U{\sqrt {\frac {-2\ln S}{S}}},\qquad Y=V{\sqrt {\frac {-2\ln S}{S}}}$
วิธีอัตราส่วน^{[ 68 ]}เป็นวิธีการปฏิเสธ อัลกอริทึมดำเนินไปดังนี้:
- สร้างค่าเบี่ยงเบนสม่ำเสมออิสระสองค่า คือ $U$ และ $V$ ;
- คำนวณ $X = \sqrt 8/ e (V - 0.5)/ U$ ;
- ตัวเลือกเสริม: ถ้า $X 2 \leq 5 - 4 e 1/4 U$ ให้ยอมรับ $X$ และยุติอัลกอริทึม
- ตัวเลือกเสริม: ถ้า $X 2 \geq 4 e -1.35 / U + 1.4$ ให้ปฏิเสธ $X$ และเริ่มต้นใหม่ตั้งแต่ขั้นตอนที่ 1
- ถ้า $X 2 \leq -4 ln U$ ให้ยอมรับ $X$ มิฉะนั้นให้เริ่มอัลกอริทึมใหม่
ขั้นตอนเสริมสองขั้นตอนช่วยให้สามารถหลีกเลี่ยงการประเมินลอการิทึมในขั้นตอนสุดท้ายได้ในกรณีส่วนใหญ่ ขั้นตอนเหล่านี้สามารถปรับปรุงได้อย่างมาก^{[ 69 ]}เพื่อให้การประเมินลอการิทึมเกิดขึ้นได้น้อยมาก
อัลกอริทึมซิกกูแรต^{[ 70 ]}เร็วกว่าการแปลงบ็อกซ์-มุลเลอร์และยังคงแม่นยำ ในประมาณ 97% ของทุกกรณี จะใช้เพียงตัวเลขสุ่มสองตัว ตัวเลขสุ่มจำนวนเต็มหนึ่งตัวและตัวเลขสุ่มแบบเอกรูปหนึ่งตัว การคูณหนึ่งครั้ง และการทดสอบเงื่อนไข เฉพาะใน 3% ของกรณีที่การรวมกันของทั้งสองนั้นอยู่นอก "แกนกลางของซิกกูแรต" (การสุ่มตัวอย่างแบบปฏิเสธโดยใช้ลอการิทึม) เท่านั้นที่ต้องใช้เลขชี้กำลังและตัวเลขสุ่มแบบเอกรูปเพิ่มเติม
สามารถใช้เลขคณิตจำนวนเต็มเพื่อสุ่มตัวอย่างจากการกระจายปกติมาตรฐานได้^{[ 71 ]}^{[ 72 ]}วิธีนี้มีความแม่นยำในแง่ที่ว่ามันตรงตามเงื่อนไขของ การประมาณค่า ในอุดมคติ^{[ 73 ]}กล่าวคือ มันเทียบเท่ากับการสุ่มตัวอย่างจำนวนจริงจากการกระจายปกติมาตรฐานและปัดเศษให้เป็นจำนวนจุดลอยตัวที่ใกล้ที่สุดที่สามารถแสดงได้
นอกจากนี้ยังมีการตรวจสอบ^{[ 74 ]} บางส่วน เกี่ยวกับความเชื่อมโยงระหว่างการแปลง Hadamard แบบเร็ว กับการกระจายแบบปกติ เนื่องจากการแปลงใช้เพียงการบวกและการลบ และตามทฤษฎีบทขีดจำกัดกลาง ตัวเลขสุ่มจากการกระจายเกือบทุกแบบจะถูกแปลงเป็นการกระจายแบบปกติ ในแง่นี้ ชุดของการแปลง Hadamard สามารถรวมเข้ากับการเรียงสับเปลี่ยนแบบสุ่มเพื่อเปลี่ยนชุดข้อมูลใดๆ ให้เป็นข้อมูลที่มีการกระจายแบบปกติได้

การประมาณค่าเชิงตัวเลขสำหรับฟังก์ชันการกระจายสะสมปกติและฟังก์ชันควอนไทล์ปกติ

ฟังก์ชันการแจกแจงสะสมแบบปกติมาตรฐานถูกนำมาใช้กันอย่างแพร่หลายในการคำนวณทางวิทยาศาสตร์และสถิติ

ค่า $Φ (x)$ สามารถประมาณได้อย่างแม่นยำมากด้วยวิธีการต่างๆ เช่นการอินทิเกรตเชิงตัวเลขอนุกรมเทย์เลอร์อนุกรมเชิงเส้นกำกับและเศษส่วนต่อเนื่องมีการใช้การประมาณค่าที่แตกต่างกันไปตามระดับความแม่นยำที่ต้องการ

Zelen & Severo (1964)ให้ค่าประมาณสำหรับ $Φ (x)$ สำหรับ $x > 0$ โดยมีข้อผิดพลาดสัมบูรณ์ $| ε (x) | < 7.5\cdot10 -8$ (อัลกอริทึม26.2.17 ): โดยที่ $ϕ$ $($ $x$ $)$ คือฟังก์ชันความ หนาแน่นความน่าจะเป็นปกติมาตรฐาน และ $b$ $0$ $= 0.2316419$ , $b$ $1$ $= 0.319381530$ , $b$ $2$ $= -0.356563782$ , $b$ $3$ $= 1.781477937$ , $b$ $4$ $= -1.821255978$ , $b$ $5$ $= 1.330274429$ $\Phi (x)=1-\varphi (x)\left(b_{1}t+b_{2}t^{2}+b_{3}t^{3}+b_{4}t^{4}+b_{5}t^{5}\right)+\varepsilon (x),\qquad t={\frac {1}{1+b_{0}x}},$
ฮาร์ท (1968)แสดงรายการการประมาณค่าหลายสิบวิธีโดยใช้ฟังก์ชันตรรกยะ ทั้งแบบมีและไม่มีเลขชี้กำลัง สำหรับ ฟังก์ชัน erfc()โดยที่ erfc(x) = 1 - erf(x) อัลกอริทึมของเขามีความซับซ้อนและความแม่นยำแตกต่างกันไป โดยมีความแม่นยำสัมบูรณ์สูงสุด 24 หลัก อัลกอริทึมของเวสต์ (2009)ได้รวมอัลกอริทึม 5666 ของฮาร์ทเข้ากับ การประมาณ ค่าเศษส่วนต่อเนื่องในส่วนท้าย เพื่อให้ได้อัลกอริทึมการคำนวณที่รวดเร็วและมีความแม่นยำ 16 หลัก
Cody (1969)หลังจากระลึกได้ว่าวิธีแก้ปัญหาของ Hart68 ไม่เหมาะสมสำหรับ erf จึงได้เสนอวิธีแก้ปัญหาสำหรับทั้ง erf และ erfc โดยมีขอบเขตข้อผิดพลาดสัมพัทธ์สูงสุด ผ่านการประมาณค่า Chebyshev แบบมีเหตุผล
Marsaglia (2004)เสนออัลกอริทึมง่ายๆ^{[หมายเหตุ 1 ]}โดยอิงจากการขยายอนุกรมเทย์เลอร์สำหรับการคำนวณ $Φ$ $($ $x$ $)$ ด้วยความแม่นยำตามอำเภอใจ ข้อเสียของอัลกอริทึมนี้คือเวลาในการคำนวณค่อนข้างช้า (ตัวอย่างเช่น ต้องใช้การวนซ้ำมากกว่า 300 ครั้งในการคำนวณฟังก์ชันด้วยความแม่นยำ 16 หลักเมื่อ $x$ $= 10$ ) $\Phi (x)={\frac {1}{2}}+\varphi (x)\left(x+{\frac {x^{3}}{3}}+{\frac {x^{5}}{3\cdot 5}}+{\frac {x^{7}}{3\cdot 5\cdot 7}}+{\frac {x^{9}}{3\cdot 5\cdot 7\cdot 9}}+\cdots \right)$
ไลบรารีวิทยาศาสตร์ของ GNUคำนวณค่าของฟังก์ชันการกระจายสะสมปกติมาตรฐานโดยใช้อัลกอริทึมของ Hart และการประมาณค่าด้วย พหุ นามChebyshev
Dia (2023)เสนอการประมาณค่าต่อไปนี้โดยมีข้อผิดพลาดสัมพัทธ์สูงสุดน้อยกว่าในค่าสัมบูรณ์: สำหรับและสำหรับ ${\textstyle 1-\Phi }$ ${\textstyle 2^{-53}}$ ${\textstyle \left(\approx 1.1\times 10^{-16}\right)}$ ${\textstyle x\geq 0}$ ${\textstyle {\begin{aligned}1-\Phi \left(x\right)&=\left({\frac {0.39894228040143268}{x+2.92678600515804815}}\right)\left({\frac {x^{2}+8.42742300458043240x+18.38871225773938487}{x^{2}+5.81582518933527391x+8.97280659046817350}}\right)\\&\left({\frac {x^{2}+7.30756258553673541x+18.25323235347346525}{x^{2}+5.70347935898051437x+10.27157061171363079}}\right)\left({\frac {x^{2}+5.66479518878470765x+18.61193318971775795}{x^{2}+5.51862483025707963x+12.72323261907760928}}\right)\\&\left({\frac {x^{2}+4.91396098895240075x+24.14804072812762821}{x^{2}+5.26184239579604207x+16.88639562007936908}}\right)\left({\frac {x^{2}+3.83362947800146179x+11.61511226260603247}{x^{2}+4.92081346632882033x+24.12333774572479110}}\right)e^{-{\frac {x^{2}}{2}}}\end{aligned}}}$ ${\textstyle x<0}$

$1-\Phi \left(x\right)=1-\left(1-\Phi \left(-x\right)\right)$

Shore (1982) ได้นำเสนอการประมาณค่าอย่างง่ายที่อาจนำไปใช้ในแบบจำลองการเพิ่มประสิทธิภาพเชิงสุ่มของวิศวกรรมและการวิจัยการดำเนินงาน เช่น วิศวกรรมความน่าเชื่อถือและการวิเคราะห์สินค้าคงคลัง โดยกำหนดให้ $p = Φ (z)$ การประมาณค่าที่ง่ายที่สุดสำหรับฟังก์ชันควอนไทล์คือ: $z=\Phi ^{-1}(p)=5.5556\left[1-\left({\frac {1-p}{p}}\right)^{0.1186}\right],\qquad p\geq 1/2$

การประมาณค่านี้ให้ค่าความคลาดเคลื่อนสัมบูรณ์สูงสุด สำหรับ $z ที่ 0.026 (สำหรับ$ $0.5 \leq p \leq 0.9999$ ซึ่งสอดคล้องกับ $0 \leq z \leq 3.719$ ) สำหรับ $p < 1/2$ ให้แทน $p$ ด้วย $1 - p$ แล้วเปลี่ยนเครื่องหมาย การประมาณค่าอีกวิธีหนึ่งซึ่งมีความแม่นยำน้อยกว่าเล็กน้อย คือการประมาณค่าแบบพารามิเตอร์เดียว: $z=-0.4115\left\{{\frac {1-p}{p}}+\log \left[{\frac {1-p}{p}}\right]-1\right\},\qquad p\geq 1/2$

วิธีการหลังนี้ใช้เพื่อหาค่าประมาณอย่างง่ายสำหรับปริพันธ์การสูญเสียของการแจกแจงปกติ ซึ่งกำหนดโดย ${\begin{aligned}L(z)&=\int _{z}^{\infty }(u-z)\varphi (u)\,du=\int _{z}^{\infty }[1-\Phi (u)]\,du\\[5pt]L(z)&\approx {\begin{cases}0.4115\left({\dfrac {p}{1-p}}\right)-z,&p<1/2,\\\\0.4115\left({\dfrac {1-p}{p}}\right),&p\geq 1/2.\end{cases}}\\[5pt]{\text{or, equivalently,}}\\L(z)&\approx {\begin{cases}0.4115\left\{1-\log \left[{\frac {p}{1-p}}\right]\right\},&p<1/2,\\\\0.4115{\dfrac {1-p}{p}},&p\geq 1/2.\end{cases}}\end{aligned}}$

การประมาณค่านี้มีความแม่นยำเป็นพิเศษสำหรับส่วนปลายด้านขวา (ข้อผิดพลาดสูงสุด 10 ⁻³สำหรับ $z \geq 1.4$ ) การประมาณค่าที่มีความแม่นยำสูงสำหรับฟังก์ชันการกระจายสะสม โดยอิงตามระเบียบวิธีแบบจำลองการตอบสนอง (RMM, Shore, 2011, 2012) แสดงไว้ใน Shore (2005)

สามารถค้นหาค่าประมาณเพิ่มเติมได้ที่: ฟังก์ชันข้อผิดพลาด#การประมาณค่าด้วยฟังก์ชันพื้นฐานโดยเฉพาะอย่างยิ่ง ข้อผิดพลาด สัมพัทธ์ เล็กน้อย ในโดเมนทั้งหมดสำหรับฟังก์ชันการกระจายสะสมและ $\Phi$ ฟังก์ชันควอนไทล์นั้นสามารถทำได้โดยใช้สูตรผกผันที่ชัดเจนซึ่งคิดค้นโดย Sergei Winitzki ในปี 2008 ${\textstyle \Phi ^{-1}}$

ประวัติศาสตร์

การพัฒนา

ผู้เขียนบางท่าน^{[ 75 ]}^{[ 76 ]}ระบุว่าการค้นพบการแจกแจงปกติเป็นผลงานของเดอ มัวฟร์ซึ่งในปี 1738 ^{[หมายเหตุ 2 ]} ได้ตีพิมพ์ผล การศึกษาเกี่ยวกับสัมประสิทธิ์ในการขยายทวินามของ $($ $a$ $+$ $b$ $)$ $n$ ในฉบับพิมพ์ครั้งที่สองของหนังสือ The Doctrine of Chancesของเขาเดอ มัวฟร์พิสูจน์ว่าพจน์กลางในการขยายนี้มีขนาดโดยประมาณเท่ากับและว่า "ถ้า $m$ หรือ $⁠$ ${\textstyle 2^{n}/{\sqrt {2\pi n}}}$ $1 / 2 ถ้า n$ เป็นปริมาณที่มากอย่างไม่มีที่สิ้นสุด ลอการิทึมของอัตราส่วนที่พจน์ที่อยู่ห่างจากตรงกลางด้วยช่วง $ℓ$ มีต่อพจน์ตรงกลางคือ”^[⁷⁷^]แม้ว่าทฤษฎีบทนี้สามารถตีความได้ว่าเป็นการแสดงออกที่ไม่ชัดเจนครั้งแรกสำหรับกฎความน่าจะเป็นปกติ แต่ Stiglerชี้ให้เห็นว่า de Moivre เองก็ไม่ได้ตีความผลลัพธ์ของเขาว่าเป็นอะไรมากไปกว่ากฎโดยประมาณสำหรับสัมประสิทธิ์ทวินาม และโดยเฉพาะอย่างยิ่ง de Moivre ขาดแนวคิดของฟังก์ชันความหนาแน่นความน่าจะเป็น^[⁷⁸^] ${\textstyle -{\frac {2\ell \ell }{n}}}$

ในปี ค.ศ. 1823 เกาส์ได้ตีพิมพ์งานวิจัยเรื่อง" Theoria combinationis observationum erroribus minimis obnoxiae "ซึ่งในงานวิจัยนี้ เขาได้แนะนำแนวคิดทางสถิติที่สำคัญหลายประการ เช่นวิธีการกำลังสองน้อยที่สุดวิธีการความน่าจะเป็นสูงสุดและการแจกแจงแบบปกติเกาส์ใช้ $M$ , $M'$ , $M ″, ...$ แทนการวัดปริมาณที่ไม่ทราบค่า $V$ และพยายามหาตัวประมาณค่าที่มีความน่าจะเป็นสูงสุดของปริมาณนั้น นั่นคือ ตัวประมาณค่าที่ทำให้ความน่าจะเป็น $φ (M - V) \cdot φ (M' - V) \cdot φ (M ″ - V) \cdot ...$ ของการได้ผลการทดลองที่สังเกตได้สูงสุด ในสัญลักษณ์ของเขา φΔ คือฟังก์ชันความหนาแน่นความน่าจะเป็นของข้อผิดพลาดในการวัดที่มีขนาด Δ เนื่องจากไม่ทราบว่าฟังก์ชัน $φ$ คืออะไร เกาส์จึงต้องการให้วิธีการของเขาลดลงเหลือคำตอบที่รู้จักกันดี นั่นคือ ค่าเฉลี่ยเลขคณิตของค่าที่วัดได้^{[หมายเหตุ 3 ]}จากหลักการเหล่านี้ เกาส์แสดงให้เห็นว่ากฎเดียวที่อธิบายเหตุผลของการเลือกค่าเฉลี่ยเลขคณิตเป็นตัวประมาณค่าพารามิเตอร์ตำแหน่งได้คือกฎปกติของข้อผิดพลาด: ^{[ 79 ]} โดยที่ $h$ คือ "การวัดความแม่นยำของการสังเกต" การใช้กฎปกตินี้เป็นแบบจำลองทั่วไปสำหรับข้อผิดพลาดในการทดลอง เกาส์ได้กำหนดสิ่งที่ปัจจุบันรู้จักกันในชื่อวิธีการถ่วงน้ำหนักกำลังสองน้อยที่สุด แบบ ไม่เชิงเส้น^[⁸⁰^] $\varphi {\mathit {\Delta }}={\frac {h}{\surd \pi }}\,e^{-\mathrm {hh} \Delta \Delta },$

แม้ว่าเกาส์จะเป็นคนแรกที่เสนอแนวคิดเรื่องกฎการแจกแจงแบบปกติ แต่ลาปลาซก็มีส่วนสำคัญอย่างมาก^{[หมายเหตุ 4 ]}ลาปลาซเป็นคนแรกที่ตั้งปัญหาการรวมการสังเกตหลายๆ ครั้งในปี 1774 ^{[ 81 ]}แม้ว่าวิธีแก้ปัญหาของเขาเองจะนำไปสู่การแจกแจงแบบลาปลาซก็ตาม ลาปลาซเป็นคนแรกที่คำนวณค่าของอินทิกรัล $\int e - t 2 dt = \sqrt π$ ในปี 1782 ซึ่งให้ค่าคงที่ของการทำให้เป็นมาตรฐานสำหรับการแจกแจงแบบปกติ^{[ 82 ]}ด้วยความสำเร็จนี้ เกาส์จึงยอมรับความสำคัญของลาปลาซ^{[ 83 ]} สุดท้าย ลาปลาซเป็นผู้ที่พิสูจน์และนำเสนอ ทฤษฎีบทขีดจำกัดกลางพื้นฐานต่อวงการวิชาการในปี 1810 ซึ่งเน้นย้ำถึงความสำคัญทางทฤษฎีของการแจกแจงแบบปกติ^{[ 84 ]}

เป็นที่น่าสนใจที่จะสังเกตว่าในปี พ.ศ. 2352 นักคณิตศาสตร์ชาวไอริช-อเมริกันชื่อRobert Adrainได้ตีพิมพ์ผลงานที่ลึกซึ้งแต่มีข้อบกพร่องสองชิ้นเกี่ยวกับกฎความน่าจะเป็นปกติ พร้อมกันและเป็นอิสระจาก Gauss ^{[ 85 ]} ผลงานของเขาส่วนใหญ่ไม่เป็นที่รู้จักของชุมชนวิทยาศาสตร์ จนกระทั่งในปี พ.ศ. 2314 Abbeได้นำผลงานเหล่านั้นกลับมาศึกษาอีกครั้ง^{[ 86 ]}

ในช่วงกลางศตวรรษที่ 19 แม็กซ์เวลล์ได้แสดงให้เห็นว่าการแจกแจงแบบปกติไม่ได้เป็นเพียงเครื่องมือทางคณิตศาสตร์ที่สะดวกเท่านั้น แต่ยังอาจเกิดขึ้นในปรากฏการณ์ทางธรรมชาติได้อีกด้วย: ^{[ 59 ]}จำนวนอนุภาคที่มีความเร็วซึ่งถูกวิเคราะห์ในทิศทางใดทิศทางหนึ่งอยู่ระหว่าง $x$ และ $x + dx$ คือ $\operatorname {N} {\frac {1}{\alpha \;{\sqrt {\pi }}}}\;e^{-{\frac {x^{2}}{\alpha ^{2}}}}\,dx$

การตั้งชื่อ

ในปัจจุบัน แนวคิดนี้มักเรียกกันในภาษาอังกฤษว่าการแจกแจงปกติหรือการแจกแจงแบบเกาส์เซียนชื่ออื่นๆ ที่ใช้กันน้อยกว่า ได้แก่ การแจกแจงแบบเกาส์ การแจกแจงแบบลาปลาซ-เกาส์ กฎแห่งความคลาดเคลื่อน กฎแห่งความง่ายของความคลาดเคลื่อน กฎข้อที่สองของลาปลาซ และกฎแบบเกาส์เซียน

ดูเหมือนว่าเกาส์เองจะเป็นผู้บัญญัติศัพท์นี้โดยอ้างอิงถึง "สมการปกติ" ที่เกี่ยวข้องกับการประยุกต์ใช้ โดยคำว่าปกติในเชิงเทคนิคหมายถึงตั้งฉากกัน ไม่ใช่ปกติ^{[ 87 ]}อย่างไรก็ตาม ในช่วงปลายศตวรรษที่ 19 ผู้เขียนบางคน^{[หมายเหตุ 5 ]}ได้เริ่มใช้ชื่อการแจกแจงปกติโดยใช้คำว่า "ปกติ" เป็นคำคุณศัพท์ ซึ่งในขณะนั้นคำนี้ถูกมองว่าเป็นการสะท้อนให้เห็นว่าการแจกแจงนี้เป็นเรื่องปกติ ทั่วไป และจึงถือว่าปกติเพียร์ซ (หนึ่งในผู้เขียนเหล่านั้น) เคยให้คำจำกัดความของ "ปกติ" ไว้ดังนี้: "... 'ปกติ' ไม่ใช่ค่าเฉลี่ย (หรือค่าเฉลี่ยประเภทอื่นใด) ของสิ่งที่เกิดขึ้นจริง แต่เป็นสิ่งที่ในระยะยาวจะ เกิดขึ้นภายใต้สถานการณ์บางอย่าง" ^{[ 88 ]}ประมาณช่วงเปลี่ยนศตวรรษที่ 20 เพียร์สันได้ทำให้คำว่าปกติ เป็นที่นิยม ในฐานะคำที่ใช้เรียกการแจกแจงนี้^{[ 89 ]}

หลายปีที่แล้ว ผมเคยเรียกเส้นโค้งลาปลาซ-เกาส์เซียนว่า เส้นโค้ง ปกติซึ่งชื่อนี้ถึงแม้จะช่วยหลีกเลี่ยงประเด็นเรื่องความได้เปรียบในระดับนานาชาติ แต่ก็มีข้อเสียคือทำให้ผู้คนเข้าใจผิดว่าการแจกแจงความถี่แบบอื่นๆ ทั้งหมดนั้น 'ผิดปกติ' ในแง่ใดแง่หนึ่ง

— เพียร์สัน (1920)

นอกจากนี้ เพียร์สันเป็นคนแรกที่เขียนการแจกแจงในรูปของค่าเบี่ยงเบนมาตรฐาน $σ$ ดังเช่นสัญลักษณ์ที่ใช้ในปัจจุบัน ไม่นานหลังจากนั้น ในปี 1915 ฟิชเชอร์ได้เพิ่มพารามิเตอร์ตำแหน่งเข้าไปในสูตรการแจกแจงปกติ โดยแสดงออกมาในรูปแบบที่เขียนกันในปัจจุบัน: $df={\frac {1}{\sqrt {2\sigma ^{2}\pi }}}e^{-(x-m)^{2}/(2\sigma ^{2})}\,dx.$

คำว่าการแจกแจงปกติมาตรฐานซึ่งหมายถึงการแจกแจงปกติที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง เริ่มใช้กันอย่างแพร่หลายในช่วงทศวรรษ 1950 โดยปรากฏในตำราเรียนยอดนิยมของ P. G. Hoel (1947) Introduction to Mathematical StatisticsและAlexander M. Mood (1950) Introduction to the Theory of Statistics ^{[ 90 ]}^{[ 91 ]}^{[ 92 ]}

ดูเพิ่มเติม

การแจกแจงเบตส์ – คล้ายกับการแจกแจงเออร์วิน-ฮอลล์ แต่ปรับขนาดให้อยู่ในช่วง 0 ถึง 1
ปัญหาของเบห์เรนส์-ฟิชเชอร์ – ปัญหาที่ค้างคามานานเกี่ยวกับการทดสอบว่าตัวอย่างปกติสองตัวอย่างที่มีความแปรปรวนต่างกันจะมีค่าเฉลี่ยเท่ากันหรือไม่
ระยะทาง Bhattacharyya – วิธีที่ใช้ในการแยกส่วนผสมของการแจกแจงแบบปกติ
ทฤษฎีบท Erdős–Kac – เกี่ยวกับการปรากฏของการกระจายแบบปกติในทฤษฎีจำนวน
ความกว้างเต็มที่ที่ครึ่งหนึ่งของค่าสูงสุด
การเบลอแบบเกาส์เซียน – การแปลงแบบคอนโวลูชันซึ่งใช้การแจกแจงแบบปกติเป็นเคอร์เนล
ฟังก์ชันเกาส์เซียน
การแจกแจงแบบครึ่งปกติที่แก้ไขแล้ว^{[ 93 ]}ที่มี pdf บนกำหนดให้เป็น โดยที่แสดงถึงฟังก์ชัน Fox–Wright Psi ${\textstyle (0,\infty )}$ ${\textstyle f(x)={\frac {2\beta ^{\alpha /2}x^{\alpha -1}\exp(-\beta x^{2}+\gamma x)}{\Psi \left({\frac {\alpha }{2}},{\frac {\gamma }{\sqrt {\beta }}}\right)}}}$ ${\textstyle \Psi (\alpha ,z)={}_{1}\Psi _{1}\left({\begin{matrix}\left(\alpha ,{\frac {1}{2}}\right)\\(1,0)\end{matrix}};z\right)}$
การกระจายแบบปกติและไม่มีความสัมพันธ์กันไม่ได้หมายความว่าเป็นอิสระต่อกัน
อัตราส่วนการกระจายแบบปกติ
การแจกแจงปกติผกผัน
ตารางปกติมาตรฐาน
ทฤษฎีบทของสไตน์
การกระจายแบบซับเกาส์เซียน
ผลรวมของตัวแปรสุ่มที่มีการกระจายแบบปกติ
การแจกแจงแบบทวีดี (Tweedie distribution ) – การแจกแจงแบบปกติเป็นสมาชิกของตระกูลแบบจำลองการแจกแจงแบบเอกซ์โปเนนเชียล ของทวีดี (Tweedie exponential dispersion models )
การแจกแจงปกติแบบห่อหุ้ม – การแจกแจงปกติที่ใช้กับโดเมนรูปวงกลม
การทดสอบ Z – โดยใช้การแจกแจงแบบปกติ
การแจกแจงแบบเกาส์เซียนบนกลุ่มอาเบเลียนที่กระชับในระดับท้องถิ่น

หมายเหตุ

^ตัวอย่างเช่น อัลกอริทึมนี้มีอยู่ในบทความเรื่องภาษาโปรแกรม Bc
เดอ มัวร์ตีพิมพ์ผลการค้นพบของเขาครั้งแรกในปี 1733 ในจุลสารชื่อ Approximatio ad Summam Terminorum Binomii $(a + b) n$ in Seriem Expansiซึ่งกำหนดไว้สำหรับการเผยแพร่ภายในเท่านั้น แต่เขาไม่ได้เปิดเผยผลลัพธ์ต่อสาธารณะจนกระทั่งปี 1738 จุลสารฉบับดั้งเดิมได้รับการพิมพ์ซ้ำหลายครั้ง ดูตัวอย่างเช่น Walker (1985 )
^ "โดยทั่วไปแล้ว มักถือว่าสมมติฐานที่ว่า หากปริมาณใดๆ ได้รับการกำหนดโดยการสังเกตโดยตรงหลายครั้ง ภายใต้สถานการณ์เดียวกันและด้วยความระมัดระวังเท่าเทียมกัน ค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้จะให้ค่าที่มีความน่าจะเป็นมากที่สุด หากไม่ถูกต้องอย่างเคร่งครัด แต่ก็ใกล้เคียงมากที่สุด ดังนั้นจึงปลอดภัยที่สุดที่จะยึดถือค่าเฉลี่ยเลขคณิตนี้เสมอ" —เกาส์ (1809 , มาตรา 177)
^ "ธรรมเนียมของผมในการเรียกเส้นโค้งนี้ว่าเส้นโค้งเกาส์-ลาปลาเซียนหรือ เส้นโค้ง ปกติช่วยให้เราไม่ต้องแบ่งสัดส่วนคุณูปการในการค้นพบระหว่างนักดาราศาสตร์และนักคณิตศาสตร์ผู้ยิ่งใหญ่ทั้งสองท่าน" อ้างอิงจากเพียร์สัน (1905 , หน้า 189)
^นอกจากที่อ้างอิงไว้โดยเฉพาะในที่นี้แล้ว ยังพบการใช้งานในลักษณะนี้ในงานของ Peirce , Galton ( Galton (1889 , บทที่ V)) และ Lexis ( Lexis (1878) , Rohrbasser & Véron (2003) ) ประมาณปี 1875

ลิงก์ภายนอก

"การแจกแจงแบบปกติ" , สารานุกรมคณิตศาสตร์ , EMS Press , 2001 [1994]
เครื่องคำนวณการแจกแจงปกติ

[75] ตัวอย่างเช่น อัลกอริทึมนี้มีอยู่ในบทความเรื่องภาษาโปรแกรม Bc

[78] เดอ มัวร์ตีพิมพ์ผลการค้นพบของเขาครั้งแรกในปี 1733 ในจุลสารชื่อ Approximatio ad Summam Terminorum Binomii $(a + b) n$ in Seriem Expansiซึ่งกำหนดไว้สำหรับการเผยแพร่ภายในเท่านั้น แต่เขาไม่ได้เปิดเผยผลลัพธ์ต่อสาธารณะจนกระทั่งปี 1738 จุลสารฉบับดั้งเดิมได้รับการพิมพ์ซ้ำหลายครั้ง ดูตัวอย่างเช่น Walker (1985 )

[81] "โดยทั่วไปแล้ว มักถือว่าสมมติฐานที่ว่า หากปริมาณใดๆ ได้รับการกำหนดโดยการสังเกตโดยตรงหลายครั้ง ภายใต้สถานการณ์เดียวกันและด้วยความระมัดระวังเท่าเทียมกัน ค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้จะให้ค่าที่มีความน่าจะเป็นมากที่สุด หากไม่ถูกต้องอย่างเคร่งครัด แต่ก็ใกล้เคียงมากที่สุด ดังนั้นจึงปลอดภัยที่สุดที่จะยึดถือค่าเฉลี่ยเลขคณิตนี้เสมอ" —เกาส์ (1809 , มาตรา 177)

[84] "ธรรมเนียมของผมในการเรียกเส้นโค้งนี้ว่าเส้นโค้งเกาส์-ลาปลาเซียนหรือ เส้นโค้ง ปกติช่วยให้เราไม่ต้องแบ่งสัดส่วนคุณูปการในการค้นพบระหว่างนักดาราศาสตร์และนักคณิตศาสตร์ผู้ยิ่งใหญ่ทั้งสองท่าน" อ้างอิงจากเพียร์สัน (1905 , หน้า 189)

[92] นอกจากที่อ้างอิงไว้โดยเฉพาะในที่นี้แล้ว ยังพบการใช้งานในลักษณะนี้ในงานของ Peirce , Galton ( Galton (1889 , บทที่ V)) และ Lexis ( Lexis (1878) , Rohrbasser & Véron (2003) ) ประมาณปี 1875

[

[

[

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

9 ] [

10 ] อย่างไรก็ตาม

[

[

[ 13 ]

ดังนั้น

[

[ 16 ]

คำ

ๆ

คราว

[

[

[ 22 ]

[

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

เป็น

[ 29 ]

[

[ 31 ]

[

[

แปลงฟูริเยร์) คำจำกัดความนี้สามารถขยายเชิงวิเคราะห์ไปยังตัวแปรค่าเชิงซ้อนได้ [ 34 ]

[

[

[

[

[ 39 ]

[ 40 ]

[

[ 42 ]

นิ

[

[ 45 ]

[

[

[

[

[

[

[

[

[

[ 55 ]

[

[

ทำนอง

[ 59 ]

[ 60 ]

[

[ 62 ]

[ 63 ]

[ 64 ]

[ 65 ]

[ 66 ]

[ 67 ]

[ 68 ]

[ 69 ]

[ 70 ]

[ 71 ]

[ 72 ]

[ 73 ]

[ 74 ]

[หมายเหตุ 1 ]

[ 75 ]

[ 76 ]

[หมายเหตุ 2 ]

[

[

[หมายเหตุ 3 ]

[ 79 ]

[

[หมายเหตุ 4 ]

[ 81 ]

[ 82 ]

[ 83 ]

[ 84 ]

[ 85 ]

[ 86 ]

[ 87 ]

[หมายเหตุ 5 ]

[ 88 ]

[ 89 ]

[ 90 ]

[ 91 ]

[ 92 ]

[ 93 ]

การกระจายแบบปกติ
ฟังก์ชันความหนาแน่นความน่าจะเป็น เส้นโค้งสีแดงแสดงถึงการแจกแจงปกติมาตรฐาน
ฟังก์ชันการกระจายสะสม
สัญกรณ์	${\mathcal {N}}(\mu ,\sigma ^{2})$
พารามิเตอร์	$\mu \in \mathbb {R}$ = ค่าเฉลี่ย ( ตำแหน่ง ) = ความแปรปรวน ( มาตราส่วน ยกกำลังสอง ) $\sigma ^{2}\in \mathbb {R} _{>0}$
สนับสนุน	$x\in \mathbb {R}$
พีดี	${\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}$
ซีดีเอฟ	$\Phi \left({\frac {x-\mu }{\sigma }}\right)={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\right]$
ควอนไทล์	$\mu +\sigma {\sqrt {2}}\operatorname {erf} ^{-1}(2p-1)$
หมายถึง	$\mu$
ค่ามัธยฐาน	$\mu$
โหมด	$\mu$
ความแปรปรวน	$\sigma ^{2}$
โกรธ	$\sigma {\sqrt {2}}\,\operatorname {erf} ^{-1}(1/2)$
เอเอดี	${\textstyle \sigma {\sqrt {2/\pi }}}$
ความเบี่ยงเบน	$0$
ความโค้งส่วนเกิน	$0$
เอนโทรปี	${\textstyle {\tfrac {1}{2}}\log(2\pi e\sigma ^{2})}$
เอ็มจีเอฟ	$\exp(\mu t+\sigma ^{2}t^{2}/2)$
ซีเอฟ	$\exp(i\mu t-\sigma ^{2}t^{2}/2)$
ข้อมูลของฟิชเชอร์	${\mathcal {I}}(\mu ,\sigma )={\begin{pmatrix}1/\sigma ^{2}&0\\0&2/\sigma ^{2}\end{pmatrix}}$ ${\mathcal {I}}(\mu ,\sigma ^{2})={\begin{pmatrix}1/\sigma ^{2}&0\\0&1/(2\sigma ^{4})\end{pmatrix}}$
ความแตกต่าง Kullback–Leibler	${1 \over 2}\left\{\left({\frac {\sigma _{0}}{\sigma _{1}}}\right)^{2}+{\frac {(\mu _{1}-\mu _{0})^{2}}{\sigma _{1}^{2}}}-1+\ln {\sigma _{1}^{2} \over \sigma _{0}^{2}}\right\}$