การกระจายปกติแบบพับ

Q: ความหนาแน่น

ฟังก์ชัน ความหนาแน่นความน่าจะเป็น (PDF) กำหนดโดย

	ฟังก์ชันความหนาแน่นความน่าจะเป็นμ =1, σ =1
	ฟังก์ชันการกระจายสะสมμ =1, σ =1
พารามิเตอร์	μ ∈ R (รูปร่าง ) σ 2 > 0 (สเกล )
สนับสนุน	x ∈ [0,∞)
พีดี
ซีดีเอฟ
หมายถึง
ความแปรปรวน

การแจกแจงปกติแบบพับ (Folded Normal Distribution) ^{เป็นการ}แจกแจงความน่าจะเป็นที่เกี่ยวข้องกับการแจกแจงปกติเมื่อกำหนดตัวแปรสุ่มX ที่แจกแจงแบบปกติ โดยมีค่าเฉลี่ยμและความแปรปรวนσ²ตัวแปรสุ่มY = | X | จะมีการแจกแจงปกติแบบพับ กรณีเช่นนี้อาจพบได้เมื่อบันทึกเฉพาะขนาดของตัวแปรบางตัว แต่ไม่ได้บันทึกเครื่องหมาย การแจกแจงนี้เรียกว่า "แบบพับ" เพราะมวลความน่าจะเป็นทางด้านซ้ายของx = 0 จะถูกพับทับโดยการใช้ค่าสัมบูรณ์ในฟิสิกส์ของการนำความร้อนการแจกแจงปกติแบบพับเป็นคำตอบพื้นฐานของสมการความร้อนบนครึ่งพื้นที่ ซึ่งสอดคล้องกับการมีฉนวนที่สมบูรณ์แบบบนระนาบที่ผ่านจุดกำเนิด

คำจำกัดความ

ความหนาแน่น

ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) กำหนดโดย

f_{Y}(x;\mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}+{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,e^{-{\frac {(x+\mu )^{2}}{2\sigma ^{2}}}}

สำหรับx ≥ 0 และ 0 ในทุกที่อื่น การกำหนดสูตรทางเลือกอื่นมีดังนี้

f\left(x\right)={\sqrt {\frac {2}{\pi \sigma ^{2}}}}e^{-{\frac {\left(x^{2}+\mu ^{2}\right)}{2\sigma ^{2}}}}\cosh {\left({\frac {\mu x}{\sigma ^{2}}}\right)}

,

โดยที่ cosh คือฟังก์ชันโคไซน์ไฮเปอร์โบลิกดังนั้นฟังก์ชันการกระจายสะสม (CDF) จึงกำหนดโดย:

F_{Y}(x;\mu ,\sigma ^{2})={\frac {1}{2}}\left[{\mbox{erf}}\left({\frac {x+\mu }{\sqrt {2\sigma ^{2}}}}\right)+{\mbox{erf}}\left({\frac {x-\mu }{\sqrt {2\sigma ^{2}}}}\right)\right]

สำหรับx ≥ 0 โดยที่ erf() คือฟังก์ชันความคลาดเคลื่อนนิพจน์นี้จะลดรูปเป็น CDF ของการแจกแจงแบบครึ่งปกติเมื่อμ = 0

ค่าเฉลี่ยของการกระจายแบบพับคือ

\mu _{Y}=\sigma {\sqrt {\frac {2}{\pi }}}\,\,\exp \left({\frac {-\mu ^{2}}{2\sigma ^{2}}}\right)+\mu \,{\mbox{erf}}\left({\frac {\mu }{\sqrt {2\sigma ^{2}}}}\right)

หรือ

\mu _{Y}={\sqrt {\frac {2}{\pi }}}\sigma e^{-{\frac {\mu ^{2}}{2\sigma ^{2}}}}+\mu \left[1-2\Phi \left(-{\frac {\mu }{\sigma }}\right)\right]

ฟังก์ชันการกระจายสะสมปกติอยู่ที่ไหน: $\Phi$

\Phi (x)\;=\;{\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x}{\sqrt {2}}}\right)\right].

ดังนั้น ค่าความแปรปรวนจึงสามารถแสดงออกมาได้ง่ายๆ ในรูปของค่าเฉลี่ย:

\sigma _{Y}^{2}=\mu ^{2}+\sigma ^{2}-\mu _{Y}^{2}.

คุณสมบัติ

โหมด

ค่าฐานนิยมของการแจกแจงคือค่าของที่ทำให้ความหนาแน่นมีค่าสูงสุด ในการหาค่านี้ เราจะหาอนุพันธ์อันดับแรกของความหนาแน่นเทียบกับและกำหนดให้เท่ากับศูนย์ น่าเสียดายที่ไม่มีสูตรสำเร็จรูป แต่เราสามารถเขียนอนุพันธ์ในรูปแบบที่ดีกว่าและได้สมการที่ไม่เป็นเชิงเส้น $x$ $x$

${\frac {df(x)}{dx}}=0\Rightarrow -{\frac {\left(x-\mu \right)}{\sigma ^{2}}}e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}-{\frac {\left(x+\mu \right)}{\sigma ^{2}}}e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}=0$

$x\left[e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}+e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}\right]-\mu \left[e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}-e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}\right]=0$

$x\left(1+e^{-{\frac {2\mu x}{\sigma ^{2}}}}\right)-\mu \left(1-e^{-{\frac {2\mu x}{\sigma ^{2}}}}\right)=0$

$\left(\mu +x\right)e^{-{\frac {2\mu x}{\sigma ^{2}}}}=\mu -x$

$x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ .

Tsagris et al. (2014) พบจากการวิเคราะห์เชิงตัวเลขว่า เมื่อค่าสูงสุดจะเกิดขึ้นเมื่อและเมื่อมีค่ามากกว่าค่าสูงสุดจะเข้าใกล้ ซึ่งเป็นสิ่งที่คาดหวังได้ เนื่องจากในกรณีนี้ การแจกแจงปกติแบบพับจะลู่เข้าสู่การแจกแจงปกติ เพื่อหลีกเลี่ยงปัญหาใดๆ ที่เกิดจากค่าความแปรปรวนติดลบ จึงแนะนำให้ใช้การยกกำลังของพารามิเตอร์ หรืออีกทางเลือกหนึ่ง คุณสามารถเพิ่มข้อจำกัด เช่น หากตัวปรับค่าเหมาะสมที่สุดเลือกค่าความแปรปรวนติดลบ ค่าของลอการิทึมความน่าจะเป็นจะเป็น NA หรือค่าที่เล็กมาก $\mu <\sigma$ $x=0$ $\mu$ $3\sigma$ $\mu$

หน้าที่เฉพาะและหน้าที่อื่นๆ ที่เกี่ยวข้อง

ฟังก์ชันลักษณะเฉพาะกำหนดโดย

$\varphi _{x}\left(t\right)=e^{{\frac {-\sigma ^{2}t^{2}}{2}}+i\mu t}\Phi \left({\frac {\mu }{\sigma }}+i\sigma t\right)+e^{-{\frac {\sigma ^{2}t^{2}}{2}}-i\mu t}\Phi \left(-{\frac {\mu }{\sigma }}+i\sigma t\right)$ .

ฟังก์ชันสร้างโมเมนต์กำหนดโดย

$M_{x}\left(t\right)=\varphi _{x}\left(-it\right)=e^{{\frac {\sigma ^{2}t^{2}}{2}}+\mu t}\Phi \left({\frac {\mu }{\sigma }}+\sigma t\right)+e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\Phi \left(-{\frac {\mu }{\sigma }}+\sigma t\right)$ .

ฟังก์ชันก่อกำเนิดคูมูลันต์กำหนดโดย

$K_{x}\left(t\right)=\log {M_{x}\left(t\right)}=\left({\frac {\sigma ^{2}t^{2}}{2}}+\mu t\right)+\log {\left\lbrace 1-\Phi \left(-{\frac {\mu }{\sigma }}-\sigma t\right)+e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}-\sigma t\right)\right]\right\rbrace }$ .

การแปลงลาปลาสมีรูปแบบดังนี้

$E\left(e^{-tx}\right)=e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\left[1-\Phi \left(-{\frac {\mu }{\sigma }}+\sigma t\right)\right]+e^{{\frac {\sigma ^{2}t^{2}}{2}}+\mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}+\sigma t\right)\right]$ .

การแปลงฟูริเยร์กำหนดโดย

${\hat {f}}\left(t\right)=\varphi _{x}\left(-2\pi t\right)=e^{{\frac {-4\pi ^{2}\sigma ^{2}t^{2}}{2}}-i2\pi \mu t}\left[1-\Phi \left(-{\frac {\mu }{\sigma }}-i2\pi \sigma t\right)\right]+e^{-{\frac {4\pi ^{2}\sigma ^{2}t^{2}}{2}}+i2\pi \mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}-i2\pi \sigma t\right)\right]$ .

การแจกแจงที่เกี่ยวข้อง

เมื่อ $μ = 0$ การกระจายของ $Y$ จะเป็นการกระจายแบบครึ่งปกติ (half-normal distribution )
ตัวแปรสุ่ม $(Y / σ) 2$ มี การ แจกแจงไคกำลังสองแบบไม่ศูนย์กลางโดยมีองศาอิสระ 1 และค่าไม่ศูนย์กลางเท่ากับ $(μ / σ) 2$
การแจกแจงปกติแบบพับ (folded normal distribution) สามารถมองได้ว่าเป็นลิมิตของการแจกแจง t แบบไม่มาตรฐานแบบพับ (folded non-standardized t distribution)เมื่อจำนวนองศาอิสระเข้าสู่ค่าอนันต์
มีการพัฒนาเวอร์ชันแบบสองตัวแปรโดย Psarakis และ Panaretos (2001) รวมถึงเวอร์ชันแบบหลายตัวแปรที่พัฒนาโดย Chakraborty และ Chatterjee (2013)
การแจกแจงแบบไรซ์ (Rice distribution)เป็นการขยายความแบบหลายตัวแปรของการแจกแจงแบบปกติพับ (folded normal distribution)

การอนุมานทางสถิติ

การประมาณค่าพารามิเตอร์

มีหลายวิธีในการประมาณค่าพารามิเตอร์ของฟังก์ชันปกติแบบพับ (folded normal) โดยพื้นฐานแล้วทุกวิธีล้วนเป็นกระบวนการประมาณค่าความน่าจะเป็นสูงสุด แต่ในบางกรณีจะทำการหาค่าสูงสุดเชิงตัวเลข ในขณะที่ในกรณีอื่นๆ จะทำการค้นหารากของสมการ ค่าลอการิทึมความน่าจะเป็นของฟังก์ชันปกติแบบพับเมื่อมีตัวอย่างขนาดสามารถเขียนได้ในลักษณะต่อไปนี้ $x_{i}$ $n$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}+\sum _{i=1}^{n}\log {\left[e^{-{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}}+e^{-{\frac {\left(x_{i}+\mu \right)^{2}}{2\sigma ^{2}}}}\right]}$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}+\sum _{i=1}^{n}\log {\left[e^{-{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}}\left(1+e^{-{\frac {\left(x_{i}+\mu \right)^{2}}{2\sigma ^{2}}}}e^{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}\right)\right]}$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}-\sum _{i=1}^{n}{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}+\sum _{i=1}^{n}\log {\left(1+e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}\right)}$

ในภาษาโปรแกรม Rการใช้แพ็กเกจ Rfastช่วยให้หาค่าประมาณความน่าจะเป็นสูงสุด (MLE foldnorm.mle) ได้อย่างรวดเร็ว (คำสั่ง `rfast`) หรืออีกทางเลือกหนึ่ง คำสั่ง ` optim`หรือ`nlm`ก็สามารถหาค่าประมาณความน่าจะเป็นสูงสุด (MLE) ได้เช่นกัน การหาค่าสูงสุดนั้นง่าย เนื่องจากมีพารามิเตอร์สองตัว ( `x` และ ` y`) เกี่ยวข้อง โปรดทราบว่าค่า `x` ทั้งบวกและลบนั้นยอมรับได้ เนื่องจาก `x` อยู่ในเส้นจำนวนจริง ดังนั้นเครื่องหมายจึงไม่สำคัญ เพราะการแจกแจงนั้นสมมาตรกับเส้นจำนวนจริง โค้ดต่อไปนี้เขียนด้วยภาษา R $\mu$ $\sigma ^{2}$ $\mu$ $\mu$

พับ<- ฟังก์ชัน( y ) {## y คือเวกเตอร์ที่มีข้อมูลบวกn <- length ( y ) ## ขนาดตัวอย่างsy2 <- sum ( y ^ 2 )แซม<- ฟังก์ชั่น( พารา, n , sy2 ) { ฉัน<- พารา[ 1 ] ; se <- exp ( พารา[ 2 ] ) f <- - n / 2 * log ( 2 / pi / se ) + n * me ^ 2 / 2 / se + sy2 / 2 / se - sum ( บันทึก( cosh ( ฉัน* y / se ) ) ) f }mod <- optim ( c ( mean ( y ), sd ( y ) ), n = n , sy2 = sy2 , sam , control = list ( maxit = 2000 ) ) mod <- optim ( mod $ par , sam , n = n , sy2 = sy2 , control = list ( maxit = 20000 ) ) result <- c ( - mod $ value , mod $ par [ 1 ], exp ( mod $ par [ 2 ]) ) names ( result ) <- c ( "log-likelihood" , "mu" , "sigma squared" ) result}

อนุพันธ์ย่อยของลอการิทึมความน่าจะเป็นเขียนได้ดังนี้

${\frac {\partial l}{\partial \mu }}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)}{\sigma ^{2}}}-{\frac {2}{\sigma ^{2}}}\sum _{i=1}^{n}{\frac {x_{i}e^{\frac {-2\mu x_{i}}{\sigma ^{2}}}}{1+e^{\frac {-2\mu x_{i}}{\sigma ^{2}}}}}$

${\frac {\partial l}{\partial \mu }}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)}{\sigma ^{2}}}-{\frac {2}{\sigma ^{2}}}\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}\ \ {\text{and}}$

${\frac {\partial l}{\partial \sigma ^{2}}}=-{\frac {n}{2\sigma ^{2}}}+{\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{2\sigma ^{4}}}+{\frac {2\mu }{\sigma ^{4}}}\sum _{i=1}^{n}{\frac {x_{i}e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}}{1+e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}}}$

${\frac {\partial l}{\partial \sigma ^{2}}}=-{\frac {n}{2\sigma ^{2}}}+{\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{2\sigma ^{4}}}+{\frac {2\mu }{\sigma ^{4}}}\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}$ .

โดยการเทียบอนุพันธ์ย่อยอันดับแรกของลอการิทึมความน่าจะเป็นให้เท่ากับศูนย์ เราจะได้ความสัมพันธ์ที่ดี

$\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)}{2}}$ .

โปรดสังเกตว่าสมการข้างต้นมีสามคำตอบ คำตอบหนึ่งอยู่ที่ศูนย์ และอีกสองคำตอบมีเครื่องหมายตรงข้าม เมื่อแทนสมการข้างต้นลงในอนุพันธ์ย่อยของล็อกความน่าจะเป็นเทียบกับและกำหนดให้เท่ากับศูนย์ เราจะได้นิพจน์ต่อไปนี้สำหรับความแปรปรวน $\sigma ^{2}$

$\sigma ^{2}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{n}}+{\frac {2\mu \sum _{i=1}^{n}\left(x_{i}-\mu \right)}{n}}={\frac {\sum _{i=1}^{n}\left(x_{i}^{2}-\mu ^{2}\right)}{n}}={\frac {\sum _{i=1}^{n}x_{i}^{2}}{n}}-\mu ^{2}$ ,

ซึ่งเป็นสูตรเดียวกับในการกระจายแบบปกติความแตกต่างหลักอยู่ที่ว่าและไม่เป็นอิสระทางสถิติ ความสัมพันธ์ข้างต้นสามารถนำมาใช้เพื่อหาค่าประมาณความน่าจะเป็นสูงสุดได้อย่างมีประสิทธิภาพด้วยวิธีการวนซ้ำ เราเริ่มต้นด้วยค่าเริ่มต้นสำหรับและหาค่ารากบวก ( ) ของสมการสุดท้าย จากนั้นเราจะได้ค่าที่อัปเดตของกระบวนการนี้จะถูกทำซ้ำจนกว่าการเปลี่ยนแปลงในค่าลอการิทึมความน่าจะเป็นจะน้อยมาก อีกวิธีที่ง่ายกว่าและมีประสิทธิภาพกว่าคือการใช้อัลกอริธึมการค้นหา ลองเขียนสมการสุดท้ายในรูปแบบที่สวยงามกว่า $\mu$ $\sigma ^{2}$ $\sigma ^{2}$ $\mu$ $\sigma ^{2}$

$2\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}-\sum _{i=1}^{n}{\frac {x_{i}\left(1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}\right)}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}+n\mu =0$

$\sum _{i=1}^{n}{\frac {x_{i}\left(1-e^{\frac {2\mu x_{i}}{\sigma ^{2}}}\right)}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}+n\mu =0$ .

เห็นได้ชัดว่าการปรับค่าลอการิทึมความน่าจะเป็นให้เหมาะสมกับพารามิเตอร์ทั้งสองนั้นได้กลายเป็นการค้นหารากของฟังก์ชัน ซึ่งแน่นอนว่าเหมือนกับการค้นหารากก่อนหน้านี้ Tsagris et al. (2014) พบว่ามีรากสามรากสำหรับสมการนี้ นั่นคือมีค่าที่เป็นไปได้สามค่าของที่สอดคล้องกับสมการนี้ ได้แก่ และซึ่งเป็นค่าประมาณความน่าจะเป็นสูงสุด และ 0 ซึ่งสอดคล้องกับลอการิทึมความน่าจะเป็นต่ำสุด $\mu$ $\mu$ $-\mu$ $+\mu$

ดูเพิ่มเติม

การแจกแจงสะสมแบบพับ
การกระจายแบบครึ่งปกติ
การแจกแจงแบบครึ่งปกติที่แก้ไขแล้ว^{[ 1 ]}ที่มี pdf บนกำหนดให้เป็นโดยที่แสดงถึงฟังก์ชัน Fox–Wright Psi $(0,\infty )$ $f(x)={\frac {2\beta ^{\frac {\alpha }{2}}x^{\alpha -1}\exp(-\beta x^{2}+\gamma x)}{\Psi {\left({\frac {\alpha }{2}},{\frac {\gamma }{\sqrt {\beta }}}\right)}}}$ $\Psi (\alpha ,z)={}_{1}\Psi _{1}\left({\begin{matrix}\left(\alpha ,{\frac {1}{2}}\right)\\(1,0)\end{matrix}};z\right)$
การแจกแจงปกติแบบตัดทอน

ลิงก์ภายนอก

Random (เดิมชื่อ Virtual Laboratories): การแจกแจงแบบปกติพับ (Folded Normal Distribution)

[ 1 ]

ฟังก์ชันความหนาแน่นความน่าจะเป็น $μ =1, σ =1$
ฟังก์ชันการกระจายสะสม $μ =1, σ =1$
พารามิเตอร์	$μ \in R$ (รูปร่าง ) $σ 2 > 0$ (สเกล )
สนับสนุน	$x \in [0,\infty)$
พีดี	${\frac {1}{\sigma {\sqrt {2\pi }}}}\,e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}+{\frac {1}{\sigma {\sqrt {2\pi }}}}\,e^{-{\frac {(x+\mu )^{2}}{2\sigma ^{2}}}}$
ซีดีเอฟ	${\frac {1}{2}}\left[{\mbox{erf}}\left({\frac {x+\mu }{\sigma {\sqrt {2}}}}\right)+{\mbox{erf}}\left({\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\right]$
หมายถึง	$\mu _{Y}=\sigma {\sqrt {\tfrac {2}{\pi }}}\,e^{(-\mu ^{2}/2\sigma ^{2})}+\mu \left(1-2\,\Phi (-{\tfrac {\mu }{\sigma }})\right)$
ความแปรปรวน	$\sigma _{Y}^{2}=\mu ^{2}+\sigma ^{2}-\mu _{Y}^{2}$