อ่าน 12 นาที
การกระจายปกติแบบพับ
การแจกแจงปกติแบบพับ (Folded Normal Distribution) เป็นการแจกแจงความน่าจะเป็นที่เกี่ยวข้องกับการแจกแจงปกติเมื่อกำหนดตัวแปรสุ่มX ที่แจกแจงแบบปกติ...
การกระจายปกติแบบพับ
ฟังก์ชันความหนาแน่นความน่าจะเป็น | |||
ฟังก์ชันการกระจายสะสม | |||
| พารามิเตอร์ | μ ∈ R (รูปร่าง ) σ 2 > 0 (สเกล ) | ||
|---|---|---|---|
| สนับสนุน | x ∈ [0,∞) | ||
| พีดี | |||
| ซีดีเอฟ | |||
| หมายถึง | |||
| ความแปรปรวน | |||
การแจกแจงปกติแบบพับ (Folded Normal Distribution) เป็นการแจกแจงความน่าจะเป็นที่เกี่ยวข้องกับการแจกแจงปกติเมื่อกำหนดตัวแปรสุ่มX ที่แจกแจงแบบปกติ โดยมีค่าเฉลี่ยμและความแปรปรวนσ²ตัวแปรสุ่มY = | X | จะมีการแจกแจงปกติแบบพับ กรณีเช่นนี้อาจพบได้เมื่อบันทึกเฉพาะขนาดของตัวแปรบางตัว แต่ไม่ได้บันทึกเครื่องหมาย การแจกแจงนี้เรียกว่า "แบบพับ" เพราะมวลความน่าจะเป็นทางด้านซ้ายของx = 0 จะถูกพับทับโดยการใช้ค่าสัมบูรณ์ในฟิสิกส์ของการนำความร้อนการแจกแจงปกติแบบพับเป็นคำตอบพื้นฐานของสมการความร้อนบนครึ่งพื้นที่ ซึ่งสอดคล้องกับการมีฉนวนที่สมบูรณ์แบบบนระนาบที่ผ่านจุดกำเนิด
คำจำกัดความ
ความหนาแน่น
ฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) กำหนดโดย
สำหรับx ≥ 0 และ 0 ในทุกที่อื่น การกำหนดสูตรทางเลือกอื่นมีดังนี้
- ,
โดยที่ cosh คือฟังก์ชันโคไซน์ไฮเปอร์โบลิกดังนั้นฟังก์ชันการกระจายสะสม (CDF) จึงกำหนดโดย:
สำหรับx ≥ 0 โดยที่ erf() คือฟังก์ชันความคลาดเคลื่อนนิพจน์นี้จะลดรูปเป็น CDF ของการแจกแจงแบบครึ่งปกติเมื่อμ = 0
ค่าเฉลี่ยของการกระจายแบบพับคือ
หรือ
ฟังก์ชันการกระจายสะสมปกติอยู่ที่ไหน:
ดังนั้น ค่าความแปรปรวนจึงสามารถแสดงออกมาได้ง่ายๆ ในรูปของค่าเฉลี่ย:
คุณสมบัติ
โหมด
ค่าฐานนิยมของการแจกแจงคือค่าของที่ทำให้ความหนาแน่นมีค่าสูงสุด ในการหาค่านี้ เราจะหาอนุพันธ์อันดับแรกของความหนาแน่นเทียบกับและกำหนดให้เท่ากับศูนย์ น่าเสียดายที่ไม่มีสูตรสำเร็จรูป แต่เราสามารถเขียนอนุพันธ์ในรูปแบบที่ดีกว่าและได้สมการที่ไม่เป็นเชิงเส้น
.
Tsagris et al. (2014) พบจากการวิเคราะห์เชิงตัวเลขว่า เมื่อค่าสูงสุดจะเกิดขึ้นเมื่อและเมื่อมีค่ามากกว่าค่าสูงสุดจะเข้าใกล้ ซึ่งเป็นสิ่งที่คาดหวังได้ เนื่องจากในกรณีนี้ การแจกแจงปกติแบบพับจะลู่เข้าสู่การแจกแจงปกติ เพื่อหลีกเลี่ยงปัญหาใดๆ ที่เกิดจากค่าความแปรปรวนติดลบ จึงแนะนำให้ใช้การยกกำลังของพารามิเตอร์ หรืออีกทางเลือกหนึ่ง คุณสามารถเพิ่มข้อจำกัด เช่น หากตัวปรับค่าเหมาะสมที่สุดเลือกค่าความแปรปรวนติดลบ ค่าของลอการิทึมความน่าจะเป็นจะเป็น NA หรือค่าที่เล็กมาก
หน้าที่เฉพาะและหน้าที่อื่นๆ ที่เกี่ยวข้อง
- ฟังก์ชันลักษณะเฉพาะกำหนดโดย
.
- ฟังก์ชันสร้างโมเมนต์กำหนดโดย
.
- ฟังก์ชันก่อกำเนิดคูมูลันต์กำหนดโดย
.
- การแปลงลาปลาสมีรูปแบบดังนี้
.
- การแปลงฟูริเยร์กำหนดโดย
.
การแจกแจงที่เกี่ยวข้อง
- เมื่อμ = 0การกระจายของYจะเป็นการกระจายแบบครึ่งปกติ (half-normal distribution )
- ตัวแปรสุ่ม( Y / σ ) 2มี การ แจกแจงไคกำลังสองแบบไม่ศูนย์กลางโดยมีองศาอิสระ 1 และค่าไม่ศูนย์กลางเท่ากับ( μ / σ ) 2
- การแจกแจงปกติแบบพับ (folded normal distribution) สามารถมองได้ว่าเป็นลิมิตของการแจกแจง t แบบไม่มาตรฐานแบบพับ (folded non-standardized t distribution)เมื่อจำนวนองศาอิสระเข้าสู่ค่าอนันต์
- มีการพัฒนาเวอร์ชันแบบสองตัวแปรโดย Psarakis และ Panaretos (2001) รวมถึงเวอร์ชันแบบหลายตัวแปรที่พัฒนาโดย Chakraborty และ Chatterjee (2013)
- การแจกแจงแบบไรซ์ (Rice distribution)เป็นการขยายความแบบหลายตัวแปรของการแจกแจงแบบปกติพับ (folded normal distribution)
การอนุมานทางสถิติ
การประมาณค่าพารามิเตอร์
มีหลายวิธีในการประมาณค่าพารามิเตอร์ของฟังก์ชันปกติแบบพับ (folded normal) โดยพื้นฐานแล้วทุกวิธีล้วนเป็นกระบวนการประมาณค่าความน่าจะเป็นสูงสุด แต่ในบางกรณีจะทำการหาค่าสูงสุดเชิงตัวเลข ในขณะที่ในกรณีอื่นๆ จะทำการค้นหารากของสมการ ค่าลอการิทึมความน่าจะเป็นของฟังก์ชันปกติแบบพับเมื่อมีตัวอย่างขนาดสามารถเขียนได้ในลักษณะต่อไปนี้
ในภาษาโปรแกรม Rการใช้แพ็กเกจ Rfastช่วยให้หาค่าประมาณความน่าจะเป็นสูงสุด (MLE foldnorm.mle) ได้อย่างรวดเร็ว (คำสั่ง `rfast`) หรืออีกทางเลือกหนึ่ง คำสั่ง ` optim`หรือ`nlm`ก็สามารถหาค่าประมาณความน่าจะเป็นสูงสุด (MLE) ได้เช่นกัน การหาค่าสูงสุดนั้นง่าย เนื่องจากมีพารามิเตอร์สองตัว ( `x` และ ` y`) เกี่ยวข้อง โปรดทราบว่าค่า `x` ทั้งบวกและลบนั้นยอมรับได้ เนื่องจาก `x` อยู่ในเส้นจำนวนจริง ดังนั้นเครื่องหมายจึงไม่สำคัญ เพราะการแจกแจงนั้นสมมาตรกับเส้นจำนวนจริง โค้ดต่อไปนี้เขียนด้วยภาษา R
พับ<- ฟังก์ชัน( y ) {## y คือเวกเตอร์ที่มีข้อมูลบวกn <- length ( y ) ## ขนาดตัวอย่างsy2 <- sum ( y ^ 2 )แซม<- ฟังก์ชั่น( พารา, n , sy2 ) { ฉัน<- พารา[ 1 ] ; se <- exp ( พารา[ 2 ] ) f <- - n / 2 * log ( 2 / pi / se ) + n * me ^ 2 / 2 / se + sy2 / 2 / se - sum ( บันทึก( cosh ( ฉัน* y / se ) ) ) f }mod <- optim ( c ( mean ( y ), sd ( y ) ), n = n , sy2 = sy2 , sam , control = list ( maxit = 2000 ) ) mod <- optim ( mod $ par , sam , n = n , sy2 = sy2 , control = list ( maxit = 20000 ) ) result <- c ( - mod $ value , mod $ par [ 1 ], exp ( mod $ par [ 2 ]) ) names ( result ) <- c ( "log-likelihood" , "mu" , "sigma squared" ) result}อนุพันธ์ย่อยของลอการิทึมความน่าจะเป็นเขียนได้ดังนี้
.
โดยการเทียบอนุพันธ์ย่อยอันดับแรกของลอการิทึมความน่าจะเป็นให้เท่ากับศูนย์ เราจะได้ความสัมพันธ์ที่ดี
.
โปรดสังเกตว่าสมการข้างต้นมีสามคำตอบ คำตอบหนึ่งอยู่ที่ศูนย์ และอีกสองคำตอบมีเครื่องหมายตรงข้าม เมื่อแทนสมการข้างต้นลงในอนุพันธ์ย่อยของล็อกความน่าจะเป็นเทียบกับและกำหนดให้เท่ากับศูนย์ เราจะได้นิพจน์ต่อไปนี้สำหรับความแปรปรวน
,
ซึ่งเป็นสูตรเดียวกับในการกระจายแบบปกติความแตกต่างหลักอยู่ที่ว่าและไม่เป็นอิสระทางสถิติ ความสัมพันธ์ข้างต้นสามารถนำมาใช้เพื่อหาค่าประมาณความน่าจะเป็นสูงสุดได้อย่างมีประสิทธิภาพด้วยวิธีการวนซ้ำ เราเริ่มต้นด้วยค่าเริ่มต้นสำหรับและหาค่ารากบวก ( ) ของสมการสุดท้าย จากนั้นเราจะได้ค่าที่อัปเดตของกระบวนการนี้จะถูกทำซ้ำจนกว่าการเปลี่ยนแปลงในค่าลอการิทึมความน่าจะเป็นจะน้อยมาก อีกวิธีที่ง่ายกว่าและมีประสิทธิภาพกว่าคือการใช้อัลกอริธึมการค้นหา ลองเขียนสมการสุดท้ายในรูปแบบที่สวยงามกว่า
.
เห็นได้ชัดว่าการปรับค่าลอการิทึมความน่าจะเป็นให้เหมาะสมกับพารามิเตอร์ทั้งสองนั้นได้กลายเป็นการค้นหารากของฟังก์ชัน ซึ่งแน่นอนว่าเหมือนกับการค้นหารากก่อนหน้านี้ Tsagris et al. (2014) พบว่ามีรากสามรากสำหรับสมการนี้ นั่นคือมีค่าที่เป็นไปได้สามค่าของที่สอดคล้องกับสมการนี้ ได้แก่ และซึ่งเป็นค่าประมาณความน่าจะเป็นสูงสุด และ 0 ซึ่งสอดคล้องกับลอการิทึมความน่าจะเป็นต่ำสุด
ดูเพิ่มเติม
- การแจกแจงสะสมแบบพับ
- การกระจายแบบครึ่งปกติ
- การแจกแจงแบบครึ่งปกติที่แก้ไขแล้ว[ 1 ]ที่มี pdf บนกำหนดให้เป็นโดยที่แสดงถึงฟังก์ชัน Fox–Wright Psi
- การแจกแจงปกติแบบตัดทอน
ลิงก์ภายนอก
- Random (เดิมชื่อ Virtual Laboratories): การแจกแจงแบบปกติพับ (Folded Normal Distribution)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การกระจายปกติแบบพับ
การแจกแจงปกติแบบพับ (Folded Normal Distribution) เป็นการแจกแจงความน่าจะเป็นที่เกี่ยวข้องกับการแจกแจงปกติเมื่อกำหนดตัวแปรสุ่มX ที่แจกแจงแบบปกติ...
ความหนาแน่น
ฟังก์ชัน ความหนาแน่นความน่าจะเป็น (PDF) กำหนดโดย
โหมด
ค่าฐานนิยมของการแจกแจงคือค่าของที่ทำให้ความหนาแน่นมีค่าสูงสุด ในการหาค่านี้ เราจะหาอนุพันธ์อันดับแรกของความหนาแน่นเทียบกับและกำหนดให้เท่ากับศูนย์ น่าเสียดายที่ไม่มีสูตรสำเร็จรูป แต่เราสามารถเขียนอนุพันธ์ในรูปแบบที่ดีกว่าและได้สมการที่ไม่เป็นเชิงเส้น x...
หน้าที่เฉพาะและหน้าที่อื่นๆ ที่เกี่ยวข้อง
φ x ( t ) = e − σ 2 t 2 2 + i μ t Φ ( μ σ + i σ t ) + e − σ 2 t 2 2 − i μ t Φ ( − μ σ + i σ t ) {\displaystyle \varphi _{x}\left(t\right)=e^{{\frac {-\sigma ^{2}t^{2}}{2}}+i\mu t}\Phi \left({\frac {\mu }{\sigma }}+i\sigma t\right)+e^{-{\frac {\sigma...