อ่าน 9 นาที
การแจกแจงปกติทั่วไป
การ แจกแจงปกติทั่วไป ( GND ) หรือ การแจกแจงเกาส์เซียนทั่วไป ( GGD ) เป็นหนึ่งในสองตระกูลของ การแจกแจงความน่าจะเป็นต่อเนื่อง บน เส้น จำนวนจริง แบบ พาราเมตริก ทั้งสองตระกูลนี้เพิ่ม...
การแจกแจงปกติทั่วไป
การแจกแจงปกติทั่วไป ( GND ) หรือการแจกแจงเกาส์เซียนทั่วไป ( GGD ) เป็นหนึ่งในสองตระกูลของการแจกแจงความน่าจะเป็นต่อเนื่องบน เส้น จำนวนจริง แบบ พาราเมตริกทั้งสองตระกูลนี้เพิ่มพารามิเตอร์รูปร่างเข้าไปในการแจกแจงปกติเพื่อแยกแยะความแตกต่างระหว่างสองตระกูลนี้ จึงจะเรียกในที่นี้ว่า "สมมาตร" และ "อสมมาตร" อย่างไรก็ตาม นี่ไม่ใช่คำศัพท์มาตรฐาน
เวอร์ชันสมมาตร
| สมมาตรทั่วไปปกติ | |||
|---|---|---|---|
ฟังก์ชันความหนาแน่นความน่าจะเป็น | |||
ฟังก์ชันการกระจายสะสม | |||
| พารามิเตอร์ | ตำแหน่ง ( จริง ) มาตราส่วน (บวก, จริง ) รูปร่าง (บวก, จริง ) | ||
| สนับสนุน | |||
| พีดี | หมายถึงฟังก์ชันแกมมา | ||
| ซีดีเอฟ | โดยที่เป็นพารามิเตอร์รูปร่างเป็นพารามิเตอร์มาตราส่วน และเป็นฟังก์ชันแกมมาล่างไม่สมบูรณ์ที่ไม่ได้ปรับให้เป็นมาตรฐาน | ||
| ควอนไทล์ | ฟังก์ชันควอนไทล์ของการแจกแจงแกมมา อยู่ ที่ไหน[ 1 ] | ||
| หมายถึง | |||
| ค่ามัธยฐาน | |||
| โหมด | |||
| ความแปรปรวน | |||
| ความเบี่ยงเบน | 0 | ||
| ความโค้งส่วนเกิน | |||
| เอนโทรปี | [ 2 ] | ||
การแจกแจงปกติทั่วไปแบบสมมาตรหรือที่รู้จักกันในชื่อการแจกแจง Subbotin [ 3 ]การแจกแจงกำลังเลขชี้กำลังหรือการแจกแจงข้อผิดพลาดทั่วไปเป็นตระกูลพาราเมตริกของการแจกแจงแบบสมมาตรประกอบด้วย การแจกแจง ปกติและ การแจกแจง Laplace ทั้งหมด และในกรณีจำกัด จะรวมถึงการแจกแจงเอกรูปต่อเนื่อง ทั้งหมด บนช่วงที่จำกัดของเส้นจำนวนจริง
กลุ่มการแจกแจงนี้ประกอบด้วยการแจกแจงปกติเมื่อ(โดยมีค่าเฉลี่ยและความแปรปรวน) และประกอบด้วยการแจกแจงลาปลาสเมื่อ เมื่อความหนาแน่นจะลู่เข้าสู่ความหนาแน่นสม่ำเสมอ แบบจุดต่อจุด บน
ตระกูลนี้อนุญาตให้มีส่วนหางที่หนักกว่าปกติ (เมื่อ ) หรือเบากว่าปกติ (เมื่อ ) เป็นวิธีที่มีประโยชน์ในการกำหนดพารามิเตอร์ของความหนาแน่นแบบสมมาตรและแบนราบต่อเนื่องกันตั้งแต่ความหนาแน่นปกติ ( ) ไปจนถึงความหนาแน่นสม่ำเสมอ ( ) และความหนาแน่นแบบสมมาตรและเลปโตเคอร์ ติกต่อเนื่อง กัน ตั้งแต่ความหนาแน่นลาปลาซ ( ) ไปจนถึงความหนาแน่นปกติ ( ) พารามิเตอร์รูปร่างยังควบคุมความแหลมคมนอกเหนือจากส่วนหางด้วย
การประมาณค่าพารามิเตอร์
การประมาณค่าพารามิเตอร์โดยใช้ความน่าจะเป็นสูงสุดและวิธีการของโมเมนต์ได้รับการศึกษาแล้ว[ 4 ]ค่าประมาณไม่มีรูปแบบปิดและต้องได้รับมาโดยวิธีการเชิงตัวเลข นอกจากนี้ยังมีการเสนอตัวประมาณค่าที่ไม่ต้องใช้การคำนวณเชิงตัวเลขอีกด้วย[ 5 ]
ฟังก์ชันลอการิทึมความน่าจะเป็นปกติทั่วไปจะมีอนุพันธ์ต่อเนื่องจำนวนอนันต์ (กล่าวคือ อยู่ในกลุ่มฟังก์ชันเรียบ ) ก็ต่อเมื่อเป็นจำนวนเต็มคู่บวกเท่านั้น มิฉะนั้น ฟังก์ชันจะมีอนุพันธ์ต่อเนื่อง ดังนั้น ผลลัพธ์มาตรฐานสำหรับความสอดคล้องและความปกติเชิงอะซิมโทติกของการประมาณ ค่า ความน่าจะเป็นสูงสุด ของ จึงใช้ได้เฉพาะเมื่อเท่านั้น
ตัวประมาณค่าความน่าจะเป็นสูงสุด
เป็นไปได้ที่จะปรับการแจกแจงปกติทั่วไปโดยใช้วิธีความน่าจะเป็นสูงสุด โดยประมาณ [ 4 ] [ 6 ]โดยตั้งค่าเริ่มต้นเป็นโมเมนต์แรกของตัวอย่าง , จะถูกประมาณโดยใช้ วิธีการวน ซ้ำของ Newton–Raphsonโดยเริ่มต้นจากการคาดเดาเริ่มต้นของ ,
ที่ไหน
คือ โมเมนต์ทางสถิติแรกของค่าสัมบูรณ์ และคือโมเมนต์ ทางสถิติที่สอง การวนซ้ำคือ
ที่ไหน
และและคือฟังก์ชันไดแกมมาและฟังก์ชันตรีแกมมาตามลำดับ
เมื่อกำหนดค่าให้กับ แล้ว เราสามารถประมาณค่าได้โดยการหาค่าต่ำสุดของ:
สุดท้ายนี้จะถูกประเมินว่า
สำหรับค่ามัธยฐานจะเป็นตัวประมาณค่าที่เหมาะสมกว่าสำหรับค่าเมื่อประมาณค่า แล้ว ก็สามารถประมาณค่าได้ตามที่อธิบายไว้ข้างต้น[ 4 ]
แอปพลิเคชัน
การแจกแจงปกติทั่วไปแบบสมมาตรถูกนำมาใช้ในการสร้างแบบจำลองเมื่อความเข้มข้นของค่ารอบค่าเฉลี่ยและพฤติกรรมส่วนหางเป็นสิ่งที่น่าสนใจเป็นพิเศษ[ 7 ] [ 8 ] สามารถใช้ตระกูลการแจกแจงอื่นๆ ได้หากเน้นที่ความเบี่ยงเบนอื่นๆ จากภาวะปกติ หากความสมมาตรของการแจกแจงเป็นสิ่งที่สนใจหลัก สามารถใช้ตระกูลการ แจกแจงปกติแบบเบ้หรือแบบอสมมาตรของตระกูลการแจกแจงปกติทั่วไปที่กล่าวถึงด้านล่างได้ หากพฤติกรรมส่วนหางเป็นสิ่งที่สนใจหลัก สามารถใช้ตระกูลการแจกแจง t ของนักเรียนได้ ซึ่งประมาณค่าการแจกแจงปกติเมื่อระดับความเป็นอิสระเพิ่มขึ้นเป็นอนันต์ การแจกแจง t แตกต่างจากการแจกแจงปกติทั่วไปนี้ตรงที่ได้ส่วนหางที่หนักกว่าปกติโดยไม่มีจุดแหลมที่จุดกำเนิด มีการนำไปใช้ในฟิสิกส์พลาสมาภายใต้ชื่อการแจกแจง Langdon ซึ่งเป็นผลมาจากการแผ่รังสีเบร็มส์สตรัลลิงแบบผกผัน[ 9 ]
ใน ปัญหา การถดถอยเชิงเส้นที่จำลองเป็น ค่าประมาณความน่าจะเป็นสูงสุด ( MLE)จะเป็นค่าประมาณความน่าจะเป็นสูงสุด ( MLE ) โดยใช้ ค่า p-norm
คุณสมบัติ
ช่วงเวลา
ให้เป็นการกระจายแบบเกาส์เซียนทั่วไปที่มีค่าเฉลี่ยเป็นศูนย์ มีรูปร่างและพารามิเตอร์การปรับขนาด โมเมนต์ของ มีอยู่และมีค่าจำกัดสำหรับ ใดๆ ที่ มากกว่า สำหรับจำนวนเต็มที่ไม่เป็นลบใดๆ โมเมนต์กลางธรรมดาคือ[ 2 ]
ความเชื่อมโยงกับฟังก์ชันบวกแน่นอน
ฟังก์ชันความหนาแน่นความน่าจะเป็นของการแจกแจงปกติทั่วไปแบบสมมาตรเป็นฟังก์ชันบวกแน่นอน สำหรับ [ 10 ] [ 11 ]
การหารที่ไม่มีที่สิ้นสุด
การแจกแจงแบบเกาส์เซียนทั่วไปแบบสมมาตรเป็นการแจกแจงที่แบ่งได้ไม่จำกัด ก็ ต่อเมื่อ เท่านั้น [ 10 ]
การสรุปโดยทั่วไป
การแจกแจงปกติทั่วไปแบบหลายตัวแปร กล่าวคือ ผลคูณของ การแจกแจงกำลังเอกซ์โพเนนเชียลที่มี พารามิเตอร์เดียวกัน เป็นความหนาแน่นความน่าจะเป็นเพียงอย่างเดียวที่สามารถเขียนในรูปแบบและมีขอบเขตอิสระ[ 12 ]ผลลัพธ์สำหรับกรณีพิเศษของการแจกแจงปกติแบบหลายตัวแปรนั้น เดิมทีเป็นผลงานของแม็กซ์เวลล์[ 13 ]
เวอร์ชันอสมมาตร
| ปกติทั่วไปแบบไม่สมมาตร | |||
|---|---|---|---|
ฟังก์ชันความหนาแน่นความน่าจะเป็น | |||
ฟังก์ชันการกระจายสะสม | |||
| พารามิเตอร์ | ตำแหน่ง ( จริง ) มาตราส่วน (บวก, จริง ) รูปร่าง ( จริง ) | ||
| สนับสนุน | |||
| พีดี | แล้ว PDFมาตรฐานปกติ อยู่ ที่ไหน | ||
| ซีดีเอฟ | โดยที่ CDF ของ การแจกแจง ปกติมาตรฐานคือตำแหน่งใด | ||
| หมายถึง | |||
| ค่ามัธยฐาน | |||
| ความแปรปรวน | |||
| ความเบี่ยงเบน | |||
| ความโค้งส่วนเกิน | |||
การแจกแจงปกติทั่วไปแบบไม่สมมาตรเป็นตระกูลของการแจกแจงความน่าจะเป็นแบบต่อเนื่องซึ่งพารามิเตอร์รูปร่างสามารถใช้เพื่อแนะนำความไม่สมมาตรหรือความเบ้ได้[ 14 ] [ 15 ] เมื่อพารามิเตอร์รูปร่างเป็นศูนย์ จะได้การแจกแจงปกติ ค่าบวกของพารามิเตอร์รูปร่างจะให้การแจกแจงแบบเบ้ซ้ายที่มีขอบเขตด้านขวา และค่าลบของพารามิเตอร์รูปร่างจะให้การแจกแจงแบบเบ้ขวาที่มีขอบเขตด้านซ้าย เฉพาะเมื่อพารามิเตอร์รูปร่างเป็นศูนย์เท่านั้นที่ฟังก์ชันความหนาแน่นของการแจกแจงนี้จะเป็นบวกตลอดทั้งเส้นจำนวนจริง ในกรณีนี้ การแจกแจงจะเป็นการแจกแจงปกติ มิฉะนั้น การแจกแจงจะเป็นการ แจกแจงแบบลอกา ริทมิกปกติ แบบเลื่อนและอาจกลับด้านได้
การประมาณค่าพารามิเตอร์
สามารถประมาณค่าพารามิเตอร์ได้โดยใช้ วิธี การประมาณค่าความน่าจะเป็นสูงสุดหรือวิธีโมเมนต์ ค่าประมาณพารามิเตอร์ไม่มีสูตรตายตัว ดังนั้นจึงต้องใช้การคำนวณเชิงตัวเลขเพื่อหาค่าประมาณ เนื่องจากปริภูมิของตัวอย่าง (เซตของจำนวนจริงที่ความหนาแน่นไม่เป็นศูนย์) ขึ้นอยู่กับค่าที่แท้จริงของพารามิเตอร์ ผลลัพธ์มาตรฐานบางอย่างเกี่ยวกับประสิทธิภาพของการประมาณค่าพารามิเตอร์จึงไม่สามารถนำมาใช้ได้โดยอัตโนมัติเมื่อทำงานกับกลุ่มตัวแปรนี้
แอปพลิเคชัน
การแจกแจงปกติแบบทั่วไปที่ไม่สมมาตรสามารถใช้สร้างแบบจำลองค่าที่อาจมีการกระจายแบบปกติ หรืออาจเบ้ขวาหรือเบ้ซ้ายเมื่อเทียบกับการแจกแจงปกติได้ การแจกแจงปกติแบบเบ้เป็นอีกหนึ่งการแจกแจงที่มีประโยชน์สำหรับการสร้างแบบจำลองความเบี่ยงเบนจากภาวะปกติเนื่องจากความเบ้ การแจกแจงอื่นๆ ที่ใช้ในการสร้างแบบจำลองข้อมูลที่มีความเบ้ ได้แก่ การแจกแจงแกมมา การแจกแจงล็อก นอร์มั ล และ การแจกแจง ไวบูลแต่การแจกแจงเหล่านี้ไม่ได้รวมถึงการแจกแจงปกติเป็นกรณีพิเศษ
ความแตกต่างแบบ Kullback–Leibler ระหว่าง PDF สองไฟล์
ความแตกต่าง Kullback–Leibler (KLD) เป็นวิธีการที่ใช้ในการคำนวณความแตกต่างหรือความคล้ายคลึงกันระหว่างฟังก์ชันความหนาแน่นความน่าจะเป็นสองฟังก์ชัน[ 16 ]
ให้และเป็นการแจกแจงแบบเกาส์เซียนทั่วไปสองแบบที่มีพารามิเตอร์และภายใต้ข้อจำกัด . [ 17 ] จากนั้นความแตกต่างนี้จะกำหนดโดย:
การแจกแจงอื่นๆ ที่เกี่ยวข้องกับการแจกแจงปกติ
ตระกูลการแจกแจงปกติทั่วไปสองตระกูลที่กล่าวถึงในที่นี้ เช่นเดียวกับ ตระกูลการแจกแจง ปกติแบบเบ้เป็นตระกูลพาราเมตริกที่ขยายการแจกแจงปกติโดยการเพิ่มพารามิเตอร์รูปร่าง เนื่องจากบทบาทสำคัญของการแจกแจงปกติในความน่าจะเป็นและสถิติ การแจกแจงจำนวนมากจึงสามารถอธิบายได้ในแง่ของความสัมพันธ์กับการแจกแจงปกติ ตัวอย่างเช่น การแจกแจงลอการิทึมปกติ การแจกแจงปกติ แบบพับและ การแจกแจง ปกติผกผันถูกกำหนดให้เป็นการแปลงค่าที่แจกแจงแบบปกติ แต่แตกต่างจากตระกูลการแจกแจงปกติทั่วไปและการแจกแจงปกติแบบเบ้ตรงที่ การแจกแจงเหล่านี้ไม่ได้รวมการแจกแจงปกติเป็นกรณีพิเศษ
อันที่จริงแล้ว การแจกแจงทั้งหมดที่มีความแปรปรวนจำกัดนั้น ในขีดจำกัดแล้วมีความสัมพันธ์อย่างมากกับการแจกแจงปกติ การแจกแจง Student-t การแจกแจง Irwin-Hallและการแจกแจง Batesก็เป็นการขยายการแจกแจงปกติ และรวมถึงในการแจกแจงปกติในขีดจำกัดด้วย ดังนั้นจึงไม่มีเหตุผลที่ชัดเจนที่จะเลือกใช้การแจกแจงปกติแบบ "ทั่วไป" ประเภทที่ 1 เช่น มากกว่าการรวมกันของ Student-t และการแจกแจง Irwin-Hall ที่ขยายแบบปกติ – ซึ่งจะรวมถึงการแจกแจงแบบสามเหลี่ยม (ซึ่งไม่สามารถจำลองได้ด้วยการแจกแจงเกาส์เซียนแบบทั่วไปประเภทที่ 1)
สามารถสร้างการแจกแจงแบบสมมาตรที่สามารถจำลองพฤติกรรมทั้งส่วนหาง (ยาวและสั้น) และส่วนกลาง (เช่น แบบแบน แบบสามเหลี่ยม หรือแบบเกาส์เซียน) ได้อย่างอิสระโดยสมบูรณ์เช่น โดยใช้X = IH/ χ
การแจกแจงแบบ Tukey g และ hยังอนุญาตให้มีการเบี่ยงเบนจากภาวะปกติ ทั้งผ่านความเบี่ยงเบนและหางที่หนา[ 18 ]
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การแจกแจงปกติทั่วไป
การ แจกแจงปกติทั่วไป ( GND ) หรือ การแจกแจงเกาส์เซียนทั่วไป ( GGD ) เป็นหนึ่งในสองตระกูลของ การแจกแจงความน่าจะเป็นต่อเนื่อง บน เส้น จำนวนจริง แบบ พาราเมตริก ทั้งสองตระกูลนี้เพิ่ม...
เวอร์ชันสมมาตร
เบต้า 2 α Γ ( 1 / เบต้า ) อี − ( | x − μ | / α ) เบต้า {\displaystyle {\frac {\beta }{2\alpha \Gamma (1/\beta )}}\;e^{-(|x-\mu |/\alpha )^{\beta }}}
การประมาณค่าพารามิเตอร์
การประมาณค่าพารามิเตอร์โดยใช้ ความน่าจะเป็นสูงสุด และ วิธีการของโมเมนต์ ได้รับการศึกษาแล้ว [ 4 ] ค่าประมาณไม่มีรูปแบบปิดและต้องได้รับมาโดยวิธีการเชิงตัวเลข นอกจากนี้ยังมีการเสนอตัวประมาณค่าที่ไม่ต้องใช้การคำนวณเชิงตัวเลขอีกด้วย [ 5 ]
แอปพลิเคชัน
การแจกแจงปกติทั่วไปแบบสมมาตรถูกนำมาใช้ในการสร้างแบบจำลองเมื่อความเข้มข้นของค่ารอบค่าเฉลี่ยและพฤติกรรมส่วนหางเป็นสิ่งที่น่าสนใจเป็นพิเศษ [ 7 ] [ 8 ] สามารถใช้ตระกูลการแจกแจงอื่นๆ ได้หากเน้นที่ความเบี่ยงเบนอื่นๆ จากภาวะปกติ หาก ความสมมาตร...