อ่าน 34 นาที
การกระจายแบบปกติหลายตัวแปร
ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจง ปกติหลายตัวแปร การ แจกแจงเกาส์เซียนหลายตัวแปร หรือ การแจกแจงปกติร่วม เป็นการขยายความของ การแจกแจงปกติ หนึ่งมิติ ( ตัวแปรเดียว ) ไปสู่...
การกระจายแบบปกติหลายตัวแปร
| ปกติหลายตัวแปร | |||
|---|---|---|---|
ฟังก์ชันความหนาแน่นความน่าจะเป็น จุดตัวอย่างจำนวนมากจาก1การแจกแจงปกติหลายตัวแปรที่มีและแสดงร่วมกับวงรี 3 ซิกมา การแจกแจงขอบทั้งสอง และฮิสโตแกรม 1 มิติสองอัน | |||
| สัญกรณ์ | |||
| พารามิเตอร์ | μ ∈ R k —ตำแหน่งΣ ∈ R k × k —ความแปรปรวนร่วม (เมทริกซ์กึ่งกำหนดเชิงบวก ) | ||
| สนับสนุน | x ∈ μ + span( Σ ) ⊆ R k | ||
| พีดี | มีอยู่เฉพาะเมื่อΣเป็นเมทริกซ์บวกแน่นอนเท่านั้น | ||
| หมายถึง | μ | ||
| โหมด | μ | ||
| ความแปรปรวน | Σ | ||
| เอนโทรปี | |||
| เอ็มจีเอฟ | |||
| ซีเอฟ | |||
| ความแตกต่าง Kullback–Leibler | ดู§ ความแตกต่างระหว่าง Kullback และ Leibler | ||
ในทฤษฎีความน่าจะเป็นและสถิติ การ แจกแจงปกติหลายตัวแปรการแจกแจงเกาส์เซียนหลายตัวแปรหรือการแจกแจงปกติร่วม เป็นการขยายความของ การแจกแจงปกติหนึ่งมิติ ( ตัวแปรเดียว ) ไปสู่ มิติที่สูงกว่านิยามหนึ่งคือเวกเตอร์สุ่มจะมีการแจกแจงปกติk ตัวแปร ถ้า ผลรวมเชิงเส้น ทุกตัว ของ ส่วนประกอบ k ตัวของมัน มีการแจกแจงปกติตัวแปรเดียว ความสำคัญของมันส่วนใหญ่มาจากทฤษฎีบทลิมิตกลางหลายตัวแปรการแจกแจงปกติหลายตัวแปรมักใช้เพื่ออธิบายอย่างน้อยโดยประมาณ ชุดของตัวแปรสุ่มค่าจริงที่ อาจ มีความสัมพันธ์กันซึ่งแต่ละตัวจะรวมกลุ่มกันอยู่รอบค่าเฉลี่ย
คำจำกัดความ
สัญลักษณ์และการกำหนดพารามิเตอร์
การแจกแจงปกติหลายตัวแปรของเวกเตอร์สุ่มk มิติ สามารถเขียนได้ในรูปแบบต่อไปนี้:
หรือเพื่อระบุอย่างชัดเจนว่ามีมิติ k
ด้วยเวกเตอร์ค่าเฉลี่ยkมิติ
โดยที่และเมทริกซ์ผกผันของเมทริกซ์ความแปรปรวนร่วมเรียกว่าเมทริกซ์ความแม่นยำซึ่งใช้สัญลักษณ์ แทนด้วย
เวกเตอร์สุ่มปกติมาตรฐาน
เวกเตอร์สุ่ม จริงเรียกว่าเวกเตอร์สุ่มปกติมาตรฐานถ้าส่วนประกอบทั้งหมดเป็นอิสระต่อกัน และแต่ละเวกเตอร์เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง ซึ่งมีการแจกแจงแบบปกติ กล่าวคือ ถ้าสำหรับทุก[ 1 ] :หน้า 454
เวกเตอร์สุ่มปกติแบบศูนย์กลาง
เวกเตอร์สุ่มจริงเรียกว่าเวกเตอร์สุ่มปกติแบบศูนย์กลางถ้ามีเมทริกซ์ อยู่ เช่นนั้นซึ่งมีการแจกแจงแบบเดียวกันกับโดยที่เป็นเวกเตอร์สุ่มปกติมาตรฐานที่มีส่วนประกอบ[ 1 ] : หน้า 454
เวกเตอร์สุ่มปกติ
เวกเตอร์สุ่มจริงเรียกว่าเวกเตอร์สุ่มปกติถ้ามีเวกเตอร์ สุ่ม ซึ่งเป็นเวกเตอร์สุ่มปกติมาตรฐาน เวกเตอร์และเมทริกซ์เช่นนั้น[ 2 ] :หน้า 454 [ 1 ] : หน้า 455
อย่างเป็นทางการ:
ในที่นี้เมทริกซ์ความแปรปรวนร่วมคือ.
ใน กรณี พิเศษที่เมทริกซ์ความแปรปรวนร่วม เป็นเมทริกซ์ เอกฐาน การแจกแจงที่สอดคล้องกันจะไม่มีความหนาแน่น โปรดดูรายละเอียด ใน ส่วนด้านล่าง กรณีนี้เกิดขึ้นบ่อยใน ทางสถิติตัวอย่างเช่น ในการแจกแจงของเวกเตอร์ของค่าคลาดเคลื่อนในการถดถอยกำลังสองน้อยที่สุดแบบธรรมดาโดยทั่วไปแล้ว ค่า คลาดเคลื่อน เหล่านี้ จะไม่เป็นอิสระต่อกัน สามารถมองได้ว่าเป็นผลลัพธ์ของการใช้เมทริกซ์กับกลุ่มของตัวแปรเกาส์เซียนที่เป็นอิสระต่อกัน
คำจำกัดความที่เทียบเท่ากัน
คำจำกัดความต่อไปนี้เทียบเท่ากับคำจำกัดความที่ให้ไว้ข้างต้น เวกเตอร์สุ่มมีการแจกแจงแบบปกติหลายตัวแปรก็ต่อเมื่อเป็นไปตามเงื่อนไขที่เทียบเท่ากันข้อใดข้อหนึ่งต่อไปนี้
- ผลรวมเชิงเส้นทุกรูปแบบของส่วนประกอบต่างๆ ของตัวแปรสุ่มนี้ จะมีการกระจายแบบปกติกล่าวคือ สำหรับเวกเตอร์คงที่ใดๆตัวแปรสุ่มจะมีการกระจายแบบปกติแบบเอกตัวแปร โดยที่การกระจายแบบปกติแบบเอกตัวแปรที่มีความแปรปรวนเป็นศูนย์ จะเป็นจุดมวลบนค่าเฉลี่ยของ เวกเตอร์นั้น
- มีเวกเตอร์kมิติ และเมทริกซ์สมมาตรบวกกึ่งกำหนดโดยที่ฟังก์ชันลักษณะเฉพาะของคือ
การกระจายปกติทรงกลมสามารถกำหนดลักษณะได้ว่าเป็นการกระจายที่ไม่ซ้ำกันซึ่งส่วนประกอบต่างๆ เป็นอิสระในระบบพิกัดตั้งฉากใดๆ[ 3 ] [ 4 ]
ฟังก์ชันความหนาแน่น

กรณีที่ไม่เสื่อมถอย
การกระจายแบบปกติหลายตัวแปรเรียกว่า "ไม่เสื่อมสภาพ" เมื่อเมทริกซ์ความแปรปรวน ร่วมสมมาตร เป็นบวกแน่นอนในกรณีนี้การกระจายจะมีความหนาแน่น[ 5 ]
โดยที่เป็น เวกเตอร์คอลัมน์ kมิติที่เป็นจำนวนจริง และเป็นดีเทอร์มิแนนต์ของซึ่งเรียกอีกอย่างว่าความแปรปรวนทั่วไป สมการข้างต้นจะลดรูปเป็นสมการของการแจกแจงปกติแบบเอกตัวแปร ถ้าเป็นเมทริกซ์ (กล่าวคือ เป็นจำนวนจริงตัวเดียว)
รูปแบบ การแจกแจงปกติเชิงซ้อนแบบสมมาตรวงกลมนั้นมีลักษณะที่แตกต่างออกไปเล็กน้อย
แต่ละเส้นไอโซเดนซิตี้โลคัสซึ่งเป็นเส้นของจุดใน ปริภูมิ kมิติ ที่แต่ละจุดให้ค่าความหนาแน่นเดียวกันนั้น เป็นรูปวงรีหรือการขยายความในมิติที่สูงกว่าของวงรี ดังนั้น การแจกแจงปกติแบบหลายตัวแปรจึงเป็นกรณีพิเศษของการแจกแจงแบบวงรี
ปริมาณนี้เรียกว่าระยะทางมาฮาลาโนบิสซึ่งแสดงถึงระยะห่างของจุดทดสอบจากค่าเฉลี่ยระยะทางมาฮาลาโนบิสยกกำลังสอง จะถูกแยกออกเป็นผลรวมของkเทอม โดยแต่ละเทอมเป็นผลคูณของส่วนประกอบที่มีความหมายสามส่วน[ 6 ] โปรดทราบว่าในกรณีที่การแจกแจงจะลดลงเหลือการแจกแจงปกติแบบเอกตัวแปร และระยะทางมาฮาลาโนบิสจะลดลงเหลือค่าสัมบูรณ์ของคะแนนมาตรฐาน ดู ช่วงด้านล่าง ด้วย
กรณีสองตัวแปร
ในกรณี 2 มิติที่ไม่เอกฐาน ( ) ฟังก์ชันความหนาแน่นความน่าจะเป็นของเวกเตอร์คือ: โดยที่คือความสัมพันธ์ระหว่างและโดยที่และในกรณีนี้
ในกรณีสองตัวแปร เงื่อนไขเทียบเท่าแรกสำหรับการสร้างใหม่ของความปกติแบบหลายตัวแปรสามารถทำให้มีความเข้มงวดน้อยลงได้ เนื่องจากเพียงพอที่จะตรวจสอบว่า เซต ที่นับได้อนันต์ของผลรวมเชิงเส้นที่แตกต่างกันของและเป็นปกติ เพื่อสรุปได้ว่าเวกเตอร์ของ เป็นปกติแบบสองตัวแปร[ 7 ]
เส้นไอโซเดนซิตี้แบบสองตัวแปรที่พล็อตใน ระนาบ - เป็นรูปวงรี โดย แกนหลักของ วงรี ถูกกำหนดโดยเวกเตอร์ลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม ( เส้นผ่านศูนย์กลางครึ่งใหญ่และครึ่งเล็กของวงรีเท่ากับรากที่สองของค่าลักษณะเฉพาะที่เรียงลำดับแล้ว)

เมื่อค่าสัมบูรณ์ของพารามิเตอร์สหสัมพันธ์ เพิ่มขึ้น จุดเหล่านี้จะถูกบีบเข้าหาเส้นต่อไปนี้:
เนื่องจากนิพจน์นี้ โดยที่ sgn คือฟังก์ชันเครื่องหมายถูกแทนที่ด้วยเป็นการทำนายเชิงเส้นที่ไม่เอนเอียงที่ดีที่สุดของเมื่อกำหนดค่าของ[ 8 ]
กรณีที่เสื่อมทราม
ถ้าเมทริกซ์ความแปรปรวนร่วมไม่มีอันดับเต็ม การแจกแจงปกติหลายตัวแปรจะเสื่อมสภาพและไม่มีความหนาแน่น กล่าวคือ ไม่มีความหนาแน่นเมื่อเทียบกับการวัดเลเบส แบบ kมิติ(ซึ่งเป็นการวัดที่ใช้กันโดยทั่วไปในหลักสูตรความน่าจะเป็นระดับแคลคูลัส) เฉพาะเวกเตอร์สุ่มที่มีการแจกแจงต่อเนื่องอย่างสมบูรณ์เมื่อเทียบกับการวัดเท่านั้นที่จะกล่าวได้ว่ามีความหนาแน่น (เมื่อเทียบกับการวัดนั้น) เพื่อที่จะพูดถึงความหนาแน่นแต่หลีกเลี่ยงการจัดการกับความซับซ้อนทางทฤษฎีการวัด อาจจะง่ายกว่าที่จะจำกัดความสนใจไปที่เซตย่อยของพิกัดของซึ่งเมทริกซ์ความแปรปรวนร่วมสำหรับเซตย่อยนี้เป็นบวกแน่นอน จากนั้นพิกัดอื่นๆ อาจถูกมองว่าเป็นฟังก์ชันเชิงเส้นของพิกัดที่เลือกเหล่านี้[ 9 ]
เพื่อที่จะพูดถึงความหนาแน่นอย่างมีความหมายในกรณีพิเศษ เราจึงต้องเลือกมาตรวัดฐานที่แตกต่างออกไป โดยใช้ทฤษฎีบทการสลายตัวเราสามารถกำหนดข้อจำกัดของมาตรวัดเลเบสไปยังปริภูมิย่อยเชิงเส้นตรงมิติ n ของซึ่งการแจกแจงแบบเกาส์เซียนได้รับการรองรับ นั่นคือ. เมื่อเทียบกับมาตรวัดนี้ การแจกแจงจะมีค่าความหนาแน่นตามรูปแบบต่อไปนี้:
โดยที่คือตัวผกผันทั่วไปและคือดีเทอร์มิแนนต์เทียม[ 10 ]
ฟังก์ชันการกระจายสะสม
แนวคิดของฟังก์ชันการกระจายสะสม (cdf) ในมิติ 1 สามารถขยายไปสู่กรณีหลายมิติได้สองวิธี โดยอาศัยพื้นที่รูปสี่เหลี่ยมผืนผ้าและพื้นที่รูปวงรี
วิธีแรกคือการกำหนด cdf ของเวกเตอร์สุ่มเป็นความน่าจะเป็นที่ส่วนประกอบทั้งหมดของ เวกเตอร์สุ่ม มีค่าน้อยกว่าหรือเท่ากับค่าที่สอดคล้องกันในเวกเตอร์สุ่ม: [ 11 ]
แม้ว่าจะไม่มีรูปแบบปิดสำหรับ แต่ก็มีอัลกอริทึมจำนวนหนึ่งที่ประมาณค่าเป็นตัวเลข[ 11 ] [ 12 ]
อีกวิธีหนึ่งคือการกำหนด cdf เป็นความน่าจะเป็นที่ตัวอย่างจะอยู่ภายในทรงรีที่กำหนดโดยระยะทาง Mahalanobisจาก Gaussian ซึ่งเป็นการวางนัยทั่วไปโดยตรงของค่าเบี่ยงเบนมาตรฐาน[ 13 ] เพื่อคำนวณค่าของฟังก์ชันนี้ มีสูตรวิเคราะห์แบบปิด[ 13 ]ดังต่อไปนี้
ช่วงเวลา
ช่วงของการแจกแจงปกติหลายตัวแปรให้บริเวณที่ประกอบด้วยเวกเตอร์x ที่สอดคล้องกับเงื่อนไขต่อ ไปนี้
นี่คือเวกเตอร์มิติ n, คือเวกเตอร์ค่าเฉลี่ยมิติ n ที่ทราบ, คือเมทริกซ์ความแปรปรวน ร่วมที่ทราบ และคือ ฟังก์ชันควอนไทล์สำหรับความน่าจะเป็นของการแจกแจงไคกำลังสองที่มีองศาอิสระ[ 14 ] เมื่อนิพจน์กำหนดภายในของวงรีและการแจกแจงไคกำลังสองจะลดรูปเป็นการแจกแจงเอกซ์โพเนนเชียลที่มีค่าเฉลี่ยเท่ากับสอง (อัตราเท่ากับครึ่ง)
ฟังก์ชันการกระจายสะสมเสริม (การกระจายส่วนหาง)
ฟังก์ชัน การกระจายสะสมเสริม (ccdf) หรือการกระจายส่วนหาง ถูกกำหนดเป็นเมื่อแล้ว ccdf สามารถเขียนได้เป็นความน่าจะเป็นสูงสุดของตัวแปรเกาส์เซียนที่ขึ้นอยู่กัน: [ 15 ]
แม้ว่าจะไม่มีสูตรปิดที่ง่ายสำหรับการคำนวณ ccdf แต่ค่าสูงสุดของตัวแปรเกาส์เซียนที่ขึ้นอยู่กันสามารถประมาณได้อย่างแม่นยำผ่านวิธีการมอนเตคาร์โล[ 15 ] [ 16 ]
คุณสมบัติ
ช่วงเวลา
โมเมนต์ลำดับที่k ของ x กำหนดโดย
โดยที่r 1 + r 2 + ⋯ + r N = k .
โมเมนต์กลางลำดับที่ k มีดังต่อไปนี้
- ถ้าkเป็นจำนวนคี่μ 1, ..., N ( x − μ ) = 0
- ถ้าkเป็นจำนวนคู่ โดยที่k = 2 λแล้ว
โดยผลรวมจะคำนวณจากการจัดสรรเซตทั้งหมดลงใน คู่ λ (ไม่เรียงลำดับ) คู่ นั่นคือ สำหรับ โมเมนต์กลางลำดับที่ k (= 2 λ = 6)จะบวกผลคูณของค่า ความแปรปรวนร่วม λ = 3ค่า (โดยถือว่าค่าคาดหวังμเป็น 0 เพื่อความเรียบง่าย):
ผลลัพธ์ที่ได้คือพจน์ในผลรวม (15 พจน์ในกรณีข้างต้น) โดยแต่ละพจน์เป็นผลคูณของ ค่าความแปรปรวนร่วม λ (ในกรณีนี้คือ 3) สำหรับโมเมนต์ลำดับที่สี่ (สี่ตัวแปร) จะมีสามพจน์ สำหรับโมเมนต์ลำดับที่หกจะมี3 × 5 = 15พจน์ และสำหรับโมเมนต์ลำดับที่แปดจะมี3 × 5 × 7 = 105พจน์
จากนั้นจะกำหนดค่าความแปรปรวนร่วมโดยการแทนที่พจน์ในรายการด้วยพจน์ที่สอดคล้องกันในรายการที่ประกอบด้วย เลข 1 จำนวน r 1ตัว จากนั้น เลข 2 จำนวน r 2ตัว เป็นต้น เพื่อให้เห็นภาพชัดเจน ลองพิจารณากรณีโมเมนต์กลางลำดับที่ 4 ต่อไปนี้:
โดยที่คือค่าความแปรปรวนร่วมของX iและX jด้วยวิธีข้างต้น ขั้นแรกจะหาค่าทั่วไปสำหรับโมเมนต์ที่k ที่มี ตัวแปรXที่แตกต่างกันkตัว แล้วจึงลดรูปให้ง่ายขึ้นตามนั้น ตัวอย่างเช่น สำหรับ ให้X i = X j และใช้ข้อเท็จจริงที่ว่า
ฟังก์ชันของเวกเตอร์ปกติ
รูปแบบกำลังสองของเวกเตอร์ปกติ( โดยที่เป็นเมทริกซ์เป็นเวกเตอร์ และเป็นสเกลาร์) คือ ตัวแปรไค กำลังสองทั่วไปทิศทางของเวกเตอร์ปกติเป็นไปตามการแจกแจงปกติที่ฉายภาพ[ 17 ]
ถ้าเป็นฟังก์ชันค่าสเกลาร์ทั่วไปของเวกเตอร์ปกติฟังก์ชันความหนาแน่นความน่าจะเป็น ฟังก์ชันการกระจายสะสมและฟังก์ชันการกระจายสะสมผกผันสามารถคำนวณได้ด้วยวิธีการเชิงตัวเลขของการติดตามรังสี ( โค้ด Matlab เก็บถาวรเมื่อ 2025-02-20 ที่Wayback Machine )
ฟังก์ชันความน่าจะเป็น
ถ้าทราบค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วม ค่าลอการิทึมความน่าจะเป็นของเวกเตอร์ที่สังเกตได้ก็คือค่าลอการิทึมของฟังก์ชันความหนาแน่นความน่าจะเป็นนั่นเอง
- ,
กรณีเชิงซ้อนที่ไม่เป็นศูนย์กลางที่มีสมมาตรแบบวงกลม โดยที่เป็นเวกเตอร์ของจำนวนเชิงซ้อน จะเป็นดังนี้
กล่าวคือ ใช้การสลับตำแหน่งแบบสังยุค (ระบุด้วย) แทนที่การสลับตำแหน่ง แบบปกติ (ระบุด้วย) ซึ่งแตกต่างจากกรณีจริงเล็กน้อย เนื่องจากรูปแบบสมมาตรแบบวงกลมของการแจกแจงปกติเชิงซ้อน มีรูปแบบของ ค่าคงที่การทำให้เป็นมาตรฐานที่ แตกต่างกันเล็กน้อย
มีการใช้สัญลักษณ์ที่คล้ายกันสำหรับการถดถอยเชิงเส้นหลายตัวแปร[ 18 ]
เนื่องจากค่าลอการิทึมความน่าจะเป็นของเวกเตอร์ปกติเป็นรูปแบบกำลังสองของเวกเตอร์ปกติ จึงทำให้เวกเตอร์ปกติมีการแจกแจงแบบ ไคกำลังสองทั่วไป
เอนโทรปีเชิงอนุพันธ์
เอนโทรปีเชิงอนุพันธ์ของการกระจายปกติหลายตัวแปรคือ[ 19 ]
โดยที่ขีดคั่นแสดงถึง ดีเทอร์มิแน น ต์ของเมทริกซ์ k คือมิติของปริภูมิเวกเตอร์ และผลลัพธ์มีหน่วยเป็นnats
ความแตกต่าง Kullback–Leibler
ความแตกต่าง Kullback –Leiblerจากถึงสำหรับเมทริกซ์ที่ไม่เอกฐาน Σ 1และ Σ 0คือ: [ 20 ]
โดยที่แทนดีเทอร์มิแนนต์ของเมทริกซ์คือ ผลรวมของผลต่างระหว่างเมทริกซ์ กับเมทริกซ์ (trace ) คือลอการิทึมธรรมชาติและคือมิติของปริภูมิเวกเตอร์
ต้องใช้ลอการิทึมฐานe เนื่องจากพจน์สองพจน์ที่ตามหลังลอการิทึมนั้นเป็นลอการิทึมฐานe ของนิพจน์ที่เป็นตัวประกอบของฟังก์ชันความหนาแน่นหรือเกิดขึ้นเองตามธรรมชาติ ดังนั้นสมการจึงให้ผลลัพธ์ที่วัดเป็นnatsการหารนิพจน์ทั้งหมดข้างต้นด้วย log e² จะได้ค่าความแตกต่างในหน่วยบิต
เมื่อไร,
ข้อมูลร่วมกัน
ข้อมูลร่วมกันของการกระจายปกติหลายตัวแปรสองแบบเป็นกรณีพิเศษของความแตกต่าง Kullback–Leiblerซึ่งคือการกระจายหลายตัวแปรแบบมิติเต็ม และคือผลคูณของการกระจายขอบมิติและและโดยที่ข้อมูลร่วมกันระหว่างและกำหนดโดย: [ 21 ]
ที่ไหน
ถ้าเป็นผลคูณของการแจกแจงปกติแบบหนึ่งมิติ ในสัญลักษณ์ของส่วนความแตกต่าง Kullback–Leiblerในบทความนี้จะเป็นเมทริกซ์แนวทแยงที่มีค่าในแนวทแยงคือ, และสูตรที่ได้สำหรับข้อมูลร่วมกันคือ:
เมท ริก ซ์สหสัมพันธ์ที่สร้างขึ้นจาก[ 22 ]
ในกรณีสองตัวแปร สูตรสำหรับข้อมูลร่วมคือ:
ความปกติของข้อต่อ
การกระจายแบบปกติและเป็นอิสระต่อกัน
ถ้าและมีการแจกแจงแบบปกติและเป็นอิสระต่อกันนั่นหมายความว่าตัวแปรทั้งสองมีการแจกแจงแบบปกติร่วมกัน กล่าวคือ ตัวแปรทั้งสองต้องมีการแจกแจงแบบปกติหลายตัวแปร อย่างไรก็ตาม ตัวแปรสองตัวที่มีการแจกแจงแบบปกติร่วมกันไม่จำเป็นต้องเป็นอิสระต่อกัน (จะเป็นอิสระต่อกันก็ต่อเมื่อไม่มีความสัมพันธ์กันเท่านั้น)
ตัวแปรสุ่มที่มีการแจกแจงแบบปกติสองตัวไม่จำเป็นต้องมีการแจกแจงแบบปกติร่วมกันแบบทวิภาค
ข้อเท็จจริงที่ว่าตัวแปรสุ่มสองตัวและต่างก็มีการแจกแจงแบบปกติ ไม่ได้หมายความว่าตัวแปรสุ่มทั้งสองนั้นมีการแจกแจงแบบปกติร่วมกัน ตัวอย่างง่ายๆ คือ กรณีที่มีการแจกแจงแบบปกติโดยมีค่าเฉลี่ย 0 และความแปรปรวน 1 และถ้าและถ้าโดยที่มีตัวอย่างค้านที่คล้ายกันสำหรับตัวแปรสุ่มมากกว่าสองตัว โดยทั่วไปแล้ว ผลรวมของตัวอย่างเหล่านี้จะได้เป็นแบบ จำลองผสม
ความสัมพันธ์และความเป็นอิสระ
โดยทั่วไป ตัวแปรสุ่มอาจไม่มีความสัมพันธ์กันแต่มีความสัมพันธ์กันทางสถิติ แต่ถ้าเวกเตอร์สุ่มมีการกระจายแบบปกติหลายตัวแปรแล้ว ส่วนประกอบสองส่วนขึ้นไปที่ไม่มีความสัมพันธ์กันจะเป็นอิสระต่อกันนั่นหมายความว่า ส่วนประกอบสองส่วนขึ้นไปที่เป็นอิสระต่อกันเป็นคู่ๆก็จะเป็นอิสระต่อกันด้วย แต่ดังที่ได้กล่าวไว้ข้างต้นแล้วไม่ เป็น ความจริงที่ว่าตัวแปรสุ่มสองตัวที่ ( แยกกันหรือตามสัดส่วน) มีการกระจายแบบปกติและไม่มีความสัมพันธ์กันจะเป็นอิสระต่อกัน
การแจกแจงแบบมีเงื่อนไข
ถ้าxที่มีมิติNถูกแบ่งออกดังต่อไปนี้
และด้วยเหตุนี้μและΣจึงถูกแบ่งออกดังต่อไปนี้
จากนั้นการแจกแจงของx 1โดยมีเงื่อนไขว่าx 2 = aจะเป็นแบบปกติหลายตัวแปร[ 23 ] ( x 1 | x 2 = a ) ~ N ( μ , Σ )โดยที่
และเมทริกซ์ความแปรปรวนร่วม
นี่คืออินเวอร์สทั่วไปของเมทริกซ์นี้คือคอมพลีเมนต์ของ SchurของΣ 22ในΣนั่นคือ สมการข้างต้นเทียบเท่ากับการผกผันเมทริกซ์ความแปรปรวนร่วมโดยรวม ตัดแถวและคอลัมน์ที่สอดคล้องกับตัวแปรที่ถูกกำหนดเงื่อนไขออก แล้วผกผันกลับเพื่อให้ได้เมทริกซ์ความแปรปรวนร่วมแบบมีเงื่อนไข
โปรดทราบว่าการทราบว่าx 2 = aจะทำให้ค่าความแปรปรวนเปลี่ยนแปลงไป แม้ว่าค่าความแปรปรวนใหม่จะไม่ขึ้นอยู่กับค่าa ที่เฉพาะเจาะจงก็ตาม และที่น่าประหลาดใจยิ่งกว่านั้นคือ ค่าเฉลี่ยจะเปลี่ยนไปลองเปรียบเทียบกับสถานการณ์ที่ไม่ทราบค่าaซึ่งในกรณีนี้x 1จะมีการกระจายตัว แบบ
ข้อเท็จจริงที่น่าสนใจอย่างหนึ่งที่ได้มาเพื่อพิสูจน์ผลลัพธ์นี้คือ เวกเตอร์สุ่มและเป็นอิสระต่อกัน
เมทริกซ์Σ 12 Σ 22 −1เรียกว่าเมทริกซ์สัมประสิทธิ์ การถดถอย
กรณีสองตัวแปร
ในกรณีสองตัวแปรที่xถูกแบ่งออกเป็นและการแจกแจงแบบมีเงื่อนไขของเมื่อกำหนดคือ[ 25 ]
ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างและคือค่าใด
ความคาดหวังแบบมีเงื่อนไขสองตัวแปร
ในกรณีทั่วไป
ค่าคาดหวังแบบมีเงื่อนไขของ X 1เมื่อกำหนดให้ X 2คือ:
พิสูจน์: ผลลัพธ์ได้มาจากการหาค่าเฉลี่ยของการแจกแจงแบบมีเงื่อนไขข้างต้น
ในกรณีที่ค่าเบี่ยงเบนมาตรฐานมีค่าเท่ากับหนึ่ง
ค่าคาดหวังแบบมีเงื่อนไขของX 1เมื่อกำหนดให้X 2คือ
และความแปรปรวนแบบมีเงื่อนไขคือ
ดังนั้น ความ แปรปรวน แบบมีเงื่อนไข จึงไม่ขึ้นอยู่กับx²
ความคาดหวังแบบมีเงื่อนไขของX 1เมื่อกำหนดให้X 2มีค่าน้อยกว่า/มากกว่าzคือ: [ 26 ] : 367
โดยอัตราส่วนสุดท้ายในที่นี้เรียกว่า อัตราส่วนมิล ส์ ผกผัน
พิสูจน์: ผลลัพธ์สองข้อสุดท้ายได้มาจากการใช้ผลลัพธ์ดังนั้น
- จากนั้นจึงใช้คุณสมบัติของค่าคาดหวังของการแจกแจงปกติแบบตัดทอน
การกระจายแบบมาร์จินัล
เพื่อให้ได้การแจกแจงแบบมาร์จินัลเหนือเซตย่อยของตัวแปรสุ่มปกติหลายตัวแปร จำเป็นต้องตัดตัวแปรที่ไม่เกี่ยวข้อง (ตัวแปรที่ต้องการแยกออก) ออกจากเวกเตอร์ค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วม การพิสูจน์นี้เป็นไปตามคำจำกัดความของการแจกแจงปกติหลายตัวแปรและพีชคณิตเชิงเส้น[ 27 ]
ตัวอย่าง
ให้X = [ X 1 , X 2 , X 3 ]เป็นตัวแปรสุ่มปกติหลายตัวแปรที่มีเวกเตอร์ค่าเฉลี่ยμ = [ μ 1 , μ 2 , μ 3 ]และเมทริกซ์ความแปรปรวนร่วมΣ (การกำหนดพารามิเตอร์มาตรฐานสำหรับการแจกแจงปกติหลายตัวแปร) แล้วการแจกแจงร่วมของX ′ = [ X 1 , X 3 ]เป็นการแจกแจงปกติหลายตัวแปรที่มีเวกเตอร์ค่าเฉลี่ยμ ′ = [ μ 1 , μ 3 ]และเมทริกซ์ความแปรปรวนร่วม Σ
การแปลงเชิงเส้น
ถ้าY = c + BXเป็นการแปลงเชิงเส้นของโดยที่cเป็นเวกเตอร์ของค่าคงที่ และBเป็นเมทริกซ์คงที่ แล้วYจะมีการแจกแจงปกติแบบหลายตัวแปร โดยมีค่าคาดหวังc + BμและความแปรปรวนBΣB Tกล่าวคือโดยเฉพาะอย่างยิ่ง เซตย่อยใดๆ ของX iก็มีการแจกแจงแบบมาร์จินัลที่เป็นการแจกแจงปกติแบบหลายตัวแปรเช่นกัน เพื่อให้เห็นภาพนี้ ลองพิจารณาตัวอย่างต่อไปนี้: ในการดึงเซตย่อย ( X 1 , X 2 , X 4 ) T ออกมา ให้ ใช้
ซึ่งจะแยกองค์ประกอบที่ต้องการออกมาโดยตรง
อีกผลลัพธ์หนึ่งคือ การแจกแจงของZ = b · Xโดยที่bเป็นเวกเตอร์คงที่ที่มีจำนวนองค์ประกอบเท่ากับXและจุดแสดงถึงผล คูณดอท เป็นการแจกแจงแบบเกาส์เซียนแบบเอกตัวแปรที่มี ผลลัพธ์นี้ได้มาจากการใช้
สังเกตว่าคุณสมบัติความเป็นบวกแน่นอนของΣบ่งชี้ว่าค่าความแปรปรวนของผลคูณดอทต้องเป็นบวก
การแปลงเชิงเส้นของX เช่น 2X ไม่เหมือนกับผลรวมของสองการรับรู้ที่เป็นอิสระของX
การตีความทางเรขาคณิต
เส้นโค้งความหนาแน่นเท่ากันของการกระจายปกติหลายตัวแปรที่ไม่เอกฐานคือทรงรี (เช่น การแปลงเชิงเส้นของไฮเปอร์สเฟียร์ ) ที่มีจุดศูนย์กลางอยู่ที่ค่าเฉลี่ย[ 28 ]ดังนั้นการกระจายปกติหลายตัวแปรจึงเป็นตัวอย่างของคลาสของการกระจายแบบวงรีทิศทางของแกนหลักของทรงรีจะกำหนดโดยเวกเตอร์ลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม ความยาวสัมพัทธ์กำลังสองของแกนหลักจะกำหนดโดยค่าลักษณะเฉพาะที่สอดคล้องกัน
ถ้าΣ = UΛU T = UΛ 1/2 ( UΛ 1/2 ) Tเป็นการแยกส่วนประกอบค่าลักษณะเฉพาะโดยที่คอลัมน์ของUคือเวกเตอร์ลักษณะเฉพาะหน่วย และΛคือเมทริกซ์แนวทแยงของค่าลักษณะเฉพาะ แล้วเราจะได้ว่า
นอกจากนี้Uสามารถเลือกให้เป็นเมทริกซ์การหมุนได้ เนื่องจาก การกลับแกนไม่มีผลต่อN (0, Λ ) แต่การกลับคอลัมน์จะเปลี่ยนเครื่องหมายของ ดีเทอร์มิแน น ต์ ของ UการกระจายN ( μ , Σ ) ก็คือN (0, I ) ที่ถูกปรับขนาดด้วยΛ 1/2หมุนด้วยUและเลื่อนด้วยμ
ในทางกลับกัน การเลือกค่าμ ใดๆ เมทริกซ์ Uที่มีอันดับเต็มและค่าแนวทแยงมุม Λ i ที่เป็นบวก จะทำให้ได้การแจกแจงปกติหลายตัวแปรที่ไม่เป็นเอกฐาน หาก Λ i ใดๆ เป็นศูนย์และUเป็นเมทริกซ์จัตุรัส เมทริกซ์ความแปรปรวนร่วมUΛU T ที่ได้จะ เป็นเอกฐานในทางเรขาคณิต หมายความว่าทรงรีตามเส้นโค้งทุกอันจะบางมากจนไม่มีที่สิ้นสุดและมีปริมาตรเป็นศูนย์ใน ปริภูมิ nมิติ เนื่องจากแกนหลักอย่างน้อยหนึ่งแกนมีความยาวเป็นศูนย์ นี่คือกรณีเสื่อมสภาพ
"รัศมีรอบค่าเฉลี่ยที่แท้จริงในตัวแปรสุ่มปกติแบบสองตัวแปร ซึ่งเขียนใหม่ในพิกัดเชิงขั้ว (รัศมีและมุม) เป็นไปตามการแจกแจงของ Hoyt " [ 29 ]
ในมิติเดียว ความน่าจะเป็นที่จะพบตัวอย่างของการแจกแจงปกติในช่วงนั้นอยู่ที่ประมาณ 68.27% แต่ในมิติที่สูงกว่า ความน่าจะเป็นที่จะพบตัวอย่างในบริเวณวงรีส่วนเบี่ยงเบนมาตรฐานจะต่ำกว่า[ 30 ]
| มิติ | ความน่าจะเป็น |
|---|---|
| 1 | 0.6827 |
| 2 | 0.3935 |
| 3 | 0.1987 |
| 4 | 0.0902 |
| 5 | 0.0374 |
| 6 | 0.0144 |
| 7 | 0.0052 |
| 8 | 0.0018 |
| 9 | 0.0006 |
| 10 | 0.0002 |
การอนุมานทางสถิติ
การประมาณค่าพารามิเตอร์
การหาค่าประมาณความน่าจะเป็นสูงสุด ของเมทริกซ์ความแปรปรวนร่วมของการแจกแจงปกติหลายตัวแปรนั้นทำได้ง่าย
โดยสรุป ฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ของการแจกแจงปกติแบบหลายตัวแปรคือ
และตัวประมาณค่า ML ของเมทริกซ์ความแปรปรวนร่วมจากตัวอย่าง การสังเกต n ครั้งคือ[ 31 ]
ซึ่งก็คือเมทริกซ์ความแปรปรวนร่วมของตัวอย่างนั่นเอง นี่คือตัวประมาณค่าแบบมีอคติซึ่งค่าคาดหวังคือ
ค่าความแปรปรวนร่วมของตัวอย่างที่ไม่เอนเอียงคือ
- (รูปแบบเมทริกซ์; คือเมทริกซ์เอกลักษณ์, J คือเมทริกซ์ที่มีค่าเป็นหนึ่งทั้งหมด; ดังนั้นพจน์ในวงเล็บจึงเป็นเมทริกซ์ศูนย์กลาง)
เมทริกซ์ข้อมูลของฟิชเชอร์สำหรับการประมาณค่าพารามิเตอร์ของการแจกแจงปกติแบบหลายตัวแปรมีสูตรสำเร็จรูป สามารถนำไปใช้ได้ เช่น ในการคำนวณขอบเขต Cramér–Raoสำหรับการประมาณค่าพารามิเตอร์ในบริบทนี้ ดูรายละเอียดเพิ่มเติมได้ที่ ข้อมูลของฟิชเชอร์
การอนุมานแบบเบย์เซียน
ในสถิติแบบเบย์เซียนค่าความน่าจะเป็นล่วงหน้าแบบสังยุคของเวกเตอร์ค่าเฉลี่ยคือการแจกแจงปกติแบบหลายตัวแปรอีกแบบหนึ่ง และค่าความน่าจะเป็นล่วงหน้าแบบสังยุคของเมทริกซ์ความแปรปรวนร่วมคือการแจกแจงแบบอินเวอร์ส-วิชฮาร์ท สมมติว่ามีการสังเกตการณ์ n ครั้ง
และมีการกำหนดค่าก่อนหน้าแบบคอนจูเกตไว้แล้ว โดยที่
ที่ไหน
และ
จากนั้น[ 31 ]
ที่ไหน
การทดสอบความปกติแบบหลายตัวแปร
การทดสอบความปกติแบบหลายตัวแปรจะตรวจสอบชุดข้อมูลที่กำหนดว่ามีความคล้ายคลึงกับการกระจายแบบปกติ หลายตัวแปรหรือ ไม่ สมมติฐานว่างคือชุดข้อมูลมีความคล้ายคลึงกับการกระจายแบบปกติ ดังนั้นค่าp ที่เล็กเพียงพอ จะบ่งชี้ว่าข้อมูลไม่ปกติ การทดสอบความปกติแบบหลายตัวแปร ได้แก่ การทดสอบ Cox–Small [ 32 ] และการปรับปรุงการทดสอบ Friedman–Rafsky ของ Smith และ Jain [ 33 ]ซึ่งสร้างโดยLarry RafskyและJerome Friedman [ 34 ]
การทดสอบของมาร์เดีย
การทดสอบของ Mardia [ 35 ]อิงตามการขยายแบบหลายตัวแปรของ การวัด ความเบี่ยงเบนและความโค้งสำหรับตัวอย่าง { x 1 , ..., x n } ของ เวกเตอร์มิติ kเราคำนวณ
ภายใต้สมมติฐานว่างของความปกติแบบหลายตัวแปร สถิติAจะมีลักษณะการแจกแจงแบบไคกำลังสอง โดยประมาณ โดยมี1/6 ⋅ k ( k + 1)( k + 2)องศาอิสระ และ Bจะเป็นค่าประมาณปกติมาตรฐานN (0,1)
สถิติความโค้งของ Mardia มีความเบี่ยงเบนและลู่เข้าสู่การแจกแจงปกติแบบจำกัดอย่างช้ามาก สำหรับตัวอย่างขนาดกลางพารามิเตอร์ของการแจกแจงแบบอะซิมโทติกของสถิติความโค้งจะถูกปรับเปลี่ยน[ 36 ]สำหรับการทดสอบตัวอย่างขนาดเล็ก ( ) จะใช้ค่าวิกฤตเชิงประจักษ์ ตารางค่าวิกฤตสำหรับสถิติทั้งสองมีให้โดย Rencher [ 37 ]สำหรับk = 2, 3, 4
การทดสอบของ Mardia เป็นแบบ affine invariant แต่ไม่สอดคล้องกัน ตัวอย่างเช่น การทดสอบความเบี่ยงเบนแบบหลายตัวแปรไม่สอดคล้องกับทางเลือกที่ไม่ปกติแบบสมมาตร[ 38 ]
การทดสอบ BHEP
การทดสอบ BHEP [ 39 ]คำนวณค่ามาตรฐานของความแตกต่างระหว่างฟังก์ชันลักษณะ เชิงประจักษ์ และฟังก์ชันลักษณะเชิงทฤษฎีของการแจกแจงปกติ การคำนวณค่ามาตรฐานจะดำเนินการใน พื้นที่ L 2 ( μ )ของฟังก์ชันที่สามารถอินทิเกรตกำลังสองได้โดยสัมพันธ์กับฟังก์ชันถ่วงน้ำหนักแบบเกาส์เซียนสถิติการทดสอบคือ
การแจกแจงจำกัดของสถิติการทดสอบนี้คือผลรวมถ่วงน้ำหนักของตัวแปรสุ่มไคกำลังสอง[ 39 ]
มีการสำรวจรายละเอียดของขั้นตอนการทดสอบเหล่านี้และขั้นตอนอื่นๆ อยู่[ 40 ]
วิธีการคำนวณ
การดึงค่าจากการกระจาย
วิธีการที่ใช้กันอย่างแพร่หลายในการสุ่มเลือกเวกเตอร์สุ่มxจากการแจกแจงปกติหลายตัวแปรN มิติที่มีเวกเตอร์ค่าเฉลี่ย μและเมทริกซ์ความแปรปรวนร่วมΣทำงานดังนี้: [ 41 ]
- จงหาเมทริกซ์จริงใดๆAที่ทำให้AA T = Σเมื่อΣเป็นเมทริกซ์บวกกำหนด (positive-definite ) โดยทั่วไปจะใช้ การแยกตัวประกอบแบบ Choleskyเนื่องจากหาได้ง่าย มีประสิทธิภาพในการคำนวณ และเป็นที่รู้จักกันดี หากมีการแยกตัวประกอบแบบ Cholesky ที่เปิดเผยอันดับ (pivoted) เช่น dpstrf() ของ LAPACK ก็สามารถใช้ในกรณีเมทริกซ์บวกกึ่งกำหนด (positive-semidefinite) ทั่วไปได้เช่นกัน ทางเลือกทั่วไปที่ช้ากว่าคือการใช้เมทริกซ์A = UΛ 1/2 ที่ได้จากการแยกตัวประกอบเชิงสเปกตรัมΣ = UΛU −1ของΣ
- ให้z = ( z 1 , ..., z N ) Tเป็นเวกเตอร์ที่มีส่วนประกอบเป็น ตัวแปรสุ่ม ปกติมาตรฐานอิสระN ตัว (ซึ่งสามารถสร้างขึ้นได้ เช่น โดยใช้การแปลงบ็อกซ์-มุลเลอร์ )
- ให้xเป็นμ + Azซึ่งมีการกระจายตัวตามที่ต้องการเนื่องจากคุณสมบัติการแปลงเชิงเส้นตรง
ดูเพิ่มเติม
- การแจกแจงไคคือ ฟังก์ชัน ความหนาแน่นความน่าจะเป็น (pdf)ของค่า 2-นอร์ม ( นอร์มยุคลิดหรือความยาวเวกเตอร์ ) ของเวกเตอร์ที่มีการแจกแจงแบบปกติหลายตัวแปร (ไม่สัมพันธ์กันและมีค่าเฉลี่ยเป็นศูนย์)
- การแจกแจงเรย์ลี (Rayleigh distribution ) คือฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ของความยาวเวกเตอร์ของเวกเตอร์ที่มีการแจกแจงแบบปกติสองตัวแปร (ไม่มีความสัมพันธ์กันและมีค่าเฉลี่ยเป็นศูนย์)
- การแจกแจงแบบ Riceคือฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ของความยาวเวกเตอร์ของการแจกแจงแบบปกติสองตัวแปร (ไม่สัมพันธ์กันและไม่เป็นศูนย์กลาง)
- การแจกแจงแบบฮอยต์ (Hoyt distribution ) คือฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ของความยาวเวกเตอร์ของเวกเตอร์ที่มีการแจกแจงแบบปกติสองตัวแปร (มีความสัมพันธ์กันและมีค่าเฉลี่ยเป็นศูนย์)
- การแจกแจงปกติเชิงซ้อนซึ่งเป็นการประยุกต์ใช้การแจกแจงปกติแบบสองตัวแปร
- โคปูลา (Copula ) สำหรับนิยามของแบบจำลองโคปูลาแบบเกาส์เซียนหรือแบบปกติ
- การแจกแจงแบบ t หลายตัวแปรซึ่งเป็นการแจกแจงหลายตัวแปรแบบสมมาตรทรงกลมที่ใช้กันอย่างแพร่หลายอีกแบบหนึ่ง
- การขยาย การแจกแจงแบบปกติหลายตัวแปรที่มีความเสถียรเมื่อดัชนี (เลขชี้กำลังในฟังก์ชันลักษณะเฉพาะ) อยู่ระหว่างศูนย์ถึงสอง
- ระยะทางมาฮาลาโนบิส
- การจัดจำหน่ายวิชาร์ต
- การกระจายปกติของเมทริกซ์
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การกระจายแบบปกติหลายตัวแปร
ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจง ปกติหลายตัวแปร การ แจกแจงเกาส์เซียนหลายตัวแปร หรือ การแจกแจงปกติร่วม เป็นการขยายความของ การแจกแจงปกติ หนึ่งมิติ ( ตัวแปรเดียว ) ไปสู่...
สัญลักษณ์และการกำหนดพารามิเตอร์
การแจกแจงปกติหลายตัวแปรของเวกเตอร์สุ่ม k มิติ สามารถเขียนได้ในรูปแบบต่อไปนี้: X = ( X 1 , … , X k ) T {\displaystyle \mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm {T} }}
เวกเตอร์สุ่มปกติมาตรฐาน
เวกเตอร์สุ่ม จริงเรียกว่า เวกเตอร์สุ่มปกติมาตรฐาน ถ้าส่วนประกอบทั้งหมดเป็นอิสระต่อกัน และแต่ละเวกเตอร์เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง ซึ่งมีการแจกแจงแบบปกติ กล่าวคือ ถ้าสำหรับทุก[ 1 ] : หน้า 454 X = ( X 1 , … , X k ) T...
เวกเตอร์สุ่มปกติแบบศูนย์กลาง
เวกเตอร์สุ่มจริงเรียกว่า เวกเตอร์สุ่มปกติแบบศูนย์กลาง ถ้ามีเมทริกซ์ อยู่ เช่นนั้นซึ่งมีการแจกแจงแบบเดียวกันกับโดยที่เป็นเวกเตอร์สุ่มปกติมาตรฐานที่มีส่วนประกอบ [ 1 ] : หน้า 454 X = ( X 1 , … , X k ) T {\displaystyle \mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm...