กลับไปหน้าบทความ

อ่าน 34 นาที

การกระจายแบบปกติหลายตัวแปร

ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจง ปกติหลายตัวแปร การ แจกแจงเกาส์เซียนหลายตัวแปร หรือ การแจกแจงปกติร่วม เป็นการขยายความของ การแจกแจงปกติ หนึ่งมิติ ( ตัวแปรเดียว ) ไปสู่...

การกระจายแบบปกติหลายตัวแปร

ปกติหลายตัวแปร
ฟังก์ชันความหนาแน่นความน่าจะเป็น
จุดตัวอย่างจำนวนมากจาก1การแจกแจงปกติหลายตัวแปรที่มีและแสดงร่วมกับวงรี 3 ซิกมา การแจกแจงขอบทั้งสอง และฮิสโตแกรม 1 มิติสองอัน
สัญกรณ์
พารามิเตอร์μ R kตำแหน่งΣ R k  ×  kความแปรปรวนร่วม (เมทริกซ์กึ่งกำหนดเชิงบวก )
สนับสนุนx μ + span( Σ ) ⊆ R k
พีดีมีอยู่เฉพาะเมื่อΣเป็นเมทริกซ์บวกแน่นอนเท่านั้น
หมายถึงμ
โหมดμ
ความแปรปรวนΣ
เอนโทรปี
เอ็มจีเอฟ
ซีเอฟ
ความแตกต่าง Kullback–Leiblerดู§ ความแตกต่างระหว่าง Kullback และ Leibler

ในทฤษฎีความน่าจะเป็นและสถิติ การ แจกแจงปกติหลายตัวแปรการแจกแจงเกาส์เซียนหลายตัวแปรหรือการแจกแจงปกติร่วม เป็นการขยายความของ การแจกแจงปกติหนึ่งมิติ ( ตัวแปรเดียว ) ไปสู่ มิติที่สูงกว่านิยามหนึ่งคือเวกเตอร์สุ่มจะมีการแจกแจงปกติk ตัวแปร ถ้า ผลรวมเชิงเส้น ทุกตัว ของ ส่วนประกอบ k ตัวของมัน มีการแจกแจงปกติตัวแปรเดียว ความสำคัญของมันส่วนใหญ่มาจากทฤษฎีบทลิมิตกลางหลายตัวแปรการแจกแจงปกติหลายตัวแปรมักใช้เพื่ออธิบายอย่างน้อยโดยประมาณ ชุดของตัวแปรสุ่มค่าจริงที่ อาจ มีความสัมพันธ์กันซึ่งแต่ละตัวจะรวมกลุ่มกันอยู่รอบค่าเฉลี่ย

คำจำกัดความ

สัญลักษณ์และการกำหนดพารามิเตอร์

การแจกแจงปกติหลายตัวแปรของเวกเตอร์สุ่มk มิติ สามารถเขียนได้ในรูปแบบต่อไปนี้:

หรือเพื่อระบุอย่างชัดเจนว่ามีมิติ k

ด้วยเวกเตอร์ค่าเฉลี่ยkมิติ

และเมทริกซ์ความแปรปรวนร่วม

โดยที่และเมทริกซ์ผกผันของเมทริกซ์ความแปรปรวนร่วมเรียกว่าเมทริกซ์ความแม่นยำซึ่งใช้สัญลักษณ์ แทนด้วย

เวกเตอร์สุ่มปกติมาตรฐาน

เวกเตอร์สุ่ม จริงเรียกว่าเวกเตอร์สุ่มปกติมาตรฐานถ้าส่วนประกอบทั้งหมดเป็นอิสระต่อกัน และแต่ละเวกเตอร์เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง ซึ่งมีการแจกแจงแบบปกติ กล่าวคือ ถ้าสำหรับทุก[ 1 ] :หน้า 454

เวกเตอร์สุ่มปกติแบบศูนย์กลาง

เวกเตอร์สุ่มจริงเรียกว่าเวกเตอร์สุ่มปกติแบบศูนย์กลางถ้ามีเมทริกซ์ อยู่ เช่นนั้นซึ่งมีการแจกแจงแบบเดียวกันกับโดยที่เป็นเวกเตอร์สุ่มปกติมาตรฐานที่มีส่วนประกอบ[ 1 ] : หน้า 454

เวกเตอร์สุ่มปกติ

เวกเตอร์สุ่มจริงเรียกว่าเวกเตอร์สุ่มปกติถ้ามีเวกเตอร์ สุ่ม ซึ่งเป็นเวกเตอร์สุ่มปกติมาตรฐาน เวกเตอร์และเมทริกซ์เช่นนั้น[ 2 ] :หน้า 454 [ 1 ] : หน้า 455

อย่างเป็นทางการ:

ในที่นี้เมทริกซ์ความแปรปรวนร่วมคือ.

ใน กรณี พิเศษที่เมทริกซ์ความแปรปรวนร่วม เป็นเมทริกซ์ เอกฐาน การแจกแจงที่สอดคล้องกันจะไม่มีความหนาแน่น โปรดดูรายละเอียด ใน ส่วนด้านล่าง กรณีนี้เกิดขึ้นบ่อยใน ทางสถิติตัวอย่างเช่น ในการแจกแจงของเวกเตอร์ของค่าคลาดเคลื่อนในการถดถอยกำลังสองน้อยที่สุดแบบธรรมดาโดยทั่วไปแล้ว ค่า คลาดเคลื่อน เหล่านี้ จะไม่เป็นอิสระต่อกัน สามารถมองได้ว่าเป็นผลลัพธ์ของการใช้เมทริกซ์กับกลุ่มของตัวแปรเกาส์เซียนที่เป็นอิสระต่อกัน

คำจำกัดความที่เทียบเท่ากัน

คำจำกัดความต่อไปนี้เทียบเท่ากับคำจำกัดความที่ให้ไว้ข้างต้น เวกเตอร์สุ่มมีการแจกแจงแบบปกติหลายตัวแปรก็ต่อเมื่อเป็นไปตามเงื่อนไขที่เทียบเท่ากันข้อใดข้อหนึ่งต่อไปนี้

  • ผลรวมเชิงเส้นทุกรูปแบบของส่วนประกอบต่างๆ ของตัวแปรสุ่มนี้ จะมีการกระจายแบบปกติกล่าวคือ สำหรับเวกเตอร์คงที่ใดๆตัวแปรสุ่มจะมีการกระจายแบบปกติแบบเอกตัวแปร โดยที่การกระจายแบบปกติแบบเอกตัวแปรที่มีความแปรปรวนเป็นศูนย์ จะเป็นจุดมวลบนค่าเฉลี่ยของ เวกเตอร์นั้น
  • มีเวกเตอร์kมิติ และเมทริกซ์สมมาตรบวกกึ่งกำหนดโดยที่ฟังก์ชันลักษณะเฉพาะของคือ

การกระจายปกติทรงกลมสามารถกำหนดลักษณะได้ว่าเป็นการกระจายที่ไม่ซ้ำกันซึ่งส่วนประกอบต่างๆ เป็นอิสระในระบบพิกัดตั้งฉากใดๆ[ 3 ] [ 4 ]

ฟังก์ชันความหนาแน่น

ความหนาแน่นร่วมปกติแบบสองตัวแปร

กรณีที่ไม่เสื่อมถอย

การกระจายแบบปกติหลายตัวแปรเรียกว่า "ไม่เสื่อมสภาพ" เมื่อเมทริกซ์ความแปรปรวน ร่วมสมมาตร เป็นบวกแน่นอนในกรณีนี้การกระจายจะมีความหนาแน่น[ 5 ]

โดยที่เป็น เวกเตอร์คอลัมน์ kมิติที่เป็นจำนวนจริง และเป็นดีเทอร์มิแนนต์ของซึ่งเรียกอีกอย่างว่าความแปรปรวนทั่วไป สมการข้างต้นจะลดรูปเป็นสมการของการแจกแจงปกติแบบเอกตัวแปร ถ้าเป็นเมทริกซ์ (กล่าวคือ เป็นจำนวนจริงตัวเดียว)

รูปแบบ การแจกแจงปกติเชิงซ้อนแบบสมมาตรวงกลมนั้นมีลักษณะที่แตกต่างออกไปเล็กน้อย

แต่ละเส้นไอโซเดนซิตี้โลคัสซึ่งเป็นเส้นของจุดใน ปริภูมิ kมิติ ที่แต่ละจุดให้ค่าความหนาแน่นเดียวกันนั้น เป็นรูปวงรีหรือการขยายความในมิติที่สูงกว่าของวงรี ดังนั้น การแจกแจงปกติแบบหลายตัวแปรจึงเป็นกรณีพิเศษของการแจกแจงแบบวงรี

ปริมาณนี้เรียกว่าระยะทางมาฮาลาโนบิสซึ่งแสดงถึงระยะห่างของจุดทดสอบจากค่าเฉลี่ยระยะทางมาฮาลาโนบิสยกกำลังสอง จะถูกแยกออกเป็นผลรวมของkเทอม โดยแต่ละเทอมเป็นผลคูณของส่วนประกอบที่มีความหมายสามส่วน[ 6 ] โปรดทราบว่าในกรณีที่การแจกแจงจะลดลงเหลือการแจกแจงปกติแบบเอกตัวแปร และระยะทางมาฮาลาโนบิสจะลดลงเหลือค่าสัมบูรณ์ของคะแนนมาตรฐาน ดู ช่วงด้านล่าง ด้วย

กรณีสองตัวแปร

ในกรณี 2 มิติที่ไม่เอกฐาน ( ) ฟังก์ชันความหนาแน่นความน่าจะเป็นของเวกเตอร์คือ: โดยที่คือความสัมพันธ์ระหว่างและโดยที่และในกรณีนี้

ในกรณีสองตัวแปร เงื่อนไขเทียบเท่าแรกสำหรับการสร้างใหม่ของความปกติแบบหลายตัวแปรสามารถทำให้มีความเข้มงวดน้อยลงได้ เนื่องจากเพียงพอที่จะตรวจสอบว่า เซต ที่นับได้อนันต์ของผลรวมเชิงเส้นที่แตกต่างกันของและเป็นปกติ เพื่อสรุปได้ว่าเวกเตอร์ของ เป็นปกติแบบสองตัวแปร[ 7 ]

เส้นไอโซเดนซิตี้แบบสองตัวแปรที่พล็อตใน ระนาบ - เป็นรูปวงรี โดย แกนหลักของ วงรี ถูกกำหนดโดยเวกเตอร์ลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม ( เส้นผ่านศูนย์กลางครึ่งใหญ่และครึ่งเล็กของวงรีเท่ากับรากที่สองของค่าลักษณะเฉพาะที่เรียงลำดับแล้ว)

การแจกแจงปกติแบบสองตัวแปร โดยมีจุดศูนย์กลางอยู่ที่ และค่าเบี่ยงเบนมาตรฐานประมาณ 3 ในทิศทาง และ 1 ในทิศทางตั้งฉาก

เมื่อค่าสัมบูรณ์ของพารามิเตอร์สหสัมพันธ์ เพิ่มขึ้น จุดเหล่านี้จะถูกบีบเข้าหาเส้นต่อไปนี้:

เนื่องจากนิพจน์นี้ โดยที่ sgn คือฟังก์ชันเครื่องหมายถูกแทนที่ด้วยเป็นการทำนายเชิงเส้นที่ไม่เอนเอียงที่ดีที่สุดของเมื่อกำหนดค่าของ[ 8 ]

กรณีที่เสื่อมทราม

ถ้าเมทริกซ์ความแปรปรวนร่วมไม่มีอันดับเต็ม การแจกแจงปกติหลายตัวแปรจะเสื่อมสภาพและไม่มีความหนาแน่น กล่าวคือ ไม่มีความหนาแน่นเมื่อเทียบกับการวัดเลเบส แบบ kมิติ(ซึ่งเป็นการวัดที่ใช้กันโดยทั่วไปในหลักสูตรความน่าจะเป็นระดับแคลคูลัส) เฉพาะเวกเตอร์สุ่มที่มีการแจกแจงต่อเนื่องอย่างสมบูรณ์เมื่อเทียบกับการวัดเท่านั้นที่จะกล่าวได้ว่ามีความหนาแน่น (เมื่อเทียบกับการวัดนั้น) เพื่อที่จะพูดถึงความหนาแน่นแต่หลีกเลี่ยงการจัดการกับความซับซ้อนทางทฤษฎีการวัด อาจจะง่ายกว่าที่จะจำกัดความสนใจไปที่เซตย่อยของพิกัดของซึ่งเมทริกซ์ความแปรปรวนร่วมสำหรับเซตย่อยนี้เป็นบวกแน่นอน จากนั้นพิกัดอื่นๆ อาจถูกมองว่าเป็นฟังก์ชันเชิงเส้นของพิกัดที่เลือกเหล่านี้[ 9 ]

เพื่อที่จะพูดถึงความหนาแน่นอย่างมีความหมายในกรณีพิเศษ เราจึงต้องเลือกมาตรวัดฐานที่แตกต่างออกไป โดยใช้ทฤษฎีบทการสลายตัวเราสามารถกำหนดข้อจำกัดของมาตรวัดเลเบสไปยังปริภูมิย่อยเชิงเส้นตรงมิติ n ของซึ่งการแจกแจงแบบเกาส์เซียนได้รับการรองรับ นั่นคือ. เมื่อเทียบกับมาตรวัดนี้ การแจกแจงจะมีค่าความหนาแน่นตามรูปแบบต่อไปนี้:

โดยที่คือตัวผกผันทั่วไปและคือดีเทอร์มิแนนต์เทียม[ 10 ]

ฟังก์ชันการกระจายสะสม

แนวคิดของฟังก์ชันการกระจายสะสม (cdf) ในมิติ 1 สามารถขยายไปสู่กรณีหลายมิติได้สองวิธี โดยอาศัยพื้นที่รูปสี่เหลี่ยมผืนผ้าและพื้นที่รูปวงรี

วิธีแรกคือการกำหนด cdf ของเวกเตอร์สุ่มเป็นความน่าจะเป็นที่ส่วนประกอบทั้งหมดของ เวกเตอร์สุ่ม มีค่าน้อยกว่าหรือเท่ากับค่าที่สอดคล้องกันในเวกเตอร์สุ่ม: [ 11 ]

แม้ว่าจะไม่มีรูปแบบปิดสำหรับ แต่ก็มีอัลกอริทึมจำนวนหนึ่งที่ประมาณค่าเป็นตัวเลข[ 11 ] [ 12 ]

อีกวิธีหนึ่งคือการกำหนด cdf เป็นความน่าจะเป็นที่ตัวอย่างจะอยู่ภายในทรงรีที่กำหนดโดยระยะทาง Mahalanobisจาก Gaussian ซึ่งเป็นการวางนัยทั่วไปโดยตรงของค่าเบี่ยงเบนมาตรฐาน[ 13 ] เพื่อคำนวณค่าของฟังก์ชันนี้ มีสูตรวิเคราะห์แบบปิด[ 13 ]ดังต่อไปนี้

ช่วงเวลา

ช่วงของการแจกแจงปกติหลายตัวแปรให้บริเวณที่ประกอบด้วยเวกเตอร์x ที่สอดคล้องกับเงื่อนไขต่อ ไปนี้

นี่คือเวกเตอร์มิติ n, คือเวกเตอร์ค่าเฉลี่ยมิติ n ที่ทราบ, คือเมทริกซ์ความแปรปรวน ร่วมที่ทราบ และคือ ฟังก์ชันควอนไทล์สำหรับความน่าจะเป็นของการแจกแจงไคกำลังสองที่มีองศาอิสระ[ 14 ] เมื่อนิพจน์กำหนดภายในของวงรีและการแจกแจงไคกำลังสองจะลดรูปเป็นการแจกแจงเอกซ์โพเนนเชียลที่มีค่าเฉลี่ยเท่ากับสอง (อัตราเท่ากับครึ่ง)

ฟังก์ชันการกระจายสะสมเสริม (การกระจายส่วนหาง)

ฟังก์ชัน การกระจายสะสมเสริม (ccdf) หรือการกระจายส่วนหาง ถูกกำหนดเป็นเมื่อแล้ว ccdf สามารถเขียนได้เป็นความน่าจะเป็นสูงสุดของตัวแปรเกาส์เซียนที่ขึ้นอยู่กัน: [ 15 ]

แม้ว่าจะไม่มีสูตรปิดที่ง่ายสำหรับการคำนวณ ccdf แต่ค่าสูงสุดของตัวแปรเกาส์เซียนที่ขึ้นอยู่กันสามารถประมาณได้อย่างแม่นยำผ่านวิธีการมอนเตคาร์โล[ 15 ] [ 16 ]

คุณสมบัติ

ช่วงเวลา

โมเมนต์ลำดับที่k ของ x กำหนดโดย

โดยที่r 1 + r 2 + ⋯ + r N = k .

โมเมนต์กลางลำดับที่ k มีดังต่อไปนี้

  1. ถ้าkเป็นจำนวนคี่μ 1, ..., N ( xμ ) = 0
  2. ถ้าkเป็นจำนวนคู่ โดยที่k = 2 λแล้ว

โดยผลรวมจะคำนวณจากการจัดสรรเซตทั้งหมดลงใน คู่ λ (ไม่เรียงลำดับ) คู่ นั่นคือ สำหรับ โมเมนต์กลางลำดับที่ k (= 2 λ = 6)จะบวกผลคูณของค่า ความแปรปรวนร่วม λ = 3ค่า (โดยถือว่าค่าคาดหวังμเป็น 0 เพื่อความเรียบง่าย):

ผลลัพธ์ที่ได้คือพจน์ในผลรวม (15 พจน์ในกรณีข้างต้น) โดยแต่ละพจน์เป็นผลคูณของ ค่าความแปรปรวนร่วม λ (ในกรณีนี้คือ 3) สำหรับโมเมนต์ลำดับที่สี่ (สี่ตัวแปร) จะมีสามพจน์ สำหรับโมเมนต์ลำดับที่หกจะมี3 × 5 = 15พจน์ และสำหรับโมเมนต์ลำดับที่แปดจะมี3 × 5 × 7 = 105พจน์

จากนั้นจะกำหนดค่าความแปรปรวนร่วมโดยการแทนที่พจน์ในรายการด้วยพจน์ที่สอดคล้องกันในรายการที่ประกอบด้วย เลข 1 จำนวน r 1ตัว จากนั้น เลข 2 จำนวน r 2ตัว เป็นต้น เพื่อให้เห็นภาพชัดเจน ลองพิจารณากรณีโมเมนต์กลางลำดับที่ 4 ต่อไปนี้:

โดยที่คือค่าความแปรปรวนร่วมของX iและX jด้วยวิธีข้างต้น ขั้นแรกจะหาค่าทั่วไปสำหรับโมเมนต์ที่k ที่มี ตัวแปรXที่แตกต่างกันkตัว แล้วจึงลดรูปให้ง่ายขึ้นตามนั้น ตัวอย่างเช่น สำหรับ ให้X i = X j และใช้ข้อเท็จจริงที่ว่า

ฟังก์ชันของเวกเตอร์ปกติ

รูปแบบกำลังสองของเวกเตอร์ปกติ( โดยที่เป็นเมทริกซ์เป็นเวกเตอร์ และเป็นสเกลาร์) คือ ตัวแปรไค กำลังสองทั่วไปทิศทางของเวกเตอร์ปกติเป็นไปตามการแจกแจงปกติที่ฉายภาพ[ 17 ]

ถ้าเป็นฟังก์ชันค่าสเกลาร์ทั่วไปของเวกเตอร์ปกติฟังก์ชันความหนาแน่นความน่าจะเป็น ฟังก์ชันการกระจายสะสมและฟังก์ชันการกระจายสะสมผกผันสามารถคำนวณได้ด้วยวิธีการเชิงตัวเลขของการติดตามรังสี ( โค้ด Matlab เก็บถาวรเมื่อ 2025-02-20 ที่Wayback Machine )

ฟังก์ชันความน่าจะเป็น

ถ้าทราบค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วม ค่าลอการิทึมความน่าจะเป็นของเวกเตอร์ที่สังเกตได้ก็คือค่าลอการิทึมของฟังก์ชันความหนาแน่นความน่าจะเป็นนั่นเอง

,

กรณีเชิงซ้อนที่ไม่เป็นศูนย์กลางที่มีสมมาตรแบบวงกลม โดยที่เป็นเวกเตอร์ของจำนวนเชิงซ้อน จะเป็นดังนี้

กล่าวคือ ใช้การสลับตำแหน่งแบบสังยุค (ระบุด้วย) แทนที่การสลับตำแหน่ง แบบปกติ (ระบุด้วย) ซึ่งแตกต่างจากกรณีจริงเล็กน้อย เนื่องจากรูปแบบสมมาตรแบบวงกลมของการแจกแจงปกติเชิงซ้อน มีรูปแบบของ ค่าคงที่การทำให้เป็นมาตรฐานที่ แตกต่างกันเล็กน้อย

มีการใช้สัญลักษณ์ที่คล้ายกันสำหรับการถดถอยเชิงเส้นหลายตัวแปร[ 18 ]

เนื่องจากค่าลอการิทึมความน่าจะเป็นของเวกเตอร์ปกติเป็นรูปแบบกำลังสองของเวกเตอร์ปกติ จึงทำให้เวกเตอร์ปกติมีการแจกแจงแบบ ไคกำลังสองทั่วไป

เอนโทรปีเชิงอนุพันธ์

เอนโทรปีเชิงอนุพันธ์ของการกระจายปกติหลายตัวแปรคือ[ 19 ]

โดยที่ขีดคั่นแสดงถึง ดีเทอร์มิแน น ต์ของเมทริกซ์ k คือมิติของปริภูมิเวกเตอร์ และผลลัพธ์มีหน่วยเป็นnats

ความแตกต่าง Kullback–Leibler

ความแตกต่าง Kullback –Leiblerจากถึงสำหรับเมทริกซ์ที่ไม่เอกฐาน Σ 1และ Σ 0คือ: [ 20 ]

โดยที่แทนดีเทอร์มิแนนต์ของเมทริกซ์คือ ผลรวมของผลต่างระหว่างเมทริกซ์ กับเมทริกซ์ (trace ) คือลอการิทึมธรรมชาติและคือมิติของปริภูมิเวกเตอร์

ต้องใช้ลอการิทึมฐานe เนื่องจากพจน์สองพจน์ที่ตามหลังลอการิทึมนั้นเป็นลอการิทึมฐานe ของนิพจน์ที่เป็นตัวประกอบของฟังก์ชันความหนาแน่นหรือเกิดขึ้นเองตามธรรมชาติ ดังนั้นสมการจึงให้ผลลัพธ์ที่วัดเป็นnatsการหารนิพจน์ทั้งหมดข้างต้นด้วย log  จะได้ค่าความแตกต่างในหน่วยบิต

เมื่อไร,

ข้อมูลร่วมกัน

ข้อมูลร่วมกันของการกระจายปกติหลายตัวแปรสองแบบเป็นกรณีพิเศษของความแตกต่าง Kullback–Leiblerซึ่งคือการกระจายหลายตัวแปรแบบมิติเต็ม และคือผลคูณของการกระจายขอบมิติและและโดยที่ข้อมูลร่วมกันระหว่างและกำหนดโดย: [ 21 ]

ที่ไหน

ถ้าเป็นผลคูณของการแจกแจงปกติแบบหนึ่งมิติ ในสัญลักษณ์ของส่วนความแตกต่าง Kullback–Leiblerในบทความนี้จะเป็นเมทริกซ์แนวทแยงที่มีค่าในแนวทแยงคือ, และสูตรที่ได้สำหรับข้อมูลร่วมกันคือ:

เมท ริก ซ์สหสัมพันธ์ที่สร้างขึ้นจาก[ 22 ]

ในกรณีสองตัวแปร สูตรสำหรับข้อมูลร่วมคือ:

ความปกติของข้อต่อ

การกระจายแบบปกติและเป็นอิสระต่อกัน

ถ้าและมีการแจกแจงแบบปกติและเป็นอิสระต่อกันนั่นหมายความว่าตัวแปรทั้งสองมีการแจกแจงแบบปกติร่วมกัน กล่าวคือ ตัวแปรทั้งสองต้องมีการแจกแจงแบบปกติหลายตัวแปร อย่างไรก็ตาม ตัวแปรสองตัวที่มีการแจกแจงแบบปกติร่วมกันไม่จำเป็นต้องเป็นอิสระต่อกัน (จะเป็นอิสระต่อกันก็ต่อเมื่อไม่มีความสัมพันธ์กันเท่านั้น)

ตัวแปรสุ่มที่มีการแจกแจงแบบปกติสองตัวไม่จำเป็นต้องมีการแจกแจงแบบปกติร่วมกันแบบทวิภาค

ข้อเท็จจริงที่ว่าตัวแปรสุ่มสองตัวและต่างก็มีการแจกแจงแบบปกติ ไม่ได้หมายความว่าตัวแปรสุ่มทั้งสองนั้นมีการแจกแจงแบบปกติร่วมกัน ตัวอย่างง่ายๆ คือ กรณีที่มีการแจกแจงแบบปกติโดยมีค่าเฉลี่ย 0 และความแปรปรวน 1 และถ้าและถ้าโดยที่มีตัวอย่างค้านที่คล้ายกันสำหรับตัวแปรสุ่มมากกว่าสองตัว โดยทั่วไปแล้ว ผลรวมของตัวอย่างเหล่านี้จะได้เป็นแบบ จำลองผสม

ความสัมพันธ์และความเป็นอิสระ

โดยทั่วไป ตัวแปรสุ่มอาจไม่มีความสัมพันธ์กันแต่มีความสัมพันธ์กันทางสถิติ แต่ถ้าเวกเตอร์สุ่มมีการกระจายแบบปกติหลายตัวแปรแล้ว ส่วนประกอบสองส่วนขึ้นไปที่ไม่มีความสัมพันธ์กันจะเป็นอิสระต่อกันนั่นหมายความว่า ส่วนประกอบสองส่วนขึ้นไปที่เป็นอิสระต่อกันเป็นคู่ๆก็จะเป็นอิสระต่อกันด้วย แต่ดังที่ได้กล่าวไว้ข้างต้นแล้วไม่ เป็น ความจริงที่ว่าตัวแปรสุ่มสองตัวที่ ( แยกกันหรือตามสัดส่วน) มีการกระจายแบบปกติและไม่มีความสัมพันธ์กันจะเป็นอิสระต่อกัน

การแจกแจงแบบมีเงื่อนไข

ถ้าxที่มีมิติNถูกแบ่งออกดังต่อไปนี้

และด้วยเหตุนี้μและΣจึงถูกแบ่งออกดังต่อไปนี้

จากนั้นการแจกแจงของx 1โดยมีเงื่อนไขว่าx 2 = aจะเป็นแบบปกติหลายตัวแปร[ 23 ] ( x 1  |  x 2 = a ) ~ N ( μ , Σ )โดยที่

และเมทริกซ์ความแปรปรวนร่วม

[ 24 ]

นี่คืออินเวอร์สทั่วไปของเมทริกซ์นี้คือคอมพลีเมนต์ของ SchurของΣ 22ในΣนั่นคือ สมการข้างต้นเทียบเท่ากับการผกผันเมทริกซ์ความแปรปรวนร่วมโดยรวม ตัดแถวและคอลัมน์ที่สอดคล้องกับตัวแปรที่ถูกกำหนดเงื่อนไขออก แล้วผกผันกลับเพื่อให้ได้เมทริกซ์ความแปรปรวนร่วมแบบมีเงื่อนไข

โปรดทราบว่าการทราบว่าx 2 = aจะทำให้ค่าความแปรปรวนเปลี่ยนแปลงไป แม้ว่าค่าความแปรปรวนใหม่จะไม่ขึ้นอยู่กับค่าa ที่เฉพาะเจาะจงก็ตาม และที่น่าประหลาดใจยิ่งกว่านั้นคือ ค่าเฉลี่ยจะเปลี่ยนไปลองเปรียบเทียบกับสถานการณ์ที่ไม่ทราบค่าaซึ่งในกรณีนี้x 1จะมีการกระจายตัว แบบ

ข้อเท็จจริงที่น่าสนใจอย่างหนึ่งที่ได้มาเพื่อพิสูจน์ผลลัพธ์นี้คือ เวกเตอร์สุ่มและเป็นอิสระต่อกัน

เมทริกซ์Σ 12 Σ 22 −1เรียกว่าเมทริกซ์สัมประสิทธิ์ การถดถอย

กรณีสองตัวแปร

ในกรณีสองตัวแปรที่xถูกแบ่งออกเป็นและการแจกแจงแบบมีเงื่อนไขของเมื่อกำหนดคือ[ 25 ]

ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างและคือค่าใด

ความคาดหวังแบบมีเงื่อนไขสองตัวแปร

ในกรณีทั่วไป

ค่าคาดหวังแบบมีเงื่อนไขของ X 1เมื่อกำหนดให้ X 2คือ:

พิสูจน์: ผลลัพธ์ได้มาจากการหาค่าเฉลี่ยของการแจกแจงแบบมีเงื่อนไขข้างต้น

ในกรณีที่ค่าเบี่ยงเบนมาตรฐานมีค่าเท่ากับหนึ่ง

ค่าคาดหวังแบบมีเงื่อนไขของX 1เมื่อกำหนดให้X 2คือ

และความแปรปรวนแบบมีเงื่อนไขคือ

ดังนั้น ความ แปรปรวน แบบมีเงื่อนไข จึงไม่ขึ้นอยู่กับ

ความคาดหวังแบบมีเงื่อนไขของX 1เมื่อกำหนดให้X 2มีค่าน้อยกว่า/มากกว่าzคือ: [ 26 ] : 367

โดยอัตราส่วนสุดท้ายในที่นี้เรียกว่า อัตราส่วนมิล ส์ ผกผัน

พิสูจน์: ผลลัพธ์สองข้อสุดท้ายได้มาจากการใช้ผลลัพธ์ดังนั้น

จากนั้นจึงใช้คุณสมบัติของค่าคาดหวังของการแจกแจงปกติแบบตัดทอน

การกระจายแบบมาร์จินัล

เพื่อให้ได้การแจกแจงแบบมาร์จินัลเหนือเซตย่อยของตัวแปรสุ่มปกติหลายตัวแปร จำเป็นต้องตัดตัวแปรที่ไม่เกี่ยวข้อง (ตัวแปรที่ต้องการแยกออก) ออกจากเวกเตอร์ค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วม การพิสูจน์นี้เป็นไปตามคำจำกัดความของการแจกแจงปกติหลายตัวแปรและพีชคณิตเชิงเส้น[ 27 ]

ตัวอย่าง

ให้X = [ X 1 , X 2 , X 3 ]เป็นตัวแปรสุ่มปกติหลายตัวแปรที่มีเวกเตอร์ค่าเฉลี่ยμ = [ μ 1 , μ 2 , μ 3 ]และเมทริกซ์ความแปรปรวนร่วมΣ (การกำหนดพารามิเตอร์มาตรฐานสำหรับการแจกแจงปกติหลายตัวแปร) แล้วการแจกแจงร่วมของX = [ X 1 , X 3 ]เป็นการแจกแจงปกติหลายตัวแปรที่มีเวกเตอร์ค่าเฉลี่ยμ = [ μ 1 , μ 3 ]และเมทริกซ์ความแปรปรวนร่วม Σ

การแปลงเชิงเส้น

ถ้าY = c + BXเป็นการแปลงเชิงเส้นของโดยที่cเป็นเวกเตอร์ของค่าคงที่ และBเป็นเมทริกซ์คงที่ แล้วYจะมีการแจกแจงปกติแบบหลายตัวแปร โดยมีค่าคาดหวังc + และความแปรปรวนBΣB Tกล่าวคือโดยเฉพาะอย่างยิ่ง เซตย่อยใดๆ ของX iก็มีการแจกแจงแบบมาร์จินัลที่เป็นการแจกแจงปกติแบบหลายตัวแปรเช่นกัน เพื่อให้เห็นภาพนี้ ลองพิจารณาตัวอย่างต่อไปนี้: ในการดึงเซตย่อย ( X 1 , X 2 , X 4 ) T ออกมา ให้ ใช้

ซึ่งจะแยกองค์ประกอบที่ต้องการออกมาโดยตรง

อีกผลลัพธ์หนึ่งคือ การแจกแจงของZ = b · Xโดยที่bเป็นเวกเตอร์คงที่ที่มีจำนวนองค์ประกอบเท่ากับXและจุดแสดงถึงผล คูณดอท เป็นการแจกแจงแบบเกาส์เซียนแบบเอกตัวแปรที่มี ผลลัพธ์นี้ได้มาจากการใช้

สังเกตว่าคุณสมบัติความเป็นบวกแน่นอนของΣบ่งชี้ว่าค่าความแปรปรวนของผลคูณดอทต้องเป็นบวก

การแปลงเชิงเส้นของX เช่น 2X ไม่เหมือนกับผลรวมของสองการรับรู้ที่เป็นอิสระของX

การตีความทางเรขาคณิต

เส้นโค้งความหนาแน่นเท่ากันของการกระจายปกติหลายตัวแปรที่ไม่เอกฐานคือทรงรี (เช่น การแปลงเชิงเส้นของไฮเปอร์สเฟียร์ ) ที่มีจุดศูนย์กลางอยู่ที่ค่าเฉลี่ย[ 28 ]ดังนั้นการกระจายปกติหลายตัวแปรจึงเป็นตัวอย่างของคลาสของการกระจายแบบวงรีทิศทางของแกนหลักของทรงรีจะกำหนดโดยเวกเตอร์ลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม ความยาวสัมพัทธ์กำลังสองของแกนหลักจะกำหนดโดยค่าลักษณะเฉพาะที่สอดคล้องกัน

ถ้าΣ = UΛU T = 1/2 ( 1/2 ) Tเป็นการแยกส่วนประกอบค่าลักษณะเฉพาะโดยที่คอลัมน์ของUคือเวกเตอร์ลักษณะเฉพาะหน่วย และΛคือเมทริกซ์แนวทแยงของค่าลักษณะเฉพาะ แล้วเราจะได้ว่า

นอกจากนี้Uสามารถเลือกให้เป็นเมทริกซ์การหมุนได้ เนื่องจาก การกลับแกนไม่มีผลต่อN (0, Λ ) แต่การกลับคอลัมน์จะเปลี่ยนเครื่องหมายของ ดีเทอร์มิแน น ต์ ของ UการกระจายN ( μ , Σ ) ก็คือN (0, I ) ที่ถูกปรับขนาดด้วยΛ 1/2หมุนด้วยUและเลื่อนด้วยμ

ในทางกลับกัน การเลือกค่าμ ใดๆ เมทริกซ์ Uที่มีอันดับเต็มและค่าแนวทแยงมุม Λ i ที่เป็นบวก จะทำให้ได้การแจกแจงปกติหลายตัวแปรที่ไม่เป็นเอกฐาน หาก Λ i ใดๆ เป็นศูนย์และUเป็นเมทริกซ์จัตุรัส เมทริกซ์ความแปรปรวนร่วมUΛU T ที่ได้จะ เป็นเอกฐานในทางเรขาคณิต หมายความว่าทรงรีตามเส้นโค้งทุกอันจะบางมากจนไม่มีที่สิ้นสุดและมีปริมาตรเป็นศูนย์ใน ปริภูมิ nมิติ เนื่องจากแกนหลักอย่างน้อยหนึ่งแกนมีความยาวเป็นศูนย์ นี่คือกรณีเสื่อมสภาพ

"รัศมีรอบค่าเฉลี่ยที่แท้จริงในตัวแปรสุ่มปกติแบบสองตัวแปร ซึ่งเขียนใหม่ในพิกัดเชิงขั้ว (รัศมีและมุม) เป็นไปตามการแจกแจงของ Hoyt " [ 29 ]

ในมิติเดียว ความน่าจะเป็นที่จะพบตัวอย่างของการแจกแจงปกติในช่วงนั้นอยู่ที่ประมาณ 68.27% แต่ในมิติที่สูงกว่า ความน่าจะเป็นที่จะพบตัวอย่างในบริเวณวงรีส่วนเบี่ยงเบนมาตรฐานจะต่ำกว่า[ 30 ]

มิติความน่าจะเป็น
10.6827
20.3935
30.1987
40.0902
50.0374
60.0144
70.0052
80.0018
90.0006
100.0002

การอนุมานทางสถิติ

การประมาณค่าพารามิเตอร์

การหาค่าประมาณความน่าจะเป็นสูงสุด ของเมทริกซ์ความแปรปรวนร่วมของการแจกแจงปกติหลายตัวแปรนั้นทำได้ง่าย

โดยสรุป ฟังก์ชันความหนาแน่นความน่าจะเป็น (pdf) ของการแจกแจงปกติแบบหลายตัวแปรคือ

และตัวประมาณค่า ML ของเมทริกซ์ความแปรปรวนร่วมจากตัวอย่าง การสังเกต n ครั้งคือ[ 31 ]

ซึ่งก็คือเมทริกซ์ความแปรปรวนร่วมของตัวอย่างนั่นเอง นี่คือตัวประมาณค่าแบบมีอคติซึ่งค่าคาดหวังคือ

ค่าความแปรปรวนร่วมของตัวอย่างที่ไม่เอนเอียงคือ

(รูปแบบเมทริกซ์; คือเมทริกซ์เอกลักษณ์, J คือเมทริกซ์ที่มีค่าเป็นหนึ่งทั้งหมด; ดังนั้นพจน์ในวงเล็บจึงเป็นเมทริกซ์ศูนย์กลาง)

เมทริกซ์ข้อมูลของฟิชเชอร์สำหรับการประมาณค่าพารามิเตอร์ของการแจกแจงปกติแบบหลายตัวแปรมีสูตรสำเร็จรูป สามารถนำไปใช้ได้ เช่น ในการคำนวณขอบเขต Cramér–Raoสำหรับการประมาณค่าพารามิเตอร์ในบริบทนี้ ดูรายละเอียดเพิ่มเติมได้ที่ ข้อมูลของฟิชเชอร์

การอนุมานแบบเบย์เซียน

ในสถิติแบบเบย์เซียนค่าความน่าจะเป็นล่วงหน้าแบบสังยุคของเวกเตอร์ค่าเฉลี่ยคือการแจกแจงปกติแบบหลายตัวแปรอีกแบบหนึ่ง และค่าความน่าจะเป็นล่วงหน้าแบบสังยุคของเมทริกซ์ความแปรปรวนร่วมคือการแจกแจงแบบอินเวอร์ส-วิชฮาร์ท สมมติว่ามีการสังเกตการณ์ n ครั้ง

และมีการกำหนดค่าก่อนหน้าแบบคอนจูเกตไว้แล้ว โดยที่

ที่ไหน

และ

จากนั้น[ 31 ]

ที่ไหน

การทดสอบความปกติแบบหลายตัวแปร

การทดสอบความปกติแบบหลายตัวแปรจะตรวจสอบชุดข้อมูลที่กำหนดว่ามีความคล้ายคลึงกับการกระจายแบบปกติ หลายตัวแปรหรือ ไม่ สมมติฐานว่างคือชุดข้อมูลมีความคล้ายคลึงกับการกระจายแบบปกติ ดังนั้นค่าp ที่เล็กเพียงพอ จะบ่งชี้ว่าข้อมูลไม่ปกติ การทดสอบความปกติแบบหลายตัวแปร ได้แก่ การทดสอบ Cox–Small [ 32 ] และการปรับปรุงการทดสอบ Friedman–Rafsky ของ Smith และ Jain [ 33 ]ซึ่งสร้างโดยLarry RafskyและJerome Friedman [ 34 ]

การทดสอบของมาร์เดีย

การทดสอบของ Mardia [ 35 ]อิงตามการขยายแบบหลายตัวแปรของ การวัด ความเบี่ยงเบนและความโค้งสำหรับตัวอย่าง { x 1 , ..., x n } ของ เวกเตอร์มิติ kเราคำนวณ

ภายใต้สมมติฐานว่างของความปกติแบบหลายตัวแปร สถิติAจะมีลักษณะการแจกแจงแบบไคกำลังสอง โดยประมาณ โดยมี1/6k ( k + 1)( k + 2)องศาอิสระ และ Bจะเป็นค่าประมาณปกติมาตรฐานN (0,1)

สถิติความโค้งของ Mardia มีความเบี่ยงเบนและลู่เข้าสู่การแจกแจงปกติแบบจำกัดอย่างช้ามาก สำหรับตัวอย่างขนาดกลางพารามิเตอร์ของการแจกแจงแบบอะซิมโทติกของสถิติความโค้งจะถูกปรับเปลี่ยน[ 36 ]สำหรับการทดสอบตัวอย่างขนาดเล็ก ( ) จะใช้ค่าวิกฤตเชิงประจักษ์ ตารางค่าวิกฤตสำหรับสถิติทั้งสองมีให้โดย Rencher [ 37 ]สำหรับk  = 2, 3, 4

การทดสอบของ Mardia เป็นแบบ affine invariant แต่ไม่สอดคล้องกัน ตัวอย่างเช่น การทดสอบความเบี่ยงเบนแบบหลายตัวแปรไม่สอดคล้องกับทางเลือกที่ไม่ปกติแบบสมมาตร[ 38 ]

การทดสอบ BHEP

การทดสอบ BHEP [ 39 ]คำนวณค่ามาตรฐานของความแตกต่างระหว่างฟังก์ชันลักษณะ เชิงประจักษ์ และฟังก์ชันลักษณะเชิงทฤษฎีของการแจกแจงปกติ การคำนวณค่ามาตรฐานจะดำเนินการใน พื้นที่ L 2 ( μ )ของฟังก์ชันที่สามารถอินทิเกรตกำลังสองได้โดยสัมพันธ์กับฟังก์ชันถ่วงน้ำหนักแบบเกาส์เซียนสถิติการทดสอบคือ

การแจกแจงจำกัดของสถิติการทดสอบนี้คือผลรวมถ่วงน้ำหนักของตัวแปรสุ่มไคกำลังสอง[ 39 ]

มีการสำรวจรายละเอียดของขั้นตอนการทดสอบเหล่านี้และขั้นตอนอื่นๆ อยู่[ 40 ]

วิธีการคำนวณ

การดึงค่าจากการกระจาย

วิธีการที่ใช้กันอย่างแพร่หลายในการสุ่มเลือกเวกเตอร์สุ่มxจากการแจกแจงปกติหลายตัวแปรN มิติที่มีเวกเตอร์ค่าเฉลี่ย μและเมทริกซ์ความแปรปรวนร่วมΣทำงานดังนี้: [ 41 ]

  1. จงหาเมทริกซ์จริงใดๆAที่ทำให้AA T = Σเมื่อΣเป็นเมทริกซ์บวกกำหนด (positive-definite ) โดยทั่วไปจะใช้ การแยกตัวประกอบแบบ Choleskyเนื่องจากหาได้ง่าย มีประสิทธิภาพในการคำนวณ และเป็นที่รู้จักกันดี หากมีการแยกตัวประกอบแบบ Cholesky ที่เปิดเผยอันดับ (pivoted) เช่น dpstrf() ของ LAPACK ก็สามารถใช้ในกรณีเมทริกซ์บวกกึ่งกำหนด (positive-semidefinite) ทั่วไปได้เช่นกัน ทางเลือกทั่วไปที่ช้ากว่าคือการใช้เมทริกซ์A =1/2 ที่ได้จากการแยกตัวประกอบเชิงสเปกตรัมΣ = UΛU −1ของΣ
  2. ให้z = ( z 1 , ..., z N ) Tเป็นเวกเตอร์ที่มีส่วนประกอบเป็น ตัวแปรสุ่ม ปกติมาตรฐานอิสระN ตัว (ซึ่งสามารถสร้างขึ้นได้ เช่น โดยใช้การแปลงบ็อกซ์-มุลเลอร์ )
  3. ให้xเป็นμ + Azซึ่งมีการกระจายตัวตามที่ต้องการเนื่องจากคุณสมบัติการแปลงเชิงเส้นตรง

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Multivariate_normal_distribution&oldid=1352692294 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การกระจายแบบปกติหลายตัวแปร

ใน ทฤษฎีความน่าจะเป็น และ สถิติ การ แจกแจง ปกติหลายตัวแปร การ แจกแจงเกาส์เซียนหลายตัวแปร หรือ การแจกแจงปกติร่วม เป็นการขยายความของ การแจกแจงปกติ หนึ่งมิติ ( ตัวแปรเดียว ) ไปสู่...

สัญลักษณ์และการกำหนดพารามิเตอร์

การแจกแจงปกติหลายตัวแปรของเวกเตอร์สุ่ม k มิติ สามารถเขียนได้ในรูปแบบต่อไปนี้: X = ( X 1 , … , X k ) T {\displaystyle \mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm {T} }}

เวกเตอร์สุ่มปกติมาตรฐาน

เวกเตอร์สุ่ม จริงเรียกว่า เวกเตอร์สุ่มปกติมาตรฐาน ถ้าส่วนประกอบทั้งหมดเป็นอิสระต่อกัน และแต่ละเวกเตอร์เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนเป็นหนึ่ง ซึ่งมีการแจกแจงแบบปกติ กล่าวคือ ถ้าสำหรับทุก[ 1 ] : หน้า 454 X = ( X 1 , … , X k ) T...

เวกเตอร์สุ่มปกติแบบศูนย์กลาง

เวกเตอร์สุ่มจริงเรียกว่า เวกเตอร์สุ่มปกติแบบศูนย์กลาง ถ้ามีเมทริกซ์ อยู่ เช่นนั้นซึ่งมีการแจกแจงแบบเดียวกันกับโดยที่เป็นเวกเตอร์สุ่มปกติมาตรฐานที่มีส่วนประกอบ [ 1 ] : หน้า 454 X = ( X 1 , … , X k ) T {\displaystyle \mathbf {X} =(X_{1},\ldots ,X_{k})^{\mathrm...