กลับไปหน้าบทความ

อ่าน 11 นาที

การกระจายแบบซับเกาส์เซียน

การกระจายอย่างต่อเนื่อง

ในทฤษฎีความน่าจะ เป็น การแจกแจงแบบซับเกาส์เซียน ( subgaussian distribution ) คือการแจกแจงความน่าจะเป็นที่มีการลดลงอย่างรวดเร็วที่ส่วนหาง โดยเฉพาะอย่างยิ่ง...

การกระจายแบบซับเกาส์เซียน

ในทฤษฎีความน่าจะ เป็น การแจกแจงแบบซับเกาส์เซียน ( subgaussian distribution ) คือการแจกแจงความน่าจะเป็นที่มีการลดลงอย่างรวดเร็วที่ส่วนหาง โดยเฉพาะอย่างยิ่ง ส่วนหางของการแจกแจงแบบซับเกาส์เซียนนั้น จะถูกครอบงำโดย (กล่าวคือ ลดลงอย่างน้อยก็เร็วเท่ากับ) ส่วนหางของ การแจกแจงแบบเกาส์ เซียนคุณสมบัตินี้เองที่ทำให้การแจกแจงแบบซับเกาส์เซียนได้รับชื่อนี้

ในการวิเคราะห์ทางสถิติ เรามักจะแบ่งวัตถุ (เช่น ตัวแปรสุ่ม) ออกเป็นสองส่วน คือ ส่วนกลางและส่วนหางที่อยู่ห่างออกไป จากนั้นจึงวิเคราะห์แต่ละส่วนแยกกัน ในทางความน่าจะเป็น การแบ่งแบบนี้มักจะเป็น "ทุกสิ่งที่น่าสนใจเกิดขึ้นใกล้ศูนย์กลาง เหตุการณ์ที่ส่วนหางนั้นหายากมาก เราจึงสามารถละเลยได้อย่างปลอดภัย" การแจกแจงแบบซับเกาส์เซียนนั้นควรค่าแก่การศึกษา เพราะการแจกแจงแบบเกาส์เซียนนั้นเข้าใจได้ดี ดังนั้นเราจึงสามารถกำหนดขอบเขตที่ชัดเจนเกี่ยวกับความหายากของเหตุการณ์ที่ส่วนหางได้ การแจกแจงประเภทที่คล้ายกัน ซึ่งบางครั้งเรียกว่าการแจกแจงแบบซับเอ็กซ์โพเนน เชียล ก็มีประโยชน์เช่นกัน อย่างไรก็ตาม โปรดทราบว่าความหมายที่ได้รับการยอมรับมากกว่าของซับเอ็กซ์โพเนนเชียลนั้นเกือบจะตรงกันข้าม กล่าวคือ การลดลงช้ากว่าแบบเอ็กซ์โพเนนเชียล ไม่ใช่ว่าส่วนหางเบากว่าแบบเอ็กซ์โพเนนเชียล ดังนั้นจึงต้องระมัดระวังในการใช้คำนี้

ตามหลักการแล้ว การแจกแจงความน่าจะเป็นของตัวแปรสุ่มเรียกว่าแบบซับเกาส์เซียน ถ้ามีค่าคงที่ บวก C อยู่ค่า หนึ่ง ซึ่งสำหรับทุกๆ,

.

มีคำจำกัดความที่เทียบเท่ากันหลายอย่าง ตัวอย่างเช่น ตัวแปรสุ่มเป็นแบบซับเกาส์เซียนก็ต่อเมื่อฟังก์ชันการกระจายของตัวแปรสุ่มนั้นมีขอบเขตบน (โดยมีค่าคงที่) เท่ากับฟังก์ชันการกระจายของตัวแปรสุ่มเกาส์เซียน:

โดยที่เป็นค่าคงที่และเป็นตัวแปรสุ่มเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์[ 1 ] : ทฤษฎีบท 2.6

คำจำกัดความ

บรรทัดฐานซับเกาส์เซียน

นอร์มซับเกาส์เซียนของซึ่งแทนด้วยคือกล่าวอีกนัยหนึ่งคือ เป็นนอร์มออร์ลิซของที่สร้างขึ้นโดยฟังก์ชันออร์ลิซตามเงื่อนไขด้านล่าง ตัวแปรสุ่มซับเกาส์เซียนสามารถจำแนกได้ว่าเป็นตัวแปรสุ่มที่มีนอร์มซับเกาส์เซียนจำกัด

ตัวแทนความแปรปรวน

ถ้ามีจำนวนหนึ่งซึ่งสำหรับทุกค่าของ แล้วจำนวนนั้นเรียกว่าตัวแทนความแปรปรวน จำนวนที่เล็กที่สุดดังกล่าวเรียกว่าตัวแทนความแปรปรวนที่เหมาะสมที่สุดและใช้สัญลักษณ์แทน

ตัวแทนความแปรปรวนที่เหมาะสมและบรรทัดฐานซับเกาส์เซียนมีความสัมพันธ์กันโดย และขอบเขตทั้งสองมีความคมชัด ซึ่งได้มาจากการแจกแจงเกาส์เซียนมาตรฐานและการแจกแจงราเดมาเชอร์ตามลำดับ[ 2 ]

สำหรับตัวแปรสุ่มแบบเกาส์เซียนจะได้ว่า และดังนั้น

คำจำกัดความที่เทียบเท่ากัน

ให้เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยเป็นศูนย์ ให้เป็นค่าคงที่บวก เงื่อนไขต่อไปนี้เทียบเท่ากัน: (ข้อเสนอ 2.5.2 [ 3 ] )

  1. ขอบเขตความน่าจะเป็นของหาง: สำหรับทุก;
  2. นอร์มซับเกาส์เซียนจำกัด: ;
  3. โมเมนต์ : สำหรับทุกค่าโดยที่คือฟังก์ชันแกมมา ;
  4. ช่วงเวลา : สำหรับทุกคน;
  5. ฟังก์ชันสร้างโมเมนต์ (ของ) หรือตัวแทนความแปรปรวน[ 4 ] [ 5 ]  : สำหรับทุก;
  6. ฟังก์ชันสร้างโมเมนต์ (ของ): สำหรับทุก;
  7. ขอบเขตยูเนียน : สำหรับc > 0 บางค่า สำหรับn > cทั้งหมดโดยที่Xเป็นสำเนาอิสระและเหมือนกัน
  8. แบบซับเอ็กซ์โพเนนเชียล : มีการกระจายแบบซับเอ็กซ์โพเนนเชียล

นอกจากนี้ ค่าคงที่ยังเหมือนกันในคำจำกัดความ (1) ถึง (5) จนถึงค่าคงที่สัมบูรณ์ ตัวอย่างเช่น เมื่อกำหนดตัวแปรสุ่มที่สอดคล้องกับ (1) และ (2) ค่าคงที่ขั้นต่ำในคำจำกัดความทั้งสองจะสอดคล้องกับโดยที่เป็นค่าคงที่ที่ไม่ขึ้นอยู่กับตัวแปรสุ่ม

หลักฐานการเทียบเท่า

ตัวอย่างเช่น นิยามสี่ข้อแรกนั้นเทียบเท่ากันตามการพิสูจน์ด้านล่าง

พิสูจน์โดยการ เปรียบเทียบ เค้กหลายชั้น

หลังจากเปลี่ยนตัวแปรแล้ว เราพบว่าจากอนุกรมเทย์เลอร์ซึ่งน้อยกว่าหรือเท่ากับสำหรับให้แล้ว

โดยอสมการของมาร์คอฟและโดยสูตรเชิงอะซิมโทติกของฟังก์ชันแกมมา: .

จากบทพิสูจน์ เราสามารถแยกชุดอสมการได้สามชุด:

  • ถ้าเช่นนั้นสำหรับทุกๆ
  • ถ้าสำหรับทั้งหมดแล้ว.
  • ถ้าเช่นนั้น

โดยเฉพาะอย่างยิ่ง ค่าคงที่ที่กำหนดโดยคำนิยามนั้นเหมือนกันจนถึงตัวประกอบคงที่ ดังนั้นเราจึงสามารถกล่าวได้ว่าคำนิยามนั้นเทียบเท่ากันจนถึงค่าคงที่ที่ไม่ขึ้นกับตัวประกอบคงที่

ในทำนองเดียวกัน เนื่องจากค่าคงที่การคูณที่เป็นบวกสำหรับทุก ๆนิยาม (3) และ (4) ก็เทียบเท่ากันโดยมีค่าคงที่เช่นกัน

คุณสมบัติพื้นฐาน

คุณสมบัติ พื้นฐาน * ถ้าเป็นแบบซับเกาส์เซียน และแล้วและ

  • (อสมการสามเหลี่ยม) ถ้าเป็นแบบซับเกาส์เซียนแล้ว
  • (ขอบเขตเชอร์นอฟ) ถ้าเป็นแบบซับเกาส์เซียนแล้วสำหรับทุก

means that , where the positive constant is independent of and .

Subgaussian deviation boundIf is subgaussian, then

Proof

By triangle inequality, . Now we have . By the equivalence of definitions (2) and (4) of subgaussianity, we have .

Independent subgaussian sum boundIf are subgaussian and independent, then

Proof

If independent, then use that the cumulant of independent random variables is additive. That is, .

If not independent, then by Hölder's inequality, for any we have Solving the optimization problem , we obtain the result.

CorollaryLinear sums of subgaussian random variables are subgaussian.

Partial converse (Matoušek 2008, Lemma 2.4)If , and for all , then where depends on only.

Proof
Proof

Let be the CDF of . The proof splits the integral of MGF to two halves, one with and one with , and bound each one respectively.

Since for , For the second term, upper bound it by a summation: When , for any , , so

When , by drawing out the curve of , and plotting out the summation, we find that Now verify that , where depends on only.

Corollary (Matoušek 2008, Lemma 2.2) are independent random variables with the same upper subgaussian tail: for all . Also, , then for any unit vector , the linear sum has a subgaussian tail: where depends only on .

Concentration

Gaussian concentration inequality for Lipschitz functions (Tao 2012, Theorem 2.1.12.)If is -Lipschitz, and is a standard gaussian vector, then concentrates around its expectation at a rate and similarly for the other tail.

Proof
Proof

By shifting and scaling, it suffices to prove the case where , and .

Since every 1-Lipschitz function is uniformly approximable by 1-Lipschitz smooth functions (by convolving with a mollifier), it suffices to prove it for 1-Lipschitz smooth functions.

Now it remains to bound the cumulant generating function.

To exploit the Lipschitzness, we introduce , an independent copy of , then by Jensen,

By the circular symmetry of gaussian variables, we introduce . This has the benefit that its derivative is independent of it.

ทีนี้มาหาค่าคาดหวังของมันค่าคาดหวังภายในอินทิกรัลนั้นอยู่เหนือการแจกแจงร่วมของแต่เนื่องจากการแจกแจงร่วมของ นั้นเหมือนกันทุกประการ เราจึงได้

เมื่อพิจารณาตามเงื่อนไขแล้วปริมาณ ดังกล่าว จะมีการกระจายแบบปกติ โดยมีค่าความแปรปรวนเท่ากับ ดังนั้น

ดังนั้น เราจึงมี

ซับเกาส์เซียนอย่างเคร่งครัด

เมื่อขยายฟังก์ชันก่อกำเนิดคูมูลันต์เราจะพบว่าที่ขอบเขตความเป็นไปได้ เรากำหนดว่าตัวแปร สุ่มที่สอดคล้องกับเงื่อนไขนี้ เรียกว่า ตัวแปรสุ่ม ซับเกาส์เซียน อย่างเคร่งครัด

คุณสมบัติ

ทฤษฎีบท[ 6 ]ให้เป็นตัวแปรสุ่มซับเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์ ถ้าศูนย์ทั้งหมดของฟังก์ชันลักษณะเฉพาะเป็นจำนวนจริง แล้วจะเป็นซับเกาส์เซียนอย่างเคร่งครัด

บทสรุป.ถ้าตัวแปรสุ่มอิสระและเป็นแบบซับเกาส์เซียนอย่างเคร่งครัดแล้ว ผลรวมเชิงเส้นใดๆ ของตัวแปรสุ่มเหล่านั้นก็จะเป็นแบบซับเกาส์เซียนอย่างเคร่งครัดเช่นกัน

ตัวอย่าง

โดยการคำนวณฟังก์ชันลักษณะเฉพาะ เราสามารถแสดงให้เห็นว่าการแจกแจงบางอย่างเป็นแบบซับเกาส์เซียนอย่างแท้จริง ได้แก่ การแจกแจงเอกรูปสมมาตร และการแจกแจงเบอร์นูลลีสมมาตร

เนื่องจากการกระจายแบบเอกรูปสมมาตรเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด ดังนั้นการสังเคราะห์การกระจายนั้นกับตัวมันเองจึงเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด กล่าวคือการกระจายแบบสามเหลี่ยม สมมาตร เป็นแบบซับเกาส์เซียนอย่างเคร่งครัด

เนื่องจากการแจกแจงแบบเบอร์นูลลีสมมาตรเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด ดังนั้นการแจกแจงแบบทวินาม สมมาตรใดๆ ก็ เป็นแบบซับเกาส์เซียนอย่างเคร่งครัดเช่นกัน

ตัวอย่าง

ซับเกาส์เซียนอย่างเคร่งครัด?
การกระจายแบบเกาส์เซียนใช่
การแจกแจงเบอร์นูลลีที่มีค่าเฉลี่ยเป็นศูนย์วิธีแก้ปัญหาถ้า
การแจกแจงเบอร์นูลลีแบบสมมาตรใช่
การกระจายแบบสม่ำเสมอคำตอบสำหรับประมาณ 0.7727 ใช่
การแจกแจงแบบสุ่มในช่วงเวลา

ตัวแทนความแปรปรวนที่เหมาะสมที่สุดเป็นที่รู้จักสำหรับการกระจายความน่าจะเป็นมาตรฐานหลายแบบ รวมถึงเบต้า เบอร์นูลลี ดิริชเลต์[ 7 ]คูมาราสวามี สามเหลี่ยม[ 8 ]เกาส์เซียนแบบตัดทอน และเอกซ์โพเนนเชียลแบบตัดทอน[ 9 ]

การแจกแจงแบบเบอร์นูลลี

ให้เป็นจำนวนบวกสองจำนวน ให้เป็นการแจกแจงเบอร์นูลีแบบศูนย์กลางดังนั้นจึงมีค่าเฉลี่ยเป็นศูนย์ จากนั้น[ 6 ] บรรทัดฐานซับเกาส์เซียนคือโดยที่ เป็นคำตอบ บวก ที่ไม่ซ้ำกันของ

ให้เป็นตัวแปรสุ่มที่มีการแจกแจงแบบเบอร์นูลลีสมมาตร (หรือการแจกแจงแบบราเดมาเชอร์ ) กล่าวคือมีค่าเป็นและโดยมีความน่าจะเป็นเท่ากับ เนื่องจากดังนั้นและด้วยเหตุนี้จึงเป็นตัวแปรสุ่มแบบซับเกาส์เซียน

การแจกแจงแบบมีขอบเขต

การแจกแจงแบบมีขอบเขตที่ใช้กันทั่วไปบางส่วน

การแจกแจงแบบมีขอบเขตจะไม่มีส่วนหางเลย ดังนั้นจึงเห็นได้ชัดว่าเป็นการแจกแจงแบบซับเกาส์เซียน

ถ้า ถูกจำกัดอยู่ ในช่วงทฤษฎีบทของ Hoeffdingกล่าวว่าอสมการของ Hoeffdingคือขอบเขตของ Chernoff ที่ได้มาจากการใช้ข้อเท็จจริงนี้

คอนโวลูชัน

ความหนาแน่นของส่วนผสมของการแจกแจงปกติสามแบบ ( μ  = 5, 10, 15, σ  = 2) ที่มีน้ำหนักเท่ากัน โดยแต่ละส่วนประกอบแสดงเป็นความหนาแน่นแบบถ่วงน้ำหนัก (แต่ละค่าอินทิเกรตเท่ากับ 1/3)

เนื่องจากผลรวมของตัวแปรสุ่มซับเกาส์เซียนยังคงเป็นซับเกาส์เซียน ดังนั้นการสังเคราะห์ (convolution) ของการแจกแจงซับเกาส์เซียนจึงยังคงเป็นซับเกาส์เซียน โดยเฉพาะอย่างยิ่ง การสังเคราะห์ใดๆ ของการแจกแจงปกติกับการแจกแจงที่มีขอบเขตใดๆ ก็จะเป็นซับเกาส์เซียนเช่นกัน

ส่วนผสม

เมื่อกำหนดการกระจายแบบซับเกาส์เซียนแล้ว เราสามารถสร้างส่วนผสมแบบบวกได้ดังนี้: ขั้นแรก สุ่มเลือกตัวเลขจากนั้นเลือก

เนื่องจากเรามีและดังนั้นส่วนผสมจึงเป็นซับเกาส์เซียน

โดยเฉพาะอย่างยิ่งส่วนผสมแบบเกาส์เซียน ใดๆ ก็ตาม ล้วน เป็นส่วนผสมแบบซับเกาส์เซียน

โดยทั่วไปแล้ว การผสมผสานของการกระจายแบบซับเกาส์เซียนจำนวนอนันต์ก็จะเป็นแบบซับเกาส์เซียนเช่นกัน หากค่ามาตรฐานของซับเกาส์เซียนมีค่าสูงสุด จำกัด : .

เวกเตอร์สุ่มซับเกาส์เซียน

ที่ผ่านมา เราได้กล่าวถึงคุณสมบัติซับเกาส์เซียนสำหรับตัวแปรสุ่มค่าจริงไปแล้ว เรายังสามารถกำหนดคุณสมบัติซับเกาส์เซียนสำหรับเวกเตอร์สุ่ม ได้อีก ด้วย จุดประสงค์ของคุณสมบัติซับเกาส์เซียนคือการทำให้ส่วนหางของเวกเตอร์ลดลงอย่างรวดเร็ว ดังนั้นเราจึงสรุปได้ว่า เวกเตอร์สุ่มซับเกาส์เซียนคือเวกเตอร์สุ่มที่ส่วนหางลดลงอย่างรวดเร็ว

ให้เป็นเวกเตอร์สุ่มที่รับค่าใน

กำหนด.

  • โดยที่คือทรงกลมหน่วยใน ในทำนองเดียวกัน สำหรับตัวแทนความแปรปรวน
  • เป็นแบบซับเกาส์เซียนก็ต่อเมื่อ.

ทฤษฎีบท (ทฤษฎีบท 3.4.6 [ 3 ] ) สำหรับจำนวนเต็มบวกใดๆเวกเตอร์สุ่มที่กระจายอย่างสม่ำเสมอจะเป็นซับเกาส์เซียน โดยมี

นี่ไม่ใช่เรื่องน่าประหลาดใจนัก เพราะเมื่อ ค่าเข้าใกล้ การฉาย ภาพของค่าไปยังพิกัดแรกจะลู่เข้าสู่การแจกแจงปกติมาตรฐาน

ความไม่เท่าเทียมกันสูงสุด

ทฤษฎีบทถ้าเป็นซับเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์ โดยที่ แล้วสำหรับทุกเราจะได้ด้วยความน่าจะเป็น

การพิสูจน์

ตามขอบเขตของเชอร์นอฟ. จากนั้นใช้ขอบเขตของสหภาพ .

ทฤษฎีบท (แบบฝึกหัด 2.5.10 [ 3 ] ) ถ้าเป็นซับเกาส์เซียน โดยที่ แล้วนอกจากนี้ ขอบเขตยังแม่นยำ เนื่องจากเมื่อเป็นตัวอย่าง IID ของเราจะมี[ 10 ]

ทฤษฎีบท (เหนือเซตจำกัด[ 11 ] ) ถ้าเป็นแบบซับเกาส์เซียนโดยที่ แล้ว

การพิสูจน์

สำหรับ t>0 ใดๆ: นี่คือโครงสร้างการพิสูจน์มาตรฐานสำหรับการพิสูจน์ขอบเขตแบบ Chernoffสำหรับตัวแปรย่อยแบบ Gaussian สำหรับสมการที่สอง เพียงพอที่จะพิสูจน์กรณีที่มีตัวแปรเดียวและค่าเฉลี่ยเป็นศูนย์ จากนั้นใช้ขอบเขตแบบยูเนียนก่อนอื่นโดยใช้Markov , , จากนั้นโดยใช้คำจำกัดความของตัวแทนความแปรปรวน , และจากนั้นปรับให้เหมาะสมที่สุดที่

บทสรุป (บนโพลีโทปนูน ) กำหนดเซตเวกเตอร์จำกัดจำนวนหนึ่งถ้าเป็นเวกเตอร์สุ่ม โดยที่แต่ละแล้วอสมการทั้ง 4 ข้างต้นจะเป็นจริง โดยแทนที่ในที่นี้คือโพลีโทปนูนที่ล้อมรอบด้วยเวกเตอร์

ทฤษฎีบท (เวกเตอร์สุ่มซับเกาส์เซียน) ถ้าเป็นเวกเตอร์สุ่มในโดยที่สำหรับทุกบนทรงกลมหน่วยแล้วสำหรับใดๆด้วยความน่าจะเป็นอย่างน้อย

ความไม่เท่าเทียมกัน

ทฤษฎีบท (ทฤษฎีบท 2.6.1 [ 3 ] ) มีค่าคงที่บวกอยู่ค่าหนึ่งซึ่งกำหนดให้ตัวแปรสุ่มซับเกาส์เซียนอิสระที่มีค่าเฉลี่ยเป็นศูนย์จำนวนใดๆทฤษฎีบท(อสมการของ Hoeffding) (ทฤษฎีบท 2.6.3 [ 3 ] ) มีค่าคงที่บวกอยู่ค่าหนึ่ง ซึ่งกำหนดให้ตัวแปรสุ่มซับเกาส์เซียนอิสระ ที่มีค่าเฉลี่ยเป็นศูนย์จำนวนใดๆทฤษฎีบท (อสมการของ Bernstein) (ทฤษฎีบท 2.8.1 [ 3 ] ) มีค่าคงที่บวกอยู่ค่าหนึ่งซึ่งกำหนดให้ตัวแปรสุ่มซับเอกซ์โพเนนเชียลอิสระที่มีค่าเฉลี่ยเป็นศูนย์จำนวนใดๆทฤษฎีบท(อสมการของ Khinchine) (แบบฝึกหัด 2.6.5 [ 3 ] ) มีค่าคงที่บวกอยู่ค่าหนึ่งซึ่งกำหนดให้ตัวแปรสุ่มซับเกาส์เซียนอิสระที่มีค่าเฉลี่ยเป็นศูนย์และค่าความแปรปรวนเป็นหนึ่งจำนวนใดๆ ใดๆและใดๆ

ความไม่เท่าเทียมกันของแฮนสัน-ไรท์

อสมการแฮนสัน-ไรท์กล่าวว่า ถ้าเวกเตอร์สุ่มเป็นแบบซับเกาส์เซียนในความหมายหนึ่งแล้วรูปแบบกำลังสอง ใดๆ ของเวกเตอร์นี้ก็จะเป็นแบบซับเกาส์เซียน/ซับเอ็กซ์โพเนนเชียลด้วย ยิ่งไปกว่านั้น ขอบบนของส่วนหางของจะเป็นแบบเอกรูป

ทฤษฎีบทเวอร์ชันอ่อนต่อไปนี้ได้รับการพิสูจน์ใน (Hanson, Wright, 1971) [ 12 ]มีส่วนขยายและรูปแบบต่างๆ มากมาย เช่นเดียวกับทฤษฎีบทลิมิตกลางอสมการ Hanson-Wright เป็นกลุ่มของทฤษฎีบทที่มีจุดประสงค์เดียวกันมากกว่าทฤษฎีบทเดียว จุดประสงค์คือการใช้เวกเตอร์ซับเกาส์เซียนและจำกัดรูปแบบกำลังสองของมันอย่างสม่ำเสมอ

ทฤษฎีบท[ 13 ] [ 14 ]มีค่าคงที่ อยู่ค่าหนึ่งซึ่ง:

ให้เป็นจำนวนเต็มบวก ให้และ เป็นตัวแปรสุ่ม อิสระ โดยที่แต่ละตัวเป็นไปตามเงื่อนไข รวมตัวแปรสุ่มทั้งสองนี้ เข้าด้วยกันเป็นเวกเตอร์สุ่มสำหรับเมทริกซ์ ใดๆ เราจะได้ว่า โดยที่และคือค่ามาตรฐานฟรอเบนิอุสของเมทริกซ์ และคือค่ามาตรฐานตัวดำเนินการของเมทริกซ์

กล่าวคือ รูปแบบกำลังสองจะมีส่วนหางที่ถูกจำกัดอย่างสม่ำเสมอด้วยฟังก์ชันเอกซ์โปเนนเชียลหรือฟังก์ชันเกาส์เซียน แล้วแต่ว่าฟังก์ชันใดมีค่ามากกว่า

ในข้อความของทฤษฎีบท ค่าคงที่ดังกล่าวเป็น "ค่าคงที่สัมบูรณ์" ซึ่งหมายความว่ามันไม่มีความขึ้นอยู่กับค่าใดๆมันเป็นค่าคงที่ทางคณิตศาสตร์เช่นเดียวกับค่าพายและค่า e

ผลที่ตามมา

ทฤษฎีบท (ความเข้มข้นแบบซับเกาส์เซียน) [ 13 ]มีค่าคงที่ อยู่ค่าหนึ่งซึ่ง:

ให้และ เป็นจำนวนเต็มบวก ให้และ เป็นตัวแปรสุ่มอิสระ โดยที่แต่ละตัวเป็นไปตามเงื่อนไขรวมตัวแปรสุ่มทั้งสองนี้เข้าด้วยกันเป็นเวกเตอร์สุ่มสำหรับเมทริกซ์ ใดๆ เราจะได้ว่า กล่าวคือ เวกเตอร์สุ่มกระจุกตัวอยู่บนเปลือกทรงกลมรัศมีโดยที่เป็นเวกเตอร์สุ่มแบบซับเกาส์เซียน และมีนอร์มแบบซับเกาส์เซียน

ดูเพิ่มเติม

หมายเหตุ

  1. ^ Wainwright MJ.สถิติมิติสูง: มุมมองที่ไม่ใช่เชิงอะซิมโทติกเคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์; 2019. doi : 10.1017/9781108627771 , ISBN 9781108627771.
  2. ^ Leskelä, Lasse; Zhukov, Matvei (2026). "ค่าคงที่ที่คมชัดซึ่งเชื่อมโยงบรรทัดฐานย่อยเกาส์เซียนและพารามิเตอร์ย่อยเกาส์เซียน"การสื่อสารทางอิเล็กทรอนิกส์ในความน่าจะเป็น 31 : 1– 11. doi : 10.1214 /26-ECP761 .
  3. ^ a b c d e f g Vershynin, R. (2018). ความน่าจะเป็นมิติสูง: บทนำพร้อมการประยุกต์ใช้ในวิทยาศาสตร์ข้อมูลเคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์
  4. คาฮาเน เจ. (1960) "Propriétés locales des fonctions à séries de Fourier aléatoires" สตูเดีย แมทเธมาติกา . 19 : 1– 25. ดอย : 10.4064/sm-19-1-1-25 .
  5. บูลดีจิน, VV; โคซาเชนโก, ยู. วี. (1980). "ตัวแปรสุ่มแบบซับเกาส์เซียน" วารสารคณิตศาสตร์ยูเครน32 (6): 483– 489. ดอย : 10.1007/BF01087176 .
  6. ^ a b Bobkov, SG; Chistyakov, GP; Götze, F. (2023-08-03). "การแจกแจงความน่าจะเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด" arXiv : 2308.01749 [ math.PR ]
  7. ^ Marchal, Olivier; Arbel, Julyan (2017). "เกี่ยวกับความเป็นกึ่งเกาส์เซียนของการแจกแจงเบตาและดิริชเลต์" การสื่อสารทางอิเล็กทรอนิกส์ในความน่าจะเป็น 22 . arXiv : 1705.00048 . doi : 10.1214 /17-ECP92 .
  8. ^ Arbel, Julyan; Marchal, Olivier; Nguyen, Hien D. (2020). "เกี่ยวกับความเป็นกึ่งเกาส์เซียนที่เข้มงวด ความแปรปรวนตัวแทนที่เหมาะสมที่สุด และความสมมาตรสำหรับตัวแปรสุ่มที่มีขอบเขต" Esaim: ความน่าจะเป็นและสถิติ 24 : 39– 55. arXiv : 1901.09188 . doi : 10.1051 /ps/2019018 .
  9. ^ Barreto, Mathias; Marchal, Olivier; Arbel, Julyan (2024). "ตัวแทนความแปรปรวนย่อยเกาส์เซียนที่เหมาะสมที่สุดสำหรับตัวแปรสุ่มเกาส์เซียนและเอกซ์โพเนนเชียลที่ถูกตัดทอน" arXiv : 2403.08628 [ math.ST ]
  10. ^ Kamath, Gautam. "ขอบเขตของค่าคาดหวังของค่าสูงสุดของตัวอย่างจากฟังก์ชันเกาส์เซียน " (2015)
  11. ^ "MIT 18.S997 | ฤดูใบไม้ผลิ 2015 | สถิติมิติสูง บทที่ 1 ตัวแปรสุ่มแบบซับเกาส์เซียน" (PDF) . MIT OpenCourseWare . สืบค้นเมื่อ2024-04-03 .
  12. ^ Hanson, DL; Wright, FT (1971). "ขอบเขตของความน่าจะเป็นส่วนหางสำหรับรูปแบบกำลังสองในตัวแปรสุ่มอิสระ" . วารสารสถิติคณิตศาสตร์ . 42 (3): 1079– 1083. doi : 10.1214/aoms/1177693335 . ISSN 0003-4851 . JSTOR 2240253 .  
  13. ^ a b Rudelson, Mark; Vershynin, Roman (มกราคม 2013). "ความไม่เท่าเทียมกันของ Hanson-Wright และความเข้มข้นแบบ sub-gaussian" . Electronic Communications in Probability . 18 (ไม่มี): 1– 9. arXiv : 1306.2872 . doi : 10.1214/ECP.v18-2865 . ISSN 1083-589X . 
  14. ^ Vershynin, Roman (2018). "6. รูปแบบกำลังสอง การทำให้สมมาตร และการหดตัว"ความน่าจะเป็นมิติสูง: บทนำพร้อมการประยุกต์ใช้ในวิทยาศาสตร์ข้อมูล ชุดเคมบริดจ์ในคณิตศาสตร์สถิติและความน่าจะเป็น เค มบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ หน้า  127–146 doi : 10.1017 /9781108231596.009 ISBN 978-1-108-41519-4.

เอกสารอ้างอิง

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การกระจายแบบซับเกาส์เซียน

ในทฤษฎีความน่าจะ เป็น การแจกแจงแบบซับเกาส์เซียน ( subgaussian distribution ) คือการแจกแจงความน่าจะเป็นที่มีการลดลงอย่างรวดเร็วที่ส่วนหาง โดยเฉพาะอย่างยิ่ง...

บรรทัดฐานซับเกาส์เซียน

นอร์มซับเกาส์เซียนของซึ่งแทนด้วยคือกล่าวอีกนัยหนึ่งคือ เป็นนอร์มออร์ลิซของที่สร้างขึ้นโดยฟังก์ชันออร์ลิซตามเงื่อนไขด้านล่าง ตัวแปรสุ่มซับเกาส์เซียนสามารถจำแนกได้ว่าเป็นตัวแปรสุ่มที่มีนอร์มซับเกาส์เซียนจำกัด X{\displaystyle X}‖X‖ψ2{\displaystyle \Vert X\Vert...

ตัวแทนความแปรปรวน

ถ้ามีจำนวนหนึ่งซึ่งสำหรับทุกค่าของ แล้วจำนวนนั้นเรียกว่าตัวแทนความแปรปรวน จำนวนที่เล็กที่สุดดังกล่าวเรียกว่าตัวแทนความแปรปรวนที่เหมาะสมที่สุดและใช้สัญลักษณ์แทน ส2≥0{\displaystyle s^{2}\geq 0}อี[อี(X−อี[X])ที]≤อีส2ที22{\displaystyle \mathbb {E} [e^{(X-\mathbb...

คำจำกัดความที่เทียบเท่ากัน

ให้เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยเป็นศูนย์ ให้เป็นค่าคงที่บวก เงื่อนไขต่อไปนี้เทียบเท่ากัน: (ข้อเสนอ 2.5.2 [ 3 ] ) X{\displaystyle X}เค1,เค2,เค3,…{\displaystyle K_{1},K_{2},K_{3},\dots }ขอบเขตความน่าจะเป็นของหาง:...