การกระจายแบบซับเกาส์เซียน

ในทฤษฎีความน่าจะ เป็น การแจกแจงแบบซับเกาส์เซียน ( subgaussian distribution ) คือการแจกแจงความน่าจะเป็นที่มีการลดลงอย่างรวดเร็วที่ส่วนหาง โดยเฉพาะอย่างยิ่ง ส่วนหางของการแจกแจงแบบซับเกาส์เซียนนั้น จะถูกครอบงำโดย (กล่าวคือ ลดลงอย่างน้อยก็เร็วเท่ากับ) ส่วนหางของ การแจกแจงแบบเกาส์ เซียนคุณสมบัตินี้เองที่ทำให้การแจกแจงแบบซับเกาส์เซียนได้รับชื่อนี้

ในการวิเคราะห์ทางสถิติ เรามักจะแบ่งวัตถุ (เช่น ตัวแปรสุ่ม) ออกเป็นสองส่วน คือ ส่วนกลางและส่วนหางที่อยู่ห่างออกไป จากนั้นจึงวิเคราะห์แต่ละส่วนแยกกัน ในทางความน่าจะเป็น การแบ่งแบบนี้มักจะเป็น "ทุกสิ่งที่น่าสนใจเกิดขึ้นใกล้ศูนย์กลาง เหตุการณ์ที่ส่วนหางนั้นหายากมาก เราจึงสามารถละเลยได้อย่างปลอดภัย" การแจกแจงแบบซับเกาส์เซียนนั้นควรค่าแก่การศึกษา เพราะการแจกแจงแบบเกาส์เซียนนั้นเข้าใจได้ดี ดังนั้นเราจึงสามารถกำหนดขอบเขตที่ชัดเจนเกี่ยวกับความหายากของเหตุการณ์ที่ส่วนหางได้ การแจกแจงประเภทที่คล้ายกัน ซึ่งบางครั้งเรียกว่าการแจกแจงแบบซับเอ็กซ์โพเนน เชียล ก็มีประโยชน์เช่นกัน อย่างไรก็ตาม โปรดทราบว่าความหมายที่ได้รับการยอมรับมากกว่าของซับเอ็กซ์โพเนนเชียลนั้นเกือบจะตรงกันข้าม กล่าวคือ การลดลงช้ากว่าแบบเอ็กซ์โพเนนเชียล ไม่ใช่ว่าส่วนหางเบากว่าแบบเอ็กซ์โพเนนเชียล ดังนั้นจึงต้องระมัดระวังในการใช้คำนี้

ตามหลักการแล้ว การแจกแจงความน่าจะเป็นของตัวแปรสุ่มเรียกว่าแบบซับเกาส์เซียน ถ้ามีค่าคงที่ บวก C อยู่ค่า หนึ่ง ซึ่งสำหรับทุกๆ, $X$ $t\geq 0$

{\textstyle \mathbb {P} (|X|\geq t)\leq 2\exp {(-t^{2}/C^{2})}}

.

มีคำจำกัดความที่เทียบเท่ากันหลายอย่าง ตัวอย่างเช่น ตัวแปรสุ่มเป็นแบบซับเกาส์เซียนก็ต่อเมื่อฟังก์ชันการกระจายของตัวแปรสุ่มนั้นมีขอบเขตบน (โดยมีค่าคงที่) เท่ากับฟังก์ชันการกระจายของตัวแปรสุ่มเกาส์เซียน: $X$

\mathbb {P} (|X|\geq t)\leq c\,\mathbb {P} (|Z|\geq t)\quad \forall t>0

โดยที่เป็นค่าคงที่และเป็นตัวแปรสุ่มเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์^[¹^]^{: ทฤษฎีบท 2.6} $c\geq 0$ $Z$

คำจำกัดความ

บรรทัดฐานซับเกาส์เซียน

นอร์มซับเกาส์เซียนของซึ่งแทนด้วยคือกล่าวอีกนัยหนึ่งคือ เป็นนอร์มออร์ลิซของที่สร้างขึ้นโดยฟังก์ชันออร์ลิซตามเงื่อนไขด้านล่าง ตัวแปรสุ่มซับเกาส์เซียนสามารถจำแนกได้ว่าเป็นตัวแปรสุ่มที่มีนอร์มซับเกาส์เซียนจำกัด $X$ $\Vert X\Vert _{\psi _{2}}$ $\Vert X\Vert _{\psi _{2}}=\inf \left\{c>0:\mathbb {E} \left[\exp {\left({\frac {X^{2}}{c^{2}}}\right)}\right]\leq 2\right\}.$ $X$ $\พี (u)=e^{u^{2}}-1.$ $(2)$

ตัวแทนความแปรปรวน

ถ้ามีจำนวนหนึ่งซึ่งสำหรับทุกค่าของ แล้วจำนวนนั้นเรียกว่าตัวแทนความแปรปรวน จำนวนที่เล็กที่สุดดังกล่าวเรียกว่าตัวแทนความแปรปรวนที่เหมาะสมที่สุดและใช้สัญลักษณ์แทน $s^{2}\geq 0$ $\mathbb {E} [e^{(X-\mathbb {E} [X])t}]\leq e^{\frac {s^{2}t^{2}}{2}}$ $t\in \mathbb {R}$ $s^{2}$ $s^{2}$ $\Vert X\Vert _{\mathrm {vp} }^{2}$

ตัวแทนความแปรปรวนที่เหมาะสมและบรรทัดฐานซับเกาส์เซียนมีความสัมพันธ์กันโดย และขอบเขตทั้งสองมีความคมชัด ซึ่งได้มาจากการแจกแจงเกาส์เซียนมาตรฐานและการแจกแจงราเดมาเชอร์ตามลำดับ^[²^] ${\sqrt {3/8}}\cdot \Vert X\Vert _{\psi _{2}}\leq \Vert X\Vert _{\mathrm {vp} }\leq {\sqrt {\log 2}}\cdot \Vert X\Vert _{\psi _{2}},$

สำหรับตัวแปรสุ่มแบบเกาส์เซียนจะได้ว่า และดังนั้น $X\sim {\mathcal {N}}(\mu ,\sigma ^{2})$ $\mathbb {E} [e^{(X-\mathbb {E} [X])t}]=e^{\frac {\sigma ^{2}t^{2}}{2}}$ $\|X\|_{\mathrm {vp} }^{2}=\sigma ^{2}$

คำจำกัดความที่เทียบเท่ากัน

ให้เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยเป็นศูนย์ ให้เป็นค่าคงที่บวก เงื่อนไขต่อไปนี้เทียบเท่ากัน: (ข้อเสนอ 2.5.2 ^[³^] ) $X$ $K_{1},K_{2},K_{3},\dots$

ขอบเขตความน่าจะเป็นของหาง: สำหรับทุก; $\mathbb {P} (|X|\geq t)\leq 2\exp {(-t^{2}/K_{1}^{2})}$ $t\geq 0$
นอร์มซับเกาส์เซียนจำกัด: ; $\Vert X\Vert _{\psi _{2}}=K_{2}<\infty$
โมเมนต์ : สำหรับทุกค่าโดยที่คือฟังก์ชันแกมมา ; $\mathbb {E} |X|^{p}\leq 2K_{3}^{p}\Gamma \left({\frac {p}{2}}+1\right)$ $p\geq 1$ $\Gamma$
ช่วงเวลา : สำหรับทุกคน; $\mathbb {E} |X|^{p}\leq K^{p}p^{p/2}$ $p\geq 1$
ฟังก์ชันสร้างโมเมนต์ (ของ) หรือตัวแทนความแปรปรวน^[⁴^]^[⁵^] : สำหรับทุก; $X$ $\mathbb {E} [e^{(X-\mathbb {E} [X])t}]\leq e^{\frac {K^{2}t^{2}}{2}}$ $t$
ฟังก์ชันสร้างโมเมนต์ (ของ): สำหรับทุก; $X^{2}$ $\mathbb {E} [e^{X^{2}t^{2}}]\leq e^{K^{2}t^{2}}$ $t\in [-1/K,+1/K]$
ขอบเขตยูเนียน : สำหรับc > 0 บางค่า สำหรับn > cทั้งหมดโดยที่Xเป็นสำเนาอิสระและเหมือนกัน $\ \mathbb {E} [\max\{|X_{1}-\mathbb {E} [X]|,\ldots ,|X_{n}-\mathbb {E} [X]|\}]\leq c{\sqrt {\log n}}$ $X_{1},\ldots ,X_{n}$
แบบซับเอ็กซ์โพเนนเชียล : มีการกระจายแบบซับเอ็กซ์โพเนนเชียล $X^{2}$

นอกจากนี้ ค่าคงที่ยังเหมือนกันในคำจำกัดความ (1) ถึง (5) จนถึงค่าคงที่สัมบูรณ์ ตัวอย่างเช่น เมื่อกำหนดตัวแปรสุ่มที่สอดคล้องกับ (1) และ (2) ค่าคงที่ขั้นต่ำในคำจำกัดความทั้งสองจะสอดคล้องกับโดยที่เป็นค่าคงที่ที่ไม่ขึ้นอยู่กับตัวแปรสุ่ม $K$ $K_{1},K_{2}$ $K_{1}\leq cK_{2},K_{2}\leq c'K_{1}$ $c,c'$

หลักฐานการเทียบเท่า

ตัวอย่างเช่น นิยามสี่ข้อแรกนั้นเทียบเท่ากันตามการพิสูจน์ด้านล่าง

พิสูจน์โดยการ เปรียบเทียบ เค้กหลายชั้น $(1)\implies (3)$ ${\begin{aligned}\mathbb {E} |X|^{p}&=\int _{0}^{\infty }\mathbb {P} (|X|^{p}\geq t)dt\\&=\int _{0}^{\infty }pt^{p-1}\mathbb {P} (|X|\geq t)dt\\&\leq 2\int _{0}^{\infty }pt^{p-1}\exp \left(-{\frac {t^{2}}{K_{1}^{2}}}\right)dt\\\end{aligned}}$

หลังจากเปลี่ยนตัวแปรแล้ว เราพบว่าจากอนุกรมเทย์เลอร์ซึ่งน้อยกว่าหรือเท่ากับสำหรับให้แล้ว $u=t^{2}/K_{1}^{2}$ ${\begin{aligned}\mathbb {E} |X|^{p}&\leq 2K_{1}^{p}{\frac {p}{2}}\int _{0}^{\infty }u^{{\frac {p}{2}}-1}e^{-u}du\\&=2K_{1}^{p}{\frac {p}{2}}\Gamma \left({\frac {p}{2}}\right)\\&=2K_{1}^{p}\Gamma \left({\frac {p}{2}}+1\right).\end{aligned}}$ $(3)\implies (2)$ ${\textstyle e^{x}=1+\sum _{p=1}^{\infty }{\frac {x^{p}}{p!}},}$ ${\begin{aligned}\mathbb {E} [\exp {(\lambda X^{2})}]&=1+\sum _{p=1}^{\infty }{\frac {\lambda ^{p}\mathbb {E} {[X^{2p}]}}{p!}}\\&\leq 1+\sum _{p=1}^{\infty }{\frac {2\lambda ^{p}K_{3}^{2p}\Gamma \left(p+1\right)}{p!}}\\&=1+2\sum _{p=1}^{\infty }\lambda ^{p}K_{3}^{2p}\\&=2\sum _{p=0}^{\infty }\lambda ^{p}K_{3}^{2p}-1\\&={\frac {2}{1-\lambda K_{3}^{2}}}-1\quad {\text{for }}\lambda K_{3}^{2}<1,\end{aligned}}$ $2$ $\lambda \leq {\frac {1}{3K_{3}^{2}}}$ $K_{2}\geq 3^{\frac {1}{2}}K_{3}$ ${\textstyle \mathbb {E} [\exp {(X^{2}/K_{2}^{2})}]\leq 2.}$

$(2)\implies (1)$ โดยอสมการของมาร์คอฟและโดยสูตรเชิงอะซิมโทติกของฟังก์ชันแกมมา: . $\mathbb {P} (|X|\geq t)=\mathbb {P} \left(\exp \left({\frac {X^{2}}{K_{2}^{2}}}\right)\geq \exp \left({\frac {t^{2}}{K_{2}^{2}}}\right)\right)\leq {\frac {\mathbb {E} [\exp {(X^{2}/K_{2}^{2})}]}{\exp \left({\frac {t^{2}}{K_{2}^{2}}}\right)}}\leq 2\exp \left(-{\frac {t^{2}}{K_{2}^{2}}}\right).$ $(3)\iff (4)$ $\Gamma (p/2+1)\sim {\sqrt {\pi p}}\left({\frac {p}{2e}}\right)^{p/2}$

จากบทพิสูจน์ เราสามารถแยกชุดอสมการได้สามชุด:

ถ้าเช่นนั้นสำหรับทุกๆ $\mathbb {P} (|X|\geq t)\leq 2\exp {(-t^{2}/K^{2})}$ $\mathbb {E} |X|^{p}\leq 2K^{p}\Gamma \left({\frac {p}{2}}+1\right)$ $p\geq 1$
ถ้าสำหรับทั้งหมดแล้ว. $\mathbb {E} |X|^{p}\leq 2K^{p}\Gamma \left({\frac {p}{2}}+1\right)$ $p\geq 1$ $\|X\|_{\psi _{2}}\leq 3^{\frac {1}{2}}K$
ถ้าเช่นนั้น $\|X\|_{\psi _{2}}\leq K$ $\mathbb {P} (|X|\geq t)\leq 2\exp {(-t^{2}/K^{2})}$

โดยเฉพาะอย่างยิ่ง ค่าคงที่ที่กำหนดโดยคำนิยามนั้นเหมือนกันจนถึงตัวประกอบคงที่ ดังนั้นเราจึงสามารถกล่าวได้ว่าคำนิยามนั้นเทียบเท่ากันจนถึงค่าคงที่ที่ไม่ขึ้นกับตัวประกอบคงที่ $K$ $X$

ในทำนองเดียวกัน เนื่องจากค่าคงที่การคูณที่เป็นบวกสำหรับทุก ๆนิยาม (3) และ (4) ก็เทียบเท่ากันโดยมีค่าคงที่เช่นกัน $\Gamma (p/2+1)=p^{p/2}\times ((2e)^{-1/2}p^{1/2p})^{p}$ $p\geq 1$

คุณสมบัติพื้นฐาน

คุณสมบัติ พื้นฐาน— * ถ้าเป็นแบบซับเกาส์เซียน และแล้วและ ${\textstyle X}$ ${\textstyle k>0}$ ${\textstyle \|kX\|_{\psi _{2}}=k\|X\|_{\psi _{2}}}$ ${\textstyle \|kX\|_{vp}=k\|X\|_{vp}}$

(อสมการสามเหลี่ยม) ถ้าเป็นแบบซับเกาส์เซียนแล้ว ${\textstyle X,Y}$ $\|X+Y\|_{vp}^{2}\leq (\|X\|_{vp}+\|Y\|_{vp})^{2}$

(ขอบเขตเชอร์นอฟ) ถ้าเป็นแบบซับเกาส์เซียนแล้วสำหรับทุก ${\textstyle X}$ $\mathbb {P} (X\geq t)\leq e^{-{\frac {t^{2}}{2\|X\|_{vp}^{2}}}}$ ${\textstyle t\geq 0}$

${\textstyle X\lesssim X'}$ means that ${\textstyle X\leq CX'}$ , where the positive constant ${\textstyle C}$ is independent of ${\textstyle X}$ and ${\textstyle X'}$ .

Subgaussian deviation bound—If ${\textstyle X}$ is subgaussian, then $\|X-\mathbb {E} [X]\|_{\psi _{2}}\lesssim \|X\|_{\psi _{2}}$

Proof

By triangle inequality, $\|X-\mathbb {E} [X]\|_{\psi _{2}}\leq \|X\|_{\psi _{2}}+\|\mathbb {E} [X]\|_{\psi _{2}}$ . Now we have $\|\mathbb {E} [X]\|_{\psi _{2}}={\sqrt {\ln 2}}|\mathbb {E} [X]|\leq {\sqrt {\ln 2}}\mathbb {E} [|X|]\sim \mathbb {E} [|X|]$ . By the equivalence of definitions (2) and (4) of subgaussianity, we have $\mathbb {E} [|X|]\lesssim \|X\|_{\psi _{2}}$ .

Independent subgaussian sum bound—If ${\textstyle X,Y}$ are subgaussian and independent, then $\|X+Y\|_{vp}^{2}\leq \|X\|_{vp}^{2}+\|Y\|_{vp}^{2}$

Proof

If independent, then use that the cumulant of independent random variables is additive. That is, $\ln \mathbb {E} [e^{t(X+Y)}]=\ln \mathbb {E} [e^{tX}]+\ln \mathbb {E} [e^{tY}]$ .

If not independent, then by Hölder's inequality, for any $1/p+1/q=1$ we have $\mathbb {E} [e^{t(X+Y)}]=\|e^{t(X+Y)}\|_{1}\leq e^{{\frac {1}{2}}t^{2}(p\|X\|_{vp}^{2}+q\|Y\|_{vp}^{2})}$ Solving the optimization problem ${\begin{cases}\min p\|X\|_{vp}^{2}+q\|Y\|_{vp}^{2}\\1/p+1/q=1\end{cases}}$ , we obtain the result.

Corollary—Linear sums of subgaussian random variables are subgaussian.

Partial converse (Matoušek 2008, Lemma 2.4)—If ${\textstyle \mathbb {E} [X]=0,\mathbb {E} [X^{2}]=1}$ , and ${\textstyle -\ln \mathbb {P} (X\geq t)\geq {\frac {1}{2}}at^{2}}$ for all ${\textstyle t>0}$ , then $\ln \mathbb {E} [e^{tX}]\leq C_{a}t^{2}$ where ${\textstyle C_{a}>0}$ depends on ${\textstyle a}$ only.

Proof

Proof

Let ${\textstyle F(x)}$ be the CDF of ${\textstyle X}$ . The proof splits the integral of MGF to two halves, one with ${\textstyle tX>1}$ and one with ${\textstyle tX\leq 1}$ , and bound each one respectively.

${\begin{aligned}\mathbb {E} [e^{tX}]&=\int _{\mathbb {R} }e^{tx}dF(x)\\&=\int _{-\infty }^{1/t}e^{tx}dF(x)+\int _{1/t}^{+\infty }e^{tx}dF(x)\\\end{aligned}}$ Since ${\textstyle e^{x}\leq 1+x+x^{2}}$ for ${\textstyle x\leq 1}$ , ${\begin{aligned}\int _{-\infty }^{1/t}e^{tx}dF(x)&\leq \int _{-\infty }^{1/t}(1+tx+t^{2}x^{2})dF(x)\\&\leq \int _{\mathbb {R} }(1+tx+t^{2}x^{2})dF(x)\\&=1+t\mathbb {E} [X]+t^{2}\mathbb {E} [X^{2}]\\&=1+t^{2}\\&\leq e^{t^{2}}\end{aligned}}$ For the second term, upper bound it by a summation: ${\begin{aligned}\int _{1/t}^{+\infty }e^{tx}dF(x)&\leq e^{2}\mathbb {P} (X\in [1/t,2/t])+e^{3}\mathbb {P} (X\in [1/t,2/t])+\dots \\&\leq \sum _{k=1}^{\infty }e^{k+1}\mathbb {P} (X\geq k/t)\\&\leq \sum _{k=1}^{\infty }e^{k(2-{\frac {1}{2}}ak/t^{2})}\end{aligned}}$ When ${\textstyle t\leq {\sqrt {a/8}}}$ , for any ${\textstyle k\geq 1}$ , ${\textstyle 2k-{\frac {ak^{2}}{2t^{2}}}\leq -{\frac {ak}{4t^{2}}}}$ , so

$\leq {\frac {1}{e^{\frac {a}{4t^{2}}}-1}}\leq {\frac {4}{a}}t^{2}$ When ${\textstyle t>{\sqrt {a/8}}}$ , by drawing out the curve of ${\textstyle f(x)=e^{-{\frac {a}{2t^{2}}}x^{2}+2x}}$ , and plotting out the summation, we find that $\sum _{k=1}^{\infty }e^{k(2-{\frac {1}{2}}ak/t^{2})}\leq \int _{\mathbb {R} }f(x)dx+2\max _{x}f(x)=e^{\frac {2t^{2}}{a}}\left({\sqrt {\frac {2\pi t^{2}}{a}}}+2\right)<10{\sqrt {t^{2}/a}}e^{\frac {2t^{2}}{a}}$ Now verify that ${\textstyle \ln 10+{\frac {1}{2}}\ln(t^{2}/a)+{\frac {2}{a}}t^{2}<C_{a}t^{2}}$ , where ${\textstyle C_{a}}$ depends on ${\textstyle a}$ only.

Corollary (Matoušek 2008, Lemma 2.2)— ${\textstyle X_{1},\ldots ,X_{n}}$ are independent random variables with the same upper subgaussian tail: $-\ln \mathbb {P} (X_{i}\geq t)\geq {\frac {1}{2}}at^{2}$ for all ${\textstyle t>0}$ . Also, ${\textstyle \mathbb {E} [X_{i}]=0,\mathbb {E} [X_{i}^{2}]=1}$ , then for any unit vector ${\textstyle v\in \mathbb {R} ^{n}}$ , the linear sum ${\textstyle \sum _{i}v_{i}X_{i}}$ has a subgaussian tail: $-\ln \mathbb {P} \left(\sum _{i}v_{i}X_{i}\geq t\right)\geq C_{a}t^{2}$ where ${\textstyle C_{a}>0}$ depends only on ${\textstyle a}$ .

Concentration

Gaussian concentration inequality for Lipschitz functions (Tao 2012, Theorem 2.1.12.)—If ${\textstyle f:\mathbb {R} ^{n}\to \mathbb {R} }$ is ${\textstyle L}$ -Lipschitz, and ${\textstyle X\sim {\mathcal {N}}(0,I)}$ is a standard gaussian vector, then ${\textstyle f(X)}$ concentrates around its expectation at a rate $\mathbb {P} (f(X)-\mathbb {E} [f(X)]\geq t)\leq e^{-{\frac {2}{\pi ^{2}}}{\frac {t^{2}}{L^{2}}}}$ and similarly for the other tail.

Proof

Proof

By shifting and scaling, it suffices to prove the case where ${\textstyle L=1}$ , and ${\textstyle \mathbb {E} [f(X)]=0}$ .

Since every 1-Lipschitz function is uniformly approximable by 1-Lipschitz smooth functions (by convolving with a mollifier), it suffices to prove it for 1-Lipschitz smooth functions.

Now it remains to bound the cumulant generating function.

To exploit the Lipschitzness, we introduce ${\textstyle Y}$ , an independent copy of ${\textstyle X}$ , then by Jensen, $\mathbb {E} [e^{t(X-Y)}]=\mathbb {E} [e^{tX}]\mathbb {E} [e^{-tY}]\geq \mathbb {E} [e^{tX}]e^{-t\mathbb {E} [Y]}=\mathbb {E} [e^{tX}]$

By the circular symmetry of gaussian variables, we introduce ${\textstyle X_{\theta }:=Y\cos \theta +X\sin \theta }$ . This has the benefit that its derivative ${\textstyle X'=-Y\sin \theta +X\cos \theta }$ is independent of it.

${\begin{aligned}e^{t(f(X)-f(Y))}&=e^{t(f(X_{\pi /2})-f(X_{0}))}\\&=e^{t\int _{0}^{\pi /2}\nabla f(X_{\theta })\cdot X_{\theta }'d\theta }\\&=e^{\pi t/2\int _{0}^{\pi /2}\nabla f(X_{\theta })\cdot X_{\theta }'{\frac {d\theta }{\pi /2}}}\\&\leq \int _{0}^{\pi /2}e^{\pi t/2\nabla f(X_{\theta })\cdot X_{\theta }'}{\frac {d\theta }{\pi /2}}\\\end{aligned}}$

ทีนี้มาหาค่าคาดหวังของมันค่าคาดหวังภายในอินทิกรัลนั้นอยู่เหนือการแจกแจงร่วมของแต่เนื่องจากการแจกแจงร่วมของ นั้นเหมือนกันทุกประการ เราจึงได้ $\mathbb {E} [e^{t(f(X)-f(Y))}]\leq \int _{0}^{\pi /2}\mathbb {E} [e^{\pi t/2\nabla f(X_{\theta })\cdot X_{\theta }'}]{\frac {d\theta }{\pi /2}}$ ${\textstyle X,Y}$ ${\textstyle X_{\theta },X_{\theta }'}$

$=\mathbb {E} _{X}[\mathbb {E} _{Y}[e^{\pi t/2\nabla f(X)\cdot Y}]]$

เมื่อพิจารณาตามเงื่อนไขแล้วปริมาณ ดังกล่าว จะมีการกระจายแบบปกติ โดยมีค่าความแปรปรวนเท่ากับ ดังนั้น ${\textstyle X}$ ${\textstyle \nabla f(X)\cdot Y}$ ${\textstyle \leq 1}$ $\leq e^{{\frac {1}{2}}(\pi t/2)^{2}}=e^{{\frac {\pi ^{2}}{8}}t^{2}}$

ดังนั้น เราจึงมี $\ln \mathbb {E} [e^{tf(X)}]\leq {\frac {\pi ^{2}}{8}}t^{2}$

ซับเกาส์เซียนอย่างเคร่งครัด

เมื่อขยายฟังก์ชันก่อกำเนิดคูมูลันต์เราจะพบว่าที่ขอบเขตความเป็นไปได้ เรากำหนดว่าตัวแปร สุ่มที่สอดคล้องกับเงื่อนไขนี้ เรียกว่า ตัวแปรสุ่ม ซับเกาส์เซียน อย่างเคร่งครัด ${\frac {1}{2}}s^{2}t^{2}\geq \ln \mathbb {E} [e^{tX}]={\frac {1}{2}}\mathrm {Var} [X]t^{2}+\kappa _{3}t^{3}+\cdots$ $\mathrm {Var} [X]\leq \|X\|_{\mathrm {vp} }^{2}$ $X$ $\mathrm {Var} [X]=\|X\|_{\mathrm {vp} }^{2}$

คุณสมบัติ

ทฤษฎีบท^{[ 6 ]}ให้เป็นตัวแปรสุ่มซับเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์ ถ้าศูนย์ทั้งหมดของฟังก์ชันลักษณะเฉพาะเป็นจำนวนจริง แล้วจะเป็นซับเกาส์เซียนอย่างเคร่งครัด $X$ $X$

บทสรุป.ถ้าตัวแปรสุ่มอิสระและเป็นแบบซับเกาส์เซียนอย่างเคร่งครัดแล้ว ผลรวมเชิงเส้นใดๆ ของตัวแปรสุ่มเหล่านั้นก็จะเป็นแบบซับเกาส์เซียนอย่างเคร่งครัดเช่นกัน $X_{1},\ldots ,X_{n}$

ตัวอย่าง

โดยการคำนวณฟังก์ชันลักษณะเฉพาะ เราสามารถแสดงให้เห็นว่าการแจกแจงบางอย่างเป็นแบบซับเกาส์เซียนอย่างแท้จริง ได้แก่ การแจกแจงเอกรูปสมมาตร และการแจกแจงเบอร์นูลลีสมมาตร

เนื่องจากการกระจายแบบเอกรูปสมมาตรเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด ดังนั้นการสังเคราะห์การกระจายนั้นกับตัวมันเองจึงเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด กล่าวคือการกระจายแบบสามเหลี่ยม สมมาตร เป็นแบบซับเกาส์เซียนอย่างเคร่งครัด

เนื่องจากการแจกแจงแบบเบอร์นูลลีสมมาตรเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด ดังนั้นการแจกแจงแบบทวินาม สมมาตรใดๆ ก็ เป็นแบบซับเกาส์เซียนอย่างเคร่งครัดเช่นกัน

ตัวอย่าง


	$\\|X\\|_{\psi _{2}}$	$\\|X\\|_{vp}^{2}$	ซับเกาส์เซียนอย่างเคร่งครัด?
การกระจายแบบเกาส์เซียน ${\mathcal {N}}(0,1)$	${\sqrt {8/3}}$	$1$	ใช่
การแจกแจงเบอร์นูลลีที่มีค่าเฉลี่ยเป็นศูนย์ $p\delta _{q}+q\delta _{-p}$	วิธีแก้ปัญหา $pe^{(q/t)^{2}}+qe^{(p/t)^{2}}=2$	${\frac {p-q}{2(\log p-\log q)}}$	ถ้า $p=0,1/2,1$
การแจกแจงเบอร์นูลลีแบบสมมาตร ${\frac {1}{2}}\delta _{1/2}+{\frac {1}{2}}\delta _{-1/2}$	${\frac {1}{\sqrt {\ln 2}}}$	$1$	ใช่
การกระจายแบบสม่ำเสมอ $U(0,1)$	คำตอบสำหรับประมาณ 0.7727 $\int _{0}^{1}e^{x^{2}/t^{2}}dx=2$	$1/3$	ใช่
การแจกแจงแบบสุ่มในช่วงเวลา $[a,b]$		$\leq \left({\frac {b-a}{2}}\right)^{2}$

ตัวแทนความแปรปรวนที่เหมาะสมที่สุดเป็นที่รู้จักสำหรับการกระจายความน่าจะเป็นมาตรฐานหลายแบบ รวมถึงเบต้า เบอร์นูลลี ดิริชเลต์^[⁷^]คูมาราสวามี สามเหลี่ยม^[⁸^]เกาส์เซียนแบบตัดทอน และเอกซ์โพเนนเชียลแบบตัดทอน^[⁹^] $\Vert X\Vert _{\mathrm {vp} }^{2}$

การแจกแจงแบบเบอร์นูลลี

ให้เป็นจำนวนบวกสองจำนวน ให้เป็นการแจกแจงเบอร์นูลีแบบศูนย์กลางดังนั้นจึงมีค่าเฉลี่ยเป็นศูนย์ จากนั้น[ ⁶^]^{บรรทัดฐาน}ซับเกาส์เซียนคือโดยที่ เป็นคำตอบ บวก ที่ไม่ซ้ำกันของ $p+q=1$ $X$ $p\delta _{q}+q\delta _{-p}$ $\Vert X\Vert _{\mathrm {vp} }^{2}={\frac {p-q}{2(\log p-\log q)}}$ $t$ $t$ $pe^{(q/t)^{2}}+qe^{(p/t)^{2}}=2$

ให้เป็นตัวแปรสุ่มที่มีการแจกแจงแบบเบอร์นูลลีสมมาตร (หรือการแจกแจงแบบราเดมาเชอร์ ) กล่าวคือมีค่าเป็นและโดยมีความน่าจะเป็นเท่ากับ เนื่องจากดังนั้นและด้วยเหตุนี้จึงเป็นตัวแปรสุ่มแบบซับเกาส์เซียน $X$ $X$ $-1$ $1$ $1/2$ $X^{2}=1$ $\Vert X\Vert _{\psi _{2}}=\inf \left\{c>0:\mathbb {E} \left[\exp {\left({\frac {X^{2}}{c^{2}}}\right)}\right]\leq 2\right\}=\inf \left\{c>0:\exp {\left({\frac {1}{c^{2}}}\right)}\leq 2\right\}={\frac {1}{\sqrt {\ln 2}}},$ $X$

การแจกแจงแบบมีขอบเขต

การแจกแจงแบบมีขอบเขตจะไม่มีส่วนหางเลย ดังนั้นจึงเห็นได้ชัดว่าเป็นการแจกแจงแบบซับเกาส์เซียน

ถ้า ถูกจำกัดอยู่ ในช่วงทฤษฎีบทของ Hoeffdingกล่าวว่าอสมการของ Hoeffdingคือขอบเขตของ Chernoff ที่ได้มาจากการใช้ข้อเท็จจริงนี้ $X$ $[a,b]$ $\Vert X\Vert _{\mathrm {vp} }^{2}\leq \left({\frac {b-a}{2}}\right)^{2}$

คอนโวลูชัน

เนื่องจากผลรวมของตัวแปรสุ่มซับเกาส์เซียนยังคงเป็นซับเกาส์เซียน ดังนั้นการสังเคราะห์ (convolution) ของการแจกแจงซับเกาส์เซียนจึงยังคงเป็นซับเกาส์เซียน โดยเฉพาะอย่างยิ่ง การสังเคราะห์ใดๆ ของการแจกแจงปกติกับการแจกแจงที่มีขอบเขตใดๆ ก็จะเป็นซับเกาส์เซียนเช่นกัน

ส่วนผสม

เมื่อกำหนดการกระจายแบบซับเกาส์เซียนแล้ว เราสามารถสร้างส่วนผสมแบบบวกได้ดังนี้: ขั้นแรก สุ่มเลือกตัวเลขจากนั้นเลือก $X_{1},X_{2},\dots ,X_{n}$ $X$ $i\in \{1,2,\dots ,n\}$ $X_{i}$

เนื่องจากเรามีและดังนั้นส่วนผสมจึงเป็นซับเกาส์เซียน $\mathbb {E} \left[\exp {\left({\frac {X^{2}}{c^{2}}}\right)}\right]=\sum _{i}p_{i}\mathbb {E} \left[\exp {\left({\frac {X_{i}^{2}}{c^{2}}}\right)}\right]$ $\|X\|_{\psi _{2}}\leq \max _{i}\|X_{i}\|_{\psi _{2}}$

โดยเฉพาะอย่างยิ่งส่วนผสมแบบเกาส์เซียน ใดๆ ก็ตาม ล้วน เป็นส่วนผสมแบบซับเกาส์เซียน

โดยทั่วไปแล้ว การผสมผสานของการกระจายแบบซับเกาส์เซียนจำนวนอนันต์ก็จะเป็นแบบซับเกาส์เซียนเช่นกัน หากค่ามาตรฐานของซับเกาส์เซียนมีค่าสูงสุด จำกัด : . $\|X\|_{\psi _{2}}\leq \sup _{i}\|X_{i}\|_{\psi _{2}}$

เวกเตอร์สุ่มซับเกาส์เซียน

ที่ผ่านมา เราได้กล่าวถึงคุณสมบัติซับเกาส์เซียนสำหรับตัวแปรสุ่มค่าจริงไปแล้ว เรายังสามารถกำหนดคุณสมบัติซับเกาส์เซียนสำหรับเวกเตอร์สุ่ม ได้อีก ด้วย จุดประสงค์ของคุณสมบัติซับเกาส์เซียนคือการทำให้ส่วนหางของเวกเตอร์ลดลงอย่างรวดเร็ว ดังนั้นเราจึงสรุปได้ว่า เวกเตอร์สุ่มซับเกาส์เซียนคือเวกเตอร์สุ่มที่ส่วนหางลดลงอย่างรวดเร็ว

ให้เป็นเวกเตอร์สุ่มที่รับค่าใน $X$ $\mathbb {R} ^{n}$

กำหนด.

$\|X\|_{\psi _{2}}:=\sup _{v\in S^{n-1}}\|v^{T}X\|_{\psi _{2}}$ โดยที่คือทรงกลมหน่วยใน ในทำนองเดียวกัน สำหรับตัวแทนความแปรปรวน $S^{n-1}$ $\mathbb {R} ^{n}$ $\|X\|_{vp}:=\sup _{v\in S^{n-1}}\|v^{T}X\|_{vp}$
$X$ เป็นแบบซับเกาส์เซียนก็ต่อเมื่อ. $\|X\|_{\psi _{2}}<\infty$

ทฤษฎีบท (ทฤษฎีบท 3.4.6 ^{[ 3 ]} ) สำหรับจำนวนเต็มบวกใดๆเวกเตอร์สุ่มที่กระจายอย่างสม่ำเสมอจะเป็นซับเกาส์เซียน โดยมี $n$ $X\sim U({\sqrt {n}}S^{n-1})$ $\|X\|_{\psi _{2}}\lesssim {}1$

นี่ไม่ใช่เรื่องน่าประหลาดใจนัก เพราะเมื่อ ค่าเข้าใกล้ การฉาย ภาพของค่าไปยังพิกัดแรกจะลู่เข้าสู่การแจกแจงปกติมาตรฐาน $n\to \infty$ $U({\sqrt {n}}S^{n-1})$

ความไม่เท่าเทียมกันสูงสุด

ทฤษฎีบท—ถ้าเป็นซับเกาส์เซียนที่มีค่าเฉลี่ยเป็นศูนย์ โดยที่ แล้วสำหรับทุกเราจะได้ด้วยความน่าจะเป็น $X_{1},\ldots ,X_{n}$ $\|X_{i}\|_{vp}^{2}\leq \sigma ^{2}$ $\delta >0$ $\max(X_{1},\dots ,X_{n})\leq \sigma {\sqrt {2\ln {\frac {n}{\delta }}}}$ $\geq 1-\delta$

การพิสูจน์

ตามขอบเขตของเชอร์นอฟ. จากนั้นใช้ขอบเขตของสหภาพ . $\mathbb {P} (X_{i}\geq \sigma {\sqrt {2\ln(n/\delta )}})\leq \delta /n$

ทฤษฎีบท (แบบฝึกหัด 2.5.10 ^{[ 3 ]} ) —ถ้าเป็นซับเกาส์เซียน โดยที่ แล้วนอกจากนี้ ขอบเขตยังแม่นยำ เนื่องจากเมื่อเป็นตัวอย่าง IID ของเราจะมี^[¹⁰^] $X_{1},X_{2},\dots$ $\|X_{i}\|_{\psi _{2}}\leq K$ $\mathbb {E} \left[\sup _{n}{\frac {|X_{n}|}{\sqrt {1+\ln n}}}\right]\lesssim K,\quad \mathbb {E} \left[\max _{1\leq n\leq N}|X_{n}|\right]\lesssim K{\sqrt {\ln N}}$ $X_{1},X_{2},\dots$ ${\mathcal {N}}(0,1)$ $\mathbb {E} \left[\max _{1\leq n\leq N}|X_{n}|\right]\gtrsim {\sqrt {\ln N}}$

ทฤษฎีบท (เหนือเซตจำกัด^{[ 11 ]} ) —ถ้าเป็นแบบซับเกาส์เซียนโดยที่ แล้ว $X_{1},\dots ,X_{n}$ $\|X_{i}\|_{vp}^{2}\leq \sigma ^{2}$ ${\begin{aligned}\mathbb {E} [\max _{i}(X_{i}-\mathbb {E} [X_{i}])]\leq \sigma {\sqrt {2\ln n}},&\quad \mathbb {P} (\max _{i}(X_{i}-\mathbb {E} [X_{i}])>t)\leq ne^{-{\frac {t^{2}}{2\sigma ^{2}}}},\\\mathbb {E} [\max _{i}|X_{i}-\mathbb {E} [X_{i}]|]\leq \sigma {\sqrt {2\ln(2n)}},&\quad \mathbb {P} (\max _{i}|X_{i}-\mathbb {E} [X_{i}]|>t)\leq 2ne^{-{\frac {t^{2}}{2\sigma ^{2}}}}\end{aligned}}$

การพิสูจน์

สำหรับ t>0 ใดๆ: นี่คือโครงสร้างการพิสูจน์มาตรฐานสำหรับการพิสูจน์ขอบเขตแบบ Chernoffสำหรับตัวแปรย่อยแบบ Gaussian สำหรับสมการที่สอง เพียงพอที่จะพิสูจน์กรณีที่มีตัวแปรเดียวและค่าเฉลี่ยเป็นศูนย์ จากนั้นใช้ขอบเขตแบบยูเนียนก่อนอื่นโดยใช้Markov , , จากนั้นโดยใช้คำจำกัดความของตัวแทนความแปรปรวน , และจากนั้นปรับให้เหมาะสมที่สุดที่ ${\begin{aligned}\mathbb {E} \!{\bigl [}\max _{1\leq i\leq n}(X_{i}-\mathbb {E} [X_{i}]){\bigr ]}&={\frac {1}{t}}\,\mathbb {E} \!{\Bigl [}\ln \max _{i}e^{\,t(X_{i}-\mathbb {E} [X_{i}])}{\Bigr ]}\\&\leq {\frac {1}{t}}\ln \mathbb {E} \!{\Bigl [}\max _{i}e^{\,t(X_{i}-\mathbb {E} [X_{i}])}{\Bigr ]}\quad {\text{by Jensen}}\\&\leq {\frac {1}{t}}\ln \sum _{i=1}^{n}\mathbb {E} e^{t(X_{i}-\mathbb {E} [X_{i}])}\\&\leq {\frac {1}{t}}\ln \sum _{i=1}^{n}e^{\sigma ^{2}t^{2}/2}\quad {\text{by def of }}\|\cdot \|_{vp}\\&={\frac {\ln n}{t}}+{\frac {\sigma ^{2}t}{2}}\\&{\overset {t={\sqrt {2\ln n}}/\sigma }{=}}\;\sigma {\sqrt {2\ln n}},\end{aligned}}$ $\mathbb {P} (X>t)\leq \mathbb {P} (e^{sX}>e^{st})\leq e^{-st}\mathbb {E} [e^{sX}]$ $\leq e^{-st}e^{\sigma ^{2}s^{2}/2}$ $s=-t^{2}/2\sigma ^{2}$

บทสรุป (บนโพลีโทปนูน ) —กำหนดเซตเวกเตอร์จำกัดจำนวนหนึ่งถ้าเป็นเวกเตอร์สุ่ม โดยที่แต่ละแล้วอสมการทั้ง 4 ข้างต้นจะเป็นจริง โดยแทนที่ในที่นี้คือโพลีโทปนูนที่ล้อมรอบด้วยเวกเตอร์ $v_{1},\dots ,v_{n}$ $X$ $\|v_{i}^{T}X\|_{vp}^{2}\leq \sigma ^{2}$ $\max _{v\in \mathrm {conv} (v_{1},\dots ,v_{n})}(v^{T}X-\mathbb {E} [v^{T}X])$ $\max _{i}(X_{i}-\mathbb {E} [X_{i}])$ $\mathrm {conv} (v_{1},\dots ,v_{n})$ $v_{1},\dots ,v_{n}$

ทฤษฎีบท (เวกเตอร์สุ่มซับเกาส์เซียน) —ถ้าเป็นเวกเตอร์สุ่มในโดยที่สำหรับทุกบนทรงกลมหน่วยแล้วสำหรับใดๆด้วยความน่าจะเป็นอย่างน้อย $X$ $\mathbb {R} ^{d}$ $\|v^{T}X\|_{vp}^{2}\leq \sigma ^{2}$ $v$ $S$ $\mathbb {E} [\max _{v\in S}v^{T}X]=\mathbb {E} [\max _{v\in S}|v^{T}X|]\leq 4\sigma {\sqrt {d}}$ $\delta >0$ $1-\delta$ $\max _{v\in S}v^{T}X=\max _{v\in S}|v^{T}X|\leq 4\sigma {\sqrt {d}}+2\sigma {\sqrt {2\log(1/\delta )}}$

ความไม่เท่าเทียมกัน

ทฤษฎีบท (ทฤษฎีบท 2.6.1 ^{[ 3 ]} ) มีค่าคงที่บวกอยู่ค่าหนึ่งซึ่งกำหนดให้ตัวแปรสุ่มซับเกาส์เซียนอิสระที่มีค่าเฉลี่ยเป็นศูนย์จำนวนใดๆทฤษฎีบท(อสมการของ Hoeffding) (ทฤษฎีบท 2.6.3 ^[³^] ) มีค่าคงที่บวกอยู่ค่าหนึ่ง ซึ่งกำหนดให้ตัวแปรสุ่มซับเกาส์เซียนอิสระ ที่มีค่าเฉลี่ยเป็นศูนย์จำนวนใดๆทฤษฎีบท (อสมการของ Bernstein) (ทฤษฎีบท 2.8.1 ^[³^] ) มีค่าคงที่บวกอยู่ค่าหนึ่งซึ่งกำหนดให้ตัวแปรสุ่มซับเอกซ์โพเนนเชียลอิสระที่มีค่าเฉลี่ยเป็นศูนย์จำนวนใดๆทฤษฎีบท(อสมการของ Khinchine) (แบบฝึกหัด 2.6.5 ^[³^] ) มีค่าคงที่บวกอยู่ค่าหนึ่งซึ่งกำหนดให้ตัวแปรสุ่มซับเกาส์เซียนอิสระที่มีค่าเฉลี่ยเป็นศูนย์และค่าความแปรปรวนเป็นหนึ่งจำนวนใดๆ ใดๆและใดๆ $C$ $X_{1},\dots ,X_{n}$ $\left\|\sum _{i=1}^{n}X_{i}\right\|_{\psi _{2}}^{2}\leq C\sum _{i=1}^{n}\left\|X_{i}\right\|_{\psi _{2}}^{2}$ $c$ $X_{1},\dots ,X_{N}$ $\mathbb {P} \left(\left|\sum _{i=1}^{N}X_{i}\right|\geq t\right)\leq 2\exp \left(-{\frac {ct^{2}}{\sum _{i=1}^{N}\left\|X_{i}\right\|_{\psi _{2}}^{2}}}\right)\quad \forall t>0$ $c$ $X_{1},\dots ,X_{N}$ $\mathbb {P} \left(\left|\sum _{i=1}^{N}X_{i}\right|\geq t\right)\leq 2\exp \left(-c\min \left({\frac {t^{2}}{\sum _{i=1}^{N}\left\|X_{i}\right\|_{\psi _{1}}^{2}}},{\frac {t}{\max _{i}\left\|X_{i}\right\|_{\psi _{1}}}}\right)\right)$ $C$ $X_{1},\dots ,X_{N}$ $p\geq 2$ $a_{1},\dots ,a_{N}\in \mathbb {R}$ $\left(\sum _{i=1}^{N}a_{i}^{2}\right)^{1/2}\leq \left\|\sum _{i=1}^{N}a_{i}X_{i}\right\|_{L^{p}}\leq CK{\sqrt {p}}\left(\sum _{i=1}^{N}a_{i}^{2}\right)^{1/2}$

ความไม่เท่าเทียมกันของแฮนสัน-ไรท์

อสมการแฮนสัน-ไรท์กล่าวว่า ถ้าเวกเตอร์สุ่มเป็นแบบซับเกาส์เซียนในความหมายหนึ่งแล้วรูปแบบกำลังสอง ใดๆ ของเวกเตอร์นี้ก็จะเป็นแบบซับเกาส์เซียน/ซับเอ็กซ์โพเนนเชียลด้วย ยิ่งไปกว่านั้น ขอบบนของส่วนหางของจะเป็นแบบเอกรูป $X$ $A$ $X^{T}AX$ $X^{T}AX$

ทฤษฎีบทเวอร์ชันอ่อนต่อไปนี้ได้รับการพิสูจน์ใน (Hanson, Wright, 1971) ^{[ 12 ]}มีส่วนขยายและรูปแบบต่างๆ มากมาย เช่นเดียวกับทฤษฎีบทลิมิตกลางอสมการ Hanson-Wright เป็นกลุ่มของทฤษฎีบทที่มีจุดประสงค์เดียวกันมากกว่าทฤษฎีบทเดียว จุดประสงค์คือการใช้เวกเตอร์ซับเกาส์เซียนและจำกัดรูปแบบกำลังสองของมันอย่างสม่ำเสมอ

ทฤษฎีบท^{[ 13 ]}^{[ 14 ]}มีค่าคงที่ อยู่ค่าหนึ่งซึ่ง: $c$

ให้เป็นจำนวนเต็มบวก ให้และ เป็นตัวแปรสุ่ม อิสระ โดยที่แต่ละตัวเป็นไปตามเงื่อนไข รวมตัวแปรสุ่มทั้งสองนี้ เข้าด้วยกันเป็นเวกเตอร์สุ่มสำหรับเมทริกซ์ ใดๆ เราจะได้ว่า โดยที่และคือค่ามาตรฐานฟรอเบนิอุสของเมทริกซ์ และคือค่ามาตรฐานตัวดำเนินการของเมทริกซ์ $n$ $X_{1},...,X_{n}$ $E[X_{i}]=0$ $X=(X_{1},\dots ,X_{n})$ $n\times n$ $A$ $\mathbb {P} (|X^{T}AX-\mathbb {E} [X^{T}AX]|>t)\leq \max \left(2e^{-{\frac {ct^{2}}{K^{4}\|A\|_{F}^{2}}}},2e^{-{\frac {ct}{K^{2}\|A\|}}}\right)=2\exp \left[-c\min \left({\frac {t^{2}}{K^{4}\|A\|_{F}^{2}}},{\frac {t}{K^{2}\|A\|}}\right)\right]$ $K=\max _{i}\|X_{i}\|_{\psi _{2}}$ $\|A\|_{F}={\sqrt {\sum _{ij}A_{ij}^{2}}}$ $\|A\|=\max _{\|x\|_{2}=1}\|Ax\|_{2}$

กล่าวคือ รูปแบบกำลังสองจะมีส่วนหางที่ถูกจำกัดอย่างสม่ำเสมอด้วยฟังก์ชันเอกซ์โปเนนเชียลหรือฟังก์ชันเกาส์เซียน แล้วแต่ว่าฟังก์ชันใดมีค่ามากกว่า $X^{T}AX$

ในข้อความของทฤษฎีบท ค่าคงที่ดังกล่าวเป็น "ค่าคงที่สัมบูรณ์" ซึ่งหมายความว่ามันไม่มีความขึ้นอยู่กับค่าใดๆมันเป็นค่าคงที่ทางคณิตศาสตร์เช่นเดียวกับค่าพายและค่า e $c$ $n,X_{1},\dots ,X_{n},A$

ผลที่ตามมา

ทฤษฎีบท (ความเข้มข้นแบบซับเกาส์เซียน) ^{[ 13 ]}มีค่าคงที่ อยู่ค่าหนึ่งซึ่ง: $c$

ให้และ เป็นจำนวนเต็มบวก ให้และ เป็นตัวแปรสุ่มอิสระ โดยที่แต่ละตัวเป็นไปตามเงื่อนไขรวมตัวแปรสุ่มทั้งสองนี้เข้าด้วยกันเป็นเวกเตอร์สุ่มสำหรับเมทริกซ์ ใดๆ เราจะได้ว่า กล่าวคือ เวกเตอร์สุ่มกระจุกตัวอยู่บนเปลือกทรงกลมรัศมีโดยที่เป็นเวกเตอร์สุ่มแบบซับเกาส์เซียน และมีนอร์มแบบซับเกาส์เซียน $n,m$ $X_{1},...,X_{n}$ $\mathbb {E} [X_{i}]=0,\mathbb {E} [X_{i}^{2}]=1$ $X=(X_{1},\dots ,X_{n})$ $m\times n$ $A$ $\mathbb {P} (|\|AX\|_{2}-\|A\|_{F}|>t)\leq 2e^{-{\frac {ct^{2}}{K^{4}\|A\|^{2}}}}$ $AX$ $\|A\|_{F}$ $\|AX\|_{2}-\|A\|_{F}$ $\leq {\sqrt {3/c}}\|A\|K^{2}$

ดูเพิ่มเติม

การกระจายแบบแพลตีเคอร์ติก

หมายเหตุ

^ Wainwright MJ.สถิติมิติสูง: มุมมองที่ไม่ใช่เชิงอะซิมโทติกเคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์; 2019. doi : 10.1017/9781108627771 , ISBN 9781108627771.
^ Leskelä, Lasse; Zhukov, Matvei (2026). "ค่าคงที่ที่คมชัดซึ่งเชื่อมโยงบรรทัดฐานย่อยเกาส์เซียนและพารามิเตอร์ย่อยเกาส์เซียน"การสื่อสารทางอิเล็กทรอนิกส์ในความน่าจะเป็น 31 : 1– 11. doi : 10.1214 /26-ECP761 .
^ ^a ^b ^c ^d ^e ^f ^g Vershynin, R. (2018). ความน่าจะเป็นมิติสูง: บทนำพร้อมการประยุกต์ใช้ในวิทยาศาสตร์ข้อมูลเคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์
↑คาฮาเน เจ. (1960) "Propriétés locales des fonctions à séries de Fourier aléatoires" สตูเดีย แมทเธมาติกา . 19 : 1– 25. ดอย : 10.4064/sm-19-1-1-25 .
↑บูลดีจิน, VV; โคซาเชนโก, ยู. วี. (1980). "ตัวแปรสุ่มแบบซับเกาส์เซียน" วารสารคณิตศาสตร์ยูเครน32 (6): 483– 489. ดอย : 10.1007/BF01087176 .
^ ^a ^b Bobkov, SG; Chistyakov, GP; Götze, F. (2023-08-03). "การแจกแจงความน่าจะเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด" arXiv : 2308.01749 [ math.PR ]
^ Marchal, Olivier; Arbel, Julyan (2017). "เกี่ยวกับความเป็นกึ่งเกาส์เซียนของการแจกแจงเบตาและดิริชเลต์" การสื่อสารทางอิเล็กทรอนิกส์ในความน่าจะเป็น 22 . arXiv : 1705.00048 . doi : 10.1214 /17-ECP92 .
^ Arbel, Julyan; Marchal, Olivier; Nguyen, Hien D. (2020). "เกี่ยวกับความเป็นกึ่งเกาส์เซียนที่เข้มงวด ความแปรปรวนตัวแทนที่เหมาะสมที่สุด และความสมมาตรสำหรับตัวแปรสุ่มที่มีขอบเขต" Esaim: ความน่าจะเป็นและสถิติ 24 : 39– 55. arXiv : 1901.09188 . doi : 10.1051 /ps/2019018 .
^ Barreto, Mathias; Marchal, Olivier; Arbel, Julyan (2024). "ตัวแทนความแปรปรวนย่อยเกาส์เซียนที่เหมาะสมที่สุดสำหรับตัวแปรสุ่มเกาส์เซียนและเอกซ์โพเนนเชียลที่ถูกตัดทอน" arXiv : 2403.08628 [ math.ST ]
^ Kamath, Gautam. "ขอบเขตของค่าคาดหวังของค่าสูงสุดของตัวอย่างจากฟังก์ชันเกาส์เซียน " (2015)
^ "MIT 18.S997 | ฤดูใบไม้ผลิ 2015 | สถิติมิติสูง บทที่ 1 ตัวแปรสุ่มแบบซับเกาส์เซียน" (PDF) . MIT OpenCourseWare . สืบค้นเมื่อ2024-04-03 .
^ Hanson, DL; Wright, FT (1971). "ขอบเขตของความน่าจะเป็นส่วนหางสำหรับรูปแบบกำลังสองในตัวแปรสุ่มอิสระ" . วารสารสถิติคณิตศาสตร์ . 42 (3): 1079– 1083. doi : 10.1214/aoms/1177693335 . ISSN 0003-4851 . JSTOR 2240253 .
^ ^a ^b Rudelson, Mark; Vershynin, Roman (มกราคม 2013). "ความไม่เท่าเทียมกันของ Hanson-Wright และความเข้มข้นแบบ sub-gaussian" . Electronic Communications in Probability . 18 (ไม่มี): 1– 9. arXiv : 1306.2872 . doi : 10.1214/ECP.v18-2865 . ISSN 1083-589X .
^ Vershynin, Roman (2018). "6. รูปแบบกำลังสอง การทำให้สมมาตร และการหดตัว"ความน่าจะเป็นมิติสูง: บทนำพร้อมการประยุกต์ใช้ในวิทยาศาสตร์ข้อมูล ชุดเคมบริดจ์ในคณิตศาสตร์สถิติและความน่าจะเป็น เค มบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ หน้า 127–146 doi : 10.1017 /9781108231596.009 ISBN 978-1-108-41519-4.

เอกสารอ้างอิง

คาฮาเน เจพี (1960) "Propriétés locales des fonctions à séries de Fourier aléatoires" . สตูเดีย แมทเธมาติกา . 19 : 1– 25. ดอย : 10.4064/sm-19-1-1-25 .
เทา, เทเรนซ์ (2012). หัวข้อในทฤษฎีเมทริกซ์สุ่มการศึกษาระดับบัณฑิตศึกษาทางคณิตศาสตร์ พรอวิเดนซ์ รัฐโรดไอส์แลนด์: สมาคมคณิตศาสตร์อเมริกันISBN 978-0-8218-7430-1.
Matoušek, Jiří (กันยายน 2551) "ในรูปแบบต่างๆ ของบทแทรกของจอห์นสัน–ลินเดนสเตราส์ " โครงสร้างสุ่มและอัลกอริทึม33 (2): 142– 156. ดอย : 10.1002/rsa.20218 . ไอเอสเอ็น 1042-9832
บูลดีจิน, VV; Kozachenko, Yu.V. (1980) "ตัวแปรสุ่มแบบซับเกาส์เซียน" วารสารคณิตศาสตร์ยูเครน32 (6): 483– 489. ดอย : 10.1007/BF01087176 .
Ledoux, Michel; Talagrand, Michel (1991). ความน่าจะเป็นในปริภูมิบานาค . Springer-Verlag.
Stromberg, KR (1994). ความน่าจะเป็นสำหรับนักวิเคราะห์ . Chapman & Hall/CRC.
Litvak, AE; Pajor, A.; Rudelson, M.; Tomczak-Jaegermann, N. (2005). "ค่าเอกลักษณ์ที่เล็กที่สุดของเมทริกซ์สุ่มและเรขาคณิตของโพลีโทปสุ่ม" (PDF)ความก้าวหน้าทางคณิตศาสตร์ 195 ( 2): 491– 523. doi : 10.1016/j.aim.2004.08.004 .
Rudelson, Mark; Vershynin, Roman (2010). "ทฤษฎีเมทริกซ์สุ่มที่ไม่ใช่เชิงอะซิมโทติก: ค่าเอกพจน์สุดขั้ว". รายงานการประชุมสภาคณิตศาสตร์นานาชาติ 2010.หน้า 1576–1602 . arXiv : 1003.2990 . doi : 10.1142 /9789814324359_0111 .
Rivasplata, O. (2012). "ตัวแปรสุ่มซับเกาส์เซียน: บันทึกอธิบาย" (PDF) . ยังไม่ได้ตีพิมพ์ .
Vershynin, R. (2018). "ความน่าจะเป็นมิติสูง: บทนำพร้อมการประยุกต์ใช้ในวิทยาศาสตร์ข้อมูล" (PDF). เล่มที่ 47 ของชุดหนังสือ Cambridge Series in Statistical and Probabilistic Mathematics . สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, เคมบริดจ์.
Zajkowskim, K. (2020). "เกี่ยวกับบรรทัดฐานในปริภูมิ Orlicz ประเภทเอกซ์โพเนนเชียลบางชั้นของตัวแปรสุ่ม" Positivity. วารสารคณิตศาสตร์นานาชาติที่อุทิศให้กับทฤษฎีและการประยุกต์ใช้ Positivity. 24 (5): 1231--1240. arXiv : 1709.02970 . doi : 10.1007/s11117-019-00729-6 .

[Wainwright2019-1] Wainwright MJ.สถิติมิติสูง: มุมมองที่ไม่ใช่เชิงอะซิมโทติกเคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์; 2019. doi : 10.1017/9781108627771 , ISBN 9781108627771.

[2] Leskelä, Lasse; Zhukov, Matvei (2026). "ค่าคงที่ที่คมชัดซึ่งเชื่อมโยงบรรทัดฐานย่อยเกาส์เซียนและพารามิเตอร์ย่อยเกาส์เซียน"การสื่อสารทางอิเล็กทรอนิกส์ในความน่าจะเป็น 31 : 1– 11. doi : 10.1214 /26-ECP761 .

[:0-3] ^ ^a ^b ^c ^d ^e ^f ^g Vershynin, R. (2018). ความน่าจะเป็นมิติสูง: บทนำพร้อมการประยุกต์ใช้ในวิทยาศาสตร์ข้อมูลเคมบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์

[kahane-4] คาฮาเน เจ. (1960) "Propriétés locales des fonctions à séries de Fourier aléatoires" สตูเดีย แมทเธมาติกา . 19 : 1– 25. ดอย : 10.4064/sm-19-1-1-25 .

[buldygin-5] บูลดีจิน, VV; โคซาเชนโก, ยู. วี. (1980). "ตัวแปรสุ่มแบบซับเกาส์เซียน" วารสารคณิตศาสตร์ยูเครน32 (6): 483– 489. ดอย : 10.1007/BF01087176 .

[:2-6] Bobkov, SG; Chistyakov, GP; Götze, F. (2023-08-03). "การแจกแจงความน่าจะเป็นแบบซับเกาส์เซียนอย่างเคร่งครัด" arXiv : 2308.01749 [ math.PR ]

[marchal2017-7] Marchal, Olivier; Arbel, Julyan (2017). "เกี่ยวกับความเป็นกึ่งเกาส์เซียนของการแจกแจงเบตาและดิริชเลต์" การสื่อสารทางอิเล็กทรอนิกส์ในความน่าจะเป็น 22 . arXiv : 1705.00048 . doi : 10.1214 /17-ECP92 .

[arbel2020-8] Arbel, Julyan; Marchal, Olivier; Nguyen, Hien D. (2020). "เกี่ยวกับความเป็นกึ่งเกาส์เซียนที่เข้มงวด ความแปรปรวนตัวแทนที่เหมาะสมที่สุด และความสมมาตรสำหรับตัวแปรสุ่มที่มีขอบเขต" Esaim: ความน่าจะเป็นและสถิติ 24 : 39– 55. arXiv : 1901.09188 . doi : 10.1051 /ps/2019018 .

[barreto2024-9] Barreto, Mathias; Marchal, Olivier; Arbel, Julyan (2024). "ตัวแทนความแปรปรวนย่อยเกาส์เซียนที่เหมาะสมที่สุดสำหรับตัวแปรสุ่มเกาส์เซียนและเอกซ์โพเนนเชียลที่ถูกตัดทอน" arXiv : 2403.08628 [ math.ST ]

[10] Kamath, Gautam. "ขอบเขตของค่าคาดหวังของค่าสูงสุดของตัวอย่างจากฟังก์ชันเกาส์เซียน " (2015)

[11] "MIT 18.S997 | ฤดูใบไม้ผลิ 2015 | สถิติมิติสูง บทที่ 1 ตัวแปรสุ่มแบบซับเกาส์เซียน" (PDF) . MIT OpenCourseWare . สืบค้นเมื่อ2024-04-03 .

[12] Hanson, DL; Wright, FT (1971). "ขอบเขตของความน่าจะเป็นส่วนหางสำหรับรูปแบบกำลังสองในตัวแปรสุ่มอิสระ" . วารสารสถิติคณิตศาสตร์ . 42 (3): 1079– 1083. doi : 10.1214/aoms/1177693335 . ISSN 0003-4851 . JSTOR 2240253 .

[:1-13] Rudelson, Mark; Vershynin, Roman (มกราคม 2013). "ความไม่เท่าเทียมกันของ Hanson-Wright และความเข้มข้นแบบ sub-gaussian" . Electronic Communications in Probability . 18 (ไม่มี): 1– 9. arXiv : 1306.2872 . doi : 10.1214/ECP.v18-2865 . ISSN 1083-589X .

[14] Vershynin, Roman (2018). "6. รูปแบบกำลังสอง การทำให้สมมาตร และการหดตัว"ความน่าจะเป็นมิติสูง: บทนำพร้อมการประยุกต์ใช้ในวิทยาศาสตร์ข้อมูล ชุดเคมบริดจ์ในคณิตศาสตร์สถิติและความน่าจะเป็น เค มบริดจ์: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ หน้า 127–146 doi : 10.1017 /9781108231596.009 ISBN 978-1-108-41519-4.

[

[

[

[

[

[ 6 ]

[

[

[

[

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

การกระจายแบบซับเกาส์เซียน

คำจำกัดความ

บรรทัดฐานซับเกาส์เซียน

ตัวแทนความแปรปรวน

คำจำกัดความที่เทียบเท่ากัน

หลักฐานการเทียบเท่า

คุณสมบัติพื้นฐาน

Concentration

ซับเกาส์เซียนอย่างเคร่งครัด

คุณสมบัติ

ตัวอย่าง

ตัวอย่าง

การแจกแจงแบบเบอร์นูลลี

การแจกแจงแบบมีขอบเขต

คอนโวลูชัน

ส่วนผสม

เวกเตอร์สุ่มซับเกาส์เซียน

ความไม่เท่าเทียมกันสูงสุด

ความไม่เท่าเทียมกัน

ความไม่เท่าเทียมกันของแฮนสัน-ไรท์

ผลที่ตามมา

ดูเพิ่มเติม

หมายเหตุ

เอกสารอ้างอิง

ข้อมูลสำคัญจากบทความ