การสุ่มตัวอย่างการแปลงผกผัน

Q: ปรีชา

จากนั้นเราต้องการสร้างด้วย ฟังก์ชันการกระจายสะสม (CDF) เราสมมติว่า เป็น ฟังก์ชันต่อเนื่องที่เพิ่มขึ้น อย่างเคร่งครัด ซึ่งช่วยให้เข้าใจได้ง่าย ยู ~ ยู n ฉัน เอฟ [ 0 , 1 ] {\displaystyle U\sim \mathrm {Unif} [0,1]} X {\displaystyle X} เอฟ X ( x ) .

การสุ่มตัวอย่างแบบแปลงผกผัน (หรือที่รู้จักกันในชื่อการสุ่มตัวอย่างแบบผกผันการแปลงอินทิกรัลความน่าจะเป็นผกผันวิธีการแปลงผกผันหรือการแปลงSmirnov ) เป็นวิธีการพื้นฐานสำหรับการสุ่มตัวอย่างตัวเลขสุ่มเทียม กล่าวคือ สำหรับการ สร้าง ตัวเลขตัวอย่างแบบสุ่มจากฟังก์ชันการกระจายความน่าจะเป็น ใดๆ โดยกำหนดฟังก์ชันการกระจายสะสม

การสุ่มตัวอย่างแบบแปลงผกผัน (Inverse transformation sampling) จะสุ่มตัวอย่างแบบสม่ำเสมอด้วยตัวเลขระหว่าง 0 ถึง 1 ซึ่งตีความได้ว่าเป็นความน่าจะเป็น แล้วส่งคืนตัวเลขที่เล็กที่สุดที่ทำให้ฟังก์ชันการแจกแจงสะสมของตัวแปรสุ่มนั้นเป็นจริง ตัวอย่างเช่น สมมติว่า คือ การแจกแจงปกติมาตรฐานที่มีค่าเฉลี่ยเป็นศูนย์และส่วนเบี่ยงเบนมาตรฐานเป็นหนึ่ง ตารางด้านล่างแสดงตัวอย่างที่ได้จากการแจกแจงแบบสม่ำเสมอและการแสดงผลบนการแจกแจงปกติมาตรฐาน $u$ $x\in \mathbb {R}$ $F(x)\geq u$ $F$ $F$

การเปลี่ยนจากตัวอย่างที่เป็นเนื้อเดียวกันไปเป็นปกติ
$u$	$F^{-1}(u)$
0.5	0
0.975	1.95996
0.995	2.5758
.999999	4.75342
1-2 ⁻⁵²	8.12589

การสุ่มตัวอย่างแบบแปลงผกผันสำหรับการแจกแจงแบบปกติ

เราสุ่มเลือกสัดส่วนของพื้นที่ใต้เส้นโค้ง และส่งคืนค่าตัวเลขในโดเมน โดยที่สัดส่วนของพื้นที่นั้นจะปรากฏอยู่ทางด้านซ้ายของตัวเลขที่เลือกไว้ โดยสัญชาตญาณแล้ว เราไม่น่าจะเลือกตัวเลขที่อยู่ปลายสุดของเส้นโค้ง เพราะมีพื้นที่น้อยมาก ซึ่งจะทำให้ต้องเลือกตัวเลขที่ใกล้เคียงกับศูนย์หรือหนึ่งมาก

ในเชิงการคำนวณ วิธีนี้เกี่ยวข้องกับการคำนวณฟังก์ชันควอนไทล์ของการแจกแจง — กล่าวอีกนัยหนึ่งคือ การคำนวณฟังก์ชันการแจกแจงสะสม (CDF) ของการแจกแจง (ซึ่งแปลงตัวเลขในโดเมนเป็นความน่าจะเป็นระหว่าง 0 ถึง 1) แล้วจึงหาฟังก์ชันผกผันของฟังก์ชันนั้น นี่คือที่มาของคำว่า "ผกผัน" หรือ "การกลับด้าน" ในชื่อส่วนใหญ่ของวิธีนี้ โปรดทราบว่าสำหรับการแจกแจงแบบไม่ต่อเนื่องการคำนวณ CDF โดยทั่วไปไม่ใช่เรื่องยากเกินไป: เราเพียงแค่บวกความน่าจะเป็นแต่ละจุดของการแจกแจงเข้าด้วยกัน อย่างไรก็ตาม สำหรับการแจกแจงแบบต่อเนื่องเราจำเป็นต้องหาปริพันธ์ของฟังก์ชันความหนาแน่นความน่าจะเป็น (PDF) ของการแจกแจง ซึ่งเป็นไปไม่ได้ที่จะทำได้โดยวิธีวิเคราะห์สำหรับหลายๆ การแจกแจง (รวมถึงการแจกแจงปกติ ) ด้วยเหตุนี้ วิธีนี้อาจไม่มีประสิทธิภาพในการคำนวณสำหรับหลายๆ การแจกแจง และอาจนิยมใช้วิธีอื่นๆ มากกว่า อย่างไรก็ตาม วิธีนี้เป็นวิธีที่มีประโยชน์สำหรับการสร้างตัวสุ่มตัวอย่างที่ใช้งานได้ทั่วไปมากขึ้น เช่น ตัวสุ่มตัวอย่างที่ใช้การ สุ่มตัวอย่างแบบปฏิเสธ

สำหรับการแจกแจงปกติการขาดการแสดงออกเชิงวิเคราะห์สำหรับฟังก์ชันควอนไทล์ที่สอดคล้องกันหมายความว่าวิธีการอื่น ๆ (เช่นการแปลง Box–Muller ) อาจเป็นที่ต้องการมากกว่าในเชิงการคำนวณ บ่อยครั้งที่แม้แต่สำหรับการแจกแจงแบบง่าย ๆ วิธีการสุ่มตัวอย่างแบบแปลงผกผันก็สามารถปรับปรุงได้^{[ 1 ]}ดูตัวอย่างเช่นอัลกอริทึมซิกกูแรตและการสุ่มตัวอย่างแบบปฏิเสธ ในทางกลับกัน เป็นไปได้ที่จะประมาณฟังก์ชันควอนไทล์ของการแจกแจงปกติได้อย่างแม่นยำมากโดยใช้พหุนามระดับปานกลาง และในความเป็นจริงวิธีการทำเช่นนี้เร็วพอที่การสุ่มตัวอย่างแบบผกผันจะ ^เป็นวิธีการเริ่มต้นสำหรับการสุ่มตัวอย่างจากการแจกแจงปกติในแพ็คเกจทางสถิติR [ ^{2 ]}

คำแถลงอย่างเป็นทางการ

สำหรับตัวแปรสุ่ม ใดๆ บนตัวแปรสุ่มจะมีการกระจายแบบเดียวกันกับโดยที่คือผกผันทั่วไปของฟังก์ชันการกระจายสะสมของและเป็นแบบเอกรูปบน^[³^] $X$ $\mathbb {R}$ $F_{X}^{-1}(U)$ $X$ $F_{X}^{-1}$ $F_{X}$ $X$ $U$ $[0,1]$

สำหรับตัวแปรสุ่มต่อเนื่อง การแปลงอินทิก รัลความน่าจะเป็นผกผันนั้นแท้จริงแล้วคือส่วนกลับของการแปลงอินทิกรัลความน่าจะเป็นซึ่งระบุว่าสำหรับตัวแปรสุ่มต่อเนื่อง ที่มีฟังก์ชันการกระจายสะสมตัวแปรสุ่มนั้นจะเป็นแบบเอกรูป บน $X$ $F_{X}$ $U=F_{X}(X)$ $[0,1]$

กราฟแสดงเทคนิคการผกผันจากถึง โดยที่ด้านล่างขวาแสดงฟังก์ชันปกติ และด้านบนซ้ายแสดงฟังก์ชันผกผัน $x$ $F(x)$

ปรีชา

จากนั้นเราต้องการสร้างด้วยฟังก์ชันการกระจายสะสม (CDF)เราสมมติว่า เป็นฟังก์ชันต่อเนื่องที่เพิ่มขึ้น อย่างเคร่งครัด ซึ่งช่วยให้เข้าใจได้ง่าย $U\sim \mathrm {Unif} [0,1]$ $X$ $F_{X}(x).$ $F_{X}(x)$

เราต้องการตรวจสอบว่าเราสามารถหาการแปลงแบบโมโนโทนอย่างเคร่งครัดได้หรือไม่ เช่นเราจะมี $T:[0,1]\mapsto \mathbb {R}$ $T(U){\overset {d}{=}}X$

$F_{X}(x)=\Pr(X\leq x)=\Pr(T(U)\leq x)=\Pr(U\leq T^{-1}(x))=T^{-1}(x),{\text{ สำหรับ }}x\in \mathbb {R} ,$

โดยขั้นตอนสุดท้ายใช้เมื่อเป็นแบบสม่ำเสมอบน. $\Pr(U\leq y)=y$ $U$ $[0,1]$

ดังนั้น เราจึงต้องเป็นฟังก์ชันผกผันของหรือเทียบเท่ากับ $F_{X}$ $T$ $T(u)=F_{X}^{-1}(u),u\in [0,1].$

ดังนั้น เราจึงสามารถสร้างจาก $X$ $F_{X}^{-1}(U).$

วิธีการ

ปัญหาที่วิธีการสุ่มตัวอย่างแบบแปลงผกผันช่วยแก้ไขมีดังนี้:

ให้เป็นตัวแปรสุ่มที่มีการกระจายตัวตามฟังก์ชันการกระจายสะสม $X$ $F_{X}$
เราต้องการสร้างค่าต่างๆ ที่มีการกระจายตัวตามการแจกแจงนี้ $X$

วิธีการสุ่มตัวอย่างแบบแปลงผกผันทำงานดังนี้:

สร้างเลขสุ่ม จาก1การแจกแจงเอกรูปมาตรฐานในช่วงเช่น จาก $u$ $[0,1]$ $U\sim \mathrm {Unif} [0,1].$
หาอินเวอร์สทั่วไปของฟังก์ชันการกระจายสะสมที่ต้องการ นั่นคือ $F_{X}^{-1}(u)$
คำนวณตัวแปรสุ่มที่คำนวณได้จะมีการกระจายตัวแบบเดียวกันกับ และด้วยเหตุนี้จึงมีกฎการกระจายตัวแบบเดียวกันกับ $X'(u)=F_{X}^{-1}(u)$ $X'(U)$ $F_{X}$ $X$

กล่าวอีกนัยหนึ่งคือ เมื่อกำหนดฟังก์ชันการกระจายสะสมและตัวแปรสม่ำเสมอตัวแปรสุ่มจะมีการกระจาย^[³^] $F_{X}$ $U\in [0,1]$ $X=F_{X}^{-1}(U)$ $F_{X}$

ในกรณีต่อเนื่อง การปฏิบัติต่อฟังก์ชันผกผันดังกล่าวในฐานะวัตถุที่สอดคล้องกับสมการเชิงอนุพันธ์สามารถทำได้^{[ 4 ]}สมการเชิงอนุพันธ์บางสมการยอมรับ คำตอบ อนุกรมกำลัง ที่ชัดเจน แม้ว่าจะไม่เชิงเส้นก็ตาม^{[ 5 ]}

ตัวอย่าง

ยกตัวอย่างเช่น สมมติว่าเรามีตัวแปรสุ่มและฟังก์ชันการกระจายสะสม $U\sim \mathrm {Unif} (0,1)$

{\begin{aligned}F(x)=1-\exp(-{\sqrt {x}})\end{aligned}}

เพื่อทำการผกผัน เราต้องการหาคำตอบสำหรับ

F(F^{-1}(u))=u

{\begin{aligned}F(F^{-1}(u))&=u\\1-\exp \left(-{\sqrt {F^{-1}(u)}}\right)&=u\\F^{-1}(u)&=(-\log(1-u))^{2}\\&=(\log(1-u))^{2}\end{aligned}}

จากตรงนี้ เราจะดำเนินการตามขั้นตอนที่หนึ่ง สอง และสาม

อีกตัวอย่างหนึ่ง เราใช้การแจกแจงแบบเอกซ์โปเนนเชียลโดยที่x ≥ 0 (และ 0 ในกรณีอื่น ๆ) โดยการแก้สมการ y=F(x) เราจะได้ฟังก์ชันผกผัน $F_{X}(x)=1-e^{-\lambda x}$

x=F^{-1}(y)=-{\frac {1}{\lambda }}\ln(1-y).

หมายความว่า ถ้าเราสุ่มตัวอย่างบางส่วนจาก a แล้วคำนวณ ผลลัพธ์ ที่ได้จะมีการกระจายแบบเอกซ์โปเนนเชียล

y_{0}

U\sim \mathrm {Unif} (0,1)

x_{0}=F_{X}^{-1}(y_{0})=-{\frac {1}{\lambda }}\ln(1-y_{0}),

x_{0}

แนวคิดนี้แสดงให้เห็นได้ในกราฟต่อไปนี้:

โปรดทราบว่าการแจกแจงจะไม่เปลี่ยนแปลงหากเราเริ่มต้นด้วย 1-y แทนที่จะเป็น y ดังนั้นเพื่อวัตถุประสงค์ในการคำนวณ จึงเพียงพอที่จะสร้างตัวเลขสุ่ม y ในช่วง [0, 1] แล้วคำนวณค่าออกมา

x=F^{-1}(y)=-{\frac {1}{\lambda }}\ln(y).

หลักฐานยืนยันความถูกต้อง

ให้เป็นฟังก์ชันการกระจายสะสมและให้เป็นฟังก์ชันผกผันทั่วไป (โดยใช้ค่าต่ำสุดเนื่องจาก CDF เป็นแบบโมโนโทนิกอ่อนและต่อเนื่องทางขวา ): ^[⁶^] $F$ $F^{-1}$

F^{-1}(u)=\inf \;\{x\mid F(x)\geq u\}\qquad (0<u<1).

ข้ออ้าง:ถ้าเป็นตัวแปรสุ่มเอกรูปบนแล้วจะมีเป็นฟังก์ชันการกระจายสะสม (CDF) ของมัน $U$ $[0,1]$ $F^{-1}(U)$ $F$

การพิสูจน์:

{\begin{aligned}&\Pr(F^{-1}(U)\leq x)\\&{}=\Pr(U\leq F(x))\quad &(F{\text{ เป็นฟังก์ชันต่อเนื่องทางขวา ดังนั้น }}\{u:F^{-1}(u)\leq x\}=\{u:u\leq F(x)\})\\&{}=F(x)\quad &({\text{เนื่องจาก }}\Pr(U\leq u)=u,{\text{ เมื่อ }}U{\text{ เป็นฟังก์ชันเอกรูปบน }}[0,1])\\\end{aligned}}

การแจกแจงแบบตัดทอน

การสุ่มตัวอย่างแบบแปลงผกผันสามารถขยายไปยังกรณีของการแจกแจงแบบตัดทอนในช่วงได้ อย่างง่ายดาย โดยไม่ต้องเสียค่าใช้จ่ายในการสุ่มตัวอย่างแบบปฏิเสธ: สามารถใช้อัลกอริทึมเดียวกันได้ แต่แทนที่จะสร้างตัวเลขสุ่มที่มีการแจกแจงแบบสม่ำเสมอระหว่าง 0 และ 1 ให้สร้างตัวเลขสุ่มที่มีการแจกแจงแบบสม่ำเสมอระหว่างและจากนั้นจึงเลือกอีกครั้ง $(a,b]$ $u$ $u$ $F(a)$ $F(b)$ $F^{-1}(u)$

การลดจำนวนการกลับด้าน

เพื่อให้ได้ตัวอย่างจำนวนมาก จำเป็นต้องทำการผกผันการแจกแจงจำนวนเท่ากัน วิธีหนึ่งที่เป็นไปได้ในการลดจำนวนการผกผันในขณะที่ได้ตัวอย่างจำนวนมากคือการประยุกต์ใช้ตัวสุ่มแบบมอนเตคาร์โลแบบการจัดเรียงแบบสุ่ม (SCMC sampler) ภายใน กรอบการขยาย ความโกลาหลพหุนามซึ่งช่วยให้เราสามารถสร้างตัวอย่างมอนเตคาร์โลจำนวนเท่าใดก็ได้ด้วยการผกผันการแจกแจงดั้งเดิมเพียงไม่กี่ครั้งด้วยตัวอย่างอิสระของตัวแปรที่สามารถผกผันได้โดยการวิเคราะห์ เช่น ตัวแปรปกติมาตรฐาน^{[ 7 ]}

การนำซอฟต์แวร์ไปใช้งาน

มีการใช้งานซอฟต์แวร์สำหรับการประยุกต์ใช้วิธีการสุ่มตัวอย่างแบบผกผันโดยใช้การประมาณเชิงตัวเลขของค่าผกผันในกรณีที่ไม่มีอยู่ในรูปแบบปิด ตัวอย่างเช่น สามารถคำนวณค่าประมาณของค่าผกผันได้หากผู้ใช้ให้ข้อมูลบางอย่างเกี่ยวกับการกระจาย เช่น PDF ^{[ 8 ]}หรือ CDF

ไลบรารี C UNU.RAN ^{[ 9 ]}
ไลบรารี R Runuran ^{[ 10 ]}
การสุ่มตัวอย่างแพ็กเกจย่อย Python ในscipy.stats ^{[ 11 ]}^{[ 12 ]}

ดูเพิ่มเติม

การแปลงอินทิกรัลความน่าจะเป็น
โคปูลา (Copula ) ถูกกำหนดโดยใช้การแปลงอินทิกรัลความน่าจะเป็น
ฟังก์ชันควอนไทล์สำหรับการสร้างฟังก์ชันการกระจายสะสมผกผันอย่างชัดเจน
ฟังก์ชันการแจกแจงผกผันสำหรับนิยามทางคณิตศาสตร์ที่แม่นยำของการแจกแจงที่มีส่วนประกอบแบบไม่ต่อเนื่อง
การสุ่มตัวอย่างแบบปฏิเสธ (Rejection sampling)เป็นอีกเทคนิคหนึ่งที่ใช้กันทั่วไปในการสร้างตัวแปรสุ่มที่ไม่ต้องอาศัยการผกผันของฟังก์ชันการกระจายสะสม (CDF)

[ 1 ]

เป็น

[

[ 4 ]

[ 5 ]

[

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]