ความสุ่มทางสถิติ

Q: การทดสอบ

การทดสอบตัวเลขสุ่มครั้งแรกได้รับการตีพิมพ์โดย MG Kendall และ Bernard Babington Smith ใน วารสารของ Royal Statistical Society ในปี พ.ศ.

Q: ดูเพิ่มเติม

ความสุ่มเชิงอัลกอริทึม ความสุ่มเชิงพื้นที่อย่างสมบูรณ์ จำนวนปกติ แผ่นรองแบบใช้ครั้งเดียว ข้อผิดพลาดแบบสุ่ม ความสุ่ม การทดสอบความสุ่ม การทดสอบสมมติฐานทางสถิติ สถานะสุ่มเจ็ดประการ ทดสอบU01 เมอร์เซนน์ ทวิสเตอร์ ภาพลวงตาของการรวมกลุ่ม

Q: ลิงก์ภายนอก

DieHarder : ชุดทดสอบตัวเลขสุ่มภาษา C ฟรี ( GPL ) การสร้างตัวเลขสุ่มที่มีการแจกแจงแบบปกติ ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Statistical_randomness&oldid=1351699211 "

ลำดับตัวเลขจะเรียกว่าสุ่มทางสถิติเมื่อไม่มีรูปแบบหรือความสม่ำเสมอที่สามารถระบุได้ ลำดับเช่นผลลัพธ์ของการทอยลูกเต๋า ในอุดมคติ หรือตัวเลขของπแสดงให้เห็นถึงความสุ่มทางสถิติ^{[ 1 ]}

ความสุ่มเชิงสถิติไม่ได้หมายความถึงความสุ่ม "ที่แท้จริง" เสมอไป กล่าว คือความไม่สามารถคาดเดาได้โดย วัตถุประสงค์ ความสุ่มเทียมก็เพียงพอสำหรับการใช้งานหลายอย่าง เช่น ในทางสถิติ จึงเป็นที่มาของชื่อความสุ่ม เชิงสถิติ

ความสุ่มแบบทั่วโลกและความสุ่มแบบเฉพาะที่นั้นแตกต่างกัน แนวคิดทางปรัชญาส่วนใหญ่เกี่ยวกับความสุ่มนั้นเป็นแบบทั่วโลก เพราะมันตั้งอยู่บนความคิดที่ว่า "ในระยะยาว" ลำดับจะดูเหมือนสุ่มอย่างแท้จริง แม้ว่าลำดับย่อยบางส่วนอาจ ดู ไม่สุ่มก็ตาม ตัวอย่างเช่น ในลำดับตัวเลขที่สุ่มอย่างแท้จริงที่มีความยาวเพียงพอ อาจมีลำดับยาวๆ ที่มีแต่ตัวเลขซ้ำกัน แม้ว่าโดยรวมแล้วลำดับนั้นอาจดูเหมือนสุ่มก็ตาม ความสุ่ม แบบเฉพาะที่หมายถึงความยาวลำดับขั้นต่ำที่การแจกแจงแบบสุ่มนั้นใกล้เคียงกัน ช่วงยาวๆ ของตัวเลขที่เหมือนกัน แม้แต่ตัวเลขที่สร้างขึ้นจากกระบวนการสุ่มอย่างแท้จริง ก็จะลด "ความสุ่มแบบเฉพาะที่" ของตัวอย่างลง (อาจดูเหมือนสุ่มแบบเฉพาะที่เฉพาะสำหรับลำดับที่มีตัวเลข 10,000 ตัวเท่านั้น การเลือกลำดับที่มีตัวเลขน้อยกว่า 1,000 ตัวอาจดูไม่สุ่มเลยก็ได้)

ลำดับที่แสดงรูปแบบหนึ่งไม่ได้หมายความว่าไม่ใช่การสุ่มทางสถิติเสมอไป ตามหลักการของทฤษฎีแรมซีย์วัตถุที่มีขนาดใหญ่เพียงพอจะต้องมีโครงสร้างย่อยที่กำหนดไว้ (" ความไร้ระเบียบโดยสมบูรณ์เป็นไปไม่ได้ ")

กฎหมายที่เกี่ยวข้องกับการพนันกำหนดมาตรฐานความสุ่มทางสถิติบางประการสำหรับเครื่องสล็อตแมชชีน

การทดสอบ

การทดสอบตัวเลขสุ่มครั้งแรกได้รับการตีพิมพ์โดยMG KendallและBernard Babington Smithในวารสารของ Royal Statistical Societyในปี พ.ศ. 2481 ^{[ 2 ]}การทดสอบเหล่านี้สร้างขึ้นจากเครื่องมือทางสถิติ เช่นการทดสอบไคสแควร์ของ Pearsonซึ่งพัฒนาขึ้นเพื่อแยกแยะว่าปรากฏการณ์เชิงทดลองตรงกับความน่าจะเป็นตามทฤษฎีหรือไม่ Pearson พัฒนาการทดสอบของเขาโดยเริ่มแรกแสดงให้เห็นว่าการทดลองลูกเต๋าจำนวนหนึ่งโดยWFR Weldonไม่แสดงพฤติกรรม "สุ่ม"

การทดสอบสี่ครั้งแรกของ Kendall และ Smith เป็นการทดสอบสมมติฐานซึ่งมีสมมติฐานหลักคือ ตัวเลขแต่ละตัวในลำดับสุ่มที่กำหนดมีโอกาสเกิดขึ้นเท่ากัน และรูปแบบต่างๆ ในข้อมูลก็ควรมีการกระจายอย่างเท่าเทียมกันด้วย

การทดสอบความถี่นั้นเป็นพื้นฐานมาก คือการตรวจสอบเพื่อให้แน่ใจว่ามีจำนวนเลข 0, 1, 2, 3 ฯลฯ ใกล้เคียงกัน
การทดสอบแบบอนุกรมทำเช่นเดียวกัน แต่ใช้กับลำดับตัวเลขสองหลักในแต่ละครั้ง (00, 01, 02 เป็นต้น) โดยเปรียบเทียบความถี่ที่สังเกตได้กับการคาดการณ์ตามสมมติฐานว่ามีการกระจายอย่างเท่าเทียมกันหรือไม่
การทดสอบโป๊กเกอร์จะทดสอบลำดับตัวเลขห้าตัวในแต่ละครั้ง (AAAAA, AAAAB, AAABB เป็นต้น) โดยอิงจากไพ่ในเกมโป๊กเกอร์
การทดสอบช่องว่างจะพิจารณาระยะห่างระหว่างเลขศูนย์ (00 จะมีระยะห่าง 0, 030 จะมีระยะห่าง 1, 02250 จะมีระยะห่าง 3 เป็นต้น)

หากลำดับที่กำหนดสามารถผ่านการทดสอบทั้งหมดเหล่านี้ได้ภายในระดับนัยสำคัญที่กำหนด (โดยทั่วไปคือ 5%) ก็จะถือว่าลำดับนั้นเป็น "สุ่มเฉพาะที่" ตามคำกล่าวของพวกเขา เคนดัลและสมิธได้แยกความแตกต่างระหว่าง "ความสุ่มเฉพาะที่" กับ "ความสุ่มที่แท้จริง" โดยที่ลำดับจำนวนมากที่สร้างขึ้นด้วยวิธี การสุ่มที่แท้จริง อาจไม่แสดง "ความสุ่มเฉพาะที่" ในระดับที่กำหนด — ลำดับขนาดใหญ่ มากอาจมีหลายแถวที่มีตัวเลขหลักเดียว ซึ่งอาจ "สุ่ม" ในระดับของลำดับทั้งหมด แต่ในบล็อกที่เล็กกว่านั้นจะไม่ "สุ่ม" (จะไม่ผ่านการทดสอบของพวกเขา) และจะไร้ประโยชน์สำหรับการใช้งานทางสถิติหลายอย่าง

เมื่อชุดตัวเลขสุ่มแพร่หลายมากขึ้นเรื่อยๆ จึงมีการใช้การทดสอบที่ซับซ้อนมากขึ้น การทดสอบสมัยใหม่บางอย่างจะพล็อตตัวเลขสุ่มเป็นจุดบนระนาบสามมิติ จากนั้นจึงหมุนเพื่อค้นหารูปแบบที่ซ่อนอยู่ ในปี 1995 นักสถิติGeorge Marsagliaได้สร้างชุดการทดสอบที่รู้จักกันในชื่อการทดสอบ diehardซึ่งเขาแจกจ่ายพร้อมกับซีดีรอม ที่มีตัวเลข สุ่มเทียม 5 พันล้านตัว ในปี 2015 Yongge Wangได้แจกจ่ายแพ็คเกจซอฟต์แวร์ Java ^{[ 3 ]}สำหรับการทดสอบความสุ่มตามระยะทางทางสถิติ

เครื่องกำเนิดเลขสุ่มเทียมจำเป็นต้องมีการทดสอบเป็นวิธีการตรวจสอบ "ความเป็นสุ่ม" เพียงอย่างเดียว เนื่องจากไม่ได้สร้างขึ้นจากกระบวนการ "สุ่มอย่างแท้จริง" แต่สร้างขึ้นจากอัลกอริธึมเชิงกำหนด ตลอดประวัติศาสตร์ของการสร้างเลขสุ่ม แหล่งที่มาของตัวเลขจำนวนมากที่คิดว่าดูเหมือน "สุ่ม" เมื่อทำการทดสอบนั้น ต่อมาพบว่าไม่สุ่มเลยเมื่อถูกทดสอบด้วยวิธีการบางประเภท แนวคิดของ เลข กึ่งสุ่มถูกพัฒนาขึ้นเพื่อหลีกเลี่ยงปัญหาเหล่านี้ แม้ว่าเครื่องกำเนิดเลขสุ่มเทียมยังคงถูกใช้อย่างแพร่หลายในหลายแอปพลิเคชัน (แม้แต่แอปพลิเคชันที่ทราบกันดีว่า "ไม่สุ่มอย่างยิ่ง") เนื่องจาก "ดีพอ" สำหรับแอปพลิเคชันส่วนใหญ่

การทดสอบอื่นๆ:

การ ทดสอบ Monobitถือว่าแต่ละบิตเอาต์พุตของตัวสร้างเลขสุ่มเป็นการทดสอบการโยนเหรียญ และตรวจสอบว่าจำนวนหัวและก้อยที่สังเกตได้นั้นใกล้เคียงกับความถี่ที่คาดหวัง 50% หรือไม่ จำนวนหัวในการโยนเหรียญแต่ละครั้งจะมีลักษณะเป็นการแจกแจงแบบทวินาม
การทดสอบ Wald –Wolfowitz จะทำการทดสอบจำนวนการเปลี่ยนบิตระหว่างบิต 0 และบิต 1 โดยเปรียบเทียบความถี่ที่สังเกตได้กับความถี่ที่คาดหวังของลำดับบิตสุ่ม
เอนโทรปีของข้อมูล
การทดสอบความสัมพันธ์อัตโนมัติ
การทดสอบ Kolmogorov–Smirnov
การทดสอบความสุ่มตามระยะทางทางสถิติYongge Wangแสดงให้เห็น^{[ 4 ]}^{[ 5 ]}ว่ามาตรฐานการทดสอบ NIST SP800-22 ไม่เพียงพอที่จะตรวจจับจุดอ่อนบางประการในเครื่องกำเนิดความสุ่ม และเสนอการทดสอบความสุ่มตามระยะทางทางสถิติ
การประมาณความหนาแน่นสเปกตรัม^{[ 6 ]} - การดำเนินการแปลงฟูริเยร์บนสัญญาณ "สุ่ม" จะแปลงสัญญาณนั้นให้เป็นผลรวมของฟังก์ชันคาบเพื่อตรวจจับแนวโน้มซ้ำที่ไม่สุ่ม
การทดสอบทางสถิติสากลของเมารอร์
การทดสอบ Diehard

ดูเพิ่มเติม

ลิงก์ภายนอก

DieHarder : ชุดทดสอบตัวเลขสุ่มภาษาCฟรี ( GPL )
การสร้างตัวเลขสุ่มที่มีการแจกแจงแบบปกติ

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

ความสุ่มทางสถิติ

การทดสอบ

ดูเพิ่มเติม

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ