อ่าน 2 นาที
ความสุ่มทางสถิติ
ลำดับ ตัวเลขจะเรียกว่า สุ่มทางสถิติ เมื่อไม่มี รูปแบบ หรือความสม่ำเสมอที่สามารถระบุได้ ลำดับเช่นผลลัพธ์ของ การทอยลูกเต๋า ในอุดมคติ หรือตัวเลขของ π แสดงให้เห็นถึงความสุ่มทางสถิติ [...
ความสุ่มทางสถิติ
ลำดับตัวเลขจะเรียกว่าสุ่มทางสถิติเมื่อไม่มีรูปแบบหรือความสม่ำเสมอที่สามารถระบุได้ ลำดับเช่นผลลัพธ์ของการทอยลูกเต๋า ในอุดมคติ หรือตัวเลขของπแสดงให้เห็นถึงความสุ่มทางสถิติ[ 1 ]
ความสุ่มเชิงสถิติไม่ได้หมายความถึงความสุ่ม "ที่แท้จริง" เสมอไป กล่าว คือความไม่สามารถคาดเดาได้โดย วัตถุประสงค์ ความสุ่มเทียมก็เพียงพอสำหรับการใช้งานหลายอย่าง เช่น ในทางสถิติ จึงเป็นที่มาของชื่อความสุ่ม เชิงสถิติ
ความสุ่มแบบทั่วโลกและความสุ่มแบบเฉพาะที่นั้นแตกต่างกัน แนวคิดทางปรัชญาส่วนใหญ่เกี่ยวกับความสุ่มนั้นเป็นแบบทั่วโลก เพราะมันตั้งอยู่บนความคิดที่ว่า "ในระยะยาว" ลำดับจะดูเหมือนสุ่มอย่างแท้จริง แม้ว่าลำดับย่อยบางส่วนอาจ ดู ไม่สุ่มก็ตาม ตัวอย่างเช่น ในลำดับตัวเลขที่สุ่มอย่างแท้จริงที่มีความยาวเพียงพอ อาจมีลำดับยาวๆ ที่มีแต่ตัวเลขซ้ำกัน แม้ว่าโดยรวมแล้วลำดับนั้นอาจดูเหมือนสุ่มก็ตาม ความสุ่ม แบบเฉพาะที่หมายถึงความยาวลำดับขั้นต่ำที่การแจกแจงแบบสุ่มนั้นใกล้เคียงกัน ช่วงยาวๆ ของตัวเลขที่เหมือนกัน แม้แต่ตัวเลขที่สร้างขึ้นจากกระบวนการสุ่มอย่างแท้จริง ก็จะลด "ความสุ่มแบบเฉพาะที่" ของตัวอย่างลง (อาจดูเหมือนสุ่มแบบเฉพาะที่เฉพาะสำหรับลำดับที่มีตัวเลข 10,000 ตัวเท่านั้น การเลือกลำดับที่มีตัวเลขน้อยกว่า 1,000 ตัวอาจดูไม่สุ่มเลยก็ได้)
ลำดับที่แสดงรูปแบบหนึ่งไม่ได้หมายความว่าไม่ใช่การสุ่มทางสถิติเสมอไป ตามหลักการของทฤษฎีแรมซีย์วัตถุที่มีขนาดใหญ่เพียงพอจะต้องมีโครงสร้างย่อยที่กำหนดไว้ (" ความไร้ระเบียบโดยสมบูรณ์เป็นไปไม่ได้ ")
กฎหมายที่เกี่ยวข้องกับการพนันกำหนดมาตรฐานความสุ่มทางสถิติบางประการสำหรับเครื่องสล็อตแมชชีน
การทดสอบ
การทดสอบตัวเลขสุ่มครั้งแรกได้รับการตีพิมพ์โดยMG KendallและBernard Babington Smithในวารสารของ Royal Statistical Societyในปี พ.ศ. 2481 [ 2 ]การทดสอบเหล่านี้สร้างขึ้นจากเครื่องมือทางสถิติ เช่นการทดสอบไคสแควร์ของ Pearsonซึ่งพัฒนาขึ้นเพื่อแยกแยะว่าปรากฏการณ์เชิงทดลองตรงกับความน่าจะเป็นตามทฤษฎีหรือไม่ Pearson พัฒนาการทดสอบของเขาโดยเริ่มแรกแสดงให้เห็นว่าการทดลองลูกเต๋าจำนวนหนึ่งโดยWFR Weldonไม่แสดงพฤติกรรม "สุ่ม"
การทดสอบสี่ครั้งแรกของ Kendall และ Smith เป็นการทดสอบสมมติฐานซึ่งมีสมมติฐานหลักคือ ตัวเลขแต่ละตัวในลำดับสุ่มที่กำหนดมีโอกาสเกิดขึ้นเท่ากัน และรูปแบบต่างๆ ในข้อมูลก็ควรมีการกระจายอย่างเท่าเทียมกันด้วย
- การทดสอบความถี่นั้นเป็นพื้นฐานมาก คือการตรวจสอบเพื่อให้แน่ใจว่ามีจำนวนเลข 0, 1, 2, 3 ฯลฯ ใกล้เคียงกัน
- การทดสอบแบบอนุกรมทำเช่นเดียวกัน แต่ใช้กับลำดับตัวเลขสองหลักในแต่ละครั้ง (00, 01, 02 เป็นต้น) โดยเปรียบเทียบความถี่ที่สังเกตได้กับการคาดการณ์ตามสมมติฐานว่ามีการกระจายอย่างเท่าเทียมกันหรือไม่
- การทดสอบโป๊กเกอร์จะทดสอบลำดับตัวเลขห้าตัวในแต่ละครั้ง (AAAAA, AAAAB, AAABB เป็นต้น) โดยอิงจากไพ่ในเกมโป๊กเกอร์
- การทดสอบช่องว่างจะพิจารณาระยะห่างระหว่างเลขศูนย์ (00 จะมีระยะห่าง 0, 030 จะมีระยะห่าง 1, 02250 จะมีระยะห่าง 3 เป็นต้น)
หากลำดับที่กำหนดสามารถผ่านการทดสอบทั้งหมดเหล่านี้ได้ภายในระดับนัยสำคัญที่กำหนด (โดยทั่วไปคือ 5%) ก็จะถือว่าลำดับนั้นเป็น "สุ่มเฉพาะที่" ตามคำกล่าวของพวกเขา เคนดัลและสมิธได้แยกความแตกต่างระหว่าง "ความสุ่มเฉพาะที่" กับ "ความสุ่มที่แท้จริง" โดยที่ลำดับจำนวนมากที่สร้างขึ้นด้วยวิธี การสุ่มที่แท้จริง อาจไม่แสดง "ความสุ่มเฉพาะที่" ในระดับที่กำหนด — ลำดับขนาดใหญ่ มากอาจมีหลายแถวที่มีตัวเลขหลักเดียว ซึ่งอาจ "สุ่ม" ในระดับของลำดับทั้งหมด แต่ในบล็อกที่เล็กกว่านั้นจะไม่ "สุ่ม" (จะไม่ผ่านการทดสอบของพวกเขา) และจะไร้ประโยชน์สำหรับการใช้งานทางสถิติหลายอย่าง
เมื่อชุดตัวเลขสุ่มแพร่หลายมากขึ้นเรื่อยๆ จึงมีการใช้การทดสอบที่ซับซ้อนมากขึ้น การทดสอบสมัยใหม่บางอย่างจะพล็อตตัวเลขสุ่มเป็นจุดบนระนาบสามมิติ จากนั้นจึงหมุนเพื่อค้นหารูปแบบที่ซ่อนอยู่ ในปี 1995 นักสถิติGeorge Marsagliaได้สร้างชุดการทดสอบที่รู้จักกันในชื่อการทดสอบ diehardซึ่งเขาแจกจ่ายพร้อมกับซีดีรอม ที่มีตัวเลข สุ่มเทียม 5 พันล้านตัว ในปี 2015 Yongge Wangได้แจกจ่ายแพ็คเกจซอฟต์แวร์ Java [ 3 ]สำหรับการทดสอบความสุ่มตามระยะทางทางสถิติ
เครื่องกำเนิดเลขสุ่มเทียมจำเป็นต้องมีการทดสอบเป็นวิธีการตรวจสอบ "ความเป็นสุ่ม" เพียงอย่างเดียว เนื่องจากไม่ได้สร้างขึ้นจากกระบวนการ "สุ่มอย่างแท้จริง" แต่สร้างขึ้นจากอัลกอริธึมเชิงกำหนด ตลอดประวัติศาสตร์ของการสร้างเลขสุ่ม แหล่งที่มาของตัวเลขจำนวนมากที่คิดว่าดูเหมือน "สุ่ม" เมื่อทำการทดสอบนั้น ต่อมาพบว่าไม่สุ่มเลยเมื่อถูกทดสอบด้วยวิธีการบางประเภท แนวคิดของ เลข กึ่งสุ่มถูกพัฒนาขึ้นเพื่อหลีกเลี่ยงปัญหาเหล่านี้ แม้ว่าเครื่องกำเนิดเลขสุ่มเทียมยังคงถูกใช้อย่างแพร่หลายในหลายแอปพลิเคชัน (แม้แต่แอปพลิเคชันที่ทราบกันดีว่า "ไม่สุ่มอย่างยิ่ง") เนื่องจาก "ดีพอ" สำหรับแอปพลิเคชันส่วนใหญ่
การทดสอบอื่นๆ:
- การ ทดสอบ Monobitถือว่าแต่ละบิตเอาต์พุตของตัวสร้างเลขสุ่มเป็นการทดสอบการโยนเหรียญ และตรวจสอบว่าจำนวนหัวและก้อยที่สังเกตได้นั้นใกล้เคียงกับความถี่ที่คาดหวัง 50% หรือไม่ จำนวนหัวในการโยนเหรียญแต่ละครั้งจะมีลักษณะเป็นการแจกแจงแบบทวินาม
- การทดสอบ Wald –Wolfowitz จะทำการทดสอบจำนวนการเปลี่ยนบิตระหว่างบิต 0 และบิต 1 โดยเปรียบเทียบความถี่ที่สังเกตได้กับความถี่ที่คาดหวังของลำดับบิตสุ่ม
- เอนโทรปีของข้อมูล
- การทดสอบความสัมพันธ์อัตโนมัติ
- การทดสอบ Kolmogorov–Smirnov
- การทดสอบความสุ่มตามระยะทางทางสถิติYongge Wangแสดงให้เห็น[ 4 ] [ 5 ]ว่ามาตรฐานการทดสอบ NIST SP800-22 ไม่เพียงพอที่จะตรวจจับจุดอ่อนบางประการในเครื่องกำเนิดความสุ่ม และเสนอการทดสอบความสุ่มตามระยะทางทางสถิติ
- การประมาณความหนาแน่นสเปกตรัม[ 6 ] - การดำเนินการแปลงฟูริเยร์บนสัญญาณ "สุ่ม" จะแปลงสัญญาณนั้นให้เป็นผลรวมของฟังก์ชันคาบเพื่อตรวจจับแนวโน้มซ้ำที่ไม่สุ่ม
- การทดสอบทางสถิติสากลของเมารอร์
- การทดสอบ Diehard
ดูเพิ่มเติม
- ความสุ่มเชิงอัลกอริทึม
- ความสุ่มเชิงพื้นที่อย่างสมบูรณ์
- จำนวนปกติ
- แผ่นรองแบบใช้ครั้งเดียว
- ข้อผิดพลาดแบบสุ่ม
- ความสุ่ม
- การทดสอบความสุ่ม
- การทดสอบสมมติฐานทางสถิติ
- สถานะสุ่มเจ็ดประการ
- ทดสอบU01
- เมอร์เซนน์ ทวิสเตอร์
- ภาพลวงตาของการรวมกลุ่ม
ลิงก์ภายนอก
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ความสุ่มทางสถิติ
ลำดับ ตัวเลขจะเรียกว่า สุ่มทางสถิติ เมื่อไม่มี รูปแบบ หรือความสม่ำเสมอที่สามารถระบุได้ ลำดับเช่นผลลัพธ์ของ การทอยลูกเต๋า ในอุดมคติ หรือตัวเลขของ π แสดงให้เห็นถึงความสุ่มทางสถิติ [...
การทดสอบ
การทดสอบตัวเลขสุ่มครั้งแรกได้รับการตีพิมพ์โดย MG Kendall และ Bernard Babington Smith ใน วารสารของ Royal Statistical Society ในปี พ.ศ.
ดูเพิ่มเติม
ความสุ่มเชิงอัลกอริทึม ความสุ่มเชิงพื้นที่อย่างสมบูรณ์ จำนวนปกติ แผ่นรองแบบใช้ครั้งเดียว ข้อผิดพลาดแบบสุ่ม ความสุ่ม การทดสอบความสุ่ม การทดสอบสมมติฐานทางสถิติ สถานะสุ่มเจ็ดประการ ทดสอบU01 เมอร์เซนน์ ทวิสเตอร์ ภาพลวงตาของการรวมกลุ่ม
ลิงก์ภายนอก
DieHarder : ชุดทดสอบตัวเลขสุ่มภาษา C ฟรี ( GPL ) การสร้างตัวเลขสุ่มที่มีการแจกแจงแบบปกติ ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Statistical_randomness&oldid=1351699211 "