อ่าน 3 นาที
การกระจายทางสถิติ
ในทางสถิติการกระจายตัว (เรียกอีกอย่างว่าความแปรปรวนการกระจัดกระจายหรือการแพร่กระจาย ) คือขอบเขตที่การกระจายตัวถูกยืดหรือบีบตัวอย่างทั่วไปของการวัดการกระจายตัวทางสถิติ
การกระจายทางสถิติ

ในทางสถิติการกระจายตัว (เรียกอีกอย่างว่าความแปรปรวนการกระจัดกระจายหรือการแพร่กระจาย ) คือขอบเขตที่การกระจายตัวถูกยืดหรือบีบ[ 1 ]ตัวอย่างทั่วไปของการวัดการกระจายตัวทางสถิติ ได้แก่ความแปรปรวนส่วนเบี่ยงเบนมาตรฐานและช่วงควาร์ไทล์ตัวอย่างเช่น เมื่อความแปรปรวนของข้อมูลในชุดมีขนาดใหญ่ ข้อมูลจะกระจัดกระจายอย่างกว้างขวาง ในทางกลับกัน เมื่อความแปรปรวนมีขนาดเล็ก ข้อมูลในชุดจะรวมกลุ่มกัน
การกระจายตัวนั้นแตกต่างจากตำแหน่งหรือแนวโน้มศูนย์กลางและทั้งสองอย่างนี้เป็นคุณสมบัติที่ใช้กันมากที่สุดในการวิเคราะห์การแจกแจงข้อมูล
การวัดการกระจายทางสถิติ
ค่าการกระจายทางสถิติคือจำนวนจริง ที่ไม่เป็นลบ ซึ่งจะมีค่าเป็นศูนย์หากข้อมูลทั้งหมดเหมือนกัน และจะเพิ่มขึ้นเมื่อข้อมูลมีความหลากหลายมากขึ้น
โดยทั่วไปแล้ว หน่วยวัดการกระจายตัวส่วนใหญ่จะเป็นหน่วย เดียว กับปริมาณที่วัด กล่าวคือ ถ้าการวัดมีหน่วยเป็นเมตรหรือวินาที หน่วยวัดการกระจายตัวก็จะเป็นเมตรหรือวินาทีเช่นกัน ตัวอย่างของหน่วยวัดการกระจายตัว ได้แก่:
- ค่าเบี่ยงเบนมาตรฐาน
- ช่วงควาร์ไทล์ (IQR)
- พิสัย
- ความแตกต่างสัมบูรณ์เฉลี่ย (หรือที่เรียกว่า ความแตกต่างสัมบูรณ์เฉลี่ยของจีนี)
- ค่าเบี่ยงเบนสัมบูรณ์มัธยฐาน (MAD)
- ค่าเบี่ยงเบนสัมบูรณ์เฉลี่ย (หรือเรียกสั้น ๆ ว่าค่าเบี่ยงเบนเฉลี่ย)
- ค่าเบี่ยงเบนมาตรฐานระยะทาง
ค่าเหล่านี้มักถูกใช้ (ร่วมกับตัวประกอบมาตราส่วน ) เป็นตัวประมาณค่าพารามิเตอร์มาตราส่วนซึ่งในความสามารถนี้เรียกว่าค่าประมาณมาตราส่วน มาตรวัดมาตราส่วนที่ทนทานคือมาตรวัด ที่ไม่ได้รับผลกระทบจาก ค่าผิดปกติจำนวนเล็กน้อยและรวมถึง IQR และ MAD
มาตรวัดการกระจายทางสถิติทั้งหมดข้างต้นมีคุณสมบัติที่เป็นประโยชน์คือไม่ขึ้นกับตำแหน่งและเป็นเชิงเส้นตามมาตราส่วนซึ่งหมายความว่าหากตัวแปรสุ่ม มีการกระจายเท่ากับแล้วการแปลงเชิงเส้นสำหรับจำนวนจริงและควรมีการกระจายเท่ากับโดยที่คือค่าสัมบูรณ์ของนั่นคือไม่สนใจเครื่องหมายลบที่อยู่ข้างหน้า
มาตรวัดการกระจายตัวแบบอื่นนั้นไม่มีมิติกล่าวคือ ไม่มีหน่วยแม้ว่าตัวแปรนั้นจะมีหน่วยก็ตาม มาตรวัดเหล่านี้ได้แก่:
- สัมประสิทธิ์ความแปรผัน
- สัมประสิทธิ์การกระจายควอไทล์
- ความแตกต่างเฉลี่ยสัมพัทธ์เท่ากับสองเท่าของสัมประสิทธิ์จินี
- เอนโทรปี : ในขณะที่เอนโทรปีของตัวแปรไม่ต่อเนื่องนั้นไม่ขึ้นกับตำแหน่งและไม่ขึ้นกับขนาด ดังนั้นจึงไม่ใช่มาตรวัดการกระจายในความหมายข้างต้น เอนโทรปีของตัวแปรต่อเนื่องนั้นไม่ขึ้นกับตำแหน่งและสามารถบวกเพิ่มได้ตามขนาด: ถ้าคือเอนโทรปีของตัวแปรต่อเนื่องและแล้ว
นอกจากนี้ยังมีมาตรวัดการกระจายตัวอื่นๆ อีกด้วย:
- ความแปรปรวน (กำลังสองของส่วนเบี่ยงเบนมาตรฐาน) – ไม่ขึ้นกับตำแหน่ง แต่ไม่เป็นเชิงเส้นตามมาตราส่วน
- อัตราส่วนความแปรปรวนต่อค่าเฉลี่ย – ส่วนใหญ่ใช้กับข้อมูลเชิงนับเมื่อใช้ คำว่า สัมประสิทธิ์การกระจาย และเมื่ออัตราส่วนนี้ ไม่มีหน่วยเนื่องจากข้อมูลเชิงนับนั้นไม่มีหน่วย มิเช่นนั้นจะใช้ได้กับข้อมูลเชิงนับ
การวัดการกระจายบางอย่างมีวัตถุประสงค์เฉพาะค่าความแปรปรวนของ Allanสามารถใช้สำหรับการใช้งานที่สัญญาณรบกวนขัดขวางการบรรจบกัน[ 2 ]ค่าความแปรปรวนของ Hadamardสามารถใช้เพื่อต่อต้านความไวต่อการเปลี่ยนแปลงความถี่เชิงเส้น[ 3 ]
สำหรับตัวแปรเชิงหมวดหมู่การวัดการกระจายด้วยตัวเลขเพียงตัวเดียวเป็นเรื่องที่พบได้ไม่บ่อยนัก โปรดดูที่การแปรผันเชิงคุณภาพมาตรวัดหนึ่งที่ทำเช่นนั้นคือเอนโทรปี แบบไม่ ต่อ เนื่อง
แหล่งที่มา
ในวิทยาศาสตร์กายภาพความแปรปรวนดังกล่าวอาจเกิดจากข้อผิดพลาดในการวัดแบบสุ่ม: การวัดด้วยเครื่องมือมักจะไม่แม่นยำอย่างสมบูรณ์ กล่าวคือ ไม่สามารถทำซ้ำได้และยังมีความแปรปรวนระหว่างผู้ประเมิน เพิ่มเติม ในการตีความและรายงานผลการวัด อาจสันนิษฐานได้ว่าปริมาณที่วัดนั้นคงที่ และความแปรปรวนระหว่างการวัดเกิดจากข้อผิดพลาดในการสังเกตระบบที่มีอนุภาคจำนวนมากจะมีลักษณะเฉพาะด้วยค่าเฉลี่ยของปริมาณมหภาคจำนวนน้อย เช่น อุณหภูมิ พลังงาน และความหนาแน่น ค่าเบี่ยงเบนมาตรฐานเป็นการวัดที่สำคัญในทฤษฎีความผันผวน ซึ่งอธิบายปรากฏการณ์ทางกายภาพหลายอย่าง รวมถึงเหตุผลที่ท้องฟ้าเป็นสีฟ้า[ 4 ]
ในวิทยาศาสตร์ชีวภาพปริมาณที่วัดนั้นมักจะไม่คงที่และไม่เปลี่ยนแปลง และความแปรผันที่สังเกตได้อาจเป็นลักษณะเฉพาะของปรากฏการณ์นั้นเอง กล่าวคือ อาจเกิดจากความแปรผันระหว่างบุคคล กล่าวคือ สมาชิกที่แตกต่างกันในประชากรเดียวกัน หรืออาจเกิดจากความแปรผันภายในบุคคลกล่าวคือ บุคคลเดียวกันอาจแตกต่างกันในการทดสอบที่ทำในเวลาต่างกันหรือในสภาวะที่แตกต่างกัน ความแปรผันประเภทนี้ยังพบเห็นได้ในวงการผลิตภัณฑ์ที่ผลิตขึ้น แม้แต่ในวงการนี้ นักวิทยาศาสตร์ที่พิถีพิถันก็ยังพบความแปรผันอยู่ดี
ลำดับบางส่วนของการกระจายตัว
การกระจายแบบรักษาค่าเฉลี่ย ( MPS) คือการเปลี่ยนแปลงจากการกระจายความน่าจะเป็น A หนึ่งไปเป็นการกระจายความน่าจะเป็น B อีกหนึ่ง โดยที่ B ถูกสร้างขึ้นโดยการกระจายส่วนหนึ่งหรือมากกว่าของฟังก์ชันความหนาแน่นความน่าจะเป็นของ A ออกไป ในขณะที่ค่าเฉลี่ย (ค่าที่คาดหวัง) ยังคงไม่เปลี่ยนแปลง[ 5 ]แนวคิดของการกระจายแบบรักษาค่าเฉลี่ยช่วยให้สามารถจัดลำดับการกระจายความน่าจะเป็นบางส่วนตามการกระจายตัวได้ กล่าวคือ การกระจายความน่าจะเป็นสองแบบ แบบหนึ่งอาจมีการกระจายตัวมากกว่าอีกแบบหนึ่ง หรืออีกทางหนึ่ง อาจไม่มีแบบใดที่มีการกระจายตัวมากกว่ากันเลย
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การกระจายทางสถิติ
ในทางสถิติการกระจายตัว (เรียกอีกอย่างว่าความแปรปรวนการกระจัดกระจายหรือการแพร่กระจาย ) คือขอบเขตที่การกระจายตัวถูกยืดหรือบีบตัวอย่างทั่วไปของการวัดการกระจายตัวทางสถิติ
การวัดการกระจายทางสถิติ
ค่า การกระจายทางสถิติ คือ จำนวนจริง ที่ไม่เป็นลบ ซึ่งจะมีค่าเป็นศูนย์หากข้อมูลทั้งหมดเหมือนกัน และจะเพิ่มขึ้นเมื่อข้อมูลมีความหลากหลายมากขึ้น
แหล่งที่มา
ใน วิทยาศาสตร์กายภาพ ความแปรปรวนดังกล่าวอาจเกิดจากข้อผิดพลาดในการวัดแบบสุ่ม: การวัดด้วยเครื่องมือมักจะไม่ แม่นยำอย่างสมบูรณ์ กล่าวคือ ไม่สามารถทำซ้ำได้ และยังมี ความแปรปรวนระหว่างผู้ประเมิน เพิ่มเติม ในการตีความและรายงานผลการวัด...
ลำดับบางส่วนของการกระจายตัว
การกระจายแบบรักษาค่าเฉลี่ย ( MPS) คือการเปลี่ยนแปลงจากการกระจายความน่าจะเป็น A หนึ่งไปเป็นการกระจายความน่าจะเป็น B อีกหนึ่ง โดยที่ B ถูกสร้างขึ้นโดยการกระจายส่วนหนึ่งหรือมากกว่าของฟังก์ชันความหนาแน่นความน่าจะเป็นของ A ออกไป ในขณะที่ค่าเฉลี่ย (ค่าที่คาดหวัง)...