กลับไปหน้าบทความ

อ่าน 4 นาที

สถิติทางคณิตศาสตร์

สถิติทางคณิตศาสตร์คือการประยุกต์ใช้ทฤษฎีความน่าจะเป็นและแนวคิดทางคณิตศาสตร์อื่นๆ กับสถิติซึ่งแตกต่างจากเทคนิคในการรวบรวมข้อมูลทางสถิติเทคนิคทางคณิตศาสตร์เฉพาะที่ใช้กันทั่วไปในสถิติ

สถิติทางคณิตศาสตร์

ภาพประกอบแสดงการวิเคราะห์การถดถอยเชิงเส้นบนชุดข้อมูลการวิเคราะห์การถดถอยเป็นส่วนสำคัญของสถิติทางคณิตศาสตร์

สถิติทางคณิตศาสตร์คือการประยุกต์ใช้ทฤษฎีความน่าจะเป็นและแนวคิดทางคณิตศาสตร์อื่นๆ กับสถิติซึ่งแตกต่างจากเทคนิคในการรวบรวมข้อมูลทางสถิติ[ 1 ]เทคนิคทางคณิตศาสตร์เฉพาะที่ใช้กันทั่วไปในสถิติ ได้แก่การวิเคราะห์ทางคณิตศาสตร์พีชคณิตเชิงเส้นการวิเคราะห์เชิงสุ่ม สมการเชิงอนุพันธ์และทฤษฎีการวัด[ 2 ] [ 3 ]

การแนะนำ

การเก็บรวบรวมข้อมูลทางสถิติเกี่ยวข้องกับการวางแผนการศึกษา โดยเฉพาะอย่างยิ่งการออกแบบการทดลองแบบสุ่มและการวางแผนการสำรวจโดยใช้การสุ่มตัวอย่างการวิเคราะห์ข้อมูลเบื้องต้นมักเป็นไปตามระเบียบวิธีการศึกษาที่ระบุไว้ก่อนดำเนินการศึกษา ข้อมูลจากการศึกษาอาจนำมาวิเคราะห์เพื่อพิจารณาสมมติฐานรองที่ได้จากผลลัพธ์เบื้องต้น หรือเพื่อเสนอแนะการศึกษาใหม่ การวิเคราะห์ข้อมูลขั้นที่สองจากการศึกษาที่วางแผนไว้จะใช้เครื่องมือจากการวิเคราะห์ข้อมูลและกระบวนการในการทำเช่นนี้คือสถิติทางคณิตศาสตร์

การวิเคราะห์ข้อมูลแบ่งออกเป็น:

  • สถิติเชิงพรรณนา – เป็นส่วนหนึ่งของสถิติที่ใช้อธิบายข้อมูล กล่าวคือ สรุปข้อมูลและคุณลักษณะทั่วไปของข้อมูลเหล่านั้น
  • สถิติเชิงอนุมาน – ส่วนหนึ่งของสถิติที่สรุปผลจากข้อมูล (โดยใช้แบบจำลองบางอย่างสำหรับข้อมูล): ตัวอย่างเช่น สถิติเชิงอนุมานเกี่ยวข้องกับการเลือกแบบจำลองสำหรับข้อมูล การตรวจสอบว่าข้อมูลตรงตามเงื่อนไขของแบบจำลองนั้นหรือไม่ และการหาปริมาณความไม่แน่นอนที่เกี่ยวข้อง (เช่น การใช้ช่วงความเชื่อมั่น )

แม้ว่าเครื่องมือวิเคราะห์ข้อมูลจะทำงานได้ดีที่สุดกับข้อมูลจากการศึกษาแบบสุ่ม แต่ก็ยังสามารถนำไปใช้กับข้อมูลประเภทอื่นได้เช่นกัน ตัวอย่างเช่น จากการทดลองตามธรรมชาติและการศึกษาเชิงสังเกตซึ่งในกรณีนี้ การอนุมานจะขึ้นอยู่กับแบบจำลองที่นักสถิติเลือก และจึงเป็นไปตามดุลพินิจ[ 4 ] [ 5 ]

หัวข้อ

ต่อไปนี้เป็นหัวข้อสำคัญบางส่วนในสถิติทางคณิตศาสตร์: [ 6 ] [ 7 ]

การแจกแจงความน่าจะเป็น

การแจกแจงความน่าจะเป็นคือฟังก์ชันที่กำหนดความน่าจะเป็นให้กับแต่ละเซตย่อยที่วัดได้ของผลลัพธ์ที่เป็นไปได้ของการทดลองแบบ สุ่ม การสำรวจหรือกระบวนการอนุมานทางสถิติตัวอย่างพบได้ในการทดลองที่ มี ปริภูมิของตัวอย่างที่ไม่ใช่ตัวเลข ซึ่งการแจกแจงจะเป็นการแจกแจงเชิงหมวดหมู่ การทดลองที่มีปริภูมิของตัวอย่างที่เข้ารหัสด้วยตัวแปรสุ่มแบบ ไม่ต่อเนื่อง ซึ่งการแจกแจงสามารถระบุได้ด้วยฟังก์ชันมวลความน่าจะเป็นและการทดลองที่มีปริภูมิของตัวอย่างที่เข้ารหัสด้วยตัวแปรสุ่มแบบต่อเนื่อง ซึ่งการแจกแจงสามารถระบุได้ด้วยฟังก์ชันความหนาแน่นความน่าจะเป็นการทดลองที่ซับซ้อนกว่า เช่น การทดลองที่เกี่ยวข้องกับกระบวนการสุ่มที่กำหนดในเวลาต่อเนื่องอาจต้องใช้มาตรวัดความน่าจะ เป็น ที่ ทั่วไปกว่า

การแจกแจงความน่าจะเป็นอาจเป็นแบบตัวแปรเดียวหรือแบบหลายตัวแปรการแจกแจงแบบตัวแปรเดียวให้ความน่าจะเป็นที่ตัวแปรสุ่ม ตัวเดียว จะมีค่าต่างๆ กัน ในขณะที่การแจกแจงแบบหลายตัวแปร ( การแจกแจงความน่าจะเป็นร่วม ) ให้ความน่าจะเป็นที่เวกเตอร์สุ่มซึ่งเป็นชุดของตัวแปรสุ่มสองตัวขึ้นไป จะมีค่าต่างๆ กัน การแจกแจงความน่าจะเป็นแบบตัวแปรเดียวที่สำคัญและพบได้บ่อย ได้แก่ การแจกแจง ทวินาม การแจกแจงไฮเปอร์จีโอเมตริกและการแจกแจงปกติการแจกแจงปกติแบบหลายตัวแปรเป็นการแจกแจงแบบหลายตัวแปรที่พบได้บ่อยเช่นกัน

การแจกจ่ายพิเศษ

การอนุมานทางสถิติ

การอนุมานทางสถิติเป็นกระบวนการสรุปผลจากข้อมูลที่อยู่ภายใต้ความผันแปรแบบสุ่ม เช่น ข้อผิดพลาดในการสังเกตหรือความผันแปรของการสุ่มตัวอย่าง[ 8 ]ข้อกำหนดเบื้องต้นของระบบขั้นตอนดังกล่าวสำหรับการอนุมานและการเหนี่ยวนำคือ ระบบควรสร้างคำตอบที่สมเหตุสมผลเมื่อนำไปใช้กับสถานการณ์ที่กำหนดไว้อย่างชัดเจน และควรมีความเป็นทั่วไปเพียงพอที่จะนำไปใช้ได้ในสถานการณ์ที่หลากหลาย สถิติเชิงอนุมานใช้เพื่อทดสอบสมมติฐานและทำการประมาณค่าโดยใช้ข้อมูลตัวอย่าง ในขณะที่สถิติเชิงพรรณนาอธิบายตัวอย่าง สถิติเชิงอนุมานจะอนุมานการคาดการณ์เกี่ยวกับประชากรขนาดใหญ่ที่ตัวอย่างเป็นตัวแทน

ผลลัพธ์ของการอนุมานทางสถิติอาจเป็นคำตอบของคำถามที่ว่า "ควรทำอะไรต่อไป?" ซึ่งอาจเป็นการตัดสินใจเกี่ยวกับการทำการทดลองหรือสำรวจเพิ่มเติม หรือเกี่ยวกับการสรุปผลก่อนที่จะนำนโยบายขององค์กรหรือรัฐบาลไปใช้ โดยส่วนใหญ่แล้ว การอนุมานทางสถิติจะสร้างข้อเสนอเกี่ยวกับประชากร โดยใช้ข้อมูลที่ได้จากประชากรที่สนใจผ่านวิธีการสุ่มตัวอย่างแบบต่างๆ โดยทั่วไปแล้ว ข้อมูลเกี่ยวกับกระบวนการสุ่มจะได้รับจากพฤติกรรมที่สังเกตได้ในช่วงเวลาจำกัด เมื่อมีพารามิเตอร์หรือสมมติฐานที่ต้องการอนุมาน การอนุมานทางสถิติมักใช้:

  • แบบจำลองทางสถิติของกระบวนการสุ่มที่คาดว่าจะสร้างข้อมูล ซึ่งทราบได้ว่ามีการใช้การสุ่มแล้ว และ
  • ผลลัพธ์เฉพาะอย่างหนึ่งของกระบวนการสุ่ม กล่าวคือ ชุดข้อมูล

การถดถอย

ในทางสถิติการวิเคราะห์การถดถอยเป็นกระบวนการทางสถิติสำหรับการประมาณความสัมพันธ์ระหว่างตัวแปรต่างๆ ประกอบด้วยวิธีการมากมายสำหรับการสร้างแบบจำลองและการวิเคราะห์ตัวแปรหลายตัว โดยเน้นที่ความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ หนึ่งตัวหรือมากกว่านั้น โดยเฉพาะอย่างยิ่ง การวิเคราะห์การถดถอยช่วยให้เข้าใจว่าค่าเฉลี่ยของตัวแปรตาม (หรือ 'ตัวแปรเกณฑ์') เปลี่ยนแปลงอย่างไรเมื่อตัวแปรอิสระตัวใดตัวหนึ่งเปลี่ยนแปลงไป ในขณะที่ตัวแปรอิสระอื่นๆ คงที่ โดยทั่วไป การวิเคราะห์การถดถอยจะประมาณค่าความคาดหวังแบบมีเงื่อนไขของตัวแปรตามเมื่อกำหนดตัวแปรอิสระ – นั่นคือค่าเฉลี่ยของตัวแปรตามเมื่อตัวแปรอิสระคงที่ ในบางกรณี การวิเคราะห์การถดถอยอาจเน้นที่ควอนไทล์หรือพารามิเตอร์ตำแหน่ง อื่นๆ ของการแจกแจงแบบมีเงื่อนไขของตัวแปรตามเมื่อกำหนดตัวแปรอิสระ ในทุกกรณี เป้าหมายของการประมาณค่าคือฟังก์ชันของตัวแปรอิสระที่เรียกว่าฟังก์ชันการถดถอยในการวิเคราะห์การถดถอย การระบุลักษณะการเปลี่ยนแปลงของตัวแปรตามรอบๆ ฟังก์ชันการถดถอย ซึ่งสามารถอธิบายได้ด้วยการกระจายความน่าจะเป็น ก็เป็นสิ่งที่น่าสนใจเช่น กัน

มีการพัฒนาเทคนิคมากมายสำหรับการวิเคราะห์การถดถอย วิธีที่คุ้นเคย เช่นการถดถอยเชิงเส้น เป็นแบบพาราเมตริกกล่าวคือ ฟังก์ชันการถดถอยถูกกำหนดในรูปของ พารามิเตอร์ที่ไม่ทราบค่าจำนวนจำกัดซึ่งประมาณค่าได้จากข้อมูล (เช่น การใช้ วิธีการ กำลังสองน้อยที่สุดแบบธรรมดา ) การถดถอยแบบไม่พาราเมตริกหมายถึงเทคนิคที่อนุญาตให้ฟังก์ชันการถดถอยอยู่ในชุดของฟังก์ชัน ที่กำหนด ซึ่งอาจมีมิติอนันต์ได้

สถิติแบบไม่ใช้พารามิเตอร์

สถิติแบบไม่ใช้พารามิเตอร์คือค่าที่คำนวณจากข้อมูลในลักษณะที่ไม่ขึ้นอยู่กับตระกูลการแจกแจงความน่าจะเป็นแบบมีพารามิเตอร์ซึ่งรวมถึงทั้ง สถิติ เชิงพรรณนาและเชิงอนุมานพารามิเตอร์ทั่วไปคือค่าคาดหวัง ความแปรปรวน เป็นต้น แตกต่างจากสถิติแบบใช้พารามิเตอร์สถิติแบบไม่ใช้พารามิเตอร์ไม่ได้ตั้งสมมติฐานเกี่ยวกับการแจกแจงความน่าจะเป็นของตัวแปรที่กำลังประเมิน[ 9 ]

วิธีการทางสถิติแบบไม่ใช้พารามิเตอร์ถูกนำมาใช้กันอย่างแพร่หลายในการศึกษาประชากรที่มีลำดับ (เช่น บทวิจารณ์ภาพยนตร์ที่ได้รับหนึ่งถึงสี่ดาว) การใช้วิธีการทางสถิติแบบไม่ใช้พารามิเตอร์อาจมีความจำเป็นเมื่อข้อมูลมีลำดับแต่ไม่มีการตีความเชิงตัวเลขที่ชัดเจน เช่น เมื่อประเมินความชอบในแง่ของระดับการวัดวิธีการทางสถิติแบบไม่ใช้พารามิเตอร์จะให้ผลลัพธ์เป็นข้อมูลเชิงลำดับ

เนื่องจากวิธีการแบบไม่ใช้พารามิเตอร์ตั้งสมมติฐานน้อยกว่า จึงมีขอบเขตการใช้งานที่กว้างกว่าวิธีการแบบใช้พารามิเตอร์ โดยเฉพาะอย่างยิ่ง สามารถนำไปใช้ในสถานการณ์ที่ทราบข้อมูลเกี่ยวกับแอปพลิเคชันนั้นๆ น้อย นอกจากนี้ เนื่องจากอาศัยสมมติฐานน้อยกว่า วิธีการแบบไม่ใช้พารามิเตอร์จึงมีความแข็งแกร่งกว่า

ข้อเสียประการหนึ่งของวิธีการที่ไม่ใช้พารามิเตอร์คือ เนื่องจากวิธีการเหล่านี้ไม่ได้อาศัยสมมติฐาน จึงโดยทั่วไปแล้วจะมีประสิทธิภาพ น้อย กว่าวิธีการที่ใช้พารามิเตอร์[ 10 ] การทดสอบที่ไม่ใช้พารามิเตอร์ที่มีกำลังต่ำเป็นปัญหา เนื่องจากโดยทั่วไปแล้ววิธีการเหล่านี้มักใช้ในกรณีที่ตัวอย่างมีขนาดตัวอย่างน้อย[ 10 ] วิธีการที่ใช้พารามิเตอร์หลายวิธีได้รับการพิสูจน์แล้วว่าเป็นวิธีการทดสอบที่มีประสิทธิภาพมากที่สุด โดยใช้วิธีการต่างๆ เช่นทฤษฎีบทเนย์แมน-เพียร์สันและการทดสอบอัตราส่วนความน่าจะเป็น

อีกหนึ่งเหตุผลที่สนับสนุนการใช้วิธีการทางสถิติแบบไม่พาราเมตริกคือความเรียบง่าย ในบางกรณี แม้ว่าการใช้วิธีการทางสถิติแบบพาราเมตริกจะเหมาะสม แต่อาจใช้วิธีที่ไม่พาราเมตริกได้ง่ายกว่า ด้วยความเรียบง่ายและความแข็งแกร่งที่มากกว่า ทำให้ผู้เชี่ยวชาญด้านสถิติบางคนมองว่าวิธีการที่ไม่พาราเมตริกมีโอกาสน้อยกว่าที่จะนำไปใช้ผิดวิธีหรือเกิดความเข้าใจผิด

สถิติ คณิตศาสตร์ และสถิติเชิงคณิตศาสตร์

สถิติเชิงคณิตศาสตร์เป็นสาขาย่อยที่สำคัญของวิชาสถิตินักทฤษฎีสถิติศึกษาและปรับปรุงกระบวนการทางสถิติด้วยคณิตศาสตร์ และงานวิจัยทางสถิติมักก่อให้เกิดคำถามทางคณิตศาสตร์

นักคณิตศาสตร์และนักสถิติ เช่นเกาส์ลาปลาซ และซี.เอส. เพียร์ซใช้ทฤษฎีการตัดสินใจร่วมกับการแจกแจงความน่าจะเป็นและฟังก์ชันการสูญเสีย (หรือฟังก์ชันอรรถประโยชน์ ) แนวทางการอนุมานทางสถิติเชิงทฤษฎีการตัดสินใจได้รับการฟื้นฟูโดยอับราฮัม วอลด์และผู้สืบทอดของเขา[ 11 ] [ 12 ] [ 13 ] [ 14 ] [ 15 ] [ 16 ] [ 17 ]และมีการใช้การคำนวณทางวิทยาศาสตร์การวิเคราะห์และการเพิ่มประสิทธิภาพ อย่างกว้างขวาง สำหรับการออกแบบการทดลองนักสถิติใช้พีชคณิตและ คณิตศาสตร์ เชิงการจัดเรียงแต่ในขณะที่การปฏิบัติทางสถิติมักอาศัยความน่าจะเป็นและทฤษฎีการตัดสินใจ การประยุกต์ใช้ก็อาจเป็นที่ถกเถียงกันได้[ 5 ]

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Borovkov, AA (1999). สถิติทางคณิตศาสตร์ . สำนักพิมพ์ CRC. ISBN 90-5699-018-7
  • ห้องปฏิบัติการเสมือนจริงด้านความน่าจะเป็นและสถิติ (มหาวิทยาลัยอลาบามา-ฮันต์สวิลล์)
  • StatiBotระบบผู้เชี่ยวชาญออนไลน์แบบโต้ตอบเกี่ยวกับการทดสอบทางสถิติ
  • เรย์, มาโนฮาร์; ชาร์มา, ฮาร์ สวารุป (1966) สถิติทางคณิตศาสตร์ . รามปราสาดและบุตรISBN 978-9383385188
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Mathematical_statistics&oldid=1360283754 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สถิติทางคณิตศาสตร์

สถิติทางคณิตศาสตร์คือการประยุกต์ใช้ทฤษฎีความน่าจะเป็นและแนวคิดทางคณิตศาสตร์อื่นๆ กับสถิติซึ่งแตกต่างจากเทคนิคในการรวบรวมข้อมูลทางสถิติเทคนิคทางคณิตศาสตร์เฉพาะที่ใช้กันทั่วไปในสถิติ

การแนะนำ

การเก็บรวบรวมข้อมูลทางสถิติเกี่ยวข้องกับการวางแผนการศึกษา โดยเฉพาะอย่างยิ่งการ ออกแบบการทดลองแบบสุ่ม และการวางแผน การสำรวจ โดยใช้ การสุ่มตัวอย่าง การวิเคราะห์ข้อมูลเบื้องต้นมักเป็นไปตามระเบียบวิธีการศึกษาที่ระบุไว้ก่อนดำเนินการศึกษา...

หัวข้อ

ต่อไปนี้เป็นหัวข้อสำคัญบางส่วนในสถิติทางคณิตศาสตร์: [ 6 ] [ 7 ]

การแจกแจงความน่าจะเป็น

การ แจกแจงความน่าจะเป็น คือ ฟังก์ชัน ที่กำหนด ความน่าจะเป็นให้ กับแต่ละ เซตย่อยที่วัดได้ ของผลลัพธ์ที่เป็นไปได้ของ การทดลอง แบบ สุ่ม การสำรวจ หรือกระบวนการ อนุมานทางสถิติ ตัวอย่างพบได้ในการทดลองที่ มี ปริภูมิของตัวอย่าง ที่ไม่ใช่ตัวเลข ซึ่งการแจกแจงจะเป็นการ...