อ่าน 17 นาที
การวิเคราะห์ความแปรปรวน
การวิเคราะห์ความแปรปรวน ( ANOVA ) เป็นกลุ่มของ วิธีการทางสถิติ ที่ใช้ในการเปรียบเทียบค่า เฉลี่ย ของกลุ่มสองกลุ่มขึ้นไปโดยการวิเคราะห์ความแปรปรวน โดยเฉพาะอย่างยิ่ง ANOVA...
การวิเคราะห์ความแปรปรวน
การวิเคราะห์ความแปรปรวน ( ANOVA ) เป็นกลุ่มของวิธีการทางสถิติที่ใช้ในการเปรียบเทียบค่าเฉลี่ยของกลุ่มสองกลุ่มขึ้นไปโดยการวิเคราะห์ความแปรปรวน โดยเฉพาะอย่างยิ่ง ANOVA จะเปรียบเทียบปริมาณความแปรปรวนระหว่างค่าเฉลี่ยของกลุ่มกับปริมาณความแปรปรวนภายในแต่ละกลุ่ม หากความแปรปรวนระหว่างกลุ่มมีขนาดใหญ่กว่าความแปรปรวนภายในกลุ่มอย่างมีนัยสำคัญ แสดงว่าค่าเฉลี่ยของกลุ่มเหล่านั้นน่าจะแตกต่างกัน การเปรียบเทียบนี้ทำโดยใช้การทดสอบ Fหลักการพื้นฐานของ ANOVA มาจากกฎของความแปรปรวนรวมซึ่งระบุว่าความแปรปรวนทั้งหมดในชุดข้อมูลสามารถแบ่งออกเป็นส่วนประกอบที่มาจากแหล่งที่มาต่างๆ ในกรณีของ ANOVA แหล่งที่มาเหล่านี้คือความแปรปรวนระหว่างกลุ่มและความแปรปรวนภายในกลุ่ม
ANOVA ถูกพัฒนาโดยนักสถิติโรนัลด์ ฟิชเชอร์ในรูปแบบที่ง่ายที่สุด ANOVA เป็นการทดสอบทางสถิติ ว่า ค่าเฉลี่ยของประชากรสองกลุ่มขึ้นไปเท่ากันหรือไม่ และด้วยเหตุนี้จึงเป็นการขยายผลของการทดสอบt ไปสู่การวิเคราะห์ค่าเฉลี่ย มากกว่าสองค่า
ประวัติศาสตร์
แม้ว่าการวิเคราะห์ความแปรปรวนจะประสบความสำเร็จในศตวรรษที่ 20 แต่ต้นกำเนิดนั้นย้อนกลับไปหลายศตวรรษตามที่Stiglerกล่าว ไว้ [ 1 ]ซึ่งรวมถึงการทดสอบสมมติฐาน การแบ่งผลรวมกำลังสอง เทคนิคการทดลอง และแบบจำลองแบบบวกLaplaceได้ทำการทดสอบสมมติฐานในช่วงทศวรรษที่ 1770 [ 2 ]ประมาณปี 1800 Laplace และGaussได้พัฒนาวิธีการกำลังสองน้อยที่สุดสำหรับการรวมการสังเกต ซึ่งปรับปรุงวิธีการที่ใช้ในดาราศาสตร์และธรณีวิทยา ในขณะนั้น นอกจากนี้ยังเริ่มต้นการศึกษามากมายเกี่ยวกับการมีส่วนร่วมในผลรวมกำลังสอง Laplace รู้จักวิธีประมาณความแปรปรวนจากผลรวมกำลังสองที่เหลือ (แทนที่จะเป็นผลรวมทั้งหมด) [ 3 ]ในปี 1827 Laplace ได้ใช้ วิธีการ กำลังสองน้อยที่สุดเพื่อแก้ไขปัญหา ANOVA เกี่ยวกับการวัดกระแสน้ำในบรรยากาศ[ 4 ]ก่อนปี 1800 นักดาราศาสตร์ได้แยกข้อผิดพลาดในการสังเกตที่เกิดจากเวลาตอบสนอง (" สมการส่วนบุคคล ") และได้พัฒนาวิธีการลดข้อผิดพลาด[ 5 ]วิธีการทดลองที่ใช้ในการศึกษาสมการส่วนบุคคลได้รับการยอมรับในภายหลังโดยสาขาจิตวิทยาที่กำลังเกิดขึ้นใหม่[ 6 ]ซึ่งได้พัฒนาวิธีการทดลองที่แข็งแกร่ง (แฟกทอเรียลเต็มรูปแบบ) ซึ่งในไม่ช้าก็ได้เพิ่มการสุ่มและการปิดบังข้อมูลเข้าไป[ 7 ]คำอธิบายที่ไม่ใช้คณิตศาสตร์ที่ชัดเจนของแบบจำลองผลกระทบแบบบวกมีให้ในปี พ.ศ. 2428 [ 8 ]
โรนัลด์ ฟิชเชอร์ได้แนะนำคำว่าความแปรปรวนและเสนอการวิเคราะห์อย่างเป็นทางการในบทความปี 1918 เกี่ยวกับพันธุศาสตร์ประชากรเชิงทฤษฎี เรื่อง " ความสัมพันธ์ระหว่างญาติโดยอาศัยสมมติฐานการถ่ายทอดทางพันธุกรรมแบบเมนเดล" [ 9 ] การประยุกต์ใช้การวิเคราะห์ความแปรปรวนกับการวิเคราะห์ข้อมูลครั้งแรกของเขาได้รับการตีพิมพ์ในปี 1921 ในหนังสือ Studies in Crop Variation I [ 10 ] ซึ่งแบ่งความแปรปรวนของอนุกรมเวลาออกเป็นส่วนประกอบที่แสดงถึงสาเหตุรายปีและการเสื่อมสภาพอย่างช้าๆ ผลงานชิ้นต่อไปของฟิชเชอร์ เรื่องStudies in Crop Variation IIซึ่งเขียนร่วมกับวินิเฟรด แมคเคนซีและตีพิมพ์ในปี 1923 ได้ศึกษาความแปรปรวนของผลผลิตในแปลงที่ปลูกด้วยพันธุ์พืชที่แตกต่างกันและได้รับการบำบัดด้วยปุ๋ยที่แตกต่างกัน[ 11 ] การวิเคราะห์ความแปรปรวนเป็นที่รู้จักกันอย่างแพร่หลายหลังจากที่ถูกรวมอยู่ในหนังสือ Statistical Methods for Research Workers ของฟิชเชอร์ ใน ปี 1925
นักวิจัยหลายคนได้พัฒนารูปแบบการสุ่มขึ้นมา โดยรูปแบบแรกได้รับการตีพิมพ์เป็นภาษาโปแลนด์โดยJerzy Neymanในปี พ.ศ. 2466 [ 12 ]
ตัวอย่าง



การวิเคราะห์ความแปรปรวนสามารถใช้เพื่ออธิบายความสัมพันธ์ที่ซับซ้อนระหว่างตัวแปรต่างๆ ได้ การประกวดสุนัขเป็นตัวอย่างหนึ่ง การประกวดสุนัขไม่ใช่การสุ่มตัวอย่างของสายพันธุ์ แต่โดยทั่วไปแล้วจะจำกัดเฉพาะสุนัขที่โตเต็มวัย พันธุ์แท้ และมีลักษณะดีเยี่ยม ฮิสโตแกรมของน้ำหนักสุนัขจากการประกวดจึงมักจะค่อนข้างซับซ้อน เช่น การกระจายสีเหลือง-ส้มที่แสดงในภาพประกอบ สมมติว่าเราต้องการทำนายน้ำหนักของสุนัขโดยพิจารณาจากลักษณะเฉพาะบางอย่างของสุนัขแต่ละตัว วิธีหนึ่งที่จะทำได้คือการอธิบายการกระจายของน้ำหนักโดยการแบ่งประชากรสุนัขออกเป็นกลุ่มตามลักษณะเหล่านั้น การจัดกลุ่มที่ประสบความสำเร็จจะแบ่งสุนัขออกเป็นสองกลุ่มโดย (ก) แต่ละกลุ่มมีความแปรปรวนของน้ำหนักสุนัขต่ำ (หมายความว่ากลุ่มนั้นค่อนข้างเป็นเนื้อเดียวกัน) และ (ข) ค่าเฉลี่ยของแต่ละกลุ่มแตกต่างกัน (หากสองกลุ่มมีค่าเฉลี่ยเท่ากัน ก็ไม่สมเหตุสมผลที่จะสรุปว่ากลุ่มเหล่านั้นแยกออกจากกันอย่างแท้จริง)
ในภาพประกอบด้านขวา กลุ่มต่างๆ ถูกระบุเป็นX 1 , X 2เป็นต้น ในภาพประกอบแรก สุนัขถูกแบ่งตามผลคูณ (ปฏิสัมพันธ์) ของกลุ่มไบนารีสองกลุ่ม ได้แก่ อายุน้อยกับอายุมาก และขนสั้นกับขนยาว (เช่น กลุ่ม 1 คือสุนัขอายุน้อยขนสั้น กลุ่ม 2 คือสุนัขอายุน้อยขนยาว เป็นต้น) เนื่องจากค่าความแปรปรวนของน้ำหนักสุนัขภายในแต่ละกลุ่ม (แสดงด้วยสีน้ำเงิน) ค่อนข้างสูง และเนื่องจากค่าเฉลี่ยใกล้เคียงกันมากในแต่ละกลุ่ม การจัดกลุ่มสุนัขตามลักษณะเหล่านี้จึงไม่ได้ให้ผลลัพธ์ที่มีประสิทธิภาพในการอธิบายความแปรปรวนของน้ำหนักสุนัข กล่าวคือ การรู้ว่าสุนัขอยู่ในกลุ่มใดไม่ได้ช่วยให้เราคาดการณ์น้ำหนักของมันได้ดีไปกว่าการรู้ว่าสุนัขตัวนั้นเข้าร่วมการประกวดสุนัข ดังนั้น การจัดกลุ่มนี้จึงไม่สามารถอธิบายความแปรปรวนในภาพรวม (สีเหลือง-ส้ม) ได้
การพยายามอธิบายการกระจายน้ำหนักโดยการจัดกลุ่มสุนัขเป็นสุนัขเลี้ยงกับสุนัขใช้งานและสุนัขที่มีสมรรถภาพทางกายต่ำกับสุนัขที่มีสมรรถภาพทางกายสูงน่าจะประสบความสำเร็จมากกว่า (เหมาะสมพอสมควร) สุนัขประกวดที่มีน้ำหนักมากที่สุดมักจะเป็นสุนัขพันธุ์ใหญ่ แข็งแรง และใช้งาน ในขณะที่สุนัขที่เลี้ยงไว้เป็นสัตว์เลี้ยงมักจะมีขนาดเล็กกว่าและน้ำหนักเบากว่า ดังที่แสดงในภาพประกอบที่สอง การกระจายตัวมีค่าความแปรปรวนที่น้อยกว่าในกรณีแรกอย่างมาก และค่าเฉลี่ยก็แยกแยะได้ง่ายกว่า อย่างไรก็ตาม การทับซ้อนกันอย่างมีนัยสำคัญของการกระจายตัว เช่น หมายความว่าเราไม่สามารถแยกแยะX 1และX 2ได้อย่างน่าเชื่อถือ การจัดกลุ่มสุนัขตามการโยนเหรียญอาจทำให้ได้การกระจายตัวที่ดูคล้ายกัน
การพยายามอธิบายน้ำหนักตามสายพันธุ์มักจะได้ผลลัพธ์ที่สอดคล้องกันเป็นอย่างดี สุนัขพันธุ์ชิวาวาทุกตัวมีน้ำหนักเบา และสุนัขพันธุ์เซนต์เบอร์นาร์ดทุกตัวมีน้ำหนักมาก ความแตกต่างของน้ำหนักระหว่างสุนัขพันธุ์เซ็ตเตอร์และพอยน์เตอร์ไม่ได้บ่งชี้ถึงการแยกสายพันธุ์ การวิเคราะห์ความแปรปรวนเป็นเครื่องมือที่เป็นทางการที่ช่วยยืนยันการตัดสินใจโดยสัญชาตญาณเหล่านี้ การใช้งานทั่วไปของวิธีนี้คือการวิเคราะห์ข้อมูลจากการทดลองหรือการพัฒนาแบบจำลอง วิธีนี้มีข้อดีบางประการเหนือกว่าการหาความสัมพันธ์ คือ ข้อมูลไม่จำเป็นต้องเป็นตัวเลขทั้งหมด และผลลัพธ์อย่างหนึ่งของวิธีนี้คือการตัดสินใจเกี่ยวกับความเชื่อมั่นในความสัมพันธ์เชิงอธิบาย
คลาสของโมเดล
ในการวิเคราะห์ความแปรปรวนมีแบบจำลองอยู่ 3 ประเภท ซึ่งจะอธิบายไว้ในที่นี้
แบบจำลองผลกระทบคงที่
แบบจำลองผลกระทบคงที่ (ประเภทที่ 1) ของการวิเคราะห์ความแปรปรวนใช้ได้กับสถานการณ์ที่ผู้ทำการทดลองใช้การรักษาอย่างน้อยหนึ่งอย่างกับกลุ่มตัวอย่างเพื่อดูว่า ค่า ตัวแปรตอบสนองเปลี่ยนแปลงไปหรือไม่ วิธีนี้ช่วยให้ผู้ทำการทดลองสามารถประมาณช่วงของค่าตัวแปรตอบสนองที่การรักษาจะสร้างขึ้นในประชากรโดยรวมได้

แบบจำลองผลกระทบแบบสุ่ม
แบบจำลองผลกระทบแบบสุ่ม (คลาส II) ใช้เมื่อการรักษาไม่คงที่ ซึ่งเกิดขึ้นเมื่อระดับปัจจัยต่างๆ ถูกสุ่มตัวอย่างจากประชากรขนาดใหญ่ เนื่องจากระดับเหล่านั้นเป็นตัวแปรสุ่มเองสมมติฐานบางประการและวิธีการเปรียบเทียบการรักษา (การขยายผลต่างแบบง่ายหลายตัวแปร) จึงแตกต่างจากแบบจำลองผลกระทบแบบคงที่[ 13 ]
แบบจำลองผลกระทบแบบผสม
แบบจำลองผลกระทบแบบผสม (ประเภทที่ 3) ประกอบด้วยปัจจัยทดลองทั้งแบบผลกระทบคงที่และแบบสุ่ม โดยมีการตีความและการวิเคราะห์ที่แตกต่างกันอย่างเหมาะสมสำหรับทั้งสองประเภท
ตัวอย่าง
การทดลองทางการสอนสามารถดำเนินการโดยภาควิชาในวิทยาลัยหรือมหาวิทยาลัยเพื่อค้นหาตำราเรียนเบื้องต้นที่ดี โดยแต่ละตำราถือเป็นการทดลอง แบบจำลองผลกระทบคงที่ (fixed-effects model) จะเปรียบเทียบรายชื่อตำราที่เสนอ แบบจำลองผลกระทบสุ่ม (random-effects model) จะพิจารณาว่ามีความแตกต่างที่สำคัญหรือไม่ในรายชื่อตำราที่เลือกแบบสุ่ม แบบจำลองผลกระทบผสม (mixed-effects model) จะเปรียบเทียบตำราที่มีอยู่ (คงที่) กับทางเลือกอื่นที่เลือกแบบสุ่ม
การกำหนดผลกระทบแบบคงที่และแบบสุ่มพิสูจน์แล้วว่าทำได้ยาก โดยมีคำจำกัดความที่แข่งขันกันหลายประการ[ 14 ]
ข้อสมมติฐาน
การวิเคราะห์ความแปรปรวนได้รับการศึกษาจากหลายแนวทาง โดยแนวทางที่พบมากที่สุดคือการใช้แบบจำลองเชิงเส้นที่เชื่อมโยงการตอบสนองกับการทดลองและกลุ่มทดลอง โปรดทราบว่าแบบจำลองนี้เป็นเชิงเส้นในแง่ของพารามิเตอร์ แต่อาจไม่เป็นเชิงเส้นในระดับปัจจัย การตีความทำได้ง่ายเมื่อข้อมูลมีความสมดุลในทุกปัจจัย แต่จำเป็นต้องมีความเข้าใจที่ลึกซึ้งยิ่งขึ้นสำหรับข้อมูลที่ไม่สมดุล
การวิเคราะห์ตำราเรียนโดยใช้การแจกแจงแบบปกติ
การวิเคราะห์ความแปรปรวนสามารถนำเสนอได้ในรูปของแบบจำลองเชิงเส้นซึ่งตั้งสมมติฐานเกี่ยวกับการกระจายความน่าจะเป็นของการตอบสนองดังต่อไปนี้: [ 15 ] [ 16 ] [ 17 ] [ 18 ]
- ความเป็นอิสระของการสังเกต – นี่คือข้อสมมติฐานของแบบจำลองที่ช่วยให้การวิเคราะห์ทางสถิติทำได้ง่ายขึ้น
- ความปกติ – การกระจายตัวของค่าความคลาดเคลื่อน เป็น ไปตาม การกระจาย แบบปกติ
- ความเท่าเทียมกัน (หรือ "ความเป็นเนื้อเดียวกัน") ของความแปรปรวน เรียกว่าโฮโมสเคดาสติกลิตี้ — ความแปรปรวนของข้อมูลในแต่ละกลุ่มควรเท่ากัน
ข้อสมมติฐานที่แยกจากกันของแบบจำลองในตำราเรียนบ่งชี้ว่าข้อผิดพลาดเป็นอิสระ เหมือนกัน และมีการกระจายแบบปกติสำหรับแบบจำลองผลกระทบคงที่ นั่นคือ ข้อผิดพลาด ( ) เป็นอิสระและ
การวิเคราะห์แบบสุ่ม
ในการทดลองแบบสุ่มควบคุมการทดลองจะถูกกำหนดให้กับหน่วยทดลองแบบสุ่ม โดยปฏิบัติตามระเบียบวิธีการทดลอง การสุ่มนี้เป็นไปอย่างเป็นกลางและประกาศไว้ก่อนที่จะทำการทดลอง การกำหนดแบบสุ่มอย่างเป็นกลางนี้ใช้เพื่อทดสอบความสำคัญของสมมติฐานว่างตามแนวคิดของCS PeirceและRonald Fisherการวิเคราะห์ตามการออกแบบนี้ได้รับการอภิปรายและพัฒนาโดยFrancis J. Anscombeที่สถานีทดลอง RothamstedและโดยOscar Kempthorneที่มหาวิทยาลัยรัฐไอโอวา [ 19 ] Kempthorneและนักศึกษาของเขาตั้งสมมติฐานเกี่ยวกับการเพิ่มผลของการทดลองแต่ละหน่วยซึ่งมีการกล่าวถึงในหนังสือของ Kempthorne และDavid R. Cox [ 20 ] [ 21 ]
ความสามารถในการรวมการบำบัดหน่วย
ในรูปแบบที่ง่ายที่สุด สมมติฐานเรื่องการเพิ่มผลของการรักษาต่อหน่วย[ nb 1 ]ระบุว่าการตอบสนองที่สังเกตได้จากหน่วยทดลองเมื่อได้รับการรักษาสามารถเขียนได้เป็นผลรวมของการตอบสนองของหน่วยและผลของการรักษานั่นคือ[ 22 ] [ 23 ] [ 24 ] สมมติฐานเรื่องการเพิ่มผลของการรักษาต่อหน่วยหมายความว่า สำหรับการรักษาทุกแบบ การรักษา ที่th มีผลเหมือนกัน ทุกประการ กับทุกหน่วยทดลอง
ตามที่ Cox และ Kempthorne กล่าวไว้สมมติฐานเรื่องการบวกกันของผลการรักษาแต่ละหน่วยนั้นโดยทั่วไปแล้วไม่สามารถพิสูจน์ได้ โดยตรงว่าเป็นเท็จ อย่างไรก็ตาม ผลที่ตามมา หลายอย่าง ของสมมติฐานนี้สามารถพิสูจน์ได้ว่าเป็นเท็จ สำหรับการทดลองแบบสุ่ม สมมติฐานเรื่องการบวกกันของผลการรักษาแต่ละหน่วยหมายความว่าความแปรปรวนมีค่าคงที่สำหรับทุกการรักษา ดังนั้น โดยหลักการผกผันเงื่อนไขที่จำเป็นสำหรับการบวกกันของผลการรักษาแต่ละหน่วยก็คือ ความแปรปรวนมีค่าคงที่
การใช้คุณสมบัติการบวกของการรักษาแต่ละหน่วยและการสุ่มนั้นคล้ายคลึงกับการอนุมานตามการออกแบบซึ่งเป็นมาตรฐานในการสุ่มตัวอย่างสำรวจ ประชากร จำกัด
แบบจำลองเชิงเส้นที่ได้มา
Kempthorne ใช้การแจกแจงแบบสุ่มและสมมติฐานของการเพิ่มการรักษาแบบหน่วยเพื่อสร้างแบบจำลองเชิงเส้นที่ได้มาซึ่งคล้ายกับแบบจำลองในตำราที่กล่าวถึงก่อนหน้านี้มาก[ 25 ]สถิติการทดสอบของแบบจำลองเชิงเส้นที่ได้มานี้ใกล้เคียงกับสถิติการทดสอบของแบบจำลองเชิงเส้นปกติที่เหมาะสม ตามทฤษฎีบทการประมาณและการศึกษาการจำลอง[ 26 ]อย่างไรก็ตาม มีความแตกต่างอยู่บ้าง ตัวอย่างเช่น การวิเคราะห์แบบสุ่มส่งผลให้เกิดความสัมพันธ์เชิงลบเล็กน้อยแต่ (อย่างเคร่งครัด) ระหว่างการสังเกต[ 27 ] [ 28 ]ในการวิเคราะห์แบบสุ่ม ไม่มีการสมมติการ แจกแจง แบบปกติและแน่นอนว่าไม่มีการสมมติความเป็นอิสระในทางตรงกันข้ามการสังเกตมีความสัมพันธ์กัน !
การวิเคราะห์โดยใช้การสุ่มมีข้อเสียคือ การอธิบายนั้นต้องใช้พีชคณิตที่ยุ่งยากและใช้เวลานาน เนื่องจากวิธีการวิเคราะห์โดยใช้การสุ่มนั้นซับซ้อนและใกล้เคียงกับวิธีการใช้แบบจำลองเชิงเส้นปกติ อาจารย์ส่วนใหญ่จึงเน้นวิธีการใช้แบบจำลองเชิงเส้นปกติมากกว่า นักสถิติส่วนน้อยเท่านั้นที่คัดค้านการวิเคราะห์แบบจำลองของการทดลองแบบสุ่มที่สมดุล
แบบจำลองทางสถิติสำหรับข้อมูลจากการสังเกต
อย่างไรก็ตาม เมื่อนำไปใช้กับข้อมูลจากการทดลองที่ไม่ใช่แบบสุ่มหรือการศึกษาเชิงสังเกตการวิเคราะห์ตามแบบจำลองจะขาดการรับรองจากการสุ่ม[ 29 ]สำหรับข้อมูลเชิงสังเกต การหาช่วงความเชื่อมั่นจะต้องใช้ แบบจำลอง เชิงอัตวิสัยดังที่โรนัลด์ ฟิชเชอร์และผู้ติดตามของเขาเน้นย้ำ ในทางปฏิบัติ การประมาณผลกระทบของการรักษาจากการศึกษาเชิงสังเกตมักจะไม่สอดคล้องกัน ในทางปฏิบัติ "แบบจำลองทางสถิติ" และข้อมูลเชิงสังเกตมีประโยชน์สำหรับการแนะนำสมมติฐานที่สาธารณชนควรพิจารณาอย่างระมัดระวัง[ 30 ]
สรุปข้อสมมติฐาน
การวิเคราะห์ ANOVA ตามแบบจำลองปกติจะถือว่าความแปรปรวนของค่าคลาดเคลื่อนเป็นอิสระ มีการกระจายแบบปกติ และเป็นเนื้อเดียวกัน ส่วนการวิเคราะห์แบบสุ่มจะถือว่าความแปรปรวนของค่าคลาดเคลื่อนเป็นเนื้อเดียวกันเท่านั้น (ซึ่งเป็นผลมาจากคุณสมบัติการบวกของการรักษาแบบหน่วย) และใช้กระบวนการสุ่มของการทดลอง การวิเคราะห์ทั้งสองแบบนี้จำเป็นต้องมีค่าความแปรปรวนคงที่ซึ่งเป็นข้อสมมติสำหรับการวิเคราะห์ตามแบบจำลองปกติ และเป็นผลมาจากการสุ่มและการบวกสำหรับการวิเคราะห์แบบสุ่ม
อย่างไรก็ตาม การศึกษาเกี่ยวกับกระบวนการที่เปลี่ยนแปลงความแปรปรวนมากกว่าค่าเฉลี่ย (เรียกว่าผลกระทบจากการกระจายตัว) ได้รับการดำเนินการสำเร็จโดยใช้ ANOVA [ 31 ]ไม่มี ข้อสมมติ ที่จำเป็นสำหรับ ANOVA ในรูปแบบทั่วไปทั้งหมด แต่การ ทดสอบ Fที่ใช้สำหรับการทดสอบสมมติฐาน ANOVA มีข้อสมมติและข้อจำกัดในทางปฏิบัติซึ่งยังคงเป็นที่น่าสนใจอย่างต่อเนื่อง
ปัญหาที่ไม่ตรงตามข้อสมมติของ ANOVA มักจะสามารถแปลงให้ตรงตามข้อสมมติได้ คุณสมบัติของการบวกแบบหน่วยการรักษาไม่คงที่ภายใต้ "การเปลี่ยนขนาด" ดังนั้นนักสถิติมักใช้การแปลงเพื่อให้ได้คุณสมบัติการบวกแบบหน่วยการรักษา หากคาดว่าตัวแปรตอบสนองจะเป็นไปตามตระกูลการแจกแจงความน่าจะเป็นแบบพาราเมตริก นักสถิติอาจระบุ (ในโปรโตคอลสำหรับการทดลองหรือการศึกษาเชิงสังเกต) ว่าการตอบสนองจะต้องถูกแปลงเพื่อทำให้ความแปรปรวนคงที่[ 32 ]นอกจากนี้ นักสถิติอาจระบุว่าควรใช้การแปลงลอการิทึมกับการตอบสนองที่เชื่อว่าเป็นไปตามแบบจำลองการคูณ[ 23 ] [ 33 ] ตามทฤษฎีบทสมการเชิงฟังก์ชันของ Cauchy ลอการิทึมเป็นการแปลงต่อเนื่องเพียงอย่างเดียวที่เชื่อมโยงการดำเนินการคูณกับการดำเนินการบวกเหนือจำนวนจริง[ 34 ] [ 35 ] [ 36 ]
ลักษณะเฉพาะ
ANOVA ใช้ในการวิเคราะห์การทดลองเปรียบเทียบ ซึ่งสนใจเฉพาะความแตกต่างของผลลัพธ์เท่านั้น ความสำคัญทางสถิติของการทดลองถูกกำหนดโดยอัตราส่วนของความแปรปรวนสองค่า อัตราส่วนนี้เป็นอิสระจากการเปลี่ยนแปลงที่เป็นไปได้หลายประการในการสังเกตการทดลอง: การเพิ่มค่าคงที่ให้กับการสังเกตทั้งหมดไม่ได้เปลี่ยนแปลงความสำคัญ การคูณการสังเกตทั้งหมดด้วยค่าคงที่ไม่ได้เปลี่ยนแปลงความสำคัญ ดังนั้นผลลัพธ์ความสำคัญทางสถิติของ ANOVA จึงเป็นอิสระจากอคติคงที่และข้อผิดพลาดในการปรับขนาด รวมถึงหน่วยที่ใช้ในการแสดงการสังเกต ในยุคของการคำนวณเชิงกล เป็นเรื่องปกติที่จะลบค่าคงที่ออกจากการสังเกตทั้งหมด (เมื่อเทียบเท่ากับการตัดตัวเลขนำหน้า) เพื่อลดความซับซ้อนในการป้อนข้อมูล[ 37 ] [ 38 ]นี่เป็นตัวอย่างของการเข้ารหัสข้อมูล
อัลกอริทึม
การคำนวณ ANOVA สามารถอธิบายได้ว่าเป็นการคำนวณค่าเฉลี่ยและความแปรปรวนจำนวนหนึ่ง หารความแปรปรวนสองค่า และเปรียบเทียบอัตราส่วนกับค่าในคู่มือเพื่อกำหนดนัยสำคัญทางสถิติ การคำนวณผลของการรักษาจึงเป็นเรื่องง่าย: "ผลของการรักษาใดๆ จะถูกประมาณโดยการหาผลต่างระหว่างค่าเฉลี่ยของการสังเกตที่ได้รับการรักษาและค่าเฉลี่ยทั่วไป" [ 39 ]
การแบ่งส่วนผลรวมกำลังสอง

ANOVA ใช้ศัพท์มาตรฐานแบบดั้งเดิม สมการนิยามของความแปรปรวนของตัวอย่างคือโดยที่ตัวหารเรียกว่าระดับความเป็นอิสระ (DF) ผลรวมเรียกว่าผลรวมกำลังสอง (SS) ผลลัพธ์เรียกว่าค่าเฉลี่ยกำลังสอง (MS) และพจน์กำลังสองคือค่าเบี่ยงเบนจากค่าเฉลี่ยของตัวอย่าง ANOVA ประมาณค่าความแปรปรวนของตัวอย่าง 3 ค่า ได้แก่ ความแปรปรวนทั้งหมดซึ่งคำนวณจากค่าเบี่ยงเบนของการสังเกตทั้งหมดจากค่าเฉลี่ยรวม ความแปรปรวนของข้อผิดพลาดซึ่งคำนวณจากค่าเบี่ยงเบนของการสังเกตทั้งหมดจากค่าเฉลี่ยของการทดลองที่เหมาะสม และความแปรปรวนของการทดลอง ความแปรปรวนของการทดลองคำนวณจากค่าเบี่ยงเบนของค่าเฉลี่ยของการทดลองจากค่าเฉลี่ยรวม โดยผลลัพธ์จะถูกคูณด้วยจำนวนการสังเกตในแต่ละการทดลองเพื่ออธิบายความแตกต่างระหว่างความแปรปรวนของการสังเกตและความแปรปรวนของค่าเฉลี่ย
เทคนิคพื้นฐานคือการแบ่งผลรวมกำลังสอง ทั้งหมด (SS)ออกเป็นส่วนประกอบที่เกี่ยวข้องกับผลกระทบที่ใช้ในแบบจำลอง ตัวอย่างเช่น แบบจำลองสำหรับ ANOVA แบบง่ายที่มีการรักษาประเภทเดียวในระดับต่างๆ กัน
จำนวนองศาอิสระDFสามารถแบ่งออกได้ในลักษณะเดียวกัน: ส่วนประกอบหนึ่งในนั้น (ส่วนที่เกี่ยวกับข้อผิดพลาด) ระบุการแจกแจงแบบไคกำลังสองซึ่งอธิบายผลรวมกำลังสองที่เกี่ยวข้อง ในขณะเดียวกันก็เป็นเช่นเดียวกันสำหรับ "การรักษา" หากไม่มีผลกระทบจากการรักษา
การทดสอบF

การทดสอบFใช้สำหรับเปรียบเทียบปัจจัยต่างๆ ของความเบี่ยงเบนทั้งหมด ตัวอย่างเช่น ในการวิเคราะห์ความแปรปรวนแบบทางเดียว หรือแบบปัจจัยเดียว (ANOVA) จะทดสอบความมีนัยสำคัญทางสถิติโดยการเปรียบเทียบค่าสถิติการทดสอบ F
โดยที่MSคือค่าเฉลี่ยกำลังสอง, คือจำนวนการรักษา และคือจำนวนกรณีทั้งหมด สำหรับการแจกแจงFโดยที่คือระดับความเป็นอิสระของตัวเศษ และคือระดับความเป็นอิสระของตัวส่วน การใช้การ แจกแจง Fเป็นตัวเลือกที่เหมาะสม เนื่องจากสถิติการทดสอบคืออัตราส่วนของผลรวมกำลังสองที่ปรับขนาดแล้วสองค่า ซึ่งแต่ละค่าเป็นไปตามการแจกแจงไคกำลังสอง ที่ปรับขนาด แล้ว
ค่าที่คาดหวังของ F คือ(โดยที่คือขนาดตัวอย่างของการทดลอง) ซึ่งเท่ากับ 1 เมื่อไม่มีผลกระทบจากการทดลอง เมื่อค่าของ F เพิ่มขึ้นเกิน 1 หลักฐานจะยิ่งไม่สอดคล้องกับสมมติฐานว่างมากขึ้น วิธีการทดลองสองวิธีที่เห็นได้ชัดในการเพิ่มค่า F คือ การเพิ่มขนาดตัวอย่างและการลดความแปรปรวนของข้อผิดพลาดโดยการควบคุมการทดลองอย่างเข้มงวด
มีสองวิธีในการสรุปผลการทดสอบสมมติฐาน ANOVA ซึ่งทั้งสองวิธีให้ผลลัพธ์เหมือนกัน:
- วิธีการตามตำราคือการเปรียบเทียบค่า F ที่สังเกตได้กับค่าวิกฤตของ F ที่กำหนดจากตาราง ค่าวิกฤตของ F เป็นฟังก์ชันของระดับความเป็นอิสระของตัวเศษและตัวส่วน และระดับนัยสำคัญ ( α ) ถ้า F ≥ F วิกฤตสมมติฐานว่างจะถูกปฏิเสธ
- วิธีการคำนวณด้วยคอมพิวเตอร์จะคำนวณความน่าจะเป็น ( ค่าp ) ของค่า F ที่มากกว่าหรือเท่ากับค่าที่สังเกตได้ สมมติฐานว่างจะถูกปฏิเสธหากความน่าจะเป็นนี้มีค่าน้อยกว่าหรือเท่ากับระดับนัยสำคัญ ( α )
การทดสอบ Fของ ANOVA เป็นที่ทราบกันดีว่าเกือบจะเหมาะสมที่สุดในแง่ของการลดข้อผิดพลาดเชิงลบเท็จให้น้อยที่สุดสำหรับอัตราข้อผิดพลาดเชิงบวกเท็จที่คงที่ (กล่าวคือ เพิ่มพลังสูงสุดสำหรับระดับนัยสำคัญที่คงที่) ตัวอย่างเช่น ในการทดสอบสมมติฐานที่ว่าการรักษาทางการแพทย์ต่างๆ มีผลเหมือนกันทุกประการ ค่า pของการทดสอบFจะใกล้เคียงกับ ค่า pของการทดสอบการเรียงสับเปลี่ยน : การประมาณค่าจะใกล้เคียงกันเป็นพิเศษเมื่อการออกแบบมีความสมดุล[ 26 ] [ 40 ]การทดสอบการเรียงสับเปลี่ยนดังกล่าวเป็นลักษณะ ของ การทดสอบที่มีพลังสูงสุด ต่อ สมมติฐานทางเลือกทั้งหมด ดังที่ Rosenbaumสังเกต[ nb 2 ] การทดสอบ FของANOVA (ของสมมติฐานว่างที่ว่าการรักษาทั้งหมดมีผลเหมือนกันทุกประการ) ได้รับการแนะนำให้เป็นการทดสอบที่ใช้งานได้จริง เนื่องจากมีความแข็งแกร่งต่อการแจกแจงทางเลือกหลายแบบ[ 41 ] [ nb 3 ]
อัลกอริทึมที่ขยายเพิ่มเติม
ANOVA ประกอบด้วยส่วนที่แยกออกจากกันได้ การแบ่งแหล่งที่มาของความแปรปรวนและการทดสอบสมมติฐานสามารถใช้แยกกันได้ ANOVA ใช้เพื่อสนับสนุนเครื่องมือทางสถิติอื่นๆ การถดถอยจะใช้ก่อนเพื่อปรับแบบจำลองที่ซับซ้อนกว่าให้เข้ากับข้อมูล จากนั้น ANOVA จะใช้ในการเปรียบเทียบแบบจำลองโดยมีวัตถุประสงค์เพื่อเลือกแบบจำลองที่ง่ายกว่า (r) ที่อธิบายข้อมูลได้อย่างเพียงพอ “แบบจำลองดังกล่าวสามารถปรับได้โดยไม่ต้องอ้างอิงถึง ANOVA แต่เครื่องมือ ANOVA สามารถใช้เพื่อทำความเข้าใจแบบจำลองที่ปรับแล้ว และเพื่อทดสอบสมมติฐานเกี่ยวกับกลุ่มสัมประสิทธิ์” [ 42 ] “เราคิดว่าการวิเคราะห์ความแปรปรวนเป็นวิธีหนึ่งในการทำความเข้าใจและจัดโครงสร้างแบบจำลองหลายระดับ ไม่ใช่เป็นทางเลือกแทนการถดถอย แต่เป็นเครื่องมือสำหรับการสรุปการอนุมานที่มีมิติสูงที่ซับซ้อน...” [ 42 ]
สำหรับปัจจัยเดียว
การทดลองที่ง่ายที่สุดที่เหมาะสมสำหรับการวิเคราะห์ ANOVA คือการทดลองแบบสุ่มสมบูรณ์ที่มีปัจจัยเดียว การทดลองที่ซับซ้อนกว่าที่มีปัจจัยเดียวเกี่ยวข้องกับข้อจำกัดในการสุ่ม และรวมถึงบล็อกแบบสุ่มสมบูรณ์และตารางละติน (และรูปแบบต่างๆ เช่นตารางกรีก-ละตินเป็นต้น) การทดลองที่ซับซ้อนกว่านั้นมีความซับซ้อนหลายอย่างคล้ายกับการทดลองที่มีหลายปัจจัย
นอกจากวิธีการวิเคราะห์ความแปรปรวนแบบทางเดียวทั่วไปแล้ว ยังมีวิธีอื่น ๆ ที่ใช้แทนได้ เช่น การทดสอบ F ของ Welch ที่มีความแปรปรวนไม่คงที่, การทดสอบ F ของ Welch ที่มีความแปรปรวนไม่คงที่โดยตัดค่าเฉลี่ยออก และความแปรปรวนแบบ Winsorized, การทดสอบ Brown-Forsythe, การทดสอบ Alexander-Govern, การทดสอบลำดับที่สองของ James และการทดสอบ Kruskal-Wallis ซึ่งมีอยู่ในโปรแกรม onewaytests R
เป็นประโยชน์ที่จะแสดงจุดข้อมูลแต่ละจุดในรูปแบบต่อไปนี้ ซึ่งเรียกว่าแบบจำลองทางสถิติ: โดยที่
- i = 1, 2, 3, ..., R
- j = 1, 2, 3, ..., C
- μ = ค่าเฉลี่ยโดยรวม (ค่าเฉลี่ยเลขคณิต)
- τ j = ผลกระทบเชิงอนุพันธ์ (การตอบสนอง) ที่เกี่ยวข้องกับ ระดับ jของ X;โดยถือว่าโดยรวมแล้วค่าของτ jรวมกันได้เป็นศูนย์ (นั่นคือ)
- ε ij = สัญญาณรบกวนหรือข้อผิดพลาดที่เกี่ยวข้องกับค่าข้อมูลij นั้นๆ
กล่าวคือ เรามองเห็นภาพแบบจำลองแบบบวกที่ระบุว่า จุดข้อมูลทุกจุดสามารถแสดงได้ด้วยการรวมปริมาณสามอย่าง ได้แก่ ค่าเฉลี่ยที่แท้จริง ซึ่งเฉลี่ยจากทุกระดับปัจจัยที่กำลังตรวจสอบ บวกกับส่วนประกอบที่เพิ่มขึ้นซึ่งเกี่ยวข้องกับคอลัมน์ (ระดับปัจจัย) เฉพาะนั้น บวกกับส่วนประกอบสุดท้ายซึ่งเกี่ยวข้องกับสิ่งอื่น ๆ ทั้งหมดที่ส่งผลต่อค่าข้อมูลเฉพาะนั้น
เนื่องจากหลายปัจจัย
ANOVA ขยายความไปสู่การศึกษาผลกระทบของปัจจัยหลายประการ เมื่อการทดลองรวมการสังเกตที่ทุกชุดค่าผสมของระดับของแต่ละปัจจัย จะเรียกว่า การทดลอง แบบแฟกทอเรียลการทดลองแบบแฟกทอเรียลมีประสิทธิภาพมากกว่าชุดการทดลองปัจจัยเดียว และประสิทธิภาพจะเพิ่มขึ้นเมื่อจำนวนปัจจัยเพิ่มขึ้น[ 43 ]ดังนั้น การออกแบบแบบแฟกทอเรียลจึงถูกนำมาใช้อย่างแพร่หลาย
การใช้ ANOVA เพื่อศึกษาผลกระทบของปัจจัยหลายอย่างมีความซับซ้อน ใน ANOVA แบบ 3 ทางที่มีปัจจัย x, y และ z แบบจำลอง ANOVA จะรวมเทอมสำหรับผลกระทบหลัก (x, y, z) และเทอมสำหรับปฏิสัมพันธ์ (xy, xz, yz, xyz) เทอมทั้งหมดต้องมีการทดสอบสมมติฐาน การเพิ่มขึ้นของเทอมปฏิสัมพันธ์จะเพิ่มความเสี่ยงที่การทดสอบสมมติฐานบางอย่างจะให้ผลบวกเท็จโดยบังเอิญ โชคดีที่ประสบการณ์บอกว่าปฏิสัมพันธ์ลำดับสูงนั้นหายาก[ 44 ] ความสามารถในการตรวจจับปฏิสัมพันธ์เป็นข้อได้เปรียบที่สำคัญของ ANOVA หลายปัจจัย การทดสอบปัจจัยทีละตัวจะซ่อนปฏิสัมพันธ์ แต่จะให้ผลการทดลองที่ไม่สอดคล้องกันอย่างเห็นได้ชัด[ 43 ]
ควรใช้ความระมัดระวังเมื่อพบปฏิสัมพันธ์ ควรทดสอบพจน์ปฏิสัมพันธ์ก่อน และขยายการวิเคราะห์ให้มากกว่า ANOVA หากพบปฏิสัมพันธ์ ตำราต่าง ๆ มีคำแนะนำที่แตกต่างกันเกี่ยวกับการดำเนินการต่อตามขั้นตอน ANOVA หลังจากพบปฏิสัมพันธ์ ปฏิสัมพันธ์ทำให้การตีความข้อมูลการทดลองซับซ้อนขึ้น ทั้งการคำนวณความสำคัญและผลกระทบของการรักษาที่ประมาณไว้ไม่สามารถนำมาใช้ได้โดยตรง “ปฏิสัมพันธ์ที่มีนัยสำคัญมักจะบดบังความสำคัญของผลกระทบหลัก” [ 45 ]แนะนำให้ใช้วิธีการทางกราฟิกเพื่อเพิ่มความเข้าใจ การถดถอยมักมีประโยชน์ มีการอภิปรายอย่างละเอียดเกี่ยวกับปฏิสัมพันธ์ใน Cox (1958) [ 46 ]ปฏิสัมพันธ์บางอย่างสามารถกำจัดได้ (โดยการแปลง) ในขณะที่บางอย่างไม่สามารถกำจัดได้
มีการใช้เทคนิคต่างๆ มากมายกับ ANOVA แบบหลายปัจจัยเพื่อลดค่าใช้จ่าย เทคนิคหนึ่งที่ใช้ในการออกแบบแฟกทอเรียลคือการลดการทำซ้ำให้น้อยที่สุด (อาจไม่มีการทำซ้ำเลยหากได้รับการสนับสนุนจากกลอุบายในการวิเคราะห์ ) และการรวมกลุ่มเมื่อพบว่าผลกระทบไม่มีนัยสำคัญทางสถิติ (หรือในทางปฏิบัติ) การทดลองที่มีปัจจัยที่ไม่สำคัญจำนวนมากอาจยุบรวมเป็นการทดลองที่มีปัจจัยเพียงไม่กี่ปัจจัยซึ่งได้รับการสนับสนุนจากการทำซ้ำจำนวนมาก[ 47 ]
การวิเคราะห์ที่เกี่ยวข้อง
จำเป็นต้องมีการวิเคราะห์บางส่วนเพื่อสนับสนุนการออกแบบการทดลอง ในขณะที่การวิเคราะห์อื่นๆ จะดำเนินการหลังจากที่พบว่าการเปลี่ยนแปลงในปัจจัยต่างๆ ส่งผลให้เกิดการเปลี่ยนแปลงที่มีนัยสำคัญทางสถิติในผลลัพธ์ เนื่องจากการทดลองเป็นกระบวนการที่ทำซ้ำ ผลลัพธ์ของการทดลองหนึ่งจึงส่งผลต่อแผนการทดลองในครั้งต่อไป
การวิเคราะห์เบื้องต้น
จำนวนหน่วยทดลอง
ในการออกแบบการทดลอง จำนวนหน่วยทดลองจะถูกวางแผนเพื่อให้บรรลุเป้าหมายของการทดลอง การทดลองมักจะดำเนินการตามลำดับ
การทดลองในระยะแรกมักถูกออกแบบมาเพื่อให้ได้ค่าประมาณที่ไม่เอนเอียงไปทางค่าเฉลี่ยของผลกระทบจากการรักษาและข้อผิดพลาดในการทดลอง ส่วนการทดลองในระยะหลังมักถูกออกแบบมาเพื่อทดสอบสมมติฐานที่ว่าผลกระทบจากการรักษานั้นมีขนาดใหญ่พอสมควร ในกรณีนี้ จำนวนหน่วยทดลองจะถูกเลือกเพื่อให้การทดลองอยู่ในงบประมาณและมีกำลังการทดสอบที่เพียงพอ รวมถึงเป้าหมายอื่นๆ ด้วย
โดยทั่วไปแล้ว การรายงานการวิเคราะห์ขนาดตัวอย่างเป็นสิ่งจำเป็นในสาขาจิตวิทยา “ให้ข้อมูลเกี่ยวกับขนาดตัวอย่างและกระบวนการที่นำไปสู่การตัดสินใจเกี่ยวกับขนาดตัวอย่าง” [ 48 ]การวิเคราะห์ซึ่งเขียนไว้ในโปรโตคอลการทดลองก่อนที่จะทำการทดลอง จะถูกตรวจสอบในใบสมัครขอรับทุนและคณะกรรมการตรวจสอบการบริหาร
นอกจากการวิเคราะห์กำลังแล้ว ยังมีวิธีการที่ไม่เป็นทางการอื่นๆ ในการเลือกจำนวนหน่วยทดลอง ซึ่งรวมถึงวิธีการทางกราฟิกที่อิงตามการจำกัดความน่าจะเป็นของข้อผิดพลาดเชิงลบเท็จ วิธีการทางกราฟิกที่อิงตามการเพิ่มขึ้นของความแปรปรวนที่คาดหวัง (เหนือค่าตกค้าง) และวิธีการทางกราฟิกที่อิงตามการบรรลุช่วงความเชื่อมั่นที่ต้องการ[ 49 ]
การวิเคราะห์กำลัง
การวิเคราะห์กำลังมักถูกนำมาใช้ในบริบทของ ANOVA เพื่อประเมินความน่าจะเป็นของการปฏิเสธสมมติฐานว่างได้สำเร็จ หากเราสมมติการออกแบบ ANOVA ขนาดผลกระทบในประชากร ขนาดตัวอย่าง และระดับนัยสำคัญที่แน่นอน การวิเคราะห์กำลังสามารถช่วยในการออกแบบการศึกษาโดยการกำหนดขนาดตัวอย่างที่จำเป็นเพื่อให้มีโอกาสที่สมเหตุสมผลในการปฏิเสธสมมติฐานว่างเมื่อสมมติฐานทางเลือกเป็นจริง[ 50 ] [ 51 ] [ 52 ] [ 53 ]

ขนาดของผลกระทบ
มีการเสนอมาตรวัดผลกระทบมาตรฐานหลายรายการสำหรับ ANOVA เพื่อสรุปความแข็งแกร่งของความสัมพันธ์ระหว่างตัวทำนายและตัวแปรตาม หรือความแตกต่างมาตรฐานโดยรวมของแบบจำลองที่สมบูรณ์ การประมาณขนาดผลกระทบมาตรฐานช่วยให้สามารถเปรียบเทียบผลการค้นพบระหว่างการศึกษาและสาขาวิชาต่างๆ ได้ อย่างไรก็ตาม แม้ว่าขนาดผลกระทบมาตรฐานจะถูกใช้กันทั่วไปในเอกสารทางวิชาชีพจำนวนมาก แต่มาตรวัดขนาดผลกระทบที่ไม่เป็นมาตรฐานซึ่งมีหน่วยที่ "มีความหมาย" ในทันทีอาจเป็นที่ต้องการมากกว่าสำหรับการรายงาน[ 54 ]
การยืนยันแบบจำลอง
บางครั้งมีการทดสอบเพื่อตรวจสอบว่าสมมติฐานของ ANOVA ถูกละเมิดหรือไม่ มีการตรวจสอบหรือวิเคราะห์ค่าตกค้างเพื่อยืนยันความแปรปรวนคงที่และความเป็นปกติโดยรวม[ 55 ]ค่าตกค้างควรมีลักษณะเหมือนสัญญาณรบกวน (การกระจายแบบปกติที่มีค่าเฉลี่ยเป็นศูนย์) เมื่อพล็อตเป็นฟังก์ชันของสิ่งใดก็ตาม รวมถึงเวลาและค่าข้อมูลที่จำลอง แนวโน้มบ่งชี้ถึงปฏิสัมพันธ์ระหว่างปัจจัยหรือระหว่างการสังเกต
การตรวจติดตามผล
ผลลัพธ์ที่มีนัยสำคัญทางสถิติใน ANOVA มักตามมาด้วยการทดสอบเพิ่มเติม ซึ่งอาจทำเพื่อประเมินว่ากลุ่มใดแตกต่างจากกลุ่มอื่น หรือเพื่อทดสอบสมมติฐานเฉพาะเจาะจงอื่นๆ การทดสอบติดตามผลมักแบ่งตามว่าเป็นการทดสอบที่ "วางแผนไว้ล่วงหน้า" ( a priori ) หรือ"ทดสอบภายหลัง" (post hoc ) การทดสอบที่วางแผนไว้ล่วงหน้าจะถูกกำหนดก่อนที่จะพิจารณาข้อมูล ในขณะที่การทดสอบภายหลังจะถูกคิดขึ้นหลังจากพิจารณาข้อมูลแล้ว (แม้ว่าคำว่า "post hoc" จะถูกใช้ไม่สม่ำเสมอ)
การทดสอบติดตามผลอาจเป็นการเปรียบเทียบแบบ "ง่ายๆ" ระหว่างค่าเฉลี่ยของแต่ละกลุ่ม หรืออาจเป็นการเปรียบเทียบแบบ "ซับซ้อน" (เช่น การเปรียบเทียบค่าเฉลี่ยรวมของกลุ่ม A, B และ C กับค่าเฉลี่ยของกลุ่ม D) การเปรียบเทียบยังสามารถพิจารณาการทดสอบแนวโน้ม เช่น ความสัมพันธ์เชิงเส้นและเชิงกำลังสอง เมื่อตัวแปรอิสระเกี่ยวข้องกับระดับที่มีลำดับ บ่อยครั้งที่การทดสอบติดตามผลจะรวมวิธีการปรับแก้ปัญหาการเปรียบเทียบหลายครั้งไว้ ด้วย
การทดสอบติดตามผลเพื่อระบุว่ากลุ่ม ตัวแปร หรือปัจจัยใดมีค่าเฉลี่ยแตกต่างกันทางสถิติ ได้แก่การทดสอบช่วงของ Tukeyและการทดสอบช่วงหลายค่าใหม่ของ Duncanโดยทั่วไปแล้ว การทดสอบเหล่านี้มักตามด้วย ระเบียบวิธี แสดงผลแบบย่อ (Compact Letter Display: CLD)เพื่อให้ผลลัพธ์ของการทดสอบดังกล่าวมีความโปร่งใสมากขึ้นสำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญด้านสถิติ
การออกแบบการศึกษา
มี ANOVA หลายประเภท นักสถิติหลายคนใช้ ANOVA โดยอิงตามการออกแบบการทดลอง [ 56 ] โดยเฉพาะอย่างยิ่งตามโปรโตคอลที่ระบุการสุ่มจัดสรรการรักษาให้กับผู้ถูกทดลอง คำอธิบายของโปรโตคอลเกี่ยวกับกลไกการจัดสรรควรรวมถึงข้อกำหนดของโครงสร้างของการรักษาและการแบ่งกลุ่มนอกจากนี้ยังเป็นเรื่องปกติที่จะใช้ ANOVA กับข้อมูลเชิงสังเกตโดยใช้แบบจำลองทางสถิติที่เหมาะสม[ 57 ]
การออกแบบที่เป็นที่นิยมบางแบบใช้ ANOVA ประเภทต่อไปนี้:
- การวิเคราะห์ความแปรปรวน แบบทางเดียว (One-way ANOVA)ใช้เพื่อทดสอบความแตกต่างระหว่าง กลุ่ม อิสระ สองกลุ่มขึ้นไป (ค่าเฉลี่ย) เช่น ระดับการใช้ยูเรียที่แตกต่างกันในพืชผล หรือระดับการออกฤทธิ์ของยาปฏิชีวนะที่แตกต่างกันในแบคทีเรียหลายชนิด[ 58 ]หรือระดับผลกระทบของยาบางชนิดต่อกลุ่มผู้ป่วยที่แตกต่างกัน อย่างไรก็ตาม หากกลุ่มเหล่านี้ไม่เป็นอิสระ และมีลำดับในกลุ่ม (เช่น โรคเล็กน้อย ปานกลาง และรุนแรง) หรือในปริมาณยา (เช่น 5 มก./มล. 10 มก./มล. 20 มก./มล.) ที่ให้แก่กลุ่มผู้ป่วยกลุ่มเดียวกัน ควรใช้ การประมาณแนวโน้มเชิงเส้นโดยทั่วไปแล้ว การวิเคราะห์ความแปรปรวนแบบทางเดียว (One-way ANOVA) จะใช้เพื่อทดสอบความแตกต่างระหว่างกลุ่มอย่างน้อยสามกลุ่ม เนื่องจากกรณีสองกลุ่มสามารถครอบคลุมได้ด้วย การ ทดสอบt [ 59 ]เมื่อมีค่าเฉลี่ยเพียงสองค่าที่จะเปรียบเทียบการทดสอบ t และ การทดสอบF ของ ANOVA จะเทียบเท่ากัน ความสัมพันธ์ระหว่าง ANOVA และt กำหนดโดยF = t²
- การวิเคราะห์ความแปรปรวน แบบแฟกทอเรียล (Factorial ANOVA) ใช้เมื่อมีปัจจัยมากกว่าหนึ่งปัจจัย
- การวิเคราะห์ความแปรปรวนแบบวัดซ้ำ (Repeated measures ANOVA) ใช้เมื่อใช้กลุ่มตัวอย่างเดียวกันสำหรับแต่ละปัจจัย (เช่น ในการศึกษาแบบระยะยาว )
- การวิเคราะห์ความแปรปรวนหลายตัวแปร (MANOVA) ใช้เมื่อมีตัวแปรตอบสนอง มากกว่าหนึ่ง ตัว
ข้อควรระวัง
การทดลองที่สมดุล (การทดลองที่มีขนาดตัวอย่างเท่ากันสำหรับแต่ละการรักษา) นั้นตีความได้ค่อนข้างง่าย การทดลองที่ไม่สมดุลนั้นมีความซับซ้อนมากกว่า สำหรับ ANOVA แบบปัจจัยเดียว (ทางเดียว) การปรับข้อมูลที่ไม่สมดุลนั้นง่าย แต่การวิเคราะห์ที่ไม่สมดุลนั้นขาดทั้งความแข็งแกร่งและพลัง[ 60 ]สำหรับการออกแบบที่ซับซ้อนกว่านั้น การขาดความสมดุลนำไปสู่ความซับซ้อนเพิ่มเติม “คุณสมบัติความเป็นตั้งฉากของผลกระทบหลักและปฏิสัมพันธ์ที่มีอยู่ในข้อมูลที่สมดุลนั้นไม่ได้ถ่ายทอดไปยังกรณีที่ไม่สมดุล ซึ่งหมายความว่าเทคนิคการวิเคราะห์ความแปรปรวนตามปกติไม่สามารถนำมาใช้ได้ ดังนั้น การวิเคราะห์แฟกทอเรียลที่ไม่สมดุลจึงยากกว่าการวิเคราะห์การออกแบบที่สมดุลมาก” [ 61 ]ในกรณีทั่วไป “การวิเคราะห์ความแปรปรวนยังสามารถนำไปใช้กับข้อมูลที่ไม่สมดุลได้ แต่ผลรวมกำลังสอง กำลังสองเฉลี่ย และ อัตราส่วน Fจะขึ้นอยู่กับลำดับที่พิจารณาแหล่งที่มาของความแปรปรวน” [ 42 ]
ANOVA เป็น (ส่วนหนึ่ง) การทดสอบความสำคัญทางสถิติ สมาคมจิตวิทยาอเมริกัน (และองค์กรอื่นๆ อีกมากมาย) ถือว่าการรายงานความสำคัญทางสถิติเพียงอย่างเดียวนั้นไม่เพียงพอ และควรรายงานขอบเขตความเชื่อมั่นด้วย[ 54 ]
การสรุปโดยทั่วไป
ANOVA ถือเป็นกรณีพิเศษของการถดถอยเชิงเส้น[ 62 ] [ 63 ]ซึ่งในทางกลับกันก็เป็นกรณีพิเศษของ แบบ จำลองเชิงเส้นทั่วไป[ 64 ]ทั้งหมดนี้ถือว่าการสังเกตเป็นผลรวมของแบบจำลอง (ความเหมาะสม) และส่วนที่เหลือ (ข้อผิดพลาด) ที่ต้องลดให้น้อยที่สุด
การทดสอบ Kruskal-Wallisและการทดสอบ Friedmanเป็นการ ทดสอบแบบ ไม่ใช้พารามิเตอร์ซึ่งไม่ขึ้นอยู่กับสมมติฐานเรื่องความปกติ[ 65 ] [ 66 ]
ความเชื่อมโยงกับการถดถอยเชิงเส้น
ด้านล่างนี้ เราจะอธิบายความเชื่อมโยงระหว่าง ANOVA แบบหลายตัวแปรและการถดถอยเชิงเส้นให้ชัดเจนยิ่งขึ้น
จัดเรียงข้อมูลใหม่เชิงเส้นเพื่อให้การสังเกตที่ i สัมพันธ์กับการตอบสนองและปัจจัยโดยที่แทนปัจจัยต่างๆ และคือจำนวนปัจจัยทั้งหมด ในการวิเคราะห์ความแปรปรวนแบบทางเดียว (ANOVA) และในการวิเคราะห์ความแปรปรวนแบบสองทาง (ANOVA ) นอกจากนี้ เราสมมติว่าปัจจัยที่ i มีระดับ คือตอนนี้ เราสามารถเข้ารหัสปัจจัยแบบ one-hot ลงใน เวกเตอร์มิติได้
ฟังก์ชันการเข้ารหัสแบบวันฮอต (one-hot encoding) ถูกกำหนดไว้โดยที่รายการที่ i ของคือ เวกเตอร์คือการรวมกันของเวกเตอร์ทั้งหมดข้างต้นสำหรับทุกค่าดังนั้นเพื่อให้ได้ANOVA ปฏิสัมพันธ์แบบ n ทางทั่วไปอย่างสมบูรณ์ เราต้องรวมพจน์ปฏิสัมพันธ์เพิ่มเติมทั้งหมดในเวกเตอร์แล้วเพิ่มพจน์ค่าคงที่เข้าไป ให้เวกเตอร์นั้นเป็น
เมื่อใช้สัญลักษณ์นี้แล้ว เราก็จะได้ความสัมพันธ์ที่ชัดเจนกับการถดถอยเชิงเส้น เราเพียงแค่ถดถอยค่าตอบสนองเทียบกับเวกเตอร์อย่างไรก็ตาม มีข้อกังวลเกี่ยวกับความสามารถ ในการระบุตัวตน เพื่อที่จะเอาชนะปัญหาดังกล่าว เราจึงสมมติว่าผลรวมของพารามิเตอร์ภายในแต่ละชุดของปฏิสัมพันธ์เท่ากับศูนย์ จากนั้น เราสามารถใช้ สถิติ Fหรือวิธีการอื่น ๆ เพื่อกำหนดความสำคัญของปัจจัยแต่ละตัวได้
ตัวอย่าง
เราสามารถพิจารณาตัวอย่างปฏิสัมพันธ์แบบ 2 ทาง โดยสมมติว่าปัจจัยแรกมี 2 ระดับ และปัจจัยที่สองมี 3 ระดับ
กำหนดเงื่อนไขว่าถ้าและถ้ากล่าวคือคือการเข้ารหัสแบบวันฮอตของแฟกเตอร์ตัวแรก และคือการเข้ารหัสแบบวันฮอตของแฟกเตอร์ตัวที่สอง
ด้วยเหตุนี้ พจน์สุดท้ายจึงเป็นพจน์ค่าคงที่ สำหรับตัวอย่างที่เป็นรูปธรรมมากขึ้น สมมติว่า จากนั้น
ดูเพิ่มเติม
- การวิเคราะห์ความแปรปรวน (ANOVA) บนอันดับ
- ANOVA - การวิเคราะห์องค์ประกอบพร้อมกัน
- การวิเคราะห์ความแปรปรวนร่วม ( ANCOVA )
- การวิเคราะห์ความแปรปรวนระดับโมเลกุล (AMOVA)
- การวิเคราะห์ความแปรปรวนของจังหวะ (ANORVA)
- ค่าเฉลี่ยกำลังสองที่คาดหวัง
- ความแปรผันที่อธิบายได้
- การประมาณแนวโน้มเชิงเส้น
- การวิเคราะห์ความแปรปรวนแบบการออกแบบผสม
- การวิเคราะห์ความแปรปรวนร่วมหลายตัวแปร ( MANCOVA )
- การวิเคราะห์ความแปรปรวนแบบเรียงสับเปลี่ยน
- การวิเคราะห์ส่วนประกอบหลัก
- การแยกส่วนความแปรปรวน
เชิงอรรถ
- ^ในตำราส่วนใหญ่เรียกความสามารถในการบวกของการรักษาแต่ละหน่วยว่า ความสามารถในการบวก (additivity) Hinkelmann และ Kempthorne ได้เพิ่มคำคุณศัพท์และแยกแยะความแตกต่างระหว่างความสามารถในการบวกในความหมายที่เข้มงวดและความหมายที่กว้าง ซึ่งทำให้สามารถพิจารณาแหล่งที่มาของข้อผิดพลาดหลายแหล่ง (การรักษา สถานะ การเลือก การวัด และการสุ่มตัวอย่าง) ได้อย่างละเอียดในหน้า 161
- ^ Rosenbaum (2002, หน้า 40) อ้างถึงหัวข้อ 5.7 (การทดสอบการเรียงสับเปลี่ยน) ทฤษฎีบท 2.3 (ที่จริงคือทฤษฎีบท 3 หน้า 184) ของหนังสือ Testing Statistical Hypothesesของ Lehmann (1959)
- ^การ ทดสอบ Fสำหรับการเปรียบเทียบความแปรปรวนมีชื่อเสียงที่หลากหลาย ไม่แนะนำให้ใช้เป็นการทดสอบสมมติฐานเพื่อตรวจสอบว่าตัวอย่างสอง ตัวอย่าง ที่แตกต่างกันมีความแปรปรวนเท่ากันหรือไม่ แต่แนะนำให้ใช้สำหรับการวิเคราะห์ความแปรปรวน (ANOVA) ที่เปรียบเทียบค่าประมาณความแปรปรวนสองค่าของตัวอย่างเดียวกัน แม้ว่าการทดสอบ Fโดยทั่วไปจะไม่แข็งแกร่งต่อการเบี่ยงเบนจากภาวะปกติ แต่ก็พบว่าแข็งแกร่งในกรณีพิเศษของการวิเคราะห์ความแปรปรวน อ้างอิงจาก Moore & McCabe (2003): "การวิเคราะห์ความแปรปรวนใช้สถิติ F แต่สถิติเหล่านี้ไม่เหมือนกับสถิติ F สำหรับการเปรียบเทียบค่าเบี่ยงเบนมาตรฐานของประชากรสองกลุ่ม" (หน้า 554) "การทดสอบ F และขั้นตอนอื่นๆ สำหรับการอนุมานเกี่ยวกับความแปรปรวนนั้นขาดความแข็งแกร่งจนแทบไม่มีประโยชน์ในทางปฏิบัติ" (หน้า 556) "[ การทดสอบ F ของ ANOVA ] ค่อนข้างไม่ไวต่อภาวะที่ไม่ปกติปานกลางและความแปรปรวนที่ไม่เท่ากัน โดยเฉพาะอย่างยิ่งเมื่อขนาดตัวอย่างใกล้เคียงกัน" (หน้า 763) ANOVA สมมติว่ามีความแปรปรวนคงที่ แต่ก็มีความแข็งแกร่ง การทดสอบทางสถิติเพื่อตรวจสอบความเท่าเทียมกันของความแปรปรวน ( การทดสอบ F ) นั้นไม่แข็งแกร่งพอ Moore และ McCabe แนะนำให้ใช้กฎง่ายๆ แทน
หมายเหตุ
- ^สติกล์เลอร์ (1986)
- ^สติกล์เลอร์ (1986, หน้า 134)
- ^สติกล์เลอร์ (1986, หน้า 153)
- ^สติกล์เลอร์ (1986, หน้า 154–155)
- ^สติกล์เลอร์ (1986, หน้า 240–242)
- ^สติกล์เลอร์ (1986, บทที่ 7 – จิตฟิสิกส์ในฐานะจุดโต้แย้ง)
- ^สติกล์เลอร์ (1986, หน้า 253)
- ^สติกล์เลอร์ (1986, หน้า 314–315)
- ^ความสัมพันธ์ระหว่างญาติโดยอาศัยสมมติฐานการถ่ายทอดทางพันธุกรรมแบบเมนเดล โรนัลด์ เอ. ฟิชเชอร์วารสารปรัชญาของราชสมาคมแห่งเอดินบะระปี 1918 (เล่มที่ 52 หน้า 399–433)
- ^ Fisher, Ronald A. (1921). ") การศึกษาความแปรปรวนของพืชผล I. การตรวจสอบผลผลิตของเมล็ดธัญพืชที่ผ่านการแต่งจาก Broadbalk" วารสารวิทยาศาสตร์การเกษตร 11 ( 2): 107– 135. doi : 10.1017/S0021859600003750 . hdl : 2440/15170 . S2CID 86029217 .
- ^ Fisher, Ronald A. (1923). ") การศึกษาความแปรปรวนของพืช. II. การตอบสนองต่อปุ๋ยของมันฝรั่งพันธุ์ต่างๆ". วารสารวิทยาศาสตร์การเกษตร . 13 (3): 311– 320. doi : 10.1017/S0021859600003592 . hdl : 2440/15179 . S2CID 85985907 .
- ^ Scheffé (1959, หน้า 291, "แบบจำลองการสุ่มได้รับการกำหนดขึ้นครั้งแรกโดย Neyman (1923) สำหรับการออกแบบแบบสุ่มสมบูรณ์ โดย Neyman (1935) สำหรับบล็อกแบบสุ่ม โดย Welch (1937) และ Pitman (1937) สำหรับตารางละตินภายใต้สมมติฐานว่างที่แน่นอน และโดย Kempthorne (1952, 1955) และ Wilk (1955) สำหรับการออกแบบอื่นๆ อีกมากมาย")
- ^มอนต์โกเมอรี (2001, บทที่ 12: การทดลองกับปัจจัยสุ่ม)
- ^เกลแมน (2005, หน้า 20–21)
- ^ Snedecor, George W.; Cochran, William G. (1967). วิธีการทางสถิติ (ฉบับที่ 6). หน้า 321.
- ^ Cochran & Cox (1992, หน้า 48)
- ^โฮเวลล์ (2002, หน้า 323)
- ^ Anderson, David R.; Sweeney, Dennis J.; Williams, Thomas A. (1996). สถิติสำหรับธุรกิจและเศรษฐศาสตร์ (ฉบับที่ 6). มินนิอาโปลิส/เซนต์พอล: West Pub. Co. หน้า 452–453 . ISBN 978-0-314-06378-6.
- ^แอนสคอมบ์ (1948)
- ^ Hinkelmann, Klaus; Kempthorne, Oscar (2005). การออกแบบและการวิเคราะห์การทดลอง เล่ม 2: การออกแบบการทดลองขั้นสูง สำนักพิมพ์ John Wiley หน้า 213 ISBN 978-0-471-70993-0.
- ^ Cox, DR (1992). การวางแผนการทดลอง . Wiley. ISBN 978-0-471-57429-3.
- ^เคมป์ธอร์น (1979, หน้า 30)
- ^ a b Cox (1958, บทที่ 2: ข้อสมมติฐานสำคัญบางประการ)
- ^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ตลอดทั้งเล่ม แนะนำในส่วนที่ 2.3.3: หลักการออกแบบการทดลอง; แบบจำลองเชิงเส้น; โครงร่างของแบบจำลอง)
- ^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.3: การออกแบบแบบสุ่มสมบูรณ์; แบบจำลองเชิงเส้นที่ได้มา)
- ^ a b Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.6: การออกแบบแบบสุ่มสมบูรณ์; การประมาณการทดสอบการสุ่ม)
- ^ Bailey (2008, บทที่ 2.14 "แบบจำลองทั่วไปมากขึ้น" ใน Bailey, หน้า 38–40)
- ^ Hinkelmann และ Kempthorne (2008, เล่ม 1, บทที่ 7: การเปรียบเทียบวิธีการรักษา)
- ^ Kempthorne (1979, หน้า 125–126, "นักทดลองต้องตัดสินใจว่าสาเหตุต่างๆ ที่เขารู้สึกว่าจะทำให้เกิดความแปรปรวนในผลลัพธ์ของเขานั้น สาเหตุใดบ้างที่ต้องควบคุมในการทดลอง สาเหตุเหล่านั้นที่เขาไม่ได้ควบคุมในการทดลอง เพราะเขาไม่ทราบถึงสาเหตุเหล่านั้น เขาต้องควบคุมโดยใช้วิธีการสุ่ม" "[เฉพาะเมื่อนักทดลองใช้การทดลองโดยใช้ขั้นตอนการสุ่มอย่างสมบูรณ์เท่านั้นที่ห่วงโซ่ของการอนุมานแบบอุปนัยจะสมเหตุสมผล ภายใต้สถานการณ์เหล่านี้ เท่านั้นที่นักทดลองสามารถระบุได้ว่าผลกระทบใดๆ ที่เขาสังเกตเห็นนั้นเกิดจากการทดลองและการทดลองเท่านั้น ภายใต้สถานการณ์เหล่านี้ ข้อสรุปของเขาจะน่าเชื่อถือในเชิงสถิติ")
- ^ฟรีดแมน
- ^มอนต์โกเมอรี (2001, ส่วนที่ 3.8: การค้นพบผลกระทบจากการกระจายตัว)
- ^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.10: การออกแบบแบบสุ่มสมบูรณ์; การแปลง)
- ^เบลีย์ (2008)
- ^ "สมการเชิงฟังก์ชันของโคชี "
- ↑โกชี, ออกัสติน หลุยส์ (1821) Cours d'analyse de l'École royale polytechnique [ หลักสูตรการวิเคราะห์ที่ Royal Polytechnic School ] (ในภาษาฝรั่งเศส) อิมพรีเมอรี่ รอยัล หน้า 106– 109. OL 6477125M .
- ^ "การแก้สมการโดยการกำหนดค่าของฟังก์ชันที่ไม่ทราบค่าบนเซตหนาแน่น" บรรยายเรื่องสมการเชิงฟังก์ชันและการประยุกต์ใช้คณิตศาสตร์ในวิทยาศาสตร์และวิศวกรรมศาสตร์ เล่มที่ 19 พ.ศ. 2509 หน้า 31–139 doi : 10.1016 / S0076-5392(09)60208-3 ISBN 978-0-12-043750-4.
- ^มอนต์โกเมอรี (2001, ส่วนที่ 3-3: การทดลองที่มีปัจจัยเดียว: การวิเคราะห์ความแปรปรวน; การวิเคราะห์แบบจำลองผลกระทบคงที่)
- ^ Cochran & Cox (1992, หน้า 2 ตัวอย่าง)
- ^ Cochran & Cox (1992, หน้า 49)
- ^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.7: การออกแบบแบบสุ่มสมบูรณ์; CRD ที่มีจำนวนการทำซ้ำไม่เท่ากัน)
- ^มัวร์และแมคเคบ (2003, หน้า 763)
- ^ a b cเจลแมน (2008)
- ^ a b Montgomery (2001, ส่วนที่ 5-2: บทนำเกี่ยวกับการออกแบบแฟกทอเรียล; ข้อดีของการออกแบบแฟกทอเรียล)
- ^เบลล์ (2008, ส่วนที่ 8.4: ปฏิสัมพันธ์ระดับสูงเกิดขึ้นไม่บ่อยนัก)
- ^มอนต์โกเมอรี (2001, ส่วนที่ 5-1: บทนำเกี่ยวกับการออกแบบเชิงแฟกทอเรียล; คำจำกัดความและหลักการพื้นฐาน)
- ^ค็อกซ์ (1958, บทที่ 6: แนวคิดพื้นฐานเกี่ยวกับการทดลองเชิงแฟกทอเรียล)
- ^มอนต์โกเมอรี (2001, ส่วนที่ 5-3.7: บทนำเกี่ยวกับการออกแบบเชิงแฟกทอเรียล; การออกแบบเชิงแฟกทอเรียลสองปัจจัย; การสังเกตหนึ่งครั้งต่อเซลล์)
- ^วิลกินสัน (1999, หน้า 596)
- ^มอนต์โกเมอรี (2001, ส่วนที่ 3-7: การกำหนดขนาดตัวอย่าง)
- ^โฮเวลล์ (2002, บทที่ 8: อำนาจ)
- ^ Howell (2002, ส่วนที่ 11.12: กำลัง (ใน ANOVA))
- ^ Howell (2002, ส่วนที่ 13.7: การวิเคราะห์กำลังสำหรับการทดลองแบบแฟคทอเรียล)
- ^มัวร์และแมคเคบ (2003, หน้า 778–780)
- ^ a b Wilkinson (1999, หน้า 599)
- ^มอนต์โกเมอรี (2001, ส่วนที่ 3-4: การตรวจสอบความเพียงพอของแบบจำลอง)
- ^ Cochran & Cox (1957, หน้า 9, "กฎทั่วไปคือ วิธีการดำเนินการทดลองไม่เพียงแต่กำหนดว่าจะสามารถสรุปผลได้หรือไม่ แต่ยังกำหนดวิธีการคำนวณที่จำเป็นในการสรุปผลเหล่านั้นด้วย")
- ^ "การออกแบบ ANOVA" . bluebox.creighton.edu . สืบค้นเมื่อ23 มกราคม 2023 .
- ^ "การวิเคราะห์ความแปรปรวนแบบทางเดียว/ปัจจัยเดียว"เก็บถาวรจากต้นฉบับเมื่อวันที่ 7 พฤศจิกายน 2014
- ^ "ความคลาดเคลื่อนที่น่าจะเป็นไปได้ของค่าเฉลี่ย" Biometrika . 6 : 1– 25. 1908. doi : 10.1093/biomet/6.1.1 . hdl : 10338.dmlcz/143545 .
- ^มอนต์โกเมอรี (2001, ส่วนที่ 3-3.4: ข้อมูลที่ไม่สมดุล)
- ^มอนต์โกเมอรี (2001, ส่วนที่ 14-2: ข้อมูลที่ไม่สมดุลในการออกแบบเชิงแฟกทอเรียล)
- ^เกลแมน (2005, หน้า 1) (โดยมีข้อจำกัดในเนื้อหาส่วนหลัง)
- ^มอนต์โกเมอรี (2001, ส่วนที่ 3.9: แนวทางการถดถอยในการวิเคราะห์ความแปรปรวน)
- ^โฮเวลล์ (2002, หน้า 604)
- ^ Howell (2002, บทที่ 18: การสุ่มตัวอย่างซ้ำและแนวทางที่ไม่ใช้พารามิเตอร์สำหรับข้อมูล)
- ^มอนต์โกเมอรี (2001, ส่วนที่ 3-10: วิธีการทางสถิติแบบไม่พาราเมตริกในการวิเคราะห์ความแปรปรวน)
อ่านเพิ่มเติม
- ฟรีดแมน, เดวิด เอ. ; พิซานี, โรเบิร์ต; เพอร์เวส, โรเจอร์ (2007). สถิติ (ฉบับที่ 4). WW Norton & Company. ISBN 978-0-393-92972-0.
- Tabachnick, Barbara G.; Fidell, Linda S. (2006). การใช้สถิติหลายตัวแปร . สำนักพิมพ์ Pearson International Edition (ฉบับที่ 5). Needham, MA: Allyn & Bacon, Inc. ISBN 978-0-205-45938-4.
- Wichura, Michael J. (2006). แนวทางที่ไม่ขึ้นกับพิกัดสำหรับแบบจำลองเชิงเส้นชุดหนังสือเคมบริดจ์ด้านคณิตศาสตร์สถิติและความน่าจะเป็น สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ หน้า xiv+199 ISBN 978-0-521-86842-6. MR 2283455 .
{{cite book}}: CS1 maint: location missing publisher (link) - คริสเตนเซน, โรนัลด์ (2002). คำตอบแบบระนาบสำหรับคำถามที่ซับซ้อน: ทฤษฎีแบบจำลองเชิงเส้น (ฉบับที่สาม). นิวยอร์ก: สปริงเกอร์. ISBN 978-0-387-95361-8.
- Caliński, Tadeusz; Kageyama, Sanpei (2000). Block Designs: A Randomization Approach . Lecture Notes in Statistics. Vol. 150. doi : 10.1007/978-1-4612-1192-1 . ISBN 978-0-387-98578-7.
- Cox, DR; Reid, Nancy (2000). ทฤษฎีการออกแบบการทดลอง . doi : 10.1201/9781420035834 . ISBN 978-0-429-12628-4.
- Hettmansperger, TP; McKean, JW (1998). วิธีการทางสถิติแบบไม่ใช้พารามิเตอร์ที่ทนทาน . ห้องสมุดสถิติของ Kendall. เล่ม 5 (ฉบับพิมพ์ครั้งที่ 1). นิวยอร์ก: สำนักพิมพ์ Hodder Arnold. หน้า xiv+467. ISBN 978-0-340-54937-7MR 1604954
- Lentner, Marvin; Bishop, Thomas (1993). การออกแบบและการวิเคราะห์การทดลอง (ฉบับที่ 2). Blacksburg, VA: Valley Book Company. ISBN 978-0-9616255-2-8.
- Phadke, Madhav S. (1989). วิศวกรรมคุณภาพโดยใช้การออกแบบที่แข็งแกร่ง . นิวเจอร์ซีย์: Prentice Hall PTR. ISBN 978-0-13-745167-8.
- Box, GEP (1954). "ทฤษฎีบทบางประการเกี่ยวกับรูปแบบกำลังสองที่ใช้ในการศึกษาปัญหาการวิเคราะห์ความแปรปรวน, II. ผลกระทบของความไม่เท่าเทียมกันของความแปรปรวนและความสัมพันธ์ระหว่างข้อผิดพลาดในการจำแนกประเภทสองทาง"วารสารสถิติคณิตศาสตร์25 ( 3): 484. doi : 10.1214/aoms/1177728717
- Box, GEP (1954). "ทฤษฎีบทบางประการเกี่ยวกับรูปแบบกำลังสองที่ใช้ในการศึกษาปัญหาการวิเคราะห์ความแปรปรวน I. ผลกระทบของความไม่เท่าเทียมกันของความแปรปรวนในการจัดประเภททางเดียว"วารสารสถิติคณิตศาสตร์ 25 ( 2): 290. doi : 10.1214/aoms/1177728786
- Box, GEP (1953). "ความไม่ปกติและการทดสอบความแปรปรวน". Biometrika . 40 (3/4): 318– 335. doi : 10.1093/biomet/40.3-4.318 . JSTOR 2333350 .
- Fisher, RA (เมษายน 1921). "การศึกษาความแปรปรวนของพืชผล I. การตรวจสอบผลผลิตของเมล็ดพืชที่แต่งแล้วจาก Broadbalk" วารสารวิทยาศาสตร์การเกษตร 11 ( 2): 107– 135. doi : 10.1017/S0021859600003750 . hdl : 2440/15170 . รหัสผลลัพธ์ CORE 162101431 .
ลิงก์ภายนอก
- SOCR : กิจกรรม ANOVA
- ตัวอย่างของแบบจำลอง ANOVA และ ANCOVA ทั้งหมดที่มีปัจจัยการรักษาได้สูงสุดสามปัจจัย รวมถึงแบบบล็อกสุ่ม แบบแบ่งแปลง แบบวัดซ้ำ และแบบลาตินสแควร์ และการวิเคราะห์ใน R (มหาวิทยาลัยเซาแธมป์ตัน)
- คู่มืออิเล็กทรอนิกส์ NIST/SEMATECH ว่าด้วยวิธีทางสถิติส่วนที่ 7.4.3: "ค่าเฉลี่ยเท่ากันหรือไม่?"
- การวิเคราะห์ความแปรปรวน: บทนำ
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การวิเคราะห์ความแปรปรวน
การวิเคราะห์ความแปรปรวน ( ANOVA ) เป็นกลุ่มของ วิธีการทางสถิติ ที่ใช้ในการเปรียบเทียบค่า เฉลี่ย ของกลุ่มสองกลุ่มขึ้นไปโดยการวิเคราะห์ความแปรปรวน โดยเฉพาะอย่างยิ่ง ANOVA...
ประวัติศาสตร์
แม้ว่าการวิเคราะห์ความแปรปรวนจะประสบความสำเร็จในศตวรรษที่ 20 แต่ต้นกำเนิดนั้นย้อนกลับไปหลายศตวรรษตามที่ Stigler กล่าว ไว้ [ 1 ] ซึ่งรวมถึงการทดสอบสมมติฐาน การแบ่งผลรวมกำลังสอง เทคนิคการทดลอง และแบบจำลองแบบบวก Laplace ได้ทำการทดสอบสมมติฐานในช่วงทศวรรษที่ 1770...
ตัวอย่าง
การวิเคราะห์ความแปรปรวนสามารถใช้เพื่ออธิบายความสัมพันธ์ที่ซับซ้อนระหว่างตัวแปรต่างๆ ได้ การประกวดสุนัขเป็นตัวอย่างหนึ่ง การประกวดสุนัขไม่ใช่การสุ่มตัวอย่างของสายพันธุ์ แต่โดยทั่วไปแล้วจะจำกัดเฉพาะสุนัขที่โตเต็มวัย พันธุ์แท้ และมีลักษณะดีเยี่ยม...
คลาสของโมเดล
ในการวิเคราะห์ความแปรปรวนมีแบบจำลองอยู่ 3 ประเภท ซึ่งจะอธิบายไว้ในที่นี้