การวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวน ( ANOVA ) เป็นกลุ่มของวิธีการทางสถิติที่ใช้ในการเปรียบเทียบค่าเฉลี่ยของกลุ่มสองกลุ่มขึ้นไปโดยการวิเคราะห์ความแปรปรวน โดยเฉพาะอย่างยิ่ง ANOVA จะเปรียบเทียบปริมาณความแปรปรวนระหว่างค่าเฉลี่ยของกลุ่มกับปริมาณความแปรปรวนภายในแต่ละกลุ่ม หากความแปรปรวนระหว่างกลุ่มมีขนาดใหญ่กว่าความแปรปรวนภายในกลุ่มอย่างมีนัยสำคัญ แสดงว่าค่าเฉลี่ยของกลุ่มเหล่านั้นน่าจะแตกต่างกัน การเปรียบเทียบนี้ทำโดยใช้การทดสอบ Fหลักการพื้นฐานของ ANOVA มาจากกฎของความแปรปรวนรวมซึ่งระบุว่าความแปรปรวนทั้งหมดในชุดข้อมูลสามารถแบ่งออกเป็นส่วนประกอบที่มาจากแหล่งที่มาต่างๆ ในกรณีของ ANOVA แหล่งที่มาเหล่านี้คือความแปรปรวนระหว่างกลุ่มและความแปรปรวนภายในกลุ่ม

ANOVA ถูกพัฒนาโดยนักสถิติ โรนัลด์ ฟิชเชอร์ในรูปแบบที่ง่ายที่สุด ANOVA เป็นการทดสอบทางสถิติ ว่า ค่าเฉลี่ยของประชากรสองกลุ่มขึ้นไปเท่ากันหรือไม่ และด้วยเหตุนี้จึงเป็นการขยายผลของการทดสอบ t ไปสู่การวิเคราะห์ค่าเฉลี่ย มากกว่าสองค่า

ประวัติศาสตร์

แม้ว่าการวิเคราะห์ความแปรปรวนจะประสบความสำเร็จในศตวรรษที่ 20 แต่ต้นกำเนิดนั้นย้อนกลับไปหลายศตวรรษตามที่Stiglerกล่าว ไว้ ^{[ 1 ]}ซึ่งรวมถึงการทดสอบสมมติฐาน การแบ่งผลรวมกำลังสอง เทคนิคการทดลอง และแบบจำลองแบบบวกLaplaceได้ทำการทดสอบสมมติฐานในช่วงทศวรรษที่ 1770 ^{[ 2 ]}ประมาณปี 1800 Laplace และGaussได้พัฒนาวิธีการกำลังสองน้อยที่สุดสำหรับการรวมการสังเกต ซึ่งปรับปรุงวิธีการที่ใช้ในดาราศาสตร์และธรณีวิทยา ในขณะนั้น นอกจากนี้ยังเริ่มต้นการศึกษามากมายเกี่ยวกับการมีส่วนร่วมในผลรวมกำลังสอง Laplace รู้จักวิธีประมาณความแปรปรวนจากผลรวมกำลังสองที่เหลือ (แทนที่จะเป็นผลรวมทั้งหมด) ^{[ 3 ]}ในปี 1827 Laplace ได้ใช้ วิธีการ กำลังสองน้อยที่สุดเพื่อแก้ไขปัญหา ANOVA เกี่ยวกับการวัดกระแสน้ำในบรรยากาศ^{[ 4 ]}ก่อนปี 1800 นักดาราศาสตร์ได้แยกข้อผิดพลาดในการสังเกตที่เกิดจากเวลาตอบสนอง (" สมการส่วนบุคคล ") และได้พัฒนาวิธีการลดข้อผิดพลาด^{[ 5 ]}วิธีการทดลองที่ใช้ในการศึกษาสมการส่วนบุคคลได้รับการยอมรับในภายหลังโดยสาขาจิตวิทยาที่กำลังเกิดขึ้นใหม่^{[ 6 ]}ซึ่งได้พัฒนาวิธีการทดลองที่แข็งแกร่ง (แฟกทอเรียลเต็มรูปแบบ) ซึ่งในไม่ช้าก็ได้เพิ่มการสุ่มและการปิดบังข้อมูลเข้าไป^{[ 7 ]}คำอธิบายที่ไม่ใช้คณิตศาสตร์ที่ชัดเจนของแบบจำลองผลกระทบแบบบวกมีให้ในปี พ.ศ. 2428 ^{[ 8 ]}

โรนัลด์ ฟิชเชอร์ได้แนะนำคำว่าความแปรปรวนและเสนอการวิเคราะห์อย่างเป็นทางการในบทความปี 1918 เกี่ยวกับพันธุศาสตร์ประชากรเชิงทฤษฎี เรื่อง " ความสัมพันธ์ระหว่างญาติโดยอาศัยสมมติฐานการถ่ายทอดทางพันธุกรรมแบบเมนเดล" [ ^{9 ] การ}ประยุกต์ใช้การวิเคราะห์ความแปรปรวนกับการวิเคราะห์ข้อมูลครั้งแรกของเขาได้รับการตีพิมพ์ในปี 1921 ในหนังสือ Studies in Crop Variation I [ ^{10 ] ซึ่ง}แบ่งความแปรปรวนของอนุกรมเวลาออกเป็นส่วนประกอบที่แสดงถึงสาเหตุรายปีและการเสื่อมสภาพอย่างช้าๆ ผลงานชิ้นต่อไปของฟิชเชอร์ เรื่องStudies in Crop Variation IIซึ่งเขียนร่วมกับวินิเฟรด แมคเคนซีและตีพิมพ์ในปี 1923 ได้ศึกษาความแปรปรวนของผลผลิตในแปลงที่ปลูกด้วยพันธุ์พืชที่แตกต่างกันและได้รับการบำบัดด้วยปุ๋ยที่แตกต่างกัน^{[ 11 ]} การวิเคราะห์ความแปรปรวนเป็นที่รู้จักกันอย่างแพร่หลายหลังจากที่ถูกรวมอยู่ในหนังสือ Statistical Methods for Research Workers ของฟิชเชอร์ ใน ปี 1925

นักวิจัยหลายคนได้พัฒนารูปแบบการสุ่มขึ้นมา โดยรูปแบบแรกได้รับการตีพิมพ์เป็นภาษาโปแลนด์โดยJerzy Neymanในปี พ.ศ. 2466 ^{[ 12 ]}

ตัวอย่าง

การวิเคราะห์ความแปรปรวนสามารถใช้เพื่ออธิบายความสัมพันธ์ที่ซับซ้อนระหว่างตัวแปรต่างๆ ได้ การประกวดสุนัขเป็นตัวอย่างหนึ่ง การประกวดสุนัขไม่ใช่การสุ่มตัวอย่างของสายพันธุ์ แต่โดยทั่วไปแล้วจะจำกัดเฉพาะสุนัขที่โตเต็มวัย พันธุ์แท้ และมีลักษณะดีเยี่ยม ฮิสโตแกรมของน้ำหนักสุนัขจากการประกวดจึงมักจะค่อนข้างซับซ้อน เช่น การกระจายสีเหลือง-ส้มที่แสดงในภาพประกอบ สมมติว่าเราต้องการทำนายน้ำหนักของสุนัขโดยพิจารณาจากลักษณะเฉพาะบางอย่างของสุนัขแต่ละตัว วิธีหนึ่งที่จะทำได้คือการอธิบายการกระจายของน้ำหนักโดยการแบ่งประชากรสุนัขออกเป็นกลุ่มตามลักษณะเหล่านั้น การจัดกลุ่มที่ประสบความสำเร็จจะแบ่งสุนัขออกเป็นสองกลุ่มโดย (ก) แต่ละกลุ่มมีความแปรปรวนของน้ำหนักสุนัขต่ำ (หมายความว่ากลุ่มนั้นค่อนข้างเป็นเนื้อเดียวกัน) และ (ข) ค่าเฉลี่ยของแต่ละกลุ่มแตกต่างกัน (หากสองกลุ่มมีค่าเฉลี่ยเท่ากัน ก็ไม่สมเหตุสมผลที่จะสรุปว่ากลุ่มเหล่านั้นแยกออกจากกันอย่างแท้จริง)

ในภาพประกอบด้านขวา กลุ่มต่างๆ ถูกระบุเป็นX ₁ , X ₂เป็นต้น ในภาพประกอบแรก สุนัขถูกแบ่งตามผลคูณ (ปฏิสัมพันธ์) ของกลุ่มไบนารีสองกลุ่ม ได้แก่ อายุน้อยกับอายุมาก และขนสั้นกับขนยาว (เช่น กลุ่ม 1 คือสุนัขอายุน้อยขนสั้น กลุ่ม 2 คือสุนัขอายุน้อยขนยาว เป็นต้น) เนื่องจากค่าความแปรปรวนของน้ำหนักสุนัขภายในแต่ละกลุ่ม (แสดงด้วยสีน้ำเงิน) ค่อนข้างสูง และเนื่องจากค่าเฉลี่ยใกล้เคียงกันมากในแต่ละกลุ่ม การจัดกลุ่มสุนัขตามลักษณะเหล่านี้จึงไม่ได้ให้ผลลัพธ์ที่มีประสิทธิภาพในการอธิบายความแปรปรวนของน้ำหนักสุนัข กล่าวคือ การรู้ว่าสุนัขอยู่ในกลุ่มใดไม่ได้ช่วยให้เราคาดการณ์น้ำหนักของมันได้ดีไปกว่าการรู้ว่าสุนัขตัวนั้นเข้าร่วมการประกวดสุนัข ดังนั้น การจัดกลุ่มนี้จึงไม่สามารถอธิบายความแปรปรวนในภาพรวม (สีเหลือง-ส้ม) ได้

การพยายามอธิบายการกระจายน้ำหนักโดยการจัดกลุ่มสุนัขเป็นสุนัขเลี้ยงกับสุนัขใช้งานและสุนัขที่มีสมรรถภาพทางกายต่ำกับสุนัขที่มีสมรรถภาพทางกายสูงน่าจะประสบความสำเร็จมากกว่า (เหมาะสมพอสมควร) สุนัขประกวดที่มีน้ำหนักมากที่สุดมักจะเป็นสุนัขพันธุ์ใหญ่ แข็งแรง และใช้งาน ในขณะที่สุนัขที่เลี้ยงไว้เป็นสัตว์เลี้ยงมักจะมีขนาดเล็กกว่าและน้ำหนักเบากว่า ดังที่แสดงในภาพประกอบที่สอง การกระจายตัวมีค่าความแปรปรวนที่น้อยกว่าในกรณีแรกอย่างมาก และค่าเฉลี่ยก็แยกแยะได้ง่ายกว่า อย่างไรก็ตาม การทับซ้อนกันอย่างมีนัยสำคัญของการกระจายตัว เช่น หมายความว่าเราไม่สามารถแยกแยะX ₁และX ₂ได้อย่างน่าเชื่อถือ การจัดกลุ่มสุนัขตามการโยนเหรียญอาจทำให้ได้การกระจายตัวที่ดูคล้ายกัน

การพยายามอธิบายน้ำหนักตามสายพันธุ์มักจะได้ผลลัพธ์ที่สอดคล้องกันเป็นอย่างดี สุนัขพันธุ์ชิวาวาทุกตัวมีน้ำหนักเบา และสุนัขพันธุ์เซนต์เบอร์นาร์ดทุกตัวมีน้ำหนักมาก ความแตกต่างของน้ำหนักระหว่างสุนัขพันธุ์เซ็ตเตอร์และพอยน์เตอร์ไม่ได้บ่งชี้ถึงการแยกสายพันธุ์ การวิเคราะห์ความแปรปรวนเป็นเครื่องมือที่เป็นทางการที่ช่วยยืนยันการตัดสินใจโดยสัญชาตญาณเหล่านี้ การใช้งานทั่วไปของวิธีนี้คือการวิเคราะห์ข้อมูลจากการทดลองหรือการพัฒนาแบบจำลอง วิธีนี้มีข้อดีบางประการเหนือกว่าการหาความสัมพันธ์ คือ ข้อมูลไม่จำเป็นต้องเป็นตัวเลขทั้งหมด และผลลัพธ์อย่างหนึ่งของวิธีนี้คือการตัดสินใจเกี่ยวกับความเชื่อมั่นในความสัมพันธ์เชิงอธิบาย

คลาสของโมเดล

ในการวิเคราะห์ความแปรปรวนมีแบบจำลองอยู่ 3 ประเภท ซึ่งจะอธิบายไว้ในที่นี้

แบบจำลองผลกระทบคงที่

แบบจำลองผลกระทบคงที่ (ประเภทที่ 1) ของการวิเคราะห์ความแปรปรวนใช้ได้กับสถานการณ์ที่ผู้ทำการทดลองใช้การรักษาอย่างน้อยหนึ่งอย่างกับกลุ่มตัวอย่างเพื่อดูว่า ค่า ตัวแปรตอบสนองเปลี่ยนแปลงไปหรือไม่ วิธีนี้ช่วยให้ผู้ทำการทดลองสามารถประมาณช่วงของค่าตัวแปรตอบสนองที่การรักษาจะสร้างขึ้นในประชากรโดยรวมได้

แบบจำลองผลกระทบแบบสุ่ม

แบบจำลองผลกระทบแบบสุ่ม (คลาส II) ใช้เมื่อการรักษาไม่คงที่ ซึ่งเกิดขึ้นเมื่อระดับปัจจัยต่างๆ ถูกสุ่มตัวอย่างจากประชากรขนาดใหญ่ เนื่องจากระดับเหล่านั้นเป็นตัวแปรสุ่มเองสมมติฐานบางประการและวิธีการเปรียบเทียบการรักษา (การขยายผลต่างแบบง่ายหลายตัวแปร) จึงแตกต่างจากแบบจำลองผลกระทบแบบคงที่^{[ 13 ]}

แบบจำลองผลกระทบแบบผสม

แบบจำลองผลกระทบแบบผสม (ประเภทที่ 3) ประกอบด้วยปัจจัยทดลองทั้งแบบผลกระทบคงที่และแบบสุ่ม โดยมีการตีความและการวิเคราะห์ที่แตกต่างกันอย่างเหมาะสมสำหรับทั้งสองประเภท

ตัวอย่าง

การทดลองทางการสอนสามารถดำเนินการโดยภาควิชาในวิทยาลัยหรือมหาวิทยาลัยเพื่อค้นหาตำราเรียนเบื้องต้นที่ดี โดยแต่ละตำราถือเป็นการทดลอง แบบจำลองผลกระทบคงที่ (fixed-effects model) จะเปรียบเทียบรายชื่อตำราที่เสนอ แบบจำลองผลกระทบสุ่ม (random-effects model) จะพิจารณาว่ามีความแตกต่างที่สำคัญหรือไม่ในรายชื่อตำราที่เลือกแบบสุ่ม แบบจำลองผลกระทบผสม (mixed-effects model) จะเปรียบเทียบตำราที่มีอยู่ (คงที่) กับทางเลือกอื่นที่เลือกแบบสุ่ม

การกำหนดผลกระทบแบบคงที่และแบบสุ่มพิสูจน์แล้วว่าทำได้ยาก โดยมีคำจำกัดความที่แข่งขันกันหลายประการ^{[ 14 ]}

ข้อสมมติฐาน

การวิเคราะห์ความแปรปรวนได้รับการศึกษาจากหลายแนวทาง โดยแนวทางที่พบมากที่สุดคือการใช้แบบจำลองเชิงเส้นที่เชื่อมโยงการตอบสนองกับการทดลองและกลุ่มทดลอง โปรดทราบว่าแบบจำลองนี้เป็นเชิงเส้นในแง่ของพารามิเตอร์ แต่อาจไม่เป็นเชิงเส้นในระดับปัจจัย การตีความทำได้ง่ายเมื่อข้อมูลมีความสมดุลในทุกปัจจัย แต่จำเป็นต้องมีความเข้าใจที่ลึกซึ้งยิ่งขึ้นสำหรับข้อมูลที่ไม่สมดุล

การวิเคราะห์ตำราเรียนโดยใช้การแจกแจงแบบปกติ

การวิเคราะห์ความแปรปรวนสามารถนำเสนอได้ในรูปของแบบจำลองเชิงเส้นซึ่งตั้งสมมติฐานเกี่ยวกับการกระจายความน่าจะเป็นของการตอบสนองดังต่อไปนี้: ^{[ 15 ]}^{[ 16 ]}^{[ 17 ]}^{[ 18 ]}

ความเป็นอิสระของการสังเกต – นี่คือข้อสมมติฐานของแบบจำลองที่ช่วยให้การวิเคราะห์ทางสถิติทำได้ง่ายขึ้น
ความปกติ – การกระจายตัวของค่าความคลาดเคลื่อน เป็น ไปตาม การกระจาย แบบปกติ
ความเท่าเทียมกัน (หรือ "ความเป็นเนื้อเดียวกัน") ของความแปรปรวน เรียกว่าโฮโมสเคดาสติกลิตี้ — ความแปรปรวนของข้อมูลในแต่ละกลุ่มควรเท่ากัน

ข้อสมมติฐานที่แยกจากกันของแบบจำลองในตำราเรียนบ่งชี้ว่าข้อผิดพลาดเป็นอิสระ เหมือนกัน และมีการกระจายแบบปกติสำหรับแบบจำลองผลกระทบคงที่ นั่นคือ ข้อผิดพลาด ( ) เป็นอิสระและ $\varepsilon$ $\varepsilon \thicksim N(0,\sigma ^{2}).$

การวิเคราะห์แบบสุ่ม

ในการทดลองแบบสุ่มควบคุมการทดลองจะถูกกำหนดให้กับหน่วยทดลองแบบสุ่ม โดยปฏิบัติตามระเบียบวิธีการทดลอง การสุ่มนี้เป็นไปอย่างเป็นกลางและประกาศไว้ก่อนที่จะทำการทดลอง การกำหนดแบบสุ่มอย่างเป็นกลางนี้ใช้เพื่อทดสอบความสำคัญของสมมติฐานว่างตามแนวคิดของCS PeirceและRonald Fisherการวิเคราะห์ตามการออกแบบนี้ได้รับการอภิปรายและพัฒนาโดยFrancis J. Anscombeที่สถานีทดลอง RothamstedและโดยOscar Kempthorneที่มหาวิทยาลัยรัฐไอโอวา [ ^{19 ] Kempthorne}และนักศึกษาของเขาตั้งสมมติฐานเกี่ยวกับการเพิ่มผลของการทดลองแต่ละหน่วยซึ่งมีการกล่าวถึงในหนังสือของ Kempthorne และDavid R. Cox ^{[ 20 ]}^{[ 21 ]}

ความสามารถในการรวมการบำบัดหน่วย

ในรูปแบบที่ง่ายที่สุด สมมติฐานเรื่องการเพิ่มผลของการรักษาต่อหน่วย^{[ nb 1 ]}ระบุว่าการตอบสนองที่สังเกตได้จากหน่วยทดลองเมื่อได้รับการรักษาสามารถเขียนได้เป็นผลรวมของการตอบสนองของหน่วยและผลของการรักษานั่นคือ^[²²^]^[²³^]^[²⁴^] สมมติฐานเรื่องการเพิ่มผลของการรักษาต่อหน่วยหมายความว่า สำหรับการรักษาทุกแบบ การรักษา ที่th มีผลเหมือนกัน ทุกประการ กับทุกหน่วยทดลอง $y_{i,j}$ $i$ $j$ $y_{i}$ $t_{j}$ $y_{i,j}=y_{i}+t_{j}.$ $j$ $j$ $t_{j}$

ตามที่ Cox และ Kempthorne กล่าวไว้สมมติฐานเรื่องการบวกกันของผลการรักษาแต่ละหน่วยนั้นโดยทั่วไปแล้วไม่สามารถพิสูจน์ได้ โดยตรงว่าเป็นเท็จ อย่างไรก็ตาม ผลที่ตามมา หลายอย่าง ของสมมติฐานนี้สามารถพิสูจน์ได้ว่าเป็นเท็จ สำหรับการทดลองแบบสุ่ม สมมติฐานเรื่องการบวกกันของผลการรักษาแต่ละหน่วยหมายความว่าความแปรปรวนมีค่าคงที่สำหรับทุกการรักษา ดังนั้น โดยหลักการผกผันเงื่อนไขที่จำเป็นสำหรับการบวกกันของผลการรักษาแต่ละหน่วยก็คือ ความแปรปรวนมีค่าคงที่

การใช้คุณสมบัติการบวกของการรักษาแต่ละหน่วยและการสุ่มนั้นคล้ายคลึงกับการอนุมานตามการออกแบบซึ่งเป็นมาตรฐานในการสุ่มตัวอย่างสำรวจ ประชากร จำกัด

แบบจำลองเชิงเส้นที่ได้มา

Kempthorne ใช้การแจกแจงแบบสุ่มและสมมติฐานของการเพิ่มการรักษาแบบหน่วยเพื่อสร้างแบบจำลองเชิงเส้นที่ได้มาซึ่งคล้ายกับแบบจำลองในตำราที่กล่าวถึงก่อนหน้านี้มาก^{[ 25 ]}สถิติการทดสอบของแบบจำลองเชิงเส้นที่ได้มานี้ใกล้เคียงกับสถิติการทดสอบของแบบจำลองเชิงเส้นปกติที่เหมาะสม ตามทฤษฎีบทการประมาณและการศึกษาการจำลอง^{[ 26 ]}อย่างไรก็ตาม มีความแตกต่างอยู่บ้าง ตัวอย่างเช่น การวิเคราะห์แบบสุ่มส่งผลให้เกิดความสัมพันธ์เชิงลบเล็กน้อยแต่ (อย่างเคร่งครัด) ระหว่างการสังเกต^{[ 27 ]}^{[ 28 ]}ในการวิเคราะห์แบบสุ่ม ไม่มีการสมมติการ แจกแจง แบบปกติและแน่นอนว่าไม่มีการสมมติความเป็นอิสระในทางตรงกันข้ามการสังเกตมีความสัมพันธ์กัน !

การวิเคราะห์โดยใช้การสุ่มมีข้อเสียคือ การอธิบายนั้นต้องใช้พีชคณิตที่ยุ่งยากและใช้เวลานาน เนื่องจากวิธีการวิเคราะห์โดยใช้การสุ่มนั้นซับซ้อนและใกล้เคียงกับวิธีการใช้แบบจำลองเชิงเส้นปกติ อาจารย์ส่วนใหญ่จึงเน้นวิธีการใช้แบบจำลองเชิงเส้นปกติมากกว่า นักสถิติส่วนน้อยเท่านั้นที่คัดค้านการวิเคราะห์แบบจำลองของการทดลองแบบสุ่มที่สมดุล

แบบจำลองทางสถิติสำหรับข้อมูลจากการสังเกต

อย่างไรก็ตาม เมื่อนำไปใช้กับข้อมูลจากการทดลองที่ไม่ใช่แบบสุ่มหรือการศึกษาเชิงสังเกตการวิเคราะห์ตามแบบจำลองจะขาดการรับรองจากการสุ่ม^{[ 29 ]}สำหรับข้อมูลเชิงสังเกต การหาช่วงความเชื่อมั่นจะต้องใช้ แบบจำลอง เชิงอัตวิสัยดังที่โรนัลด์ ฟิชเชอร์และผู้ติดตามของเขาเน้นย้ำ ในทางปฏิบัติ การประมาณผลกระทบของการรักษาจากการศึกษาเชิงสังเกตมักจะไม่สอดคล้องกัน ในทางปฏิบัติ "แบบจำลองทางสถิติ" และข้อมูลเชิงสังเกตมีประโยชน์สำหรับการแนะนำสมมติฐานที่สาธารณชนควรพิจารณาอย่างระมัดระวัง^{[ 30 ]}

สรุปข้อสมมติฐาน

การวิเคราะห์ ANOVA ตามแบบจำลองปกติจะถือว่าความแปรปรวนของค่าคลาดเคลื่อนเป็นอิสระ มีการกระจายแบบปกติ และเป็นเนื้อเดียวกัน ส่วนการวิเคราะห์แบบสุ่มจะถือว่าความแปรปรวนของค่าคลาดเคลื่อนเป็นเนื้อเดียวกันเท่านั้น (ซึ่งเป็นผลมาจากคุณสมบัติการบวกของการรักษาแบบหน่วย) และใช้กระบวนการสุ่มของการทดลอง การวิเคราะห์ทั้งสองแบบนี้จำเป็นต้องมีค่าความแปรปรวนคงที่ซึ่งเป็นข้อสมมติสำหรับการวิเคราะห์ตามแบบจำลองปกติ และเป็นผลมาจากการสุ่มและการบวกสำหรับการวิเคราะห์แบบสุ่ม

อย่างไรก็ตาม การศึกษาเกี่ยวกับกระบวนการที่เปลี่ยนแปลงความแปรปรวนมากกว่าค่าเฉลี่ย (เรียกว่าผลกระทบจากการกระจายตัว) ได้รับการดำเนินการสำเร็จโดยใช้ ANOVA ^{[ 31 ]}ไม่มี ข้อสมมติ ที่จำเป็นสำหรับ ANOVA ในรูปแบบทั่วไปทั้งหมด แต่การ ทดสอบ Fที่ใช้สำหรับการทดสอบสมมติฐาน ANOVA มีข้อสมมติและข้อจำกัดในทางปฏิบัติซึ่งยังคงเป็นที่น่าสนใจอย่างต่อเนื่อง

ปัญหาที่ไม่ตรงตามข้อสมมติของ ANOVA มักจะสามารถแปลงให้ตรงตามข้อสมมติได้ คุณสมบัติของการบวกแบบหน่วยการรักษาไม่คงที่ภายใต้ "การเปลี่ยนขนาด" ดังนั้นนักสถิติมักใช้การแปลงเพื่อให้ได้คุณสมบัติการบวกแบบหน่วยการรักษา หากคาดว่าตัวแปรตอบสนองจะเป็นไปตามตระกูลการแจกแจงความน่าจะเป็นแบบพาราเมตริก นักสถิติอาจระบุ (ในโปรโตคอลสำหรับการทดลองหรือการศึกษาเชิงสังเกต) ว่าการตอบสนองจะต้องถูกแปลงเพื่อทำให้ความแปรปรวนคงที่^{[ 32 ]}นอกจากนี้ นักสถิติอาจระบุว่าควรใช้การแปลงลอการิทึมกับการตอบสนองที่เชื่อว่าเป็นไปตามแบบจำลองการคูณ^{[ 23 ]}^{[ 33 ]} ตามทฤษฎีบทสมการเชิงฟังก์ชันของ Cauchy ลอการิทึมเป็นการแปลงต่อเนื่องเพียงอย่างเดียวที่เชื่อมโยงการดำเนินการคูณกับการดำเนินการบวกเหนือจำนวนจริง^{[ 34 ]}^{[ 35 ]}^{[ 36 ]}

ลักษณะเฉพาะ

ANOVA ใช้ในการวิเคราะห์การทดลองเปรียบเทียบ ซึ่งสนใจเฉพาะความแตกต่างของผลลัพธ์เท่านั้น ความสำคัญทางสถิติของการทดลองถูกกำหนดโดยอัตราส่วนของความแปรปรวนสองค่า อัตราส่วนนี้เป็นอิสระจากการเปลี่ยนแปลงที่เป็นไปได้หลายประการในการสังเกตการทดลอง: การเพิ่มค่าคงที่ให้กับการสังเกตทั้งหมดไม่ได้เปลี่ยนแปลงความสำคัญ การคูณการสังเกตทั้งหมดด้วยค่าคงที่ไม่ได้เปลี่ยนแปลงความสำคัญ ดังนั้นผลลัพธ์ความสำคัญทางสถิติของ ANOVA จึงเป็นอิสระจากอคติคงที่และข้อผิดพลาดในการปรับขนาด รวมถึงหน่วยที่ใช้ในการแสดงการสังเกต ในยุคของการคำนวณเชิงกล เป็นเรื่องปกติที่จะลบค่าคงที่ออกจากการสังเกตทั้งหมด (เมื่อเทียบเท่ากับการตัดตัวเลขนำหน้า) เพื่อลดความซับซ้อนในการป้อนข้อมูล^{[ 37 ]}^{[ 38 ]}นี่เป็นตัวอย่างของการเข้ารหัสข้อมูล

อัลกอริทึม

การคำนวณ ANOVA สามารถอธิบายได้ว่าเป็นการคำนวณค่าเฉลี่ยและความแปรปรวนจำนวนหนึ่ง หารความแปรปรวนสองค่า และเปรียบเทียบอัตราส่วนกับค่าในคู่มือเพื่อกำหนดนัยสำคัญทางสถิติ การคำนวณผลของการรักษาจึงเป็นเรื่องง่าย: "ผลของการรักษาใดๆ จะถูกประมาณโดยการหาผลต่างระหว่างค่าเฉลี่ยของการสังเกตที่ได้รับการรักษาและค่าเฉลี่ยทั่วไป" ^{[ 39 ]}

การแบ่งส่วนผลรวมกำลังสอง

ANOVA ใช้ศัพท์มาตรฐานแบบดั้งเดิม สมการนิยามของความแปรปรวนของตัวอย่างคือโดยที่ตัวหารเรียกว่าระดับความเป็นอิสระ (DF) ผลรวมเรียกว่าผลรวมกำลังสอง (SS) ผลลัพธ์เรียกว่าค่าเฉลี่ยกำลังสอง (MS) และพจน์กำลังสองคือค่าเบี่ยงเบนจากค่าเฉลี่ยของตัวอย่าง ANOVA ประมาณค่าความแปรปรวนของตัวอย่าง 3 ค่า ได้แก่ ความแปรปรวนทั้งหมดซึ่งคำนวณจากค่าเบี่ยงเบนของการสังเกตทั้งหมดจากค่าเฉลี่ยรวม ความแปรปรวนของข้อผิดพลาดซึ่งคำนวณจากค่าเบี่ยงเบนของการสังเกตทั้งหมดจากค่าเฉลี่ยของการทดลองที่เหมาะสม และความแปรปรวนของการทดลอง ความแปรปรวนของการทดลองคำนวณจากค่าเบี่ยงเบนของค่าเฉลี่ยของการทดลองจากค่าเฉลี่ยรวม โดยผลลัพธ์จะถูกคูณด้วยจำนวนการสังเกตในแต่ละการทดลองเพื่ออธิบายความแตกต่างระหว่างความแปรปรวนของการสังเกตและความแปรปรวนของค่าเฉลี่ย ${\textstyle s^{2}={\frac {1}{n-1}}\sum _{i}(y_{i}-{\bar {y}})^{2}}$

เทคนิคพื้นฐานคือการแบ่งผลรวมกำลังสอง ทั้งหมด (SS)ออกเป็นส่วนประกอบที่เกี่ยวข้องกับผลกระทบที่ใช้ในแบบจำลอง ตัวอย่างเช่น แบบจำลองสำหรับ ANOVA แบบง่ายที่มีการรักษาประเภทเดียวในระดับต่างๆ กัน

$SS_{\text{Total}}=SS_{\text{Error}}+SS_{\text{Treatments}}$

จำนวนองศาอิสระDFสามารถแบ่งออกได้ในลักษณะเดียวกัน: ส่วนประกอบหนึ่งในนั้น (ส่วนที่เกี่ยวกับข้อผิดพลาด) ระบุการแจกแจงแบบไคกำลังสองซึ่งอธิบายผลรวมกำลังสองที่เกี่ยวข้อง ในขณะเดียวกันก็เป็นเช่นเดียวกันสำหรับ "การรักษา" หากไม่มีผลกระทบจากการรักษา

$DF_{\text{Total}}=DF_{\text{Error}}+DF_{\text{Treatments}}$

การทดสอบF

การทดสอบ Fใช้สำหรับเปรียบเทียบปัจจัยต่างๆ ของความเบี่ยงเบนทั้งหมด ตัวอย่างเช่น ในการวิเคราะห์ความแปรปรวนแบบทางเดียว หรือแบบปัจจัยเดียว (ANOVA) จะทดสอบความมีนัยสำคัญทางสถิติโดยการเปรียบเทียบค่าสถิติการทดสอบ F

$F={\frac {\text{variance between treatments}}{\text{variance within treatments}}}$ $F={\frac {MS_{\text{Treatments}}}{MS_{\text{Error}}}}={{SS_{\text{Treatments}}/(I-1)} \over {SS_{\text{Error}}/(n_{T}-I)}}$

โดยที่MSคือค่าเฉลี่ยกำลังสอง, คือจำนวนการรักษา และคือจำนวนกรณีทั้งหมด สำหรับการแจกแจง Fโดยที่คือระดับความเป็นอิสระของตัวเศษ และคือระดับความเป็นอิสระของตัวส่วน การใช้การ แจกแจง Fเป็นตัวเลือกที่เหมาะสม เนื่องจากสถิติการทดสอบคืออัตราส่วนของผลรวมกำลังสองที่ปรับขนาดแล้วสองค่า ซึ่งแต่ละค่าเป็นไปตามการแจกแจงไคกำลังสอง ที่ปรับขนาด แล้ว $I$ $n_{T}$ $I-1$ $n_{T}-I$

ค่าที่คาดหวังของ F คือ(โดยที่คือขนาดตัวอย่างของการทดลอง) ซึ่งเท่ากับ 1 เมื่อไม่มีผลกระทบจากการทดลอง เมื่อค่าของ F เพิ่มขึ้นเกิน 1 หลักฐานจะยิ่งไม่สอดคล้องกับสมมติฐานว่างมากขึ้น วิธีการทดลองสองวิธีที่เห็นได้ชัดในการเพิ่มค่า F คือ การเพิ่มขนาดตัวอย่างและการลดความแปรปรวนของข้อผิดพลาดโดยการควบคุมการทดลองอย่างเข้มงวด $1+{n\sigma _{\text{Treatment}}^{2}}/{\sigma _{\text{Error}}^{2}}$ $n$

มีสองวิธีในการสรุปผลการทดสอบสมมติฐาน ANOVA ซึ่งทั้งสองวิธีให้ผลลัพธ์เหมือนกัน:

วิธีการตามตำราคือการเปรียบเทียบค่า F ที่สังเกตได้กับค่าวิกฤตของ F ที่กำหนดจากตาราง ค่าวิกฤตของ F เป็นฟังก์ชันของระดับความเป็นอิสระของตัวเศษและตัวส่วน และระดับนัยสำคัญ ( α ) ถ้า F ≥ F _{วิกฤต}สมมติฐานว่างจะถูกปฏิเสธ
วิธีการคำนวณด้วยคอมพิวเตอร์จะคำนวณความน่าจะเป็น ( ค่า p ) ของค่า F ที่มากกว่าหรือเท่ากับค่าที่สังเกตได้ สมมติฐานว่างจะถูกปฏิเสธหากความน่าจะเป็นนี้มีค่าน้อยกว่าหรือเท่ากับระดับนัยสำคัญ ( α )

การทดสอบ Fของ ANOVA เป็นที่ทราบกันดีว่าเกือบจะเหมาะสมที่สุดในแง่ของการลดข้อผิดพลาดเชิงลบเท็จให้น้อยที่สุดสำหรับอัตราข้อผิดพลาดเชิงบวกเท็จที่คงที่ (กล่าวคือ เพิ่มพลังสูงสุดสำหรับระดับนัยสำคัญที่คงที่) ตัวอย่างเช่น ในการทดสอบสมมติฐานที่ว่าการรักษาทางการแพทย์ต่างๆ มีผลเหมือนกันทุกประการ ค่า pของการทดสอบFจะใกล้เคียงกับ ค่า pของการทดสอบการเรียงสับเปลี่ยน : การประมาณค่าจะใกล้เคียงกันเป็นพิเศษเมื่อการออกแบบมีความสมดุล^[²⁶^]^[⁴⁰^]การทดสอบการเรียงสับเปลี่ยนดังกล่าวเป็นลักษณะ ของ การทดสอบที่มีพลังสูงสุด ต่อ สมมติฐานทางเลือกทั้งหมด ดังที่ Rosenbaumสังเกต^[^{nb 2}^] การทดสอบ FของANOVA (ของสมมติฐานว่างที่ว่าการรักษาทั้งหมดมีผลเหมือนกันทุกประการ) ได้รับการแนะนำให้เป็นการทดสอบที่ใช้งานได้จริง เนื่องจากมีความแข็งแกร่งต่อการแจกแจงทางเลือกหลายแบบ^[⁴¹^]^[^{nb 3}^]

อัลกอริทึมที่ขยายเพิ่มเติม

ANOVA ประกอบด้วยส่วนที่แยกออกจากกันได้ การแบ่งแหล่งที่มาของความแปรปรวนและการทดสอบสมมติฐานสามารถใช้แยกกันได้ ANOVA ใช้เพื่อสนับสนุนเครื่องมือทางสถิติอื่นๆ การถดถอยจะใช้ก่อนเพื่อปรับแบบจำลองที่ซับซ้อนกว่าให้เข้ากับข้อมูล จากนั้น ANOVA จะใช้ในการเปรียบเทียบแบบจำลองโดยมีวัตถุประสงค์เพื่อเลือกแบบจำลองที่ง่ายกว่า (r) ที่อธิบายข้อมูลได้อย่างเพียงพอ “แบบจำลองดังกล่าวสามารถปรับได้โดยไม่ต้องอ้างอิงถึง ANOVA แต่เครื่องมือ ANOVA สามารถใช้เพื่อทำความเข้าใจแบบจำลองที่ปรับแล้ว และเพื่อทดสอบสมมติฐานเกี่ยวกับกลุ่มสัมประสิทธิ์” ^{[ 42 ]} “เราคิดว่าการวิเคราะห์ความแปรปรวนเป็นวิธีหนึ่งในการทำความเข้าใจและจัดโครงสร้างแบบจำลองหลายระดับ ไม่ใช่เป็นทางเลือกแทนการถดถอย แต่เป็นเครื่องมือสำหรับการสรุปการอนุมานที่มีมิติสูงที่ซับซ้อน...” ^{[ 42 ]}

สำหรับปัจจัยเดียว

การทดลองที่ง่ายที่สุดที่เหมาะสมสำหรับการวิเคราะห์ ANOVA คือการทดลองแบบสุ่มสมบูรณ์ที่มีปัจจัยเดียว การทดลองที่ซับซ้อนกว่าที่มีปัจจัยเดียวเกี่ยวข้องกับข้อจำกัดในการสุ่ม และรวมถึงบล็อกแบบสุ่มสมบูรณ์และตารางละติน (และรูปแบบต่างๆ เช่นตารางกรีก-ละตินเป็นต้น) การทดลองที่ซับซ้อนกว่านั้นมีความซับซ้อนหลายอย่างคล้ายกับการทดลองที่มีหลายปัจจัย

นอกจากวิธีการวิเคราะห์ความแปรปรวนแบบทางเดียวทั่วไปแล้ว ยังมีวิธีอื่น ๆ ที่ใช้แทนได้ เช่น การทดสอบ F ของ Welch ที่มีความแปรปรวนไม่คงที่, การทดสอบ F ของ Welch ที่มีความแปรปรวนไม่คงที่โดยตัดค่าเฉลี่ยออก และความแปรปรวนแบบ Winsorized, การทดสอบ Brown-Forsythe, การทดสอบ Alexander-Govern, การทดสอบลำดับที่สองของ James และการทดสอบ Kruskal-Wallis ซึ่งมีอยู่ในโปรแกรม onewaytests R

เป็นประโยชน์ที่จะแสดงจุดข้อมูลแต่ละจุดในรูปแบบต่อไปนี้ ซึ่งเรียกว่าแบบจำลองทางสถิติ: โดยที่ $Y_{ij}=\mu +\tau _{j}+\varepsilon _{ij}$

i = 1, 2, 3, ..., R
j = 1, 2, 3, ..., C
μ = ค่าเฉลี่ยโดยรวม (ค่าเฉลี่ยเลขคณิต)
τ _j = ผลกระทบเชิงอนุพันธ์ (การตอบสนอง) ที่เกี่ยวข้องกับ ระดับ jของ X;
โดยถือว่าโดยรวมแล้วค่าของτ _jรวมกันได้เป็นศูนย์ (นั่นคือ) ${\textstyle \sum _{j=1}^{C}\tau _{j}=0}$
ε _ij = สัญญาณรบกวนหรือข้อผิดพลาดที่เกี่ยวข้องกับค่าข้อมูลij นั้นๆ

กล่าวคือ เรามองเห็นภาพแบบจำลองแบบบวกที่ระบุว่า จุดข้อมูลทุกจุดสามารถแสดงได้ด้วยการรวมปริมาณสามอย่าง ได้แก่ ค่าเฉลี่ยที่แท้จริง ซึ่งเฉลี่ยจากทุกระดับปัจจัยที่กำลังตรวจสอบ บวกกับส่วนประกอบที่เพิ่มขึ้นซึ่งเกี่ยวข้องกับคอลัมน์ (ระดับปัจจัย) เฉพาะนั้น บวกกับส่วนประกอบสุดท้ายซึ่งเกี่ยวข้องกับสิ่งอื่น ๆ ทั้งหมดที่ส่งผลต่อค่าข้อมูลเฉพาะนั้น

เนื่องจากหลายปัจจัย

ANOVA ขยายความไปสู่การศึกษาผลกระทบของปัจจัยหลายประการ เมื่อการทดลองรวมการสังเกตที่ทุกชุดค่าผสมของระดับของแต่ละปัจจัย จะเรียกว่า การทดลอง แบบแฟกทอเรียลการทดลองแบบแฟกทอเรียลมีประสิทธิภาพมากกว่าชุดการทดลองปัจจัยเดียว และประสิทธิภาพจะเพิ่มขึ้นเมื่อจำนวนปัจจัยเพิ่มขึ้น^{[ 43 ]}ดังนั้น การออกแบบแบบแฟกทอเรียลจึงถูกนำมาใช้อย่างแพร่หลาย

การใช้ ANOVA เพื่อศึกษาผลกระทบของปัจจัยหลายอย่างมีความซับซ้อน ใน ANOVA แบบ 3 ทางที่มีปัจจัย x, y และ z แบบจำลอง ANOVA จะรวมเทอมสำหรับผลกระทบหลัก (x, y, z) และเทอมสำหรับปฏิสัมพันธ์ (xy, xz, yz, xyz) เทอมทั้งหมดต้องมีการทดสอบสมมติฐาน การเพิ่มขึ้นของเทอมปฏิสัมพันธ์จะเพิ่มความเสี่ยงที่การทดสอบสมมติฐานบางอย่างจะให้ผลบวกเท็จโดยบังเอิญ โชคดีที่ประสบการณ์บอกว่าปฏิสัมพันธ์ลำดับสูงนั้นหายาก^{[ 44 ]} ความสามารถในการตรวจจับปฏิสัมพันธ์เป็นข้อได้เปรียบที่สำคัญของ ANOVA หลายปัจจัย การทดสอบปัจจัยทีละตัวจะซ่อนปฏิสัมพันธ์ แต่จะให้ผลการทดลองที่ไม่สอดคล้องกันอย่างเห็นได้ชัด^{[ 43 ]}

ควรใช้ความระมัดระวังเมื่อพบปฏิสัมพันธ์ ควรทดสอบพจน์ปฏิสัมพันธ์ก่อน และขยายการวิเคราะห์ให้มากกว่า ANOVA หากพบปฏิสัมพันธ์ ตำราต่าง ๆ มีคำแนะนำที่แตกต่างกันเกี่ยวกับการดำเนินการต่อตามขั้นตอน ANOVA หลังจากพบปฏิสัมพันธ์ ปฏิสัมพันธ์ทำให้การตีความข้อมูลการทดลองซับซ้อนขึ้น ทั้งการคำนวณความสำคัญและผลกระทบของการรักษาที่ประมาณไว้ไม่สามารถนำมาใช้ได้โดยตรง “ปฏิสัมพันธ์ที่มีนัยสำคัญมักจะบดบังความสำคัญของผลกระทบหลัก” ^{[ 45 ]}แนะนำให้ใช้วิธีการทางกราฟิกเพื่อเพิ่มความเข้าใจ การถดถอยมักมีประโยชน์ มีการอภิปรายอย่างละเอียดเกี่ยวกับปฏิสัมพันธ์ใน Cox (1958) ^{[ 46 ]}ปฏิสัมพันธ์บางอย่างสามารถกำจัดได้ (โดยการแปลง) ในขณะที่บางอย่างไม่สามารถกำจัดได้

มีการใช้เทคนิคต่างๆ มากมายกับ ANOVA แบบหลายปัจจัยเพื่อลดค่าใช้จ่าย เทคนิคหนึ่งที่ใช้ในการออกแบบแฟกทอเรียลคือการลดการทำซ้ำให้น้อยที่สุด (อาจไม่มีการทำซ้ำเลยหากได้รับการสนับสนุนจากกลอุบายในการวิเคราะห์ ) และการรวมกลุ่มเมื่อพบว่าผลกระทบไม่มีนัยสำคัญทางสถิติ (หรือในทางปฏิบัติ) การทดลองที่มีปัจจัยที่ไม่สำคัญจำนวนมากอาจยุบรวมเป็นการทดลองที่มีปัจจัยเพียงไม่กี่ปัจจัยซึ่งได้รับการสนับสนุนจากการทำซ้ำจำนวนมาก^{[ 47 ]}

การวิเคราะห์ที่เกี่ยวข้อง

จำเป็นต้องมีการวิเคราะห์บางส่วนเพื่อสนับสนุนการออกแบบการทดลอง ในขณะที่การวิเคราะห์อื่นๆ จะดำเนินการหลังจากที่พบว่าการเปลี่ยนแปลงในปัจจัยต่างๆ ส่งผลให้เกิดการเปลี่ยนแปลงที่มีนัยสำคัญทางสถิติในผลลัพธ์ เนื่องจากการทดลองเป็นกระบวนการที่ทำซ้ำ ผลลัพธ์ของการทดลองหนึ่งจึงส่งผลต่อแผนการทดลองในครั้งต่อไป

การวิเคราะห์เบื้องต้น

จำนวนหน่วยทดลอง

ในการออกแบบการทดลอง จำนวนหน่วยทดลองจะถูกวางแผนเพื่อให้บรรลุเป้าหมายของการทดลอง การทดลองมักจะดำเนินการตามลำดับ

การทดลองในระยะแรกมักถูกออกแบบมาเพื่อให้ได้ค่าประมาณที่ไม่เอนเอียงไปทางค่าเฉลี่ยของผลกระทบจากการรักษาและข้อผิดพลาดในการทดลอง ส่วนการทดลองในระยะหลังมักถูกออกแบบมาเพื่อทดสอบสมมติฐานที่ว่าผลกระทบจากการรักษานั้นมีขนาดใหญ่พอสมควร ในกรณีนี้ จำนวนหน่วยทดลองจะถูกเลือกเพื่อให้การทดลองอยู่ในงบประมาณและมีกำลังการทดสอบที่เพียงพอ รวมถึงเป้าหมายอื่นๆ ด้วย

โดยทั่วไปแล้ว การรายงานการวิเคราะห์ขนาดตัวอย่างเป็นสิ่งจำเป็นในสาขาจิตวิทยา “ให้ข้อมูลเกี่ยวกับขนาดตัวอย่างและกระบวนการที่นำไปสู่การตัดสินใจเกี่ยวกับขนาดตัวอย่าง” ^{[ 48 ]}การวิเคราะห์ซึ่งเขียนไว้ในโปรโตคอลการทดลองก่อนที่จะทำการทดลอง จะถูกตรวจสอบในใบสมัครขอรับทุนและคณะกรรมการตรวจสอบการบริหาร

นอกจากการวิเคราะห์กำลังแล้ว ยังมีวิธีการที่ไม่เป็นทางการอื่นๆ ในการเลือกจำนวนหน่วยทดลอง ซึ่งรวมถึงวิธีการทางกราฟิกที่อิงตามการจำกัดความน่าจะเป็นของข้อผิดพลาดเชิงลบเท็จ วิธีการทางกราฟิกที่อิงตามการเพิ่มขึ้นของความแปรปรวนที่คาดหวัง (เหนือค่าตกค้าง) และวิธีการทางกราฟิกที่อิงตามการบรรลุช่วงความเชื่อมั่นที่ต้องการ^{[ 49 ]}

การวิเคราะห์กำลัง

การวิเคราะห์กำลังมักถูกนำมาใช้ในบริบทของ ANOVA เพื่อประเมินความน่าจะเป็นของการปฏิเสธสมมติฐานว่างได้สำเร็จ หากเราสมมติการออกแบบ ANOVA ขนาดผลกระทบในประชากร ขนาดตัวอย่าง และระดับนัยสำคัญที่แน่นอน การวิเคราะห์กำลังสามารถช่วยในการออกแบบการศึกษาโดยการกำหนดขนาดตัวอย่างที่จำเป็นเพื่อให้มีโอกาสที่สมเหตุสมผลในการปฏิเสธสมมติฐานว่างเมื่อสมมติฐานทางเลือกเป็นจริง^{[ 50 ]}^{[ 51 ]}^{[ 52 ]}^{[ 53 ]}

ขนาดของผลกระทบ

มีการเสนอมาตรวัดผลกระทบมาตรฐานหลายรายการสำหรับ ANOVA เพื่อสรุปความแข็งแกร่งของความสัมพันธ์ระหว่างตัวทำนายและตัวแปรตาม หรือความแตกต่างมาตรฐานโดยรวมของแบบจำลองที่สมบูรณ์ การประมาณขนาดผลกระทบมาตรฐานช่วยให้สามารถเปรียบเทียบผลการค้นพบระหว่างการศึกษาและสาขาวิชาต่างๆ ได้ อย่างไรก็ตาม แม้ว่าขนาดผลกระทบมาตรฐานจะถูกใช้กันทั่วไปในเอกสารทางวิชาชีพจำนวนมาก แต่มาตรวัดขนาดผลกระทบที่ไม่เป็นมาตรฐานซึ่งมีหน่วยที่ "มีความหมาย" ในทันทีอาจเป็นที่ต้องการมากกว่าสำหรับการรายงาน^{[ 54 ]}

การยืนยันแบบจำลอง

บางครั้งมีการทดสอบเพื่อตรวจสอบว่าสมมติฐานของ ANOVA ถูกละเมิดหรือไม่ มีการตรวจสอบหรือวิเคราะห์ค่าตกค้างเพื่อยืนยันความแปรปรวนคงที่และความเป็นปกติโดยรวม^{[ 55 ]}ค่าตกค้างควรมีลักษณะเหมือนสัญญาณรบกวน (การกระจายแบบปกติที่มีค่าเฉลี่ยเป็นศูนย์) เมื่อพล็อตเป็นฟังก์ชันของสิ่งใดก็ตาม รวมถึงเวลาและค่าข้อมูลที่จำลอง แนวโน้มบ่งชี้ถึงปฏิสัมพันธ์ระหว่างปัจจัยหรือระหว่างการสังเกต

การตรวจติดตามผล

ผลลัพธ์ที่มีนัยสำคัญทางสถิติใน ANOVA มักตามมาด้วยการทดสอบเพิ่มเติม ซึ่งอาจทำเพื่อประเมินว่ากลุ่มใดแตกต่างจากกลุ่มอื่น หรือเพื่อทดสอบสมมติฐานเฉพาะเจาะจงอื่นๆ การทดสอบติดตามผลมักแบ่งตามว่าเป็นการทดสอบที่ "วางแผนไว้ล่วงหน้า" ( a priori ) หรือ"ทดสอบภายหลัง" (post hoc ) การทดสอบที่วางแผนไว้ล่วงหน้าจะถูกกำหนดก่อนที่จะพิจารณาข้อมูล ในขณะที่การทดสอบภายหลังจะถูกคิดขึ้นหลังจากพิจารณาข้อมูลแล้ว (แม้ว่าคำว่า "post hoc" จะถูกใช้ไม่สม่ำเสมอ)

การทดสอบติดตามผลอาจเป็นการเปรียบเทียบแบบ "ง่ายๆ" ระหว่างค่าเฉลี่ยของแต่ละกลุ่ม หรืออาจเป็นการเปรียบเทียบแบบ "ซับซ้อน" (เช่น การเปรียบเทียบค่าเฉลี่ยรวมของกลุ่ม A, B และ C กับค่าเฉลี่ยของกลุ่ม D) การเปรียบเทียบยังสามารถพิจารณาการทดสอบแนวโน้ม เช่น ความสัมพันธ์เชิงเส้นและเชิงกำลังสอง เมื่อตัวแปรอิสระเกี่ยวข้องกับระดับที่มีลำดับ บ่อยครั้งที่การทดสอบติดตามผลจะรวมวิธีการปรับแก้ปัญหาการเปรียบเทียบหลายครั้งไว้ ด้วย

การทดสอบติดตามผลเพื่อระบุว่ากลุ่ม ตัวแปร หรือปัจจัยใดมีค่าเฉลี่ยแตกต่างกันทางสถิติ ได้แก่การทดสอบช่วงของ Tukeyและการทดสอบช่วงหลายค่าใหม่ของ Duncanโดยทั่วไปแล้ว การทดสอบเหล่านี้มักตามด้วย ระเบียบวิธี แสดงผลแบบย่อ (Compact Letter Display: CLD)เพื่อให้ผลลัพธ์ของการทดสอบดังกล่าวมีความโปร่งใสมากขึ้นสำหรับผู้ที่ไม่ใช่ผู้เชี่ยวชาญด้านสถิติ

การออกแบบการศึกษา

มี ANOVA หลายประเภท นักสถิติหลายคนใช้ ANOVA โดยอิงตามการออกแบบการทดลอง [ ^{56 ] โดย}เฉพาะอย่างยิ่งตามโปรโตคอลที่ระบุการสุ่มจัดสรรการรักษาให้กับผู้ถูกทดลอง คำอธิบายของโปรโตคอลเกี่ยวกับกลไกการจัดสรรควรรวมถึงข้อกำหนดของโครงสร้างของการรักษาและการแบ่งกลุ่มนอกจากนี้ยังเป็นเรื่องปกติที่จะใช้ ANOVA กับข้อมูลเชิงสังเกตโดยใช้แบบจำลองทางสถิติที่เหมาะสม^{[ 57 ]}

การออกแบบที่เป็นที่นิยมบางแบบใช้ ANOVA ประเภทต่อไปนี้:

การวิเคราะห์ความแปรปรวน แบบทางเดียว (One-way ANOVA)ใช้เพื่อทดสอบความแตกต่างระหว่าง กลุ่ม อิสระ สองกลุ่มขึ้นไป (ค่าเฉลี่ย) เช่น ระดับการใช้ยูเรียที่แตกต่างกันในพืชผล หรือระดับการออกฤทธิ์ของยาปฏิชีวนะที่แตกต่างกันในแบคทีเรียหลายชนิด^{[ 58 ]}หรือระดับผลกระทบของยาบางชนิดต่อกลุ่มผู้ป่วยที่แตกต่างกัน อย่างไรก็ตาม หากกลุ่มเหล่านี้ไม่เป็นอิสระ และมีลำดับในกลุ่ม (เช่น โรคเล็กน้อย ปานกลาง และรุนแรง) หรือในปริมาณยา (เช่น 5 มก./มล. 10 มก./มล. 20 มก./มล.) ที่ให้แก่กลุ่มผู้ป่วยกลุ่มเดียวกัน ควรใช้ การประมาณแนวโน้มเชิงเส้นโดยทั่วไปแล้ว การวิเคราะห์ความแปรปรวนแบบทางเดียว (One-way ANOVA) จะใช้เพื่อทดสอบความแตกต่างระหว่างกลุ่มอย่างน้อยสามกลุ่ม เนื่องจากกรณีสองกลุ่มสามารถครอบคลุมได้ด้วย การ ทดสอบt ^{[ 59 ]}เมื่อมีค่าเฉลี่ยเพียงสองค่าที่จะเปรียบเทียบการทดสอบ t และ การทดสอบ F $ของ$ ANOVA จะเทียบเท่ากัน ความสัมพันธ์ระหว่าง ANOVA และt กำหนดโดย $F = t²$
การวิเคราะห์ความแปรปรวน แบบแฟกทอเรียล (Factorial ANOVA) ใช้เมื่อมีปัจจัยมากกว่าหนึ่งปัจจัย
การวิเคราะห์ความแปรปรวนแบบวัดซ้ำ (Repeated measures ANOVA) ใช้เมื่อใช้กลุ่มตัวอย่างเดียวกันสำหรับแต่ละปัจจัย (เช่น ในการศึกษาแบบระยะยาว )
การวิเคราะห์ความแปรปรวนหลายตัวแปร (MANOVA) ใช้เมื่อมีตัวแปรตอบสนอง มากกว่าหนึ่ง ตัว

ข้อควรระวัง

การทดลองที่สมดุล (การทดลองที่มีขนาดตัวอย่างเท่ากันสำหรับแต่ละการรักษา) นั้นตีความได้ค่อนข้างง่าย การทดลองที่ไม่สมดุลนั้นมีความซับซ้อนมากกว่า สำหรับ ANOVA แบบปัจจัยเดียว (ทางเดียว) การปรับข้อมูลที่ไม่สมดุลนั้นง่าย แต่การวิเคราะห์ที่ไม่สมดุลนั้นขาดทั้งความแข็งแกร่งและพลัง^{[ 60 ]}สำหรับการออกแบบที่ซับซ้อนกว่านั้น การขาดความสมดุลนำไปสู่ความซับซ้อนเพิ่มเติม “คุณสมบัติความเป็นตั้งฉากของผลกระทบหลักและปฏิสัมพันธ์ที่มีอยู่ในข้อมูลที่สมดุลนั้นไม่ได้ถ่ายทอดไปยังกรณีที่ไม่สมดุล ซึ่งหมายความว่าเทคนิคการวิเคราะห์ความแปรปรวนตามปกติไม่สามารถนำมาใช้ได้ ดังนั้น การวิเคราะห์แฟกทอเรียลที่ไม่สมดุลจึงยากกว่าการวิเคราะห์การออกแบบที่สมดุลมาก” ^{[ 61 ]}ในกรณีทั่วไป “การวิเคราะห์ความแปรปรวนยังสามารถนำไปใช้กับข้อมูลที่ไม่สมดุลได้ แต่ผลรวมกำลังสอง กำลังสองเฉลี่ย และ อัตราส่วน Fจะขึ้นอยู่กับลำดับที่พิจารณาแหล่งที่มาของความแปรปรวน” ^{[ 42 ]}

ANOVA เป็น (ส่วนหนึ่ง) การทดสอบความสำคัญทางสถิติ สมาคมจิตวิทยาอเมริกัน (และองค์กรอื่นๆ อีกมากมาย) ถือว่าการรายงานความสำคัญทางสถิติเพียงอย่างเดียวนั้นไม่เพียงพอ และควรรายงานขอบเขตความเชื่อมั่นด้วย^{[ 54 ]}

การสรุปโดยทั่วไป

ANOVA ถือเป็นกรณีพิเศษของการถดถอยเชิงเส้น^{[ 62 ]}^{[ 63 ]}ซึ่งในทางกลับกันก็เป็นกรณีพิเศษของ แบบ จำลองเชิงเส้นทั่วไป^{[ 64 ]}ทั้งหมดนี้ถือว่าการสังเกตเป็นผลรวมของแบบจำลอง (ความเหมาะสม) และส่วนที่เหลือ (ข้อผิดพลาด) ที่ต้องลดให้น้อยที่สุด

การทดสอบ Kruskal-Wallisและการทดสอบ Friedmanเป็นการ ทดสอบแบบ ไม่ใช้พารามิเตอร์ซึ่งไม่ขึ้นอยู่กับสมมติฐานเรื่องความปกติ^{[ 65 ]}^{[ 66 ]}

ความเชื่อมโยงกับการถดถอยเชิงเส้น

ด้านล่างนี้ เราจะอธิบายความเชื่อมโยงระหว่าง ANOVA แบบหลายตัวแปรและการถดถอยเชิงเส้นให้ชัดเจนยิ่งขึ้น

จัดเรียงข้อมูลใหม่เชิงเส้นเพื่อให้การสังเกตที่ i สัมพันธ์กับการตอบสนองและปัจจัยโดยที่แทนปัจจัยต่างๆ และคือจำนวนปัจจัยทั้งหมด ในการวิเคราะห์ความแปรปรวนแบบทางเดียว (ANOVA) และในการวิเคราะห์ความแปรปรวนแบบสองทาง (ANOVA ) นอกจากนี้ เราสมมติว่าปัจจัยที่ i มีระดับ คือตอนนี้ เราสามารถเข้ารหัสปัจจัยแบบ one-hot ลงใน เวกเตอร์มิติได้ $k$ $y_{k}$ $Z_{k,b}$ $b\in \{1,2,\ldots ,B\}$ $B$ $B=1$ $B=2$ $b$ $I_{b}$ $\{1,2,\ldots ,I_{b}\}$ ${\textstyle \sum _{b=1}^{B}I_{b}}$ $v_{k}$

ฟังก์ชันการเข้ารหัสแบบวันฮอต (one-hot encoding) ถูกกำหนดไว้โดยที่รายการที่ i ของคือ เวกเตอร์คือการรวมกันของเวกเตอร์ทั้งหมดข้างต้นสำหรับทุกค่าดังนั้นเพื่อให้ได้ANOVA ปฏิสัมพันธ์แบบ n ทางทั่วไปอย่างสมบูรณ์ เราต้องรวมพจน์ปฏิสัมพันธ์เพิ่มเติมทั้งหมดในเวกเตอร์แล้วเพิ่มพจน์ค่าคงที่เข้าไป ให้เวกเตอร์นั้นเป็น $g_{b}:\{1,2,\ldots ,I_{b}\}\mapsto \{0,1\}^{I_{b}}$ $i$ $g_{b}(Z_{k,b})$ $g_{b}(Z_{k,b})_{i}={\begin{cases}1&{\text{if }}i=Z_{k,b}\\0&{\text{otherwise}}\end{cases}}$ $v_{k}$ $b$ $v_{k}=[g_{1}(Z_{k,1}),g_{2}(Z_{k,2}),\ldots ,g_{B}(Z_{k,B})]$ $B$ $v_{k}$ $X_{k}$

เมื่อใช้สัญลักษณ์นี้แล้ว เราก็จะได้ความสัมพันธ์ที่ชัดเจนกับการถดถอยเชิงเส้น เราเพียงแค่ถดถอยค่าตอบสนองเทียบกับเวกเตอร์อย่างไรก็ตาม มีข้อกังวลเกี่ยวกับความสามารถ ในการระบุตัวตน เพื่อที่จะเอาชนะปัญหาดังกล่าว เราจึงสมมติว่าผลรวมของพารามิเตอร์ภายในแต่ละชุดของปฏิสัมพันธ์เท่ากับศูนย์ จากนั้น เราสามารถใช้ สถิติ Fหรือวิธีการอื่น ๆ เพื่อกำหนดความสำคัญของปัจจัยแต่ละตัวได้ $y_{k}$ $X_{k}$

ตัวอย่าง

เราสามารถพิจารณาตัวอย่างปฏิสัมพันธ์แบบ 2 ทาง โดยสมมติว่าปัจจัยแรกมี 2 ระดับ และปัจจัยที่สองมี 3 ระดับ

กำหนดเงื่อนไขว่าถ้าและถ้ากล่าวคือคือการเข้ารหัสแบบวันฮอตของแฟกเตอร์ตัวแรก และคือการเข้ารหัสแบบวันฮอตของแฟกเตอร์ตัวที่สอง $a_{i}=1$ $Z_{k,1}=i$ $b_{i}=1$ $Z_{k,2}=i$ $a$ $b$

ด้วยเหตุนี้ พจน์สุดท้ายจึงเป็นพจน์ค่าคงที่ สำหรับตัวอย่างที่เป็นรูปธรรมมากขึ้น สมมติว่า จากนั้น $X_{k}=[a_{1},a_{2},b_{1},b_{2},b_{3},a_{1}\times b_{1},a_{1}\times b_{2},a_{1}\times b_{3},a_{2}\times b_{1},a_{2}\times b_{2},a_{2}\times b_{3},1]$ ${\begin{aligned}Z_{k,1}&=2\\Z_{k,2}&=1\end{aligned}}$ $X_{k}=[0,1,1,0,0,0,0,0,1,0,0,1]$

ดูเพิ่มเติม

เชิงอรรถ

^ในตำราส่วนใหญ่เรียกความสามารถในการบวกของการรักษาแต่ละหน่วยว่า ความสามารถในการบวก (additivity) Hinkelmann และ Kempthorne ได้เพิ่มคำคุณศัพท์และแยกแยะความแตกต่างระหว่างความสามารถในการบวกในความหมายที่เข้มงวดและความหมายที่กว้าง ซึ่งทำให้สามารถพิจารณาแหล่งที่มาของข้อผิดพลาดหลายแหล่ง (การรักษา สถานะ การเลือก การวัด และการสุ่มตัวอย่าง) ได้อย่างละเอียดในหน้า 161
^ Rosenbaum (2002, หน้า 40) อ้างถึงหัวข้อ 5.7 (การทดสอบการเรียงสับเปลี่ยน) ทฤษฎีบท 2.3 (ที่จริงคือทฤษฎีบท 3 หน้า 184) ของหนังสือ Testing Statistical Hypothesesของ Lehmann (1959)
^การ ทดสอบ Fสำหรับการเปรียบเทียบความแปรปรวนมีชื่อเสียงที่หลากหลาย ไม่แนะนำให้ใช้เป็นการทดสอบสมมติฐานเพื่อตรวจสอบว่าตัวอย่างสอง ตัวอย่าง ที่แตกต่างกันมีความแปรปรวนเท่ากันหรือไม่ แต่แนะนำให้ใช้สำหรับการวิเคราะห์ความแปรปรวน (ANOVA) ที่เปรียบเทียบค่าประมาณความแปรปรวนสองค่าของตัวอย่างเดียวกัน แม้ว่าการทดสอบ Fโดยทั่วไปจะไม่แข็งแกร่งต่อการเบี่ยงเบนจากภาวะปกติ แต่ก็พบว่าแข็งแกร่งในกรณีพิเศษของการวิเคราะห์ความแปรปรวน อ้างอิงจาก Moore & McCabe (2003): "การวิเคราะห์ความแปรปรวนใช้สถิติ F แต่สถิติเหล่านี้ไม่เหมือนกับสถิติ F สำหรับการเปรียบเทียบค่าเบี่ยงเบนมาตรฐานของประชากรสองกลุ่ม" (หน้า 554) "การทดสอบ F และขั้นตอนอื่นๆ สำหรับการอนุมานเกี่ยวกับความแปรปรวนนั้นขาดความแข็งแกร่งจนแทบไม่มีประโยชน์ในทางปฏิบัติ" (หน้า 556) "[ การทดสอบ F ของ ANOVA ] ค่อนข้างไม่ไวต่อภาวะที่ไม่ปกติปานกลางและความแปรปรวนที่ไม่เท่ากัน โดยเฉพาะอย่างยิ่งเมื่อขนาดตัวอย่างใกล้เคียงกัน" (หน้า 763) ANOVA สมมติว่ามีความแปรปรวนคงที่ แต่ก็มีความแข็งแกร่ง การทดสอบทางสถิติเพื่อตรวจสอบความเท่าเทียมกันของความแปรปรวน ( การทดสอบ F ) นั้นไม่แข็งแกร่งพอ Moore และ McCabe แนะนำให้ใช้กฎง่ายๆ แทน

หมายเหตุ

^สติกล์เลอร์ (1986)
^สติกล์เลอร์ (1986, หน้า 134)
^สติกล์เลอร์ (1986, หน้า 153)
^สติกล์เลอร์ (1986, หน้า 154–155)
^สติกล์เลอร์ (1986, หน้า 240–242)
^สติกล์เลอร์ (1986, บทที่ 7 – จิตฟิสิกส์ในฐานะจุดโต้แย้ง)
^สติกล์เลอร์ (1986, หน้า 253)
^สติกล์เลอร์ (1986, หน้า 314–315)
^ความสัมพันธ์ระหว่างญาติโดยอาศัยสมมติฐานการถ่ายทอดทางพันธุกรรมแบบเมนเดล โรนัลด์ เอ. ฟิชเชอร์วารสารปรัชญาของราชสมาคมแห่งเอดินบะระปี 1918 (เล่มที่ 52 หน้า 399–433)
^ Fisher, Ronald A. (1921). ") การศึกษาความแปรปรวนของพืชผล I. การตรวจสอบผลผลิตของเมล็ดธัญพืชที่ผ่านการแต่งจาก Broadbalk" วารสารวิทยาศาสตร์การเกษตร 11 ( 2): 107– 135. doi : 10.1017/S0021859600003750 . hdl : 2440/15170 . S2CID 86029217 .
^ Fisher, Ronald A. (1923). ") การศึกษาความแปรปรวนของพืช. II. การตอบสนองต่อปุ๋ยของมันฝรั่งพันธุ์ต่างๆ". วารสารวิทยาศาสตร์การเกษตร . 13 (3): 311– 320. doi : 10.1017/S0021859600003592 . hdl : 2440/15179 . S2CID 85985907 .
^ Scheffé (1959, หน้า 291, "แบบจำลองการสุ่มได้รับการกำหนดขึ้นครั้งแรกโดย Neyman (1923) สำหรับการออกแบบแบบสุ่มสมบูรณ์ โดย Neyman (1935) สำหรับบล็อกแบบสุ่ม โดย Welch (1937) และ Pitman (1937) สำหรับตารางละตินภายใต้สมมติฐานว่างที่แน่นอน และโดย Kempthorne (1952, 1955) และ Wilk (1955) สำหรับการออกแบบอื่นๆ อีกมากมาย")
^มอนต์โกเมอรี (2001, บทที่ 12: การทดลองกับปัจจัยสุ่ม)
^เกลแมน (2005, หน้า 20–21)
^ Snedecor, George W.; Cochran, William G. (1967). วิธีการทางสถิติ (ฉบับที่ 6). หน้า 321.
^ Cochran & Cox (1992, หน้า 48)
^โฮเวลล์ (2002, หน้า 323)
^ Anderson, David R.; Sweeney, Dennis J.; Williams, Thomas A. (1996). สถิติสำหรับธุรกิจและเศรษฐศาสตร์ (ฉบับที่ 6). มินนิอาโปลิส/เซนต์พอล: West Pub. Co. หน้า 452–453 . ISBN 978-0-314-06378-6.
^แอนสคอมบ์ (1948)
^ Hinkelmann, Klaus; Kempthorne, Oscar (2005). การออกแบบและการวิเคราะห์การทดลอง เล่ม 2: การออกแบบการทดลองขั้นสูง สำนักพิมพ์ John Wiley หน้า 213 ISBN 978-0-471-70993-0.
^ Cox, DR (1992). การวางแผนการทดลอง . Wiley. ISBN 978-0-471-57429-3.
^เคมป์ธอร์น (1979, หน้า 30)
^ ^a ^b Cox (1958, บทที่ 2: ข้อสมมติฐานสำคัญบางประการ)
^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ตลอดทั้งเล่ม แนะนำในส่วนที่ 2.3.3: หลักการออกแบบการทดลอง; แบบจำลองเชิงเส้น; โครงร่างของแบบจำลอง)
^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.3: การออกแบบแบบสุ่มสมบูรณ์; แบบจำลองเชิงเส้นที่ได้มา)
^ ^a ^b Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.6: การออกแบบแบบสุ่มสมบูรณ์; การประมาณการทดสอบการสุ่ม)
^ Bailey (2008, บทที่ 2.14 "แบบจำลองทั่วไปมากขึ้น" ใน Bailey, หน้า 38–40)
^ Hinkelmann และ Kempthorne (2008, เล่ม 1, บทที่ 7: การเปรียบเทียบวิธีการรักษา)
^ Kempthorne (1979, หน้า 125–126, "นักทดลองต้องตัดสินใจว่าสาเหตุต่างๆ ที่เขารู้สึกว่าจะทำให้เกิดความแปรปรวนในผลลัพธ์ของเขานั้น สาเหตุใดบ้างที่ต้องควบคุมในการทดลอง สาเหตุเหล่านั้นที่เขาไม่ได้ควบคุมในการทดลอง เพราะเขาไม่ทราบถึงสาเหตุเหล่านั้น เขาต้องควบคุมโดยใช้วิธีการสุ่ม" "[เฉพาะเมื่อนักทดลองใช้การทดลองโดยใช้ขั้นตอนการสุ่มอย่างสมบูรณ์เท่านั้นที่ห่วงโซ่ของการอนุมานแบบอุปนัยจะสมเหตุสมผล ภายใต้สถานการณ์เหล่านี้ เท่านั้นที่นักทดลองสามารถระบุได้ว่าผลกระทบใดๆ ที่เขาสังเกตเห็นนั้นเกิดจากการทดลองและการทดลองเท่านั้น ภายใต้สถานการณ์เหล่านี้ ข้อสรุปของเขาจะน่าเชื่อถือในเชิงสถิติ")
^ฟรีดแมน
^มอนต์โกเมอรี (2001, ส่วนที่ 3.8: การค้นพบผลกระทบจากการกระจายตัว)
^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.10: การออกแบบแบบสุ่มสมบูรณ์; การแปลง)
^เบลีย์ (2008)
^ "สมการเชิงฟังก์ชันของโคชี "
↑โกชี, ออกัสติน หลุยส์ (1821) Cours d'analyse de l'École royale polytechnique [ หลักสูตรการวิเคราะห์ที่ Royal Polytechnic School ] (ในภาษาฝรั่งเศส) อิมพรีเมอรี่ รอยัล หน้า 106– 109. OL 6477125M .
^ "การแก้สมการโดยการกำหนดค่าของฟังก์ชันที่ไม่ทราบค่าบนเซตหนาแน่น" บรรยายเรื่องสมการเชิงฟังก์ชันและการประยุกต์ใช้คณิตศาสตร์ในวิทยาศาสตร์และวิศวกรรมศาสตร์ เล่มที่ 19 พ.ศ. 2509 หน้า 31–139 doi : 10.1016 / S0076-5392(09)60208-3 ISBN 978-0-12-043750-4.
^มอนต์โกเมอรี (2001, ส่วนที่ 3-3: การทดลองที่มีปัจจัยเดียว: การวิเคราะห์ความแปรปรวน; การวิเคราะห์แบบจำลองผลกระทบคงที่)
^ Cochran & Cox (1992, หน้า 2 ตัวอย่าง)
^ Cochran & Cox (1992, หน้า 49)
^ Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.7: การออกแบบแบบสุ่มสมบูรณ์; CRD ที่มีจำนวนการทำซ้ำไม่เท่ากัน)
^มัวร์และแมคเคบ (2003, หน้า 763)
^ ^a ^b ^cเจลแมน (2008)
^ ^a ^b Montgomery (2001, ส่วนที่ 5-2: บทนำเกี่ยวกับการออกแบบแฟกทอเรียล; ข้อดีของการออกแบบแฟกทอเรียล)
^เบลล์ (2008, ส่วนที่ 8.4: ปฏิสัมพันธ์ระดับสูงเกิดขึ้นไม่บ่อยนัก)
^มอนต์โกเมอรี (2001, ส่วนที่ 5-1: บทนำเกี่ยวกับการออกแบบเชิงแฟกทอเรียล; คำจำกัดความและหลักการพื้นฐาน)
^ค็อกซ์ (1958, บทที่ 6: แนวคิดพื้นฐานเกี่ยวกับการทดลองเชิงแฟกทอเรียล)
^มอนต์โกเมอรี (2001, ส่วนที่ 5-3.7: บทนำเกี่ยวกับการออกแบบเชิงแฟกทอเรียล; การออกแบบเชิงแฟกทอเรียลสองปัจจัย; การสังเกตหนึ่งครั้งต่อเซลล์)
^วิลกินสัน (1999, หน้า 596)
^มอนต์โกเมอรี (2001, ส่วนที่ 3-7: การกำหนดขนาดตัวอย่าง)
^โฮเวลล์ (2002, บทที่ 8: อำนาจ)
^ Howell (2002, ส่วนที่ 11.12: กำลัง (ใน ANOVA))
^ Howell (2002, ส่วนที่ 13.7: การวิเคราะห์กำลังสำหรับการทดลองแบบแฟคทอเรียล)
^มัวร์และแมคเคบ (2003, หน้า 778–780)
^ ^a ^b Wilkinson (1999, หน้า 599)
^มอนต์โกเมอรี (2001, ส่วนที่ 3-4: การตรวจสอบความเพียงพอของแบบจำลอง)
^ Cochran & Cox (1957, หน้า 9, "กฎทั่วไปคือ วิธีการดำเนินการทดลองไม่เพียงแต่กำหนดว่าจะสามารถสรุปผลได้หรือไม่ แต่ยังกำหนดวิธีการคำนวณที่จำเป็นในการสรุปผลเหล่านั้นด้วย")
^ "การออกแบบ ANOVA" . bluebox.creighton.edu . สืบค้นเมื่อ23 มกราคม 2023 .
^ "การวิเคราะห์ความแปรปรวนแบบทางเดียว/ปัจจัยเดียว"เก็บถาวรจากต้นฉบับเมื่อวันที่ 7 พฤศจิกายน 2014
^ "ความคลาดเคลื่อนที่น่าจะเป็นไปได้ของค่าเฉลี่ย" Biometrika . 6 : 1– 25. 1908. doi : 10.1093/biomet/6.1.1 . hdl : 10338.dmlcz/143545 .
^มอนต์โกเมอรี (2001, ส่วนที่ 3-3.4: ข้อมูลที่ไม่สมดุล)
^มอนต์โกเมอรี (2001, ส่วนที่ 14-2: ข้อมูลที่ไม่สมดุลในการออกแบบเชิงแฟกทอเรียล)
^เกลแมน (2005, หน้า 1) (โดยมีข้อจำกัดในเนื้อหาส่วนหลัง)
^มอนต์โกเมอรี (2001, ส่วนที่ 3.9: แนวทางการถดถอยในการวิเคราะห์ความแปรปรวน)
^โฮเวลล์ (2002, หน้า 604)
^ Howell (2002, บทที่ 18: การสุ่มตัวอย่างซ้ำและแนวทางที่ไม่ใช้พารามิเตอร์สำหรับข้อมูล)
^มอนต์โกเมอรี (2001, ส่วนที่ 3-10: วิธีการทางสถิติแบบไม่พาราเมตริกในการวิเคราะห์ความแปรปรวน)

อ่านเพิ่มเติม

ฟรีดแมน, เดวิด เอ. ; พิซานี, โรเบิร์ต; เพอร์เวส, โรเจอร์ (2007). สถิติ (ฉบับที่ 4). WW Norton & Company. ISBN 978-0-393-92972-0.
Tabachnick, Barbara G.; Fidell, Linda S. (2006). การใช้สถิติหลายตัวแปร . สำนักพิมพ์ Pearson International Edition (ฉบับที่ 5). Needham, MA: Allyn & Bacon, Inc. ISBN 978-0-205-45938-4.

Wichura, Michael J. (2006). แนวทางที่ไม่ขึ้นกับพิกัดสำหรับแบบจำลองเชิงเส้นชุดหนังสือเคมบริดจ์ด้านคณิตศาสตร์สถิติและความน่าจะเป็น สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ หน้า xiv+199 ISBN 978-0-521-86842-6. MR 2283455 .{{cite book}}: CS1 maint: location missing publisher (link)
คริสเตนเซน, โรนัลด์ (2002). คำตอบแบบระนาบสำหรับคำถามที่ซับซ้อน: ทฤษฎีแบบจำลองเชิงเส้น (ฉบับที่สาม). นิวยอร์ก: สปริงเกอร์. ISBN 978-0-387-95361-8.
Caliński, Tadeusz; Kageyama, Sanpei (2000). Block Designs: A Randomization Approach . Lecture Notes in Statistics. Vol. 150. doi : 10.1007/978-1-4612-1192-1 . ISBN 978-0-387-98578-7.
Cox, DR; Reid, Nancy (2000). ทฤษฎีการออกแบบการทดลอง . doi : 10.1201/9781420035834 . ISBN 978-0-429-12628-4.
Hettmansperger, TP; McKean, JW (1998). วิธีการทางสถิติแบบไม่ใช้พารามิเตอร์ที่ทนทาน . ห้องสมุดสถิติของ Kendall. เล่ม 5 (ฉบับพิมพ์ครั้งที่ 1). นิวยอร์ก: สำนักพิมพ์ Hodder Arnold. หน้า xiv+467. ISBN 978-0-340-54937-7MR 1604954
Lentner, Marvin; Bishop, Thomas (1993). การออกแบบและการวิเคราะห์การทดลอง (ฉบับที่ 2). Blacksburg, VA: Valley Book Company. ISBN 978-0-9616255-2-8.
Phadke, Madhav S. (1989). วิศวกรรมคุณภาพโดยใช้การออกแบบที่แข็งแกร่ง . นิวเจอร์ซีย์: Prentice Hall PTR. ISBN 978-0-13-745167-8.
Box, GEP (1954). "ทฤษฎีบทบางประการเกี่ยวกับรูปแบบกำลังสองที่ใช้ในการศึกษาปัญหาการวิเคราะห์ความแปรปรวน, II. ผลกระทบของความไม่เท่าเทียมกันของความแปรปรวนและความสัมพันธ์ระหว่างข้อผิดพลาดในการจำแนกประเภทสองทาง"วารสารสถิติคณิตศาสตร์25 ( 3): 484. doi : 10.1214/aoms/1177728717
Box, GEP (1954). "ทฤษฎีบทบางประการเกี่ยวกับรูปแบบกำลังสองที่ใช้ในการศึกษาปัญหาการวิเคราะห์ความแปรปรวน I. ผลกระทบของความไม่เท่าเทียมกันของความแปรปรวนในการจัดประเภททางเดียว"วารสารสถิติคณิตศาสตร์ 25 ( 2): 290. doi : 10.1214/aoms/1177728786

Box, GEP (1953). "ความไม่ปกติและการทดสอบความแปรปรวน". Biometrika . 40 (3/4): 318– 335. doi : 10.1093/biomet/40.3-4.318 . JSTOR 2333350 .
Fisher, RA (เมษายน 1921). "การศึกษาความแปรปรวนของพืชผล I. การตรวจสอบผลผลิตของเมล็ดพืชที่แต่งแล้วจาก Broadbalk" วารสารวิทยาศาสตร์การเกษตร 11 ( 2): 107– 135. doi : 10.1017/S0021859600003750 . hdl : 2440/15170 . รหัสผลลัพธ์ CORE 162101431 .

ลิงก์ภายนอก

SOCR : กิจกรรม ANOVA
ตัวอย่างของแบบจำลอง ANOVA และ ANCOVA ทั้งหมดที่มีปัจจัยการรักษาได้สูงสุดสามปัจจัย รวมถึงแบบบล็อกสุ่ม แบบแบ่งแปลง แบบวัดซ้ำ และแบบลาตินสแควร์ และการวิเคราะห์ใน R (มหาวิทยาลัยเซาแธมป์ตัน)
คู่มืออิเล็กทรอนิกส์ NIST/SEMATECH ว่าด้วยวิธีทางสถิติส่วนที่ 7.4.3: "ค่าเฉลี่ยเท่ากันหรือไม่?"
การวิเคราะห์ความแปรปรวน: บทนำ

[22] ในตำราส่วนใหญ่เรียกความสามารถในการบวกของการรักษาแต่ละหน่วยว่า ความสามารถในการบวก (additivity) Hinkelmann และ Kempthorne ได้เพิ่มคำคุณศัพท์และแยกแยะความแตกต่างระหว่างความสามารถในการบวกในความหมายที่เข้มงวดและความหมายที่กว้าง ซึ่งทำให้สามารถพิจารณาแหล่งที่มาของข้อผิดพลาดหลายแหล่ง (การรักษา สถานะ การเลือก การวัด และการสุ่มตัวอย่าง) ได้อย่างละเอียดในหน้า 161

[42] Rosenbaum (2002, หน้า 40) อ้างถึงหัวข้อ 5.7 (การทดสอบการเรียงสับเปลี่ยน) ทฤษฎีบท 2.3 (ที่จริงคือทฤษฎีบท 3 หน้า 184) ของหนังสือ Testing Statistical Hypothesesของ Lehmann (1959)

[44] การ ทดสอบ Fสำหรับการเปรียบเทียบความแปรปรวนมีชื่อเสียงที่หลากหลาย ไม่แนะนำให้ใช้เป็นการทดสอบสมมติฐานเพื่อตรวจสอบว่าตัวอย่างสอง ตัวอย่าง ที่แตกต่างกันมีความแปรปรวนเท่ากันหรือไม่ แต่แนะนำให้ใช้สำหรับการวิเคราะห์ความแปรปรวน (ANOVA) ที่เปรียบเทียบค่าประมาณความแปรปรวนสองค่าของตัวอย่างเดียวกัน แม้ว่าการทดสอบ Fโดยทั่วไปจะไม่แข็งแกร่งต่อการเบี่ยงเบนจากภาวะปกติ แต่ก็พบว่าแข็งแกร่งในกรณีพิเศษของการวิเคราะห์ความแปรปรวน อ้างอิงจาก Moore & McCabe (2003): "การวิเคราะห์ความแปรปรวนใช้สถิติ F แต่สถิติเหล่านี้ไม่เหมือนกับสถิติ F สำหรับการเปรียบเทียบค่าเบี่ยงเบนมาตรฐานของประชากรสองกลุ่ม" (หน้า 554) "การทดสอบ F และขั้นตอนอื่นๆ สำหรับการอนุมานเกี่ยวกับความแปรปรวนนั้นขาดความแข็งแกร่งจนแทบไม่มีประโยชน์ในทางปฏิบัติ" (หน้า 556) "[ การทดสอบ F ของ ANOVA ] ค่อนข้างไม่ไวต่อภาวะที่ไม่ปกติปานกลางและความแปรปรวนที่ไม่เท่ากัน โดยเฉพาะอย่างยิ่งเมื่อขนาดตัวอย่างใกล้เคียงกัน" (หน้า 763) ANOVA สมมติว่ามีความแปรปรวนคงที่ แต่ก็มีความแข็งแกร่ง การทดสอบทางสถิติเพื่อตรวจสอบความเท่าเทียมกันของความแปรปรวน ( การทดสอบ F ) นั้นไม่แข็งแกร่งพอ Moore และ McCabe แนะนำให้ใช้กฎง่ายๆ แทน

[1] สติกล์เลอร์ (1986)

[2] สติกล์เลอร์ (1986, หน้า 134)

[3] สติกล์เลอร์ (1986, หน้า 153)

[4] สติกล์เลอร์ (1986, หน้า 154–155)

[5] สติกล์เลอร์ (1986, หน้า 240–242)

[6] สติกล์เลอร์ (1986, บทที่ 7 – จิตฟิสิกส์ในฐานะจุดโต้แย้ง)

[7] สติกล์เลอร์ (1986, หน้า 253)

[8] สติกล์เลอร์ (1986, หน้า 314–315)

[9] ความสัมพันธ์ระหว่างญาติโดยอาศัยสมมติฐานการถ่ายทอดทางพันธุกรรมแบบเมนเดล โรนัลด์ เอ. ฟิชเชอร์วารสารปรัชญาของราชสมาคมแห่งเอดินบะระปี 1918 (เล่มที่ 52 หน้า 399–433)

[10] Fisher, Ronald A. (1921). ") การศึกษาความแปรปรวนของพืชผล I. การตรวจสอบผลผลิตของเมล็ดธัญพืชที่ผ่านการแต่งจาก Broadbalk" วารสารวิทยาศาสตร์การเกษตร 11 ( 2): 107– 135. doi : 10.1017/S0021859600003750 . hdl : 2440/15170 . S2CID 86029217 .

[11] Fisher, Ronald A. (1923). ") การศึกษาความแปรปรวนของพืช. II. การตอบสนองต่อปุ๋ยของมันฝรั่งพันธุ์ต่างๆ". วารสารวิทยาศาสตร์การเกษตร . 13 (3): 311– 320. doi : 10.1017/S0021859600003592 . hdl : 2440/15179 . S2CID 85985907 .

[12] Scheffé (1959, หน้า 291, "แบบจำลองการสุ่มได้รับการกำหนดขึ้นครั้งแรกโดย Neyman (1923) สำหรับการออกแบบแบบสุ่มสมบูรณ์ โดย Neyman (1935) สำหรับบล็อกแบบสุ่ม โดย Welch (1937) และ Pitman (1937) สำหรับตารางละตินภายใต้สมมติฐานว่างที่แน่นอน และโดย Kempthorne (1952, 1955) และ Wilk (1955) สำหรับการออกแบบอื่นๆ อีกมากมาย")

[13] มอนต์โกเมอรี (2001, บทที่ 12: การทดลองกับปัจจัยสุ่ม)

[14] เกลแมน (2005, หน้า 20–21)

[15] Snedecor, George W.; Cochran, William G. (1967). วิธีการทางสถิติ (ฉบับที่ 6). หน้า 321.

[16] Cochran & Cox (1992, หน้า 48)

[17] โฮเวลล์ (2002, หน้า 323)

[18] Anderson, David R.; Sweeney, Dennis J.; Williams, Thomas A. (1996). สถิติสำหรับธุรกิจและเศรษฐศาสตร์ (ฉบับที่ 6). มินนิอาโปลิส/เซนต์พอล: West Pub. Co. หน้า 452–453 . ISBN 978-0-314-06378-6.

[19] แอนสคอมบ์ (1948)

[20] Hinkelmann, Klaus; Kempthorne, Oscar (2005). การออกแบบและการวิเคราะห์การทดลอง เล่ม 2: การออกแบบการทดลองขั้นสูง สำนักพิมพ์ John Wiley หน้า 213 ISBN 978-0-471-70993-0.

[21] Cox, DR (1992). การวางแผนการทดลอง . Wiley. ISBN 978-0-471-57429-3.

[23] เคมป์ธอร์น (1979, หน้า 30)

[Cox-24] Cox (1958, บทที่ 2: ข้อสมมติฐานสำคัญบางประการ)

[25] Hinkelmann และ Kempthorne (2008, เล่ม 1, ตลอดทั้งเล่ม แนะนำในส่วนที่ 2.3.3: หลักการออกแบบการทดลอง; แบบจำลองเชิงเส้น; โครงร่างของแบบจำลอง)

[26] Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.3: การออกแบบแบบสุ่มสมบูรณ์; แบบจำลองเชิงเส้นที่ได้มา)

[HinkelmannKempthorne-27] Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.6: การออกแบบแบบสุ่มสมบูรณ์; การประมาณการทดสอบการสุ่ม)

[28] Bailey (2008, บทที่ 2.14 "แบบจำลองทั่วไปมากขึ้น" ใน Bailey, หน้า 38–40)

[29] Hinkelmann และ Kempthorne (2008, เล่ม 1, บทที่ 7: การเปรียบเทียบวิธีการรักษา)

[30] Kempthorne (1979, หน้า 125–126, "นักทดลองต้องตัดสินใจว่าสาเหตุต่างๆ ที่เขารู้สึกว่าจะทำให้เกิดความแปรปรวนในผลลัพธ์ของเขานั้น สาเหตุใดบ้างที่ต้องควบคุมในการทดลอง สาเหตุเหล่านั้นที่เขาไม่ได้ควบคุมในการทดลอง เพราะเขาไม่ทราบถึงสาเหตุเหล่านั้น เขาต้องควบคุมโดยใช้วิธีการสุ่ม" "[เฉพาะเมื่อนักทดลองใช้การทดลองโดยใช้ขั้นตอนการสุ่มอย่างสมบูรณ์เท่านั้นที่ห่วงโซ่ของการอนุมานแบบอุปนัยจะสมเหตุสมผล ภายใต้สถานการณ์เหล่านี้ เท่านั้นที่นักทดลองสามารถระบุได้ว่าผลกระทบใดๆ ที่เขาสังเกตเห็นนั้นเกิดจากการทดลองและการทดลองเท่านั้น ภายใต้สถานการณ์เหล่านี้ ข้อสรุปของเขาจะน่าเชื่อถือในเชิงสถิติ")

[31] ฟรีดแมน

[32] มอนต์โกเมอรี (2001, ส่วนที่ 3.8: การค้นพบผลกระทบจากการกระจายตัว)

[33] Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.10: การออกแบบแบบสุ่มสมบูรณ์; การแปลง)

[34] เบลีย์ (2008)

[35] "สมการเชิงฟังก์ชันของโคชี "

[36] โกชี, ออกัสติน หลุยส์ (1821) Cours d'analyse de l'École royale polytechnique [ หลักสูตรการวิเคราะห์ที่ Royal Polytechnic School ] (ในภาษาฝรั่งเศส) อิมพรีเมอรี่ รอยัล หน้า 106– 109. OL 6477125M .

[37] "การแก้สมการโดยการกำหนดค่าของฟังก์ชันที่ไม่ทราบค่าบนเซตหนาแน่น" บรรยายเรื่องสมการเชิงฟังก์ชันและการประยุกต์ใช้คณิตศาสตร์ในวิทยาศาสตร์และวิศวกรรมศาสตร์ เล่มที่ 19 พ.ศ. 2509 หน้า 31–139 doi : 10.1016 / S0076-5392(09)60208-3 ISBN 978-0-12-043750-4.

[38] มอนต์โกเมอรี (2001, ส่วนที่ 3-3: การทดลองที่มีปัจจัยเดียว: การวิเคราะห์ความแปรปรวน; การวิเคราะห์แบบจำลองผลกระทบคงที่)

[39] Cochran & Cox (1992, หน้า 2 ตัวอย่าง)

[40] Cochran & Cox (1992, หน้า 49)

[41] Hinkelmann และ Kempthorne (2008, เล่ม 1, ส่วนที่ 6.7: การออกแบบแบบสุ่มสมบูรณ์; CRD ที่มีจำนวนการทำซ้ำไม่เท่ากัน)

[43] มัวร์และแมคเคบ (2003, หน้า 763)

[Gelman-45] เจลแมน (2008)

[Montgomery-46] Montgomery (2001, ส่วนที่ 5-2: บทนำเกี่ยวกับการออกแบบแฟกทอเรียล; ข้อดีของการออกแบบแฟกทอเรียล)

[47] เบลล์ (2008, ส่วนที่ 8.4: ปฏิสัมพันธ์ระดับสูงเกิดขึ้นไม่บ่อยนัก)

[48] มอนต์โกเมอรี (2001, ส่วนที่ 5-1: บทนำเกี่ยวกับการออกแบบเชิงแฟกทอเรียล; คำจำกัดความและหลักการพื้นฐาน)

[49] ค็อกซ์ (1958, บทที่ 6: แนวคิดพื้นฐานเกี่ยวกับการทดลองเชิงแฟกทอเรียล)

[50] มอนต์โกเมอรี (2001, ส่วนที่ 5-3.7: บทนำเกี่ยวกับการออกแบบเชิงแฟกทอเรียล; การออกแบบเชิงแฟกทอเรียลสองปัจจัย; การสังเกตหนึ่งครั้งต่อเซลล์)

[51] วิลกินสัน (1999, หน้า 596)

[52] มอนต์โกเมอรี (2001, ส่วนที่ 3-7: การกำหนดขนาดตัวอย่าง)

[53] โฮเวลล์ (2002, บทที่ 8: อำนาจ)

[54] Howell (2002, ส่วนที่ 11.12: กำลัง (ใน ANOVA))

[55] Howell (2002, ส่วนที่ 13.7: การวิเคราะห์กำลังสำหรับการทดลองแบบแฟคทอเรียล)

[56] มัวร์และแมคเคบ (2003, หน้า 778–780)

[Wilkinson-57] Wilkinson (1999, หน้า 599)

[58] มอนต์โกเมอรี (2001, ส่วนที่ 3-4: การตรวจสอบความเพียงพอของแบบจำลอง)

[59] Cochran & Cox (1957, หน้า 9, "กฎทั่วไปคือ วิธีการดำเนินการทดลองไม่เพียงแต่กำหนดว่าจะสามารถสรุปผลได้หรือไม่ แต่ยังกำหนดวิธีการคำนวณที่จำเป็นในการสรุปผลเหล่านั้นด้วย")

[60] "การออกแบบ ANOVA" . bluebox.creighton.edu . สืบค้นเมื่อ23 มกราคม 2023 .

[61] "การวิเคราะห์ความแปรปรวนแบบทางเดียว/ปัจจัยเดียว"เก็บถาวรจากต้นฉบับเมื่อวันที่ 7 พฤศจิกายน 2014

[62] "ความคลาดเคลื่อนที่น่าจะเป็นไปได้ของค่าเฉลี่ย" Biometrika . 6 : 1– 25. 1908. doi : 10.1093/biomet/6.1.1 . hdl : 10338.dmlcz/143545 .

[63] มอนต์โกเมอรี (2001, ส่วนที่ 3-3.4: ข้อมูลที่ไม่สมดุล)

[64] มอนต์โกเมอรี (2001, ส่วนที่ 14-2: ข้อมูลที่ไม่สมดุลในการออกแบบเชิงแฟกทอเรียล)

[65] เกลแมน (2005, หน้า 1) (โดยมีข้อจำกัดในเนื้อหาส่วนหลัง)

[66] มอนต์โกเมอรี (2001, ส่วนที่ 3.9: แนวทางการถดถอยในการวิเคราะห์ความแปรปรวน)

[67] โฮเวลล์ (2002, หน้า 604)

[68] Howell (2002, บทที่ 18: การสุ่มตัวอย่างซ้ำและแนวทางที่ไม่ใช้พารามิเตอร์สำหรับข้อมูล)

[69] มอนต์โกเมอรี (2001, ส่วนที่ 3-10: วิธีการทางสถิติแบบไม่พาราเมตริกในการวิเคราะห์ความแปรปรวน)

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

9 ] การ

10 ] ซึ่ง

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

19 ] Kempthorne

[ 20 ]

[ 21 ]

[ nb 1 ]

[

[

[

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[

[

[

[

[ 42 ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 52 ]

[ 53 ]

[ 54 ]

[ 55 ]

56 ] โดย

[ 57 ]

[ 58 ]

[ 59 ]

[ 60 ]

[ 61 ]

[ 62 ]

[ 63 ]

[ 64 ]

[ 65 ]

[ 66 ]

การวิเคราะห์ความแปรปรวน

ประวัติศาสตร์

ตัวอย่าง

คลาสของโมเดล

แบบจำลองผลกระทบคงที่

แบบจำลองผลกระทบแบบสุ่ม

แบบจำลองผลกระทบแบบผสม

ตัวอย่าง

ข้อสมมติฐาน

การวิเคราะห์ตำราเรียนโดยใช้การแจกแจงแบบปกติ

การวิเคราะห์แบบสุ่ม

ความสามารถในการรวมการบำบัดหน่วย

แบบจำลองเชิงเส้นที่ได้มา

แบบจำลองทางสถิติสำหรับข้อมูลจากการสังเกต

สรุปข้อสมมติฐาน

ลักษณะเฉพาะ

อัลกอริทึม

การแบ่งส่วนผลรวมกำลังสอง

การทดสอบF

อัลกอริทึมที่ขยายเพิ่มเติม

สำหรับปัจจัยเดียว

เนื่องจากหลายปัจจัย

การวิเคราะห์ที่เกี่ยวข้อง

การวิเคราะห์เบื้องต้น

จำนวนหน่วยทดลอง

การวิเคราะห์กำลัง

ขนาดของผลกระทบ

การยืนยันแบบจำลอง

การตรวจติดตามผล

การออกแบบการศึกษา

ข้อควรระวัง

การสรุปโดยทั่วไป

ความเชื่อมโยงกับการถดถอยเชิงเส้น

ตัวอย่าง

ดูเพิ่มเติม

เชิงอรรถ

หมายเหตุ

อ่านเพิ่มเติม

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ