อ่าน 8 นาที
ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุและผล
วลี " ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ " หมายถึงความไม่สามารถอนุมาน ความสัมพันธ์แบบเหตุและผล ระหว่างเหตุการณ์หรือ ตัวแปร สองตัวได้อย่างถูกต้อง โดยอาศัยเพียงความสัมพันธ์หรือ...
ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุและผล
วลี " ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ " หมายถึงความไม่สามารถอนุมานความสัมพันธ์แบบเหตุและผลระหว่างเหตุการณ์หรือตัวแปร สองตัวได้อย่างถูกต้อง โดยอาศัยเพียงความสัมพันธ์หรือความเกี่ยวโยง ที่สังเกตได้ ระหว่างกัน[ 1 ] [ 2 ]แนวคิดที่ว่า "ความสัมพันธ์หมายถึงสาเหตุ" เป็นตัวอย่างของความผิดพลาดทางตรรกะแบบสาเหตุที่น่าสงสัย ซึ่งเหตุการณ์สองเหตุการณ์ที่เกิดขึ้นพร้อมกันถูกมองว่าได้สร้างความสัมพันธ์แบบเหตุและผล ความผิดพลาดนี้ยังเป็นที่รู้จักกันในชื่อภาษาละตินว่า cum hoc ergo propter hoc ("ด้วยสิ่งนี้ ดังนั้นเพราะสิ่งนี้") ซึ่งแตกต่างจากความผิดพลาดที่เรียกว่าpost hoc ergo propter hoc ("หลังจากนี้ ดังนั้นเพราะสิ่งนี้") ซึ่งเหตุการณ์ที่เกิดขึ้นตามหลังอีกเหตุการณ์หนึ่งถูกมองว่าเป็นผลที่ตามมาที่จำเป็นของเหตุการณ์ก่อนหน้า และจากการรวมเข้าด้วยกันอย่างผิดพลาดของเหตุการณ์ ความคิด ฐานข้อมูล ฯลฯ สองอย่างเข้าด้วยกัน
เช่นเดียวกับความผิดพลาดทางตรรกะใดๆ การระบุว่าเหตุผลเบื้องหลังข้อโต้แย้งนั้นมีข้อบกพร่องไม่ได้หมายความว่าข้อสรุปที่ได้นั้นเป็นเท็จเสมอไป มีการเสนอวิธี การทางสถิติที่ใช้ความสัมพันธ์เป็นพื้นฐานสำหรับการทดสอบสมมติฐานเกี่ยวกับความเป็นเหตุเป็นผล รวมถึงการทดสอบความเป็นเหตุเป็นผลของแกรนเจอร์และการทำแผนที่ไขว้แบบบรรจบกันเกณฑ์ของ แบรดฟอร์ด ฮิลล์ หรือที่รู้จักกันในชื่อเกณฑ์ของฮิลล์สำหรับความเป็นเหตุเป็นผล คือกลุ่มของหลักการเก้าข้อที่สามารถนำมาใช้พิจารณาหลักฐานทางระบาดวิทยาของความสัมพันธ์เชิงสาเหตุได้ ในที่สุดแล้ว จำเป็นต้องมีสมมติฐานเสมอในการสรุปความเป็นเหตุเป็นผล และ กรอบ การอนุมานเชิงสาเหตุ สมัยใหม่ มุ่งเน้นไปที่การตรวจสอบความแข็งแกร่งของสมมติฐานเหล่านี้
การใช้งานและความหมายของคำศัพท์
"โดยนัย"
ในการใช้งานทั่วไป คำว่า "บ่งชี้" มักหมายถึง แนะนำมากกว่าที่ จะหมายถึง จำเป็นต้องมีอย่างไรก็ตาม ในตรรกศาสตร์การใช้คำว่า "บ่งชี้" ในเชิงเทคนิค หมายถึง "เป็นเงื่อนไขที่เพียงพอสำหรับ" [ 3 ]นั่นคือความหมายที่นักสถิติตั้งใจไว้เมื่อพวกเขากล่าวว่า ความเป็นเหตุเป็นผลนั้นไม่แน่นอน อันที่จริงp บ่งชี้ qมีความหมายในเชิงเทคนิคของเงื่อนไขเชิงวัตถุ : ถ้า p แล้ว qซึ่งแสดงเป็นp → qนั่นคือ "ถ้าสถานการณ์pเป็นจริง แล้วq ก็ตามมา" ในแง่นั้น การกล่าวว่า "ความสัมพันธ์ไม่ได้ บ่งชี้ถึงความเป็นเหตุเป็นผล" จึงถูกต้องเสมอ
"สาเหตุ"
คำว่า " สาเหตุ " (หรือ "ความเป็นเหตุเป็นผล") มีความหมายหลายอย่างในภาษาอังกฤษ ในศัพท์ทางปรัชญา "สาเหตุ" อาจหมายถึง สาเหตุ ที่จำเป็น เพียงพอ หรือมีส่วนสนับสนุนในการตรวจสอบความสัมพันธ์ "สาเหตุ" มักใช้ในความหมายว่า "สาเหตุหนึ่งที่มีส่วนสนับสนุน" (แต่ไม่จำเป็นต้องเป็นสาเหตุเดียวที่มีส่วนสนับสนุน) [ 4 ]

การวิเคราะห์เชิงสาเหตุ
การวิเคราะห์เชิงสาเหตุเป็นสาขาของการออกแบบการทดลองและสถิติที่เกี่ยวข้องกับการสร้างสาเหตุและผลกระทบ[ 5 ]โดยทั่วไปจะเกี่ยวข้องกับการสร้างองค์ประกอบสี่ประการ ได้แก่ความสัมพันธ์ลำดับเวลา (นั่นคือ สาเหตุต้องเกิดขึ้นก่อนผลกระทบที่เสนอ) กลไกทางกายภาพหรือทฤษฎีสารสนเทศ ที่น่าเชื่อถือ สำหรับผลกระทบที่สังเกตได้ซึ่งเป็นผลมาจากสาเหตุที่เป็นไปได้ และการกำจัดความเป็นไปได้ของสาเหตุทั่วไปและสาเหตุทางเลือก ("พิเศษ") การวิเคราะห์ดังกล่าวโดยปกติจะเกี่ยวข้องกับการทดลอง แบบควบคุมหรือแบบธรรมชาติอย่างน้อยหนึ่งครั้ง[ 6 ]
การอนุมานเชิงสาเหตุ
การอนุมานเชิงสาเหตุคือกระบวนการกำหนดผลกระทบที่เป็นอิสระและแท้จริงของปรากฏการณ์เฉพาะที่เป็นส่วนประกอบของระบบที่ใหญ่กว่า ความแตกต่างหลักระหว่างการอนุมานเชิงสาเหตุและการอนุมานความสัมพันธ์คือ การอนุมานเชิงสาเหตุจะวิเคราะห์การตอบสนองของตัวแปรผลกระทบเมื่อสาเหตุของตัวแปรผลกระทบเปลี่ยนแปลงไป[ 7 ] [ 8 ]
การศึกษาว่าทำไมสิ่งต่างๆ จึงเกิดขึ้นเรียกว่ามานุษยวิทยา (etiology ) และสามารถอธิบายได้โดยใช้ภาษาของสัญลักษณ์เชิงสาเหตุทางวิทยาศาสตร์การอนุมานเชิงสาเหตุกล่าวกันว่าเป็นการให้หลักฐานของความเป็นเหตุเป็นผลตามทฤษฎีของการให้เหตุผลเชิงสาเหตุการอนุมานเชิงสาเหตุได้รับการศึกษาอย่างกว้างขวางในทุกสาขาวิทยาศาสตร์ นวัตกรรมหลายอย่างในการพัฒนาและการนำวิธีการที่ออกแบบมาเพื่อกำหนดความเป็นเหตุเป็นผลไปใช้นั้นได้แพร่หลายในช่วงไม่กี่ทศวรรษที่ผ่านมา การอนุมานเชิงสาเหตุยังคงเป็นเรื่องยากโดยเฉพาะอย่างยิ่งในกรณีที่การทดลองทำได้ยากหรือเป็นไปไม่ได้ ซึ่งเป็นเรื่องปกติในวิทยาศาสตร์ส่วนใหญ่
แนวทางการอนุมานเชิงสาเหตุสามารถนำไปประยุกต์ใช้ได้อย่างกว้างขวางในสาขาวิทยาศาสตร์ทุกประเภท และวิธีการอนุมานเชิงสาเหตุหลายวิธีที่ออกแบบมาสำหรับบางสาขาก็ถูกนำไปใช้ในสาขาอื่นๆ ด้วย บทความนี้จะสรุปกระบวนการพื้นฐานเบื้องหลังการอนุมานเชิงสาเหตุและรายละเอียดของการทดสอบที่เป็นที่นิยมใช้กันทั่วไปในสาขาต่างๆ อย่างไรก็ตาม ไม่ควรเข้าใจผิดว่าวิธีการเหล่านี้ใช้ได้เฉพาะกับสาขาเหล่านั้นเท่านั้น เพียงแต่เป็นวิธีการที่ใช้กันมากที่สุดในสาขานั้นๆ
การอนุมานเชิงสาเหตุเป็นเรื่องยาก และมีการถกเถียงกันอย่างมากในหมู่นักวิทยาศาสตร์เกี่ยวกับวิธีการที่เหมาะสมในการพิจารณาความสัมพันธ์เชิงสาเหตุ แม้จะมีนวัตกรรมอื่นๆ เกิดขึ้น แต่ก็ยังคงมีความกังวลเกี่ยวกับการที่นักวิทยาศาสตร์ตีความผลลัพธ์เชิงสหสัมพันธ์ว่าเป็นสาเหตุ การใช้วิธีการที่ไม่ถูกต้อง และการจงใจบิดเบือนผลการวิเคราะห์โดยนักวิทยาศาสตร์เพื่อให้ได้ค่าประมาณที่มีนัยสำคัญทางสถิติ ความกังวลเป็นพิเศษเกิดขึ้นในการใช้แบบจำลองการถดถอย โดยเฉพาะอย่างยิ่งแบบจำลองการถดถอยเชิงเส้น
ตัวอย่างของการอนุมานสาเหตุจากความสัมพันธ์อย่างไม่สมเหตุสมผล
B เป็นสาเหตุของ A (เหตุและผลย้อนกลับ หรือ ความสัมพันธ์เชิงสาเหตุแบบย้อนกลับ)
สาเหตุย้อนกลับหรือความสัมพันธ์เชิงสาเหตุแบบกลับด้านหรือทิศทางที่ผิดเป็นความผิดพลาดที่ไม่เป็นทางการของสาเหตุที่น่าสงสัยซึ่งสาเหตุและผลกลับกัน กล่าวกันว่าสาเหตุเป็นผลและในทางกลับกัน[ 9 ]
- ตัวอย่างที่ 1
- ยิ่งสังเกตพบว่ากังหันลมหมุนเร็วขึ้นเท่าไร ก็ยิ่งสังเกตเห็นลมแรงมากขึ้นเท่านั้น
- ดังนั้น ลมจึงเกิดจากการหมุนของกังหันลม (หรือพูดง่ายๆ ก็คือ กังหันลม เป็นเครื่องจักรที่ใช้ในการผลิตลมตามชื่อเรียก)
ในตัวอย่างนี้ ความสัมพันธ์ (ความพร้อมกัน) ระหว่างกิจกรรมของกังหันลมและความเร็วลมไม่ได้หมายความว่าลมเกิดจากกังหันลม แต่กลับเป็นไปในทางตรงกันข้าม ดังที่เห็นได้จากข้อเท็จจริงที่ว่าลมไม่จำเป็นต้องมีกังหันลมจึงจะเกิดขึ้นได้ ในขณะที่กังหันลมต้องการลมเพื่อหมุน ลมสามารถสังเกตได้ในสถานที่ที่ไม่มีกังหันลมหรือมีกังหันลมที่ไม่หมุน และมีเหตุผลที่ดีที่จะเชื่อว่าลมมีอยู่ก่อนการประดิษฐ์กังหันลม
- ตัวอย่างที่ 2
- ระดับคอเลสเตอรอลต่ำมีความสัมพันธ์กับอัตราการเสียชีวิตที่เพิ่มขึ้น
- ดังนั้น ระดับคอเลสเตอรอลต่ำจึงเพิ่มความเสี่ยงต่อการเสียชีวิต
ในความเป็นจริงแล้ว ความสัมพันธ์เชิงสาเหตุกลับตรงกันข้าม เนื่องจากโรคบางชนิด เช่น มะเร็ง ทำให้ระดับคอเลสเตอรอลต่ำเนื่องจากปัจจัยหลายอย่าง เช่น การลดน้ำหนัก และยังทำให้มีอัตราการเสียชีวิตเพิ่มขึ้นด้วย[ 10 ]สิ่งนี้สามารถพบได้ในผู้ติดสุราเช่นกัน เมื่อผู้ติดสุราได้รับการวินิจฉัยว่าเป็นโรคตับแข็ง หลายคนเลิกดื่ม แต่พวกเขาก็ยังมีความเสี่ยงต่อการเสียชีวิตเพิ่มขึ้น ในกรณีเหล่านี้ โรคเหล่านั้นเป็นสาเหตุที่ทำให้ความเสี่ยงต่อการเสียชีวิตเพิ่มขึ้น แต่การเสียชีวิตที่เพิ่มขึ้นนั้นกลับถูกมองว่าเป็นผลดีที่เกิดขึ้นหลังจากได้รับการวินิจฉัย ทำให้การเปลี่ยนแปลงเพื่อสุขภาพดูเหมือนไม่ดีต่อสุขภาพ
ตัวอย่างที่ 3
ในบางกรณี อาจไม่ชัดเจนว่าสิ่งใดเป็นสาเหตุและสิ่งใดเป็นผล ตัวอย่างเช่น:
- เด็กที่ดู ทีวีมากมักมีพฤติกรรมรุนแรงที่สุด เห็นได้ชัดว่าทีวีทำให้เด็กมีพฤติกรรมรุนแรงมากขึ้น
เรื่องนี้อาจเป็นไปในทางตรงกันข้ามก็ได้ กล่าวคือ เด็กที่มีพฤติกรรมรุนแรงอาจชอบดูทีวีมากกว่าเด็กที่มีพฤติกรรมไม่รุนแรง
ตัวอย่างที่ 4
ความสัมพันธ์ระหว่างการใช้ยาเสพติด เพื่อความบันเทิง กับความผิดปกติทางจิตเวชอาจเป็นได้ทั้งสองทาง: บางทียาเสพติดอาจเป็นสาเหตุของความผิดปกติ หรือบางทีผู้คนอาจใช้ยาเสพติดเพื่อรักษาอาการที่เป็นอยู่ก่อนแล้วทฤษฎีเกี่ยวกับยาเสพติดที่เป็นจุดเริ่มต้นอาจกล่าวว่า การใช้ กัญชานำไปสู่การใช้ยาเสพติดที่รุนแรงกว่า แต่การใช้ยาเสพติดที่รุนแรงกว่าอาจนำไปสู่การใช้กัญชา (ดูเพิ่มเติมที่ ความสับสนของสิ่งที่ตรงกันข้าม ) ที่จริงแล้ว ในสาขาสังคมศาสตร์ที่มักไม่สามารถใช้การทดลองแบบควบคุมเพื่อแยกแยะทิศทางของสาเหตุได้ ความผิดพลาดนี้สามารถเป็นเชื้อเพลิงให้กับการโต้แย้งทางวิทยาศาสตร์ที่มีมายาวนาน ตัวอย่างหนึ่งสามารถพบได้ในเศรษฐศาสตร์การศึกษาระหว่างแบบจำลองการคัดกรองหรือการส่งสัญญาณกับ แบบ จำลองทุนมนุษย์ : อาจเป็นไปได้ว่าการมีพรสวรรค์โดยกำเนิดทำให้สามารถสำเร็จการศึกษาได้ หรือการสำเร็จการศึกษาช่วยสร้างความสามารถของบุคคลนั้น
ตัวอย่างที่ 5
ตัวอย่างทางประวัติศาสตร์คือชาวยุโรปในยุคกลางเชื่อว่าเหามีประโยชน์ต่อสุขภาพ เนื่องจากแทบจะไม่พบเหาบนคนป่วยเลย เหตุผลก็คือคนป่วยเพราะเหาหนีไป แต่เหตุผลที่แท้จริงคือเหามีความไวต่ออุณหภูมิร่างกาย มาก อุณหภูมิร่างกายที่เพิ่มขึ้นเล็กน้อย เช่น ในกรณีที่มีไข้จะทำให้เหาไปหาโฮสต์ใหม่เทอร์โมมิเตอร์ ทางการแพทย์ ยังไม่ถูกประดิษฐ์ขึ้น ดังนั้นจึงไม่ค่อยมีใครสังเกตเห็นการเพิ่มขึ้นของอุณหภูมิ อาการที่สังเกตได้จะปรากฏขึ้นในภายหลัง ซึ่งทำให้เข้าใจผิดว่าเหาหนีไปก่อนที่คนจะป่วย[ 11 ]
ในบางกรณี ปรากฏการณ์สองอย่างอาจเป็นสาเหตุบางส่วนของอีกอย่างหนึ่งได้ เช่น ความยากจนและการขาดการศึกษา หรือการผัดวันประกันพรุ่งและความนับถือตนเองต่ำ อย่างไรก็ตาม ผู้ที่ใช้ปรากฏการณ์ทั้งสองนี้เป็นข้อโต้แย้ง ต้องระมัดระวังอย่าให้เกิดความผิดพลาดแบบเหตุและผลวนซ้ำความยากจนเป็นสาเหตุของการขาดการศึกษา แต่ไม่ใช่ สาเหตุ เดียวและในทางกลับกัน
ปัจจัยที่สาม C (ตัวแปรที่เป็นสาเหตุร่วม) เป็นสาเหตุทั้ง A และ B
ความผิดพลาดของสาเหตุที่สาม ( หรือที่รู้จักกันในชื่อการเพิกเฉยต่อสาเหตุร่วม[ 12 ]หรือสาเหตุที่น่าสงสัย[ 12 ] ) เป็นความผิดพลาดทางตรรกะที่ความสัมพันธ์ที่ผิดพลาดถูกเข้าใจผิดว่าเป็นสาเหตุ โดยอ้างว่า X เป็นสาเหตุของ Y ในขณะที่ความเป็นจริงแล้วทั้ง X และ Y ต่างก็เกิดจาก Z นี่เป็นรูปแบบหนึ่งของ ความผิดพลาด แบบ post hoc ergo propter hocและเป็นสมาชิกของกลุ่มความผิดพลาด ประเภทสาเหตุที่น่าสงสัย
ตัวอย่างทั้งหมดที่กล่าวมานั้นเกี่ยวข้องกับตัวแปรแฝงซึ่งก็คือตัวแปรที่สามที่ซ่อนเร้นอยู่และส่งผลกระทบต่อตัวแปรทั้งสองที่สังเกตว่ามีความสัมพันธ์กัน ตัวแปรที่สามนี้ยังเป็นที่รู้จักกันในชื่อ ตัวแปร แทรกซ้อนโดยมีความแตกต่างเล็กน้อยตรงที่ตัวแปรแทรกซ้อนไม่จำเป็นต้องซ่อนเร้นและสามารถแก้ไขได้ในการวิเคราะห์ โปรดสังเกตว่าลิงก์ Wikipedia เกี่ยวกับตัวแปรแฝงจะเปลี่ยนเส้นทางไปยังตัวแปรแทรกซ้อน ความยากลำบากมักเกิดขึ้นเมื่อปัจจัยที่สาม แม้จะแตกต่างจาก A และ B โดยพื้นฐาน แต่มีความสัมพันธ์ใกล้ชิดกับ A และ/หรือ B มากจนอาจทำให้เกิดความสับสนหรือยากที่จะแยกแยะทางวิทยาศาสตร์ออกจากกันได้ (ดูตัวอย่างที่ 4)
- ตัวอย่างที่ 1
- การนอนหลับโดยสวมรองเท้ามีความสัมพันธ์อย่างมากกับการตื่นขึ้นมาพร้อมกับอาการปวดหัว
- ดังนั้น การนอนโดยสวมรองเท้าจึงทำให้ปวดหัว
ตัวอย่างข้างต้นแสดงให้เห็นถึงความผิดพลาดในการสรุปว่า "ความสัมพันธ์นำไปสู่สาเหตุ" เนื่องจากสรุปอย่างเร่งรีบว่าการนอนโดยสวมรองเท้าทำให้ปวดหัว คำอธิบายที่สมเหตุสมผลกว่าคือทั้งสองอย่างเกิดจากปัจจัยที่สาม ในกรณีนี้คือการเข้านอนขณะมึนเมาซึ่งทำให้เกิดความสัมพันธ์ขึ้น ดังนั้นข้อสรุปจึงผิด
- ตัวอย่างที่ 2
- เด็กเล็กที่นอนเปิดไฟมีโอกาสเป็นสายตา สั้นมากขึ้น เมื่อโตขึ้น
- ดังนั้น การนอนเปิดไฟจึงทำให้สายตาสั้นได้
นี่เป็นตัวอย่างทางวิทยาศาสตร์ที่ได้จากการศึกษาที่ศูนย์การแพทย์มหาวิทยาลัยเพนซิลเวเนียตี พิมพ์ในวารสาร Natureฉบับวันที่ 13 พฤษภาคม 1999 [ 13 ]การศึกษานี้ได้รับความสนใจอย่างมากในสื่อกระแสหลักในขณะนั้น[ 14 ]อย่างไรก็ตาม การศึกษาในภายหลังที่มหาวิทยาลัยโอไฮโอสเตทไม่ได้พบว่าการที่ทารกนอนโดยเปิดไฟไว้เป็นสาเหตุของการเกิดภาวะสายตาสั้น แต่พบความเชื่อมโยงที่ชัดเจนระหว่างภาวะสายตาสั้นของพ่อแม่กับการเกิดภาวะสายตาสั้นในเด็ก และยังพบว่าพ่อแม่ที่มีภาวะสายตาสั้นมีแนวโน้มที่จะเปิดไฟไว้ในห้องนอนของลูกมากกว่า[ 15 ] [ 16 ] [ 17 ] [ 18 ]ในกรณีนี้ สาเหตุของทั้งสองภาวะคือภาวะสายตาสั้นของพ่อแม่ และข้อสรุปข้างต้นจึงเป็นเท็จ
- ตัวอย่างที่ 3
- เมื่อยอดขายไอศกรีมเพิ่มขึ้น อัตราการเสียชีวิตจากการจมน้ำก็เพิ่มขึ้นอย่างรวดเร็วเช่นกัน
- ดังนั้น การกินไอศกรีมจึงทำให้จมน้ำตาย
ตัวอย่างนี้ไม่ได้ตระหนักถึงความสำคัญของช่วงเวลาและอุณหภูมิที่มีต่อยอดขายไอศกรีม ไอศกรีมขายได้ดีกว่ามากในช่วงฤดูร้อนเมื่อเทียบกับช่วงที่อากาศเย็นกว่า และในช่วงฤดูร้อนนั้นเองที่ผู้คนมีแนวโน้มที่จะทำกิจกรรมที่เกี่ยวข้องกับน้ำมากขึ้น เช่นการว่ายน้ำการเสียชีวิตจากการจมน้ำที่เพิ่มขึ้นนั้นเกิดจากการมีส่วนร่วมในกิจกรรมทางน้ำมากขึ้น ไม่ใช่เพราะไอศกรีม ดังนั้นข้อสรุปที่กล่าวมาจึงไม่ถูกต้อง
- ตัวอย่างที่ 4
- การศึกษาเชิงสมมติฐานแสดงให้เห็นความสัมพันธ์ระหว่างคะแนนความวิตกกังวลในการสอบและคะแนนความขี้อาย โดยมี ค่า r ทางสถิติ (ความแข็งแกร่งของความสัมพันธ์) เท่ากับ +.59 [ 19 ]
- ดังนั้น จึงอาจสรุปได้ง่ายๆ ว่า ความขี้อายมีส่วนทำให้เกิดความวิตกกังวลในการสอบในระดับหนึ่ง
อย่างไรก็ตาม จากการศึกษาทางจิตวิทยาหลายชิ้น พบว่าตัวแปรอีกตัวหนึ่งคือ "คะแนนความตระหนักรู้ในตนเอง" มีความสัมพันธ์ที่ชัดเจนกว่า (+0.73) กับความขี้อาย ซึ่งชี้ให้เห็นถึงปัญหา "ตัวแปรที่สาม" ที่เป็นไปได้ แต่เมื่อพบตัวแปรที่มีความสัมพันธ์กันอย่างใกล้ชิดถึงสามตัว ก็ยิ่งบ่งชี้ว่าแต่ละตัวอาจมีแนวโน้มแบบสองทิศทาง (ดู " ตัวแปรแบบสองทิศทาง " ข้างต้น) โดยเป็นกลุ่มของค่าที่มีความสัมพันธ์กันและแต่ละค่ามีอิทธิพลต่อกันในระดับหนึ่ง ดังนั้นข้อสรุปง่ายๆ ข้างต้นอาจไม่ถูกต้อง
- ตัวอย่างที่ 5
- นับตั้งแต่ทศวรรษ 1950 เป็นต้นมา ทั้งระดับ ก๊าซคาร์บอนไดออกไซด์ในบรรยากาศและ อัตรา โรคอ้วนได้เพิ่มสูงขึ้นอย่างรวดเร็ว
- ดังนั้น ก๊าซคาร์บอนไดออกไซด์ในชั้นบรรยากาศจึงเป็นสาเหตุของโรคอ้วน
ประชากรที่มีฐานะร่ำรวยมักบริโภคอาหารมากกว่าและปล่อยก๊าซคาร์บอนไดออกไซด์ (CO2 )มากกว่า
- ตัวอย่างที่ 6
- คอเลสเตอรอลHDL ("คอเลสเตอรอลดี") มีความสัมพันธ์เชิงลบกับการเกิดโรคหัวใจวาย
- ดังนั้น การรับประทานยาเพื่อเพิ่มระดับ HDL จึงช่วยลดโอกาสในการเกิดโรคหัวใจวายได้
การวิจัยเพิ่มเติม[ 20 ]ได้ตั้งคำถามถึงข้อสรุปนี้ ในทางกลับกัน อาจเป็นไปได้ว่าปัจจัยพื้นฐานอื่นๆ เช่น ยีน อาหาร และการออกกำลังกาย ส่งผลต่อทั้งระดับ HDL และความน่าจะเป็นของการเกิดโรคหัวใจวาย เป็นไปได้ว่ายาอาจส่งผลต่อปัจจัยที่วัดได้โดยตรง คือ ระดับ HDL โดยไม่ส่งผลต่อโอกาสในการเกิดโรคหัวใจวาย
ความสัมพันธ์เชิงสาเหตุแบบสองทิศทาง: A เป็นสาเหตุของ B และ B เป็นสาเหตุของ A
ความสัมพันธ์เชิงสาเหตุไม่จำเป็นต้องเป็นทางเดียวเสมอไป ในความสัมพันธ์ระหว่างผู้ล่าและเหยื่อจำนวนผู้ล่าส่งผลต่อจำนวนเหยื่อ แต่จำนวนเหยื่อ หรือปริมาณอาหาร ก็ส่งผลต่อจำนวนผู้ล่าเช่นกัน ตัวอย่างที่รู้จักกันดีอีกอย่างหนึ่งคือ นักปั่นจักรยานมีดัชนีมวลกาย ต่ำ กว่าคนที่ไม่ปั่นจักรยาน ซึ่งมักอธิบายโดยการสันนิษฐานว่าการปั่นจักรยานช่วยเพิ่ม ระดับ กิจกรรมทางกายและดังนั้นจึงลดดัชนีมวลกายลง เนื่องจากผลการศึกษาเชิงคาดการณ์ในคนที่เพิ่มการใช้จักรยานแสดงให้เห็นผลกระทบต่อดัชนีมวลกายที่น้อยกว่าการศึกษาเชิงตัดขวาง จึงอาจมีความสัมพันธ์เชิงสาเหตุแบบย้อนกลับได้เช่นกัน ตัวอย่างเช่น คนที่มีดัชนีมวลกายต่ำกว่าอาจมีแนวโน้มที่จะต้องการปั่นจักรยานตั้งแต่แรก[ 21 ]
ความสัมพันธ์ระหว่าง A และ B เป็นเพียงเรื่องบังเอิญ
ตัวแปรทั้งสองไม่เกี่ยวข้องกันเลย แต่มีความสัมพันธ์กันโดยบังเอิญ ยิ่งตรวจสอบสิ่งต่างๆ มากเท่าไหร่ โอกาสที่ตัวแปรสองตัวที่ไม่เกี่ยวข้องกันจะดูเหมือนเกี่ยวข้องกันก็ยิ่งมากขึ้นเท่านั้น ตัวอย่างเช่น:
- ผลการแข่งขันในบ้านนัดสุดท้ายของทีมวอชิงตัน คอมมานเดอร์สก่อนการเลือกตั้งประธานาธิบดีสามารถทำนายผลการเลือกตั้งประธานาธิบดีทุกครั้งตั้งแต่ปี 1936 ถึง 2000 ได้แม้ว่าผลการแข่งขันฟุตบอลจะไม่มีส่วนเกี่ยวข้องกับผลการเลือกตั้งก็ตาม สถิตินี้ถูกทำลายลงในที่สุดในปี 2004 (หรือปี 2012หากใช้กฎเดิมในรูปแบบอื่น)
- กฎหมายเมียร์ไชด์ซึ่งเชื่อมโยงสัดส่วนคะแนนเสียงของพรรคสังคมประชาธิปไตยแห่งเยอรมนีกับขนาดการผลิตเหล็กดิบในเยอรมนีตะวันตก
- ผู้นำรัสเซียหัวล้าน สลับกับผู้นำผมยาว : ผู้นำประเทศรัสเซียที่หัวล้าน (หรือเห็นได้ชัดว่าหัวล้าน) ได้ขึ้นดำรงตำแหน่งต่อจากผู้นำที่ไม่หัวล้าน ("มีผม") และในทางกลับกัน เป็นเวลากว่า 200 ปีแล้ว
- รหัสลับในพระคัมภีร์คือคำภาษาฮีบรูที่ทำนายเหตุการณ์ทางประวัติศาสตร์ซึ่งเชื่อกันว่าซ่อนอยู่ภายในคัมภีร์โทราห์ : จำนวนการผสมผสานของตัวอักษรที่มากมายมหาศาล ทำให้การปรากฏของคำใดๆ ในข้อความที่ยาวมากพอ แทบจะไม่มีนัยสำคัญทางสถิติ
การใช้ความสัมพันธ์เชิงสถิติเป็นหลักฐานทางวิทยาศาสตร์
หลักฐานทางวิทยาศาสตร์ส่วนใหญ่มีพื้นฐานมาจากความสัมพันธ์ของตัวแปร[ 22 ]ซึ่งสังเกตได้ว่าเกิดขึ้นพร้อมกัน นักวิทยาศาสตร์ระมัดระวังที่จะชี้ให้เห็นว่าความสัมพันธ์ไม่ได้หมายความถึงสาเหตุเสมอไป สมมติฐานที่ว่า A เป็นสาเหตุของ B เพียงเพราะ A มีความสัมพันธ์กับ B นั้นไม่ได้รับการยอมรับว่าเป็นรูปแบบการโต้แย้งที่ถูกต้อง อย่างไรก็ตาม บางครั้งผู้คนก็กระทำความผิดพลาดในทางตรงกันข้ามโดยการปฏิเสธความสัมพันธ์โดยสิ้นเชิง นั่นจะทำให้หลักฐานทางวิทยาศาสตร์ที่สำคัญจำนวนมากถูกปฏิเสธ[ 22 ]
เนื่องจากอาจเป็นเรื่องยากหรือเป็นไปไม่ได้ในเชิงจริยธรรมที่จะดำเนินการศึกษาแบบควบคุมแบบปกปิดสองทางเพื่อตอบคำถามบางข้อ หลักฐานเชิงสหสัมพันธ์จากหลายมุมมองที่แตกต่างกันอาจมีประโยชน์สำหรับการทำนายแม้ว่าจะไม่สามารถให้หลักฐานเชิงสาเหตุได้ก็ตาม ตัวอย่างเช่น นักสังคมสงเคราะห์อาจสนใจที่จะทราบว่าการทารุณกรรมเด็กมีความสัมพันธ์กับผลการเรียนอย่างไร แม้ว่าการทำการทดลองที่เด็กได้รับการสุ่มให้ได้รับการทารุณกรรมหรือไม่ได้รับการทารุณกรรมจะเป็นเรื่องผิดจริยธรรม นักวิจัยสามารถพิจารณากลุ่มที่มีอยู่โดยใช้การออกแบบเชิงสหสัมพันธ์ที่ไม่ใช่การทดลอง หากมีความสัมพันธ์เชิงลบระหว่างการทารุณกรรมและผลการเรียน นักวิจัยอาจใช้ความรู้เกี่ยวกับความสัมพันธ์ทางสถิตินี้เพื่อทำนายเกี่ยวกับเด็กนอกการศึกษาที่ประสบกับการทารุณกรรม แม้ว่าการศึกษาจะไม่สามารถให้หลักฐานเชิงสาเหตุที่ว่าการทารุณกรรมทำให้ผลการเรียนลดลงก็ตาม[ 23 ]
การผสมผสานระหว่างวิธีการที่มีอยู่อย่างจำกัดกับความผิดพลาดในการปฏิเสธความสัมพันธ์นั้นบางครั้งถูกนำมาใช้เพื่อโต้แย้งการค้นพบทางวิทยาศาสตร์ ตัวอย่างเช่นอุตสาหกรรมยาสูบเคยอาศัยการปฏิเสธหลักฐานความสัมพันธ์เพื่อปฏิเสธความเชื่อมโยงระหว่างค วันบุหรี่ กับมะเร็งปอด[ 24 ]เช่นเดียวกับที่นักชีววิทยาและนักสถิติโรนัลด์ ฟิชเชอร์ ทำ (บ่อยครั้งในนามของอุตสาหกรรม) [รายการที่ 1 ]ความสัมพันธ์เป็นหลักฐานทางวิทยาศาสตร์ ที่มีคุณค่า ในสาขาต่างๆ เช่น การแพทย์ จิตวิทยา และสังคมวิทยา ความสัมพันธ์จะต้องได้รับการยืนยันว่าเป็นจริงก่อน และความสัมพันธ์เชิงสาเหตุที่เป็นไปได้ทั้งหมดจะต้องได้รับการสำรวจอย่างเป็นระบบ ในที่สุด ความสัมพันธ์เพียงอย่างเดียวไม่สามารถใช้เป็นหลักฐานสำหรับความสัมพันธ์เชิงสาเหตุและผลกระทบระหว่างการรักษาและผลประโยชน์ ปัจจัยเสี่ยงและโรค หรือปัจจัยทางสังคมหรือเศรษฐกิจและผลลัพธ์ต่างๆ ได้ มันเป็นหนึ่งในประเภทของหลักฐานที่ถูกนำไปใช้ในทางที่ผิดมากที่สุด เพราะมันง่ายและน่าดึงดูดใจที่จะสรุปก่อนกำหนดโดยอาศัยการปรากฏของความสัมพันธ์ในเบื้องต้น[ 24 ]
ดูเพิ่มเติม
- การยืนยันผลลัพธ์ – ประเภทของข้อโต้แย้งที่ผิดพลาด (ความผิดพลาดทางตรรกะ)
- การเรียงตัวของจุดสุ่ม – ปรากฏการณ์ในทางสถิติ
- หลักฐานจากคำบอกเล่า – หลักฐานที่อาศัยคำให้การส่วนบุคคล
- อะโพฟีเนีย – แนวโน้มที่จะมองเห็นความเชื่อมโยงระหว่างสิ่งที่ไม่เกี่ยวข้องกัน
- รหัสลับในพระคัมภีร์ – ชุดข้อความลับที่เชื่อกันว่าถูกเข้ารหัสไว้ในข้อความภาษาฮีบรูของคัมภีร์โทราห์
- การขุดค้นข้อมูล – การใช้การวิเคราะห์ข้อมูลในทางที่ผิด
- ปรากฏการณ์การมองไปยังที่อื่น – ปรากฏการณ์ในการวิเคราะห์ทางสถิติ
- ปัญหาการเปรียบเทียบหลายรายการ – การตีความทางสถิติด้วยการทดสอบหลายครั้ง
- การวิเคราะห์ภายหลัง – การวิเคราะห์ทางสถิติที่ไม่ได้ระบุไว้ก่อนที่จะได้เห็นข้อมูล
- การทดสอบสมมติฐานที่ได้จากข้อมูล – ปัญหาของการให้เหตุผลแบบวนลูปในทางสถิติ
- เกณฑ์แบรดฟอร์ด ฮิลล์ – เกณฑ์สำหรับการวัดสาเหตุและผลกระทบ
- การอนุมานเชิงสาเหตุ – สาขาหนึ่งของสถิติ
- ความบังเอิญ # ความเป็นเหตุเป็นผล – การเกิดขึ้นพร้อมกันของเหตุการณ์ที่ไม่มีความเชื่อมโยงกัน
- ปัจจัยรบกวน – อคติในการอนุมานเชิงสาเหตุ
- ความสับสนในสิ่งที่ตรงกันข้าม – ความผิดพลาดทางตรรกะ
- คำสาปของเสื้อเจอร์ซีย์สีรุ้ง – ตัวอย่างของความผิดพลาดในการเชื่อมโยงความสัมพันธ์ในวงการกีฬา
- ปรากฏการณ์ฝรั่งเศส – ข้อสังเกตที่ว่าโรคหัวใจในชาวฝรั่งเศสนั้นน้อยกว่าที่คาดการณ์ไว้มาก
- การออกแบบการทดลอง – การออกแบบภารกิจ
- การไกล่เกลี่ย (ทางสถิติ) – แบบจำลองทางสถิติ
- การกระจายแบบปกติและไม่มีความสัมพันธ์กันไม่ได้หมายความว่าเป็นอิสระต่อกัน
- โจรสลัดในแง่ของภาวะโลกร้อน – เทพเจ้าเสียดสี
- ความสามารถในการทำซ้ำ – ลักษณะสำคัญของการวิจัยทางวิทยาศาสตร์
- ความสัมพันธ์ลวง – ความสัมพันธ์ที่ปรากฏให้เห็น แต่เป็นความสัมพันธ์เท็จ ระหว่างตัวแปรที่ไม่มีสาเหตุเกี่ยวข้องกัน
- ความสอดคล้อง (Synchronicity) – แนวคิดของจุงเกี่ยวกับการให้ความหมายแก่เหตุการณ์บังเอิญที่ไม่มีสาเหตุ
- เทเลโอโลยี – การคิดในแง่ของโชคชะตาหรือจุดประสงค์
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุและผล
วลี " ความสัมพันธ์ไม่ได้หมายความถึงสาเหตุ " หมายถึงความไม่สามารถอนุมาน ความสัมพันธ์แบบเหตุและผล ระหว่างเหตุการณ์หรือ ตัวแปร สองตัวได้อย่างถูกต้อง โดยอาศัยเพียงความสัมพันธ์หรือ...
"โดยนัย"
ในการใช้งานทั่วไป คำว่า "บ่งชี้" มักหมาย ถึง แนะนำ มากกว่าที่ จะหมายถึง จำเป็นต้องมี อย่างไรก็ตาม ใน ตรรกศาสตร์ การใช้คำว่า "บ่งชี้" ในเชิงเทคนิค หมายถึง "เป็น เงื่อนไขที่เพียงพอ สำหรับ" [ 3 ] นั่นคือความหมายที่นักสถิติตั้งใจไว้เมื่อพวกเขากล่าวว่า...
"สาเหตุ"
คำว่า " สาเหตุ " (หรือ "ความเป็นเหตุเป็นผล") มีความหมายหลายอย่างในภาษาอังกฤษ ในศัพท์ทางปรัชญา "สาเหตุ" อาจหมายถึง สาเหตุ ที่จำเป็น เพียงพอ หรือมีส่วนสนับสนุน ในการตรวจสอบความสัมพันธ์ "สาเหตุ" มักใช้ในความหมายว่า "สาเหตุหนึ่งที่มีส่วนสนับสนุน"...
การวิเคราะห์เชิงสาเหตุ
การวิเคราะห์เชิงสาเหตุ เป็นสาขาของ การออกแบบการทดลอง และ สถิติ ที่เกี่ยวข้องกับการสร้างสาเหตุและผลกระทบ [ 5 ] โดยทั่วไปจะเกี่ยวข้องกับการสร้างองค์ประกอบสี่ประการ ได้แก่ ความสัมพันธ์ ลำดับเวลา (นั่นคือ สาเหตุต้องเกิดขึ้นก่อนผลกระทบที่เสนอ) กลไกทางกายภาพหรือ...