อ่าน 4 นาที
แผนภาพกระจาย
แผนภาพ กระจาย จุด หรือเรียกอีกอย่างว่า แผนภาพ กระจาย จุด กราฟกระจายจุด แผนภูมิ กระจายจุด แผนภาพ กระจาย จุด หรือ แผนภาพกระจายจุด [ 1 ] เป็น แผนภาพ หรือแผนภูมิ ทางคณิตศาสตร์...
แผนภาพกระจาย

แผนภาพกระจายจุดหรือเรียกอีกอย่างว่า แผนภาพ กระจายจุด กราฟกระจายจุดแผนภูมิกระจายจุด แผนภาพกระจายจุดหรือแผนภาพกระจายจุด[ 1 ] เป็น แผนภาพหรือแผนภูมิทางคณิตศาสตร์ประเภทหนึ่งที่ใช้พิกัดคาร์ทีเซียนเพื่อแสดงค่าของตัวแปร สองตัว สำหรับชุดข้อมูล หากจุดต่างๆ มีการเข้ารหัส (สี/รูปร่าง/ขนาด) จะสามารถแสดงตัวแปรเพิ่มเติมได้อีกหนึ่งตัว ข้อมูลจะแสดงเป็นชุดของจุด โดยแต่ละจุดจะมีค่าของตัวแปรหนึ่งกำหนดตำแหน่งบนแกนแนวนอน และค่าของตัวแปรอีกตัวหนึ่งกำหนดตำแหน่งบนแกนแนวตั้ง [ 2 ] แผนภาพกระจายจุดเป็นหนึ่งในเจ็ดเครื่องมือพื้นฐานของการควบคุม คุณภาพ
ประวัติศาสตร์
ตามที่ Michael Friendly และ Daniel Denis กล่าวไว้ ลักษณะเด่นที่แยกแผนภูมิกระจายออกจากแผนภูมิเส้นคือการแสดงการสังเกตเฉพาะของข้อมูลสองตัวแปร โดยที่ตัวแปรหนึ่งถูกพล็อตบนแกนแนวนอนและอีกตัวแปรหนึ่งบนแกนแนวตั้ง ตัวแปรทั้งสองมักจะถูกดึงมาจากภาพแทนทางกายภาพ เช่น การกระจายของกระสุนบนเป้าหมาย หรือการฉายภาพทางภูมิศาสตร์หรือท้องฟ้า[ 3 ] [ 4 ]
แม้ว่าเอ็ดมันด์ ฮัลลีย์จะสร้างแผนภูมิสองตัวแปรของอุณหภูมิและความดันในปี 1686 แต่เขาละเว้นจุดข้อมูลเฉพาะที่ใช้เพื่อแสดงความสัมพันธ์ เฟรนด์ลี่และเดนิสอ้างว่าการแสดงภาพของเขานั้นแตกต่างจากแผนภูมิกระจายจริง เฟรนด์ลี่และเดนิสระบุว่าแผนภูมิกระจายแรกเป็นผลงานของจอห์น เฮอร์เชลในปี 1833 เฮอร์เชลได้พล็อตมุมระหว่างดาวกลางในกลุ่มดาวหญิงสาวและแกมมาเวอร์จินิสเมื่อเวลาผ่านไป เพื่อหาว่ามุมเปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป ไม่ใช่โดยการคำนวณ แต่ด้วยการวาดด้วยมือเปล่าและการตัดสินของมนุษย์[ 3 ]
เซอร์ฟรานซิส กัลตันได้ขยายและทำให้แผนภาพกระจายและเครื่องมือทางสถิติอื่นๆ เป็นที่นิยม เพื่อแสวงหาพื้นฐานทางวิทยาศาสตร์สำหรับการปรับปรุงพันธุ์มนุษย์[ 5 ]เมื่อปี พ.ศ. 2429 กัลตันได้ตีพิมพ์แผนภาพกระจายและวงรีความสัมพันธ์ของความสูงของพ่อแม่และลูก เขาได้ขยายการพล็อตจุดข้อมูลของเฮอร์เชลโดยการจัดกลุ่มและหาค่าเฉลี่ยของเซลล์ที่อยู่ติดกันเพื่อสร้างภาพที่ราบรื่นยิ่งขึ้น[ 3 ]คาร์ล เพียร์สัน, อาร์.เอ. ฟิชเชอร์ และนักสถิติและนักปรับปรุงพันธุ์มนุษย์คน อื่นๆ ได้ต่อยอดจากงานของกัลตันและกำหนดรูปแบบความสัมพันธ์และการทดสอบนัยสำคัญอย่างเป็นทางการ[ 5 ]
ภาพรวม


แผนภาพกระจายสามารถใช้ได้ทั้งในกรณีที่ตัวแปรต่อเนื่องตัวหนึ่งอยู่ภายใต้การควบคุมของผู้ทำการทดลองและอีกตัวหนึ่งขึ้นอยู่กับตัวแปรนั้น หรือในกรณีที่ตัวแปรต่อเนื่องทั้งสองเป็นอิสระต่อกัน หาก มี พารามิเตอร์ หนึ่ง ที่เพิ่มขึ้นและ/หรือลดลงอย่างเป็นระบบโดยอีกพารามิเตอร์หนึ่ง พารามิเตอร์นั้นเรียกว่าพารามิเตอร์ควบคุมหรือตัวแปรอิสระและโดยทั่วไปจะแสดงไว้บนแกนแนวนอน ส่วนตัวแปรที่วัดได้หรือตัวแปรตามนั้นโดยทั่วไปจะแสดงไว้บนแกนแนวตั้ง หากไม่มีตัวแปรตาม ตัวแปรทั้งสองประเภทสามารถแสดงไว้บนแกนใดก็ได้ และแผนภาพกระจายจะแสดงให้เห็นเพียงระดับความสัมพันธ์ (ไม่ใช่สาเหตุ ) ระหว่างตัวแปรสองตัวเท่านั้น
แผนภาพกระจายจุดสามารถแสดงความสัมพันธ์หลายประเภทระหว่างตัวแปรต่างๆ ด้วยช่วงความเชื่อ มั่นที่กำหนด ตัวอย่างเช่น น้ำหนักและส่วนสูงจะอยู่บน แกน yและส่วนสูงจะอยู่บน แกน xความสัมพันธ์อาจเป็นบวก (เพิ่มขึ้น) ลบ (ลดลง) หรือเป็นศูนย์ (ไม่มีความสัมพันธ์) หากรูปแบบของจุดลาดเอียงจากล่างซ้ายไปบนขวา แสดงว่ามีความสัมพันธ์ เชิงบวก ระหว่างตัวแปรที่กำลังศึกษา หากรูปแบบของจุดลาดเอียงจากบนซ้ายไปล่างขวา แสดงว่ามีความสัมพันธ์เชิงลบ สามารถลากเส้น ที่เหมาะสมที่สุด (หรือเรียกว่า 'เส้นแนวโน้ม') เพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรได้ สมการสำหรับความสัมพันธ์ระหว่างตัวแปรสามารถกำหนดได้โดยวิธีการหาค่าที่เหมาะสมที่สุดที่ได้รับการยอมรับ สำหรับความสัมพันธ์เชิงเส้น วิธีการหาค่าที่เหมาะสมที่สุดเรียกว่าการถดถอยเชิงเส้นและรับประกันว่าจะได้คำตอบที่ถูกต้องในเวลาที่จำกัด ไม่มีวิธีการหาค่าที่เหมาะสมที่สุดแบบสากลใดที่รับประกันว่าจะได้คำตอบที่ถูกต้องสำหรับความสัมพันธ์ใดๆ ก็ตาม แผนภาพกระจายจุดยังมีประโยชน์มากเมื่อเราต้องการดูว่าชุดข้อมูลเปรียบเทียบสองชุดนั้นสอดคล้องกันอย่างไรในการแสดงความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างตัวแปร ความสามารถในการทำเช่นนี้สามารถเพิ่มขึ้นได้โดยการเพิ่มเส้นโค้งเรียบ เช่นLOESS [ 7 ]ยิ่งไปกว่านั้น หากข้อมูลถูกแสดงด้วยแบบจำลองผสมของความสัมพันธ์แบบง่าย ความสัมพันธ์เหล่านี้จะปรากฏให้เห็นได้ชัดเจนในรูปแบบของรูปแบบที่ซ้อนทับ กัน
แผนภาพกระจายจุดเป็นหนึ่งในเจ็ดเครื่องมือพื้นฐานของ การ ควบคุมคุณภาพ[ 8 ]
แผนภูมิกระจายสามารถสร้างได้ในรูปแบบแผนภูมิฟองแผนภูมิเครื่องหมาย หรือ/และแผนภูมิเส้น[ 9 ]
ตัวอย่าง

ตัวอย่างเช่น เพื่อแสดงความสัมพันธ์ระหว่างความจุของปอดของบุคคลกับระยะเวลาที่บุคคลนั้นสามารถกลั้นหายใจได้ นักวิจัยจะเลือกกลุ่มคนมาศึกษา จากนั้นวัดความจุของปอดของแต่ละคน (ตัวแปรแรก) และระยะเวลาที่แต่ละคนสามารถกลั้นหายใจได้ (ตัวแปรที่สอง) จากนั้นนักวิจัยจะนำข้อมูลไปพล็อตในแผนภูมิกระจาย โดยกำหนดให้ "ความจุของปอด" อยู่บนแกนแนวนอน และ "ระยะเวลากลั้นหายใจ" อยู่บนแกนแนวตั้ง
บุคคลที่มีความจุของปอดเท่ากับ400 ซีแอลที่กลั้นหายใจรอเวลา 21.7 วินาทีจะถูกแทนด้วยจุดเดียวบนแผนภาพกระจาย ณ จุด (400, 21.7) ในระบบพิกัดคาร์ทีเซียนแผนภาพกระจายของบุคคลทั้งหมดในงานวิจัยนี้จะช่วยให้นักวิจัยสามารถเปรียบเทียบตัวแปรทั้งสองในชุดข้อมูลได้ด้วยสายตา และจะช่วยในการพิจารณาว่ามีความสัมพันธ์ใดระหว่างตัวแปรทั้งสองหรือไม่
เมทริกซ์แผนภาพกระจาย
สำหรับชุดตัวแปรข้อมูล (มิติ) X 1 , X 2 , ... , X kเมทริกซ์แผนภาพกระจายจะแสดงแผนภาพกระจายแบบคู่ของตัวแปรทั้งหมดในมุมมองเดียวด้วยแผนภาพกระจายหลายรายการในรูปแบบเมทริกซ์ สำหรับ ตัวแปร kตัว เมทริกซ์แผนภาพกระจายจะมีkแถวและkคอลัมน์ แผนภาพที่อยู่บนจุดตัดของแถวที่i และคอลัมน์ที่ jคือแผนภาพของตัวแปรX iเทียบกับX j [ 10 ] ซึ่งหมายความว่าแต่ละแถวและคอลัมน์เป็นหนึ่งมิติ และ แต่ละเซลล์จะแสดงแผนภาพกระจายสองมิติ
เมทริกซ์แผนภาพกระจายทั่วไป[ 11 ]นำเสนอการแสดงผลที่หลากหลายของชุดค่าผสมที่จับคู่กันของตัวแปรเชิงหมวดหมู่และเชิงปริมาณแผนภาพโมเสกแผนภาพความผันผวน หรือแผนภูมิแท่ง แบบเหลี่ยม อาจใช้เพื่อแสดงตัวแปรเชิงหมวดหมู่สองตัว แผนภาพอื่นๆ ใช้สำหรับตัวแปรเชิงหมวดหมู่หนึ่งตัวและตัวแปรเชิงปริมาณหนึ่งตัว

ดูเพิ่มเติม
- การแสดงภาพข้อมูลและสารสนเทศ
- พรม
- กราฟแท่ง
- แผนภูมิเส้น
- รายชื่อซอฟต์แวร์ศิลปะทางคณิตศาสตร์
- สแค็กโนสติกส์
- แผนภาพจุด (สถิติ)
- แผนภูมิความเท่าเทียมกัน
อ่านเพิ่มเติม
- Cattaneo, Matias D.; Crump, Richard K.; Farrell, Max H.; Feng, Yingjie (2024). " On Binscatter ". American Economic Review . 114 (5): 1488–1514.
ลิงก์ภายนอก
สื่อที่เกี่ยวข้องกับแผนภูมิกระจายจุดในวิกิมีเดียคอมมอนส์- แผนภาพกระจายจุดคืออะไร? (เก็บถาวรเมื่อ 2020-08-07 ที่Wayback Machine)
- เมทริกซ์แผนภาพกระจายความสัมพันธ์สำหรับข้อมูลเชิงหมวดหมู่เรียงลำดับ – คำอธิบายและโค้ด R
- แผนภาพกระจายความหนาแน่นสำหรับชุดข้อมูลขนาดใหญ่ (หลายร้อยล้านจุด)
- ความสำคัญของแผนภาพกระจายจุด - จำเป็นอย่างยิ่งในการหาความสัมพันธ์และการถดถอย
- เครื่องมือสร้างกราฟกระจายแบบโต้ตอบ (MakeGraph.me)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ แผนภาพกระจาย
แผนภาพ กระจาย จุด หรือเรียกอีกอย่างว่า แผนภาพ กระจาย จุด กราฟกระจายจุด แผนภูมิ กระจายจุด แผนภาพ กระจาย จุด หรือ แผนภาพกระจายจุด [ 1 ] เป็น แผนภาพ หรือแผนภูมิ ทางคณิตศาสตร์...
ประวัติศาสตร์
ตามที่ Michael Friendly และ Daniel Denis กล่าวไว้ ลักษณะเด่นที่แยกแผนภูมิกระจายออกจากแผนภูมิเส้นคือการแสดงการสังเกตเฉพาะของข้อมูลสองตัวแปร โดยที่ตัวแปรหนึ่งถูกพล็อตบนแกนแนวนอนและอีกตัวแปรหนึ่งบนแกนแนวตั้ง ตัวแปรทั้งสองมักจะถูกดึงมาจากภาพแทนทางกายภาพ เช่น...
ภาพรวม
แผนภาพกระจายสามารถใช้ได้ทั้งในกรณีที่ตัวแปรต่อเนื่องตัวหนึ่งอยู่ภายใต้การควบคุมของผู้ทำการทดลองและอีกตัวหนึ่งขึ้นอยู่กับตัวแปรนั้น หรือในกรณีที่ตัวแปรต่อเนื่องทั้งสองเป็นอิสระต่อกัน หาก มี พารามิเตอร์ หนึ่ง...
ตัวอย่าง
ตัวอย่างเช่น เพื่อแสดงความสัมพันธ์ระหว่างความจุของปอดของบุคคลกับระยะเวลาที่บุคคลนั้นสามารถกลั้นหายใจได้ นักวิจัยจะเลือกกลุ่มคนมาศึกษา จากนั้นวัดความจุของปอดของแต่ละคน (ตัวแปรแรก) และระยะเวลาที่แต่ละคนสามารถกลั้นหายใจได้ (ตัวแปรที่สอง)...