กลับไปหน้าบทความ

อ่าน 4 นาที

แผนภาพกระจาย

แผนภาพ กระจาย จุด หรือเรียกอีกอย่างว่า แผนภาพ กระจาย จุด กราฟกระจายจุด แผนภูมิ กระจายจุด แผนภาพ กระจาย จุด หรือ แผนภาพกระจายจุด [ 1 ] เป็น แผนภาพ หรือแผนภูมิ ทางคณิตศาสตร์...

แผนภาพกระจาย

ตัวอย่างแผนภาพกระจายจุดที่แสดงความสัมพันธ์ระหว่างคุณลักษณะด้านคุณภาพกับปัจจัยนำเข้าที่กำหนด

แผนภาพกระจายจุดหรือเรียกอีกอย่างว่า แผนภาพ กระจายจุด กราฟกระจายจุดแผนภูมิกระจายจุด แผนภาพกระจายจุดหรือแผนภาพกระจายจุด[ 1 ] เป็น แผนภาพหรือแผนภูมิทางคณิตศาสตร์ประเภทหนึ่งที่ใช้พิกัดคาร์ทีเซียนเพื่อแสดงค่าของตัวแปร สองตัว สำหรับชุดข้อมูล หากจุดต่างๆ มีการเข้ารหัส (สี/รูปร่าง/ขนาด) จะสามารถแสดงตัวแปรเพิ่มเติมได้อีกหนึ่งตัว ข้อมูลจะแสดงเป็นชุดของจุด โดยแต่ละจุดจะมีค่าของตัวแปรหนึ่งกำหนดตำแหน่งบนแกนแนวนอน และค่าของตัวแปรอีกตัวหนึ่งกำหนดตำแหน่งบนแกนแนวตั้ง [ 2 ] แผนภาพกระจายจุดเป็นหนึ่งในเจ็ดเครื่องมือพื้นฐานของการควบคุม คุณภาพ

ประวัติศาสตร์

ตามที่ Michael Friendly และ Daniel Denis กล่าวไว้ ลักษณะเด่นที่แยกแผนภูมิกระจายออกจากแผนภูมิเส้นคือการแสดงการสังเกตเฉพาะของข้อมูลสองตัวแปร โดยที่ตัวแปรหนึ่งถูกพล็อตบนแกนแนวนอนและอีกตัวแปรหนึ่งบนแกนแนวตั้ง ตัวแปรทั้งสองมักจะถูกดึงมาจากภาพแทนทางกายภาพ เช่น การกระจายของกระสุนบนเป้าหมาย หรือการฉายภาพทางภูมิศาสตร์หรือท้องฟ้า[ 3 ] [ 4 ]

แม้ว่าเอ็ดมันด์ ฮัลลีย์จะสร้างแผนภูมิสองตัวแปรของอุณหภูมิและความดันในปี 1686 แต่เขาละเว้นจุดข้อมูลเฉพาะที่ใช้เพื่อแสดงความสัมพันธ์ เฟรนด์ลี่และเดนิสอ้างว่าการแสดงภาพของเขานั้นแตกต่างจากแผนภูมิกระจายจริง เฟรนด์ลี่และเดนิสระบุว่าแผนภูมิกระจายแรกเป็นผลงานของจอห์น เฮอร์เชลในปี 1833 เฮอร์เชลได้พล็อตมุมระหว่างดาวกลางในกลุ่มดาวหญิงสาวและแกมมาเวอร์จินิสเมื่อเวลาผ่านไป เพื่อหาว่ามุมเปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป ไม่ใช่โดยการคำนวณ แต่ด้วยการวาดด้วยมือเปล่าและการตัดสินของมนุษย์[ 3 ]

เซอร์ฟรานซิส กัลตันได้ขยายและทำให้แผนภาพกระจายและเครื่องมือทางสถิติอื่นๆ เป็นที่นิยม เพื่อแสวงหาพื้นฐานทางวิทยาศาสตร์สำหรับการปรับปรุงพันธุ์มนุษย์[ 5 ]เมื่อปี พ.ศ. 2429 กัลตันได้ตีพิมพ์แผนภาพกระจายและวงรีความสัมพันธ์ของความสูงของพ่อแม่และลูก เขาได้ขยายการพล็อตจุดข้อมูลของเฮอร์เชลโดยการจัดกลุ่มและหาค่าเฉลี่ยของเซลล์ที่อยู่ติดกันเพื่อสร้างภาพที่ราบรื่นยิ่งขึ้น[ 3 ]คาร์ล เพียร์สัน, อาร์.เอ. ฟิชเชอร์ และนักสถิติและนักปรับปรุงพันธุ์มนุษย์คน อื่นๆ ได้ต่อยอดจากงานของกัลตันและกำหนดรูปแบบความสัมพันธ์และการทดสอบนัยสำคัญอย่างเป็นทางการ[ 5 ]

ภาพรวม

แผนภูมินี้แสดง ระยะเวลารอคอยระหว่างการปะทุและระยะเวลาของการปะทุของน้ำพุร้อนโอลด์เฟธฟูลในอุทยานแห่งชาติเยลโลว์สโตนรัฐไวโอมิงสหรัฐอเมริกา โดยแสดงให้เห็นว่าโดยทั่วไปแล้วการปะทุมีสองประเภท คือ แบบรอคอยสั้น ระยะเวลาสั้น และแบบรอคอยยาว ระยะเวลานาน
แผนภาพกระจาย 3 มิติช่วยให้เห็นภาพข้อมูลหลายตัวแปรได้ แผนภาพกระจายนี้ใช้ตัวแปรสเกลาร์หลายตัวและใช้สำหรับแกนต่างๆ ในพื้นที่เฟส ตัวแปรต่างๆ จะถูกรวมเข้าด้วยกันเพื่อสร้างพิกัดในพื้นที่เฟส และแสดงผลโดยใช้สัญลักษณ์และระบายสีโดยใช้ตัวแปรสเกลาร์อีกตัวหนึ่ง[ 6 ]

แผนภาพกระจายสามารถใช้ได้ทั้งในกรณีที่ตัวแปรต่อเนื่องตัวหนึ่งอยู่ภายใต้การควบคุมของผู้ทำการทดลองและอีกตัวหนึ่งขึ้นอยู่กับตัวแปรนั้น หรือในกรณีที่ตัวแปรต่อเนื่องทั้งสองเป็นอิสระต่อกัน หาก มี พารามิเตอร์ หนึ่ง ที่เพิ่มขึ้นและ/หรือลดลงอย่างเป็นระบบโดยอีกพารามิเตอร์หนึ่ง พารามิเตอร์นั้นเรียกว่าพารามิเตอร์ควบคุมหรือตัวแปรอิสระและโดยทั่วไปจะแสดงไว้บนแกนแนวนอน ส่วนตัวแปรที่วัดได้หรือตัวแปรตามนั้นโดยทั่วไปจะแสดงไว้บนแกนแนวตั้ง หากไม่มีตัวแปรตาม ตัวแปรทั้งสองประเภทสามารถแสดงไว้บนแกนใดก็ได้ และแผนภาพกระจายจะแสดงให้เห็นเพียงระดับความสัมพันธ์ (ไม่ใช่สาเหตุ ) ระหว่างตัวแปรสองตัวเท่านั้น

แผนภาพกระจายจุดสามารถแสดงความสัมพันธ์หลายประเภทระหว่างตัวแปรต่างๆ ด้วยช่วงความเชื่อ มั่นที่กำหนด ตัวอย่างเช่น น้ำหนักและส่วนสูงจะอยู่บน แกน yและส่วนสูงจะอยู่บน แกน xความสัมพันธ์อาจเป็นบวก (เพิ่มขึ้น) ลบ (ลดลง) หรือเป็นศูนย์ (ไม่มีความสัมพันธ์) หากรูปแบบของจุดลาดเอียงจากล่างซ้ายไปบนขวา แสดงว่ามีความสัมพันธ์ เชิงบวก ระหว่างตัวแปรที่กำลังศึกษา หากรูปแบบของจุดลาดเอียงจากบนซ้ายไปล่างขวา แสดงว่ามีความสัมพันธ์เชิงลบ สามารถลากเส้น ที่เหมาะสมที่สุด (หรือเรียกว่า 'เส้นแนวโน้ม') เพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรได้ สมการสำหรับความสัมพันธ์ระหว่างตัวแปรสามารถกำหนดได้โดยวิธีการหาค่าที่เหมาะสมที่สุดที่ได้รับการยอมรับ สำหรับความสัมพันธ์เชิงเส้น วิธีการหาค่าที่เหมาะสมที่สุดเรียกว่าการถดถอยเชิงเส้นและรับประกันว่าจะได้คำตอบที่ถูกต้องในเวลาที่จำกัด ไม่มีวิธีการหาค่าที่เหมาะสมที่สุดแบบสากลใดที่รับประกันว่าจะได้คำตอบที่ถูกต้องสำหรับความสัมพันธ์ใดๆ ก็ตาม แผนภาพกระจายจุดยังมีประโยชน์มากเมื่อเราต้องการดูว่าชุดข้อมูลเปรียบเทียบสองชุดนั้นสอดคล้องกันอย่างไรในการแสดงความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างตัวแปร ความสามารถในการทำเช่นนี้สามารถเพิ่มขึ้นได้โดยการเพิ่มเส้นโค้งเรียบ เช่นLOESS [ 7 ]ยิ่งไปกว่านั้น หากข้อมูลถูกแสดงด้วยแบบจำลองผสมของความสัมพันธ์แบบง่าย ความสัมพันธ์เหล่านี้จะปรากฏให้เห็นได้ชัดเจนในรูปแบบของรูปแบบที่ซ้อนทับ กัน

แผนภาพกระจายจุดเป็นหนึ่งในเจ็ดเครื่องมือพื้นฐานของ การ ควบคุมคุณภาพ[ 8 ]

แผนภูมิกระจายสามารถสร้างได้ในรูปแบบแผนภูมิฟองแผนภูมิเครื่องหมาย หรือ/และแผนภูมิเส้น[ 9 ]

ตัวอย่าง

แผนภาพกระจายแสดงความสัมพันธ์ระหว่างระยะทางที่ต้องหยุดรถสำหรับรถยนต์ที่ขับด้วยความเร็วต่างๆ (n = 50)

ตัวอย่างเช่น เพื่อแสดงความสัมพันธ์ระหว่างความจุของปอดของบุคคลกับระยะเวลาที่บุคคลนั้นสามารถกลั้นหายใจได้ นักวิจัยจะเลือกกลุ่มคนมาศึกษา จากนั้นวัดความจุของปอดของแต่ละคน (ตัวแปรแรก) และระยะเวลาที่แต่ละคนสามารถกลั้นหายใจได้ (ตัวแปรที่สอง) จากนั้นนักวิจัยจะนำข้อมูลไปพล็อตในแผนภูมิกระจาย โดยกำหนดให้ "ความจุของปอด" อยู่บนแกนแนวนอน และ "ระยะเวลากลั้นหายใจ" อยู่บนแกนแนวตั้ง

บุคคลที่มีความจุของปอดเท่ากับ400  ซีแอลที่กลั้นหายใจรอเวลา 21.7 วินาทีจะถูกแทนด้วยจุดเดียวบนแผนภาพกระจาย ณ จุด (400, 21.7) ในระบบพิกัดคาร์ทีเซียนแผนภาพกระจายของบุคคลทั้งหมดในงานวิจัยนี้จะช่วยให้นักวิจัยสามารถเปรียบเทียบตัวแปรทั้งสองในชุดข้อมูลได้ด้วยสายตา และจะช่วยในการพิจารณาว่ามีความสัมพันธ์ใดระหว่างตัวแปรทั้งสองหรือไม่

เมทริกซ์แผนภาพกระจาย

สำหรับชุดตัวแปรข้อมูล (มิติ) X 1 , X 2 , ... , X kเมทริกซ์แผนภาพกระจายจะแสดงแผนภาพกระจายแบบคู่ของตัวแปรทั้งหมดในมุมมองเดียวด้วยแผนภาพกระจายหลายรายการในรูปแบบเมทริกซ์ สำหรับ ตัวแปร kตัว เมทริกซ์แผนภาพกระจายจะมีkแถวและkคอลัมน์ แผนภาพที่อยู่บนจุดตัดของแถวที่i และคอลัมน์ที่ jคือแผนภาพของตัวแปรX iเทียบกับX j [ 10 ] ซึ่งหมายความว่าแต่ละแถวและคอลัมน์เป็นหนึ่งมิติ และ แต่ละเซลล์จะแสดงแผนภาพกระจายสองมิติ

เมทริกซ์แผนภาพกระจายทั่วไป[ 11 ]นำเสนอการแสดงผลที่หลากหลายของชุดค่าผสมที่จับคู่กันของตัวแปรเชิงหมวดหมู่และเชิงปริมาณแผนภาพโมเสกแผนภาพความผันผวน หรือแผนภูมิแท่ง แบบเหลี่ยม อาจใช้เพื่อแสดงตัวแปรเชิงหมวดหมู่สองตัว แผนภาพอื่นๆ ใช้สำหรับตัวแปรเชิงหมวดหมู่หนึ่งตัวและตัวแปรเชิงปริมาณหนึ่งตัว

การแสดงภาพข้อมูล 3 มิติ พร้อมด้วยเมทริกซ์แผนภาพกระจายที่เกี่ยวข้อง

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • Cattaneo, Matias D.; Crump, Richard K.; Farrell, Max H.; Feng, Yingjie (2024). " On Binscatter ". American Economic Review . 114 (5): 1488–1514.
  • โลโก้ Wikimedia Commonsสื่อที่เกี่ยวข้องกับแผนภูมิกระจายจุดในวิกิมีเดียคอมมอนส์
  • แผนภาพกระจายจุดคืออะไร? (เก็บถาวรเมื่อ 2020-08-07 ที่Wayback Machine)
  • เมทริกซ์แผนภาพกระจายความสัมพันธ์สำหรับข้อมูลเชิงหมวดหมู่เรียงลำดับ – คำอธิบายและโค้ด R
  • แผนภาพกระจายความหนาแน่นสำหรับชุดข้อมูลขนาดใหญ่ (หลายร้อยล้านจุด)
  • ความสำคัญของแผนภาพกระจายจุด - จำเป็นอย่างยิ่งในการหาความสัมพันธ์และการถดถอย
  • เครื่องมือสร้างกราฟกระจายแบบโต้ตอบ (MakeGraph.me)
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Scatter_plot&oldid=1353646712 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แผนภาพกระจาย

แผนภาพ กระจาย จุด หรือเรียกอีกอย่างว่า แผนภาพ กระจาย จุด กราฟกระจายจุด แผนภูมิ กระจายจุด แผนภาพ กระจาย จุด หรือ แผนภาพกระจายจุด [ 1 ] เป็น แผนภาพ หรือแผนภูมิ ทางคณิตศาสตร์...

ประวัติศาสตร์

ตามที่ Michael Friendly และ Daniel Denis กล่าวไว้ ลักษณะเด่นที่แยกแผนภูมิกระจายออกจากแผนภูมิเส้นคือการแสดงการสังเกตเฉพาะของข้อมูลสองตัวแปร โดยที่ตัวแปรหนึ่งถูกพล็อตบนแกนแนวนอนและอีกตัวแปรหนึ่งบนแกนแนวตั้ง ตัวแปรทั้งสองมักจะถูกดึงมาจากภาพแทนทางกายภาพ เช่น...

ภาพรวม

แผนภาพกระจายสามารถใช้ได้ทั้งในกรณีที่ตัวแปรต่อเนื่องตัวหนึ่งอยู่ภายใต้การควบคุมของผู้ทำการทดลองและอีกตัวหนึ่งขึ้นอยู่กับตัวแปรนั้น หรือในกรณีที่ตัวแปรต่อเนื่องทั้งสองเป็นอิสระต่อกัน หาก มี พารามิเตอร์ หนึ่ง...

ตัวอย่าง

ตัวอย่างเช่น เพื่อแสดงความสัมพันธ์ระหว่างความจุของปอดของบุคคลกับระยะเวลาที่บุคคลนั้นสามารถกลั้นหายใจได้ นักวิจัยจะเลือกกลุ่มคนมาศึกษา จากนั้นวัดความจุของปอดของแต่ละคน (ตัวแปรแรก) และระยะเวลาที่แต่ละคนสามารถกลั้นหายใจได้ (ตัวแปรที่สอง)...