กลับไปหน้าบทความ

อ่าน 5 นาที

คอร์เรโลแกรม

ในการวิเคราะห์ข้อมูล คอ ร์เรโลแกรม คือ แผนภูมิ แสดง สถิติ ความสัมพันธ์ ตัวอย่าง เช่น ใน การวิเคราะห์อนุกรมเวลา แผนภูมิที่แสดง ความสัมพันธ์อัตโนมัติ ของตัวอย่าง เทียบกับช่วงเวลา...

คอร์เรโลแกรม

กราฟแสดงตัวเลขสุ่ม 100 ตัวที่มี ฟังก์ชัน ไซน์ "ซ่อนอยู่" และกราฟแสดงความสัมพันธ์อัตโนมัติ (correlogram) ของอนุกรมตัวเลขเหล่านั้นอยู่ด้านล่าง

ในการวิเคราะห์ข้อมูล คอร์เรโลแกรมคือแผนภูมิแสดง สถิติ ความสัมพันธ์ ตัวอย่าง เช่น ในการวิเคราะห์อนุกรมเวลาแผนภูมิที่แสดงความสัมพันธ์อัตโนมัติ ของตัวอย่าง เทียบกับช่วงเวลา (time lags) เรียกว่า ออโตคอร์ เรโลแกรมหาก พล็อต ความสัมพันธ์ไขว้ผลลัพธ์ที่ได้จะเรียกว่าครอสคอร์เรโลแกรม

แผนภาพสหสัมพันธ์ (Correlogram) เป็นเครื่องมือที่ใช้กันทั่วไปในการตรวจสอบความเป็นสุ่มในชุดข้อมูลหากเป็นแบบสุ่ม ค่าสหสัมพันธ์อัตโนมัติควรอยู่ใกล้ศูนย์สำหรับทุกช่วงเวลา หากไม่เป็นแบบสุ่ม ค่าสหสัมพันธ์อัตโนมัติอย่างน้อยหนึ่งค่าจะไม่เป็นศูนย์อย่างมีนัยสำคัญ

นอกจากนี้ แผนภาพสหสัมพันธ์ยังถูกใช้ใน ขั้นตอน การระบุแบบจำลองสำหรับ แบบจำลอง อนุกรมเวลาแบบถดถอยอัตโนมัติเคลื่อนที่เฉลี่ย ของ Box–Jenkins ค่าสหสัมพันธ์อัตโนมัติควรอยู่ใกล้ศูนย์เพื่อแสดงถึงความเป็นสุ่ม หากนักวิเคราะห์ไม่ตรวจสอบความเป็นสุ่ม ความถูกต้องของข้อสรุปทางสถิติหลายอย่างก็จะน่าสงสัย แผนภาพสหสัมพันธ์เป็นวิธีที่ดีเยี่ยมในการตรวจสอบความเป็นสุ่มดังกล่าว

ใน การ วิเคราะห์หลายตัวแปร เมทริกซ์สหสัมพันธ์ที่แสดงเป็น ภาพ ที่มีการแมปสีอาจเรียกว่า "correlograms" หรือ "corrgrams" ก็ได้[ 1 ] [ 2 ] [ 3 ]

แอปพลิเคชัน

แผนภาพความสัมพันธ์สามารถช่วยตอบคำถามต่อไปนี้ได้: [ 4 ]

  • ข้อมูลเหล่านี้เป็นข้อมูลสุ่มหรือไม่?
  • การสังเกตนี้เกี่ยวข้องกับการสังเกตที่อยู่ใกล้เคียงหรือไม่?
  • การสังเกตนี้เกี่ยวข้องกับการสังเกตที่ห่างออกไปสองรุ่นหรือไม่ (เป็นต้น)
  • อนุกรมเวลาที่สังเกตได้นี้เป็นสัญญาณรบกวนสีขาวหรือไม่?
  • อนุกรมเวลาที่สังเกตได้มีลักษณะเป็นคลื่นไซน์หรือไม่?
  • อนุกรมเวลาที่สังเกตได้นั้นเป็นแบบอัตถารีเกรสชันหรือไม่?
  • แบบจำลองใดเหมาะสมที่สุดสำหรับอนุกรมเวลาที่สังเกตได้?
  • แบบจำลองคือ
ถูกต้องและเพียงพอหรือไม่?
  • สูตรนี้ใช้ได้ผลหรือไม่?

ความสำคัญ

ความสุ่ม (รวมถึงแบบจำลองคงที่ ความแปรปรวนคงที่ และการกระจายคงที่) เป็นหนึ่งในสี่สมมติฐานที่มักเป็นพื้นฐานของกระบวนการวัดทั้งหมด สมมติฐานเรื่องความสุ่มมีความสำคัญอย่างยิ่งด้วยเหตุผลสามประการดังต่อไปนี้:

  • การทดสอบทางสถิติมาตรฐานส่วนใหญ่อาศัยสมมติฐานเรื่องความสุ่ม ความถูกต้องของข้อสรุปจากการทดสอบนั้นเชื่อมโยงโดยตรงกับความถูกต้องของสมมติฐานเรื่องความสุ่ม
  • สูตรทางสถิติที่ใช้กันทั่วไปหลายสูตรอาศัยสมมติฐานเรื่องความสุ่ม โดยสูตรที่ใช้กันมากที่สุดคือสูตรสำหรับการหาค่าความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยตัวอย่าง:

โดยที่sคือค่าเบี่ยงเบนมาตรฐานของข้อมูล แม้ว่าจะมีการใช้สูตรนี้อย่างแพร่หลาย แต่ผลลัพธ์ที่ได้จากการใช้สูตรนี้จะไม่มีประโยชน์ใดๆ เว้นแต่ว่าสมมติฐานเรื่องความสุ่มนั้นจะเป็นจริง

  • สำหรับข้อมูลตัวแปรเดียว โมเดลเริ่มต้นคือ

หากข้อมูลไม่ใช่ข้อมูลสุ่ม โมเดลนี้จะไม่ถูกต้องและใช้ไม่ได้ และค่าประมาณของพารามิเตอร์ (เช่น ค่าคงที่) จะไม่มีความหมายและใช้ไม่ได้เช่นกัน

การประมาณค่าความสัมพันธ์อัตโนมัติ

สัมประสิทธิ์สหสัมพันธ์อัตโนมัติที่ช่วงเวลาhกำหนดโดย

โดยที่c hคือฟังก์ชันความแปรปรวนร่วมอัตโนมัติ

และc 0คือฟังก์ชันความแปรปรวน

ค่าr h ที่ได้ จะมีค่าอยู่ระหว่าง −1 ถึง +1

การประมาณค่าแบบอื่น

บางแหล่งข้อมูลอาจใช้สูตรต่อไปนี้สำหรับฟังก์ชันความแปรปรวนร่วมอัตโนมัติ:

แม้ว่าคำจำกัดความนี้จะมีอคติ น้อยกว่า แต่สูตร (1/ N ) ก็มีคุณสมบัติทางสถิติที่น่าสนใจบางประการ และเป็นรูปแบบที่ใช้กันทั่วไปมากที่สุดในเอกสารทางสถิติ ดูรายละเอียดได้ในหน้า 20 และ 49–50 ใน Chatfield

ตรงกันข้ามกับคำจำกัดความข้างต้น คำจำกัดความนี้ช่วยให้เราคำนวณได้ง่ายขึ้นเล็กน้อย ลองพิจารณาตัวอย่างโดยที่สำหรับจากนั้น ให้

จากนั้นเราคำนวณเมทริกซ์แกรม สุดท้ายจะถูกคำนวณเป็นค่าเฉลี่ยตัวอย่างของแนวทแยงมุมที่ th ของตัวอย่างเช่นแนวทแยงมุมที่ th (แนวทแยงมุมหลัก) ของมีองค์ประกอบ และค่าเฉลี่ยตัวอย่างของแนวทแยงมุมนี้คือ แนวทแยงมุม ที่st (ทางด้านขวาของแนวทแยงมุมหลัก) ของมีองค์ประกอบ และค่าเฉลี่ยตัวอย่างของแนวทแยงมุมนี้คือและอื่นๆ

การอนุมานทางสถิติด้วยแผนภาพสหสัมพันธ์

ตัวอย่างโคโรเรโลแกรมจากตัวอย่าง 400 จุดของกระบวนการอัตถารีเกรสซีฟอันดับหนึ่งที่มีความสัมพันธ์ระหว่างจุดที่อยู่ติดกัน 0.75 พร้อมด้วยช่วงความเชื่อมั่น 95% (แสดงรอบค่าประมาณความสัมพันธ์ด้วยเส้นสีดำและรอบศูนย์ด้วยเส้นสีแดง) ซึ่งคำนวณโดยสมการในส่วนนี้ เส้นประสีน้ำเงินแสดงฟังก์ชันอัตถารีเลชันจริงของกระบวนการที่สุ่มตัวอย่าง
แผนภาพความสัมพันธ์ 20 แผนภาพ จากตัวอย่าง 400 จุดของกระบวนการสุ่มแบบเดียวกันกับในรูปก่อนหน้า

ในกราฟเดียวกันนี้ เราสามารถลากเส้นขอบเขตบนและล่างสำหรับค่าสหสัมพันธ์อัตโนมัติพร้อมระดับนัยสำคัญได้:

โดยที่ เป็นค่าประมาณของความสัมพันธ์อัตโนมัติที่ช่วงเวลาล่าช้า

หากค่าสหสัมพันธ์อัตโนมัติสูงกว่า (ต่ำกว่า) ขอบเขตบน (ล่าง) นี้ สมมติฐานว่างที่ว่าไม่มีสหสัมพันธ์อัตโนมัติที่ช่วงเวลาล่าช้าที่กำหนดและเกินกว่านั้น จะถูกปฏิเสธที่ระดับนัยสำคัญ การทดสอบนี้เป็นการทดสอบโดยประมาณและสมมติว่าอนุกรมเวลาเป็นแบบเกาส์เซียน

ในข้างต้นz 1− α /2คือควอนไทล์ของการแจกแจงปกติและ SE คือค่าความคลาดเคลื่อนมาตรฐาน ซึ่งสามารถคำนวณได้โดยใช้สูตรของBartlett สำหรับกระบวนการ MA( )

สำหรับ

จากตัวอย่างที่แสดงในกราฟ เราสามารถปฏิเสธสมมติฐานหลักที่ว่าไม่มีความสัมพันธ์อัตโนมัติระหว่างจุดเวลาที่ห่างกันไม่เกิน 4 ได้ สำหรับช่วงเวลาที่ยาวกว่านั้นส่วนใหญ่ เราไม่สามารถปฏิเสธสมมติฐานหลักที่ว่าไม่มีความสัมพันธ์อัตโนมัติ ได้

โปรดทราบว่ามีสูตรที่แตกต่างกันสองสูตรสำหรับการสร้างช่วงความเชื่อมั่น:

1. หากใช้โคเรโลแกรมเพื่อทดสอบความเป็นสุ่ม (กล่าวคือข้อมูล ไม่มี ความสัมพันธ์กับเวลา ) แนะนำให้ใช้สูตรต่อไปนี้:

โดยที่Nคือขนาดของกลุ่มตัวอย่างzคือฟังก์ชันควอนไทล์ของการแจกแจงปกติมาตรฐานและ α คือระดับนัยสำคัญในกรณีนี้ ช่วงความเชื่อมั่นจะมีขนาดความกว้างคงที่ซึ่งขึ้นอยู่กับขนาดของกลุ่มตัวอย่าง

2. แผนภาพสหสัมพันธ์ (Correlogram) ยังถูกนำมาใช้ในขั้นตอนการระบุแบบจำลองสำหรับการปรับ แบบจำลอง ARIMA ด้วย ในกรณีนี้จะถือว่าข้อมูลเป็น แบบจำลองค่าเฉลี่ยเคลื่อนที่ และควรสร้างช่วงความเชื่อมั่นดังต่อไปนี้:

โดยที่kคือค่าความล่าช้า ในกรณีนี้ ช่วงความเชื่อมั่นจะเพิ่มขึ้นเมื่อค่าความล่าช้าเพิ่มขึ้น

ซอฟต์แวร์

แผนภาพสหสัมพันธ์ (Correlogram) มีอยู่ในไลบรารีทางสถิติทั่วไปส่วนใหญ่

คอร์เรโลแกรม:

  • python pandas : pandas.plotting.autocorrelation_plot[ 5 ]
  • R : ฟังก์ชันacfและpacf

คอร์แกรม:

อ่านเพิ่มเติม

  • Hanke, John E.; Reitsch, Arthur G.; Wichern, Dean W. การพยากรณ์ทางธุรกิจ (ฉบับที่ 7). Upper Saddle River, NJ: Prentice Hall.
  • Box, GEP; Jenkins, G. (1976). การวิเคราะห์อนุกรมเวลา: การพยากรณ์และการควบคุม . Holden-Day.
  • Chatfield, C. (1989). การวิเคราะห์อนุกรมเวลา: บทนำ (ฉบับที่สี่). นิวยอร์ก, นิวยอร์ก: Chapman & Hall.
  • แผนภาพความสัมพันธ์อัตโนมัติ

สาธารณสมบัติ บทความนี้ได้นำเนื้อหาที่เป็นสาธารณสมบัติจากสถาบันมาตรฐานและเทคโนโลยีแห่งชาติ มาใช้

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Correlogram&oldid=1340773288 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ คอร์เรโลแกรม

ในการวิเคราะห์ข้อมูล คอ ร์เรโลแกรม คือ แผนภูมิ แสดง สถิติ ความสัมพันธ์ ตัวอย่าง เช่น ใน การวิเคราะห์อนุกรมเวลา แผนภูมิที่แสดง ความสัมพันธ์อัตโนมัติ ของตัวอย่าง เทียบกับช่วงเวลา...

แอปพลิเคชัน

แผนภาพความสัมพันธ์สามารถช่วยตอบคำถามต่อไปนี้ได้: [ 4 ]

ความสำคัญ

ความสุ่ม (รวมถึงแบบจำลองคงที่ ความแปรปรวนคงที่ และการกระจายคงที่) เป็นหนึ่งในสี่สมมติฐานที่มักเป็นพื้นฐานของกระบวนการวัดทั้งหมด สมมติฐานเรื่องความสุ่มมีความสำคัญอย่างยิ่งด้วยเหตุผลสามประการดังต่อไปนี้:

การประมาณค่าความสัมพันธ์อัตโนมัติ

สัมประสิทธิ์สหสัมพันธ์อัตโนมัติที่ช่วงเวลา h กำหนดโดย