กลับไปหน้าบทความ

อ่าน 14 นาที

อนุกรมเวลา

ใน ทางคณิตศาสตร์ อนุกรม เวลา คือลำดับของ จุดข้อมูล ที่จัดเรียง จัดทำรายการ หรือแสดงเป็นกราฟตามลำดับเวลา โดยทั่วไปแล้ว อนุกรมเวลาประกอบด้วยการสังเกตที่บันทึกไว้ ณ...

อนุกรมเวลา

อนุกรมเวลา: ข้อมูลสุ่มบวกแนวโน้ม พร้อมเส้นแนวโน้มที่เหมาะสมที่สุดและตัวกรองต่างๆ ที่นำมาใช้

ในทางคณิตศาสตร์อนุกรมเวลาคือลำดับของจุดข้อมูลที่จัดเรียง จัดทำรายการ หรือแสดงเป็นกราฟตามลำดับเวลา โดยทั่วไปแล้ว อนุกรมเวลาประกอบด้วยการสังเกตที่บันทึกไว้ ณ จุดเวลาที่ต่อเนื่องกันและมีระยะห่างเท่าๆ กัน ดังนั้นจึงแสดงถึงรูปแบบหนึ่งของ ข้อมูล เวลาไม่ต่อเนื่องอนุกรมเวลาอาจอธิบายถึงการวัดที่เก็บรวบรวมในช่วงเวลาไม่กี่วินาที วัน ปี หรือแม้แต่ศตวรรษ ตัวอย่างทั่วไป ได้แก่ ความสูงของน้ำขึ้นน้ำลง ในมหาสมุทร จำนวนจุด บน ดวง อาทิตย์ การวัดอุณหภูมิรายวัน และราคาปิดของดัชนีตลาดหุ้น เช่นดัชนีอุตสาหกรรมดาวโจนส์

อนุกรมเวลามักแสดงผลด้วยแผนภูมิการวิ่ง ( แผนภูมิเส้นแสดงแนวโน้มชนิดหนึ่ง) ซึ่งช่วยระบุรูปแบบต่างๆ เช่น แนวโน้ม ผลกระทบตามฤดูกาล และความผันผวนที่ไม่สม่ำเสมอ อนุกรมเวลาถูกนำไปใช้อย่างกว้างขวางในสถิติศาสตร์คณิตศาสตร์ประกันภัยการประมวลผลสัญญาณการ รู้ จำรูปแบบเศรษฐศาสตร์เชิงปริมาณการเงินเชิงคณิตศาสตร์การพยากรณ์อากาศ การทำนาย แผ่นดินไหว การตรวจคลื่นไฟฟ้าสมองวิศวกรรมควบคุมดาราศาสตร์วิศวกรรมการสื่อสารและสาขาอื่นๆ อีกมากมายของวิทยาศาสตร์และวิศวกรรม ประยุกต์ ที่เกี่ยวข้องกับการวัดเชิงเวลา

การวิเคราะห์อนุกรมเวลาประกอบด้วยวิธีการวิเคราะห์ข้อมูลอนุกรมเวลาเพื่อดึงสถิติที่มีความหมายและลักษณะอื่นๆ ของข้อมูลออกมาการพยากรณ์อนุกรมเวลาคือการใช้แบบจำลองเพื่อทำนายค่าในอนาคตโดยอิงจากค่าที่สังเกตได้ก่อนหน้านี้ โดยทั่วไป ข้อมูลอนุกรมเวลาจะถูกจำลองเป็นกระบวนการสุ่มในขณะที่การวิเคราะห์การถดถอยมักถูกนำมาใช้เพื่อทดสอบความสัมพันธ์ระหว่างอนุกรมเวลาที่แตกต่างกันหนึ่งชุดหรือมากกว่านั้น การวิเคราะห์ประเภทนี้มักไม่เรียกว่า "การวิเคราะห์อนุกรมเวลา" ซึ่งโดยเฉพาะแล้วหมายถึงความสัมพันธ์ระหว่างจุดเวลาต่างๆ ภายในอนุกรมเวลาเดียว

ข้อมูลอนุกรมเวลามีลำดับเวลาที่เป็นธรรมชาติ ทำให้การวิเคราะห์อนุกรมเวลาแตกต่างจากการศึกษาแบบภาคตัดขวางซึ่งไม่มีลำดับที่เป็นธรรมชาติของการสังเกต (เช่น การอธิบายค่าจ้างของบุคคลโดยอ้างอิงจากระดับการศึกษาของพวกเขา ซึ่งข้อมูลของแต่ละบุคคลอาจถูกป้อนในลำดับใดก็ได้) การวิเคราะห์อนุกรมเวลายังแตกต่างจากการวิเคราะห์ข้อมูลเชิงพื้นที่ซึ่งการสังเกตมักเกี่ยวข้องกับตำแหน่งทางภูมิศาสตร์ (เช่น การอธิบายราคาบ้านตามสถานที่ตั้ง รวมถึงลักษณะเฉพาะของบ้าน) แบบจำลอง เชิงสุ่มสำหรับอนุกรมเวลาโดยทั่วไปจะสะท้อนให้เห็นว่าการสังเกตที่อยู่ใกล้กันในเวลาจะมีความสัมพันธ์กันมากกว่าการสังเกตที่ห่างกัน นอกจากนี้ แบบจำลองอนุกรมเวลามักจะใช้ลำดับทางเดียวตามธรรมชาติของเวลา เพื่อให้ค่าสำหรับช่วงเวลาที่กำหนดจะแสดงออกมาในรูปแบบที่ได้มาจากค่าในอดีต แทนที่จะมาจากค่าในอนาคต (ดูความสามารถในการย้อนกลับของเวลา )

การวิเคราะห์อนุกรมเวลาสามารถนำไปใช้กับข้อมูลที่มีค่าจริง และต่อเนื่อง ข้อมูล ตัวเลขแบบไม่ต่อเนื่อง หรือข้อมูลสัญลักษณ์แบบไม่ต่อเนื่อง (เช่น ลำดับของตัวอักษร เช่น ตัวอักษรและคำในภาษาอังกฤษ[ 1 ] )

วิธีการวิเคราะห์

วิธีการวิเคราะห์อนุกรมเวลาสามารถแบ่งออกได้เป็นสองประเภท ได้แก่ วิธีการ ในโดเมนความถี่และ วิธีการ ในโดเมนเวลาประเภทแรกได้แก่การวิเคราะห์สเปกตรัมและการวิเคราะห์เวฟเล็ตส่วนประเภทหลังได้แก่ การวิเคราะห์ ความสัมพันธ์อัตโนมัติและ การวิเคราะห์ ความสัมพันธ์ไขว้ในโดเมนเวลา สามารถทำการวิเคราะห์ความสัมพันธ์ได้ในลักษณะคล้ายตัวกรองโดยใช้ความสัมพันธ์แบบปรับขนาดซึ่งช่วยลดความจำเป็นในการดำเนินการในโดเมนความถี่

นอกจากนี้ เทคนิคการวิเคราะห์อนุกรมเวลาอาจแบ่งออกเป็น วิธีการ แบบพาราเมตริกและ วิธีการ แบบไม่พาราเมตริกวิธีการแบบพาราเมตริกนั้นสมมติว่ากระบวนการสุ่มแบบอยู่ตัว ที่อยู่เบื้องหลัง มีโครงสร้างบางอย่างที่สามารถอธิบายได้โดยใช้พารามิเตอร์จำนวนน้อย (ตัวอย่างเช่น การใช้ แบบจำลอง อัตถารีเกรสซีฟหรือแบบจำลองค่าเฉลี่ยเคลื่อนที่ ) ในวิธีการเหล่านี้ งานคือการประมาณค่าพารามิเตอร์ของแบบจำลองที่อธิบายกระบวนการสุ่ม ในทางตรงกันข้าม วิธีการแบบไม่พาราเมตริกจะประมาณค่าความแปรปรวนร่วมหรือสเปกตรัมของกระบวนการอย่างชัดเจนโดยไม่ต้องสมมติว่ากระบวนการนั้นมีโครงสร้างใด ๆ เป็นพิเศษ

วิธีการวิเคราะห์อนุกรมเวลาอาจแบ่งออกเป็นแบบเชิงเส้นและไม่เชิงเส้นรวมถึงแบบตัวแปรเดียวและแบบหลายตัวแปรได้เช่น กัน

ข้อมูลแผง

อนุกรมเวลาเป็นข้อมูลประเภทหนึ่งของข้อมูลแบบพาเนลข้อมูลแบบพาเนลเป็นกลุ่มข้อมูลทั่วไป ซึ่งเป็นชุดข้อมูลหลายมิติ ในขณะที่ชุดข้อมูลอนุกรมเวลาเป็นข้อมูลแบบพาเนลมิติเดียว (เช่นเดียวกับชุดข้อมูลแบบภาคตัดขวาง ) ชุดข้อมูลอาจแสดงลักษณะของทั้งข้อมูลแบบพาเนลและข้อมูลอนุกรมเวลา วิธีหนึ่งที่จะบอกได้คือการถามว่าอะไรทำให้ระเบียนข้อมูลหนึ่งแตกต่างจากระเบียนอื่นๆ หากคำตอบคือฟิลด์ข้อมูลเวลา แสดงว่านี่คือชุดข้อมูลอนุกรมเวลา หากการกำหนดระเบียนที่ไม่ซ้ำกันต้องใช้ฟิลด์ข้อมูลเวลาและตัวระบุเพิ่มเติมที่ไม่เกี่ยวข้องกับเวลา (เช่น รหัสนักเรียน สัญลักษณ์หุ้น รหัสประเทศ) แสดงว่านี่คือข้อมูลแบบพาเนล หากความแตกต่างอยู่ที่ตัวระบุที่ไม่เกี่ยวข้องกับเวลา ชุดข้อมูลนั้นจะเป็นชุดข้อมูลแบบภาคตัดขวาง

การวิเคราะห์

มีวิธีการวิเคราะห์ข้อมูลและแรงจูงใจหลายประเภทสำหรับอนุกรมเวลา ซึ่งเหมาะสมกับวัตถุประสงค์ที่แตกต่างกัน

แรงจูงใจ

ในบริบทของสถิติเศรษฐศาสตร์เชิงปริมาณการเงินเชิงปริมาณ แผ่นดินไหววิทยาอุตุนิยมวิทยาและธรณีฟิสิกส์เป้าหมายหลักของการวิเคราะห์อนุกรมเวลาคือการพยากรณ์ในบริบทของการประมวลผลสัญญาณวิศวกรรมควบคุมและวิศวกรรมการสื่อสารจะใช้สำหรับการตรวจจับสัญญาณ การใช้งานอื่นๆ ได้แก่การขุดข้อมูลการรู้จำรูปแบบและการเรียนรู้ของเครื่องซึ่งการวิเคราะห์อนุกรมเวลาสามารถใช้สำหรับ การ จัดกลุ่ม[ 2 ] [ 3 ] [ 4 ] การจำแนกประเภท[ 5 ]การค้นหาตามเนื้อหา[ 6 ]การตรวจจับความผิดปกติรวมถึงการพยากรณ์[ 7 ]

การวิเคราะห์เชิงสำรวจ

กราฟแสดงจำนวนผู้เสียชีวิตจากวัณโรคในสหรัฐอเมริกา ตั้งแต่ปี 1954 ถึง 2021

วิธีง่ายๆ ในการตรวจสอบอนุกรมเวลาปกติคือการใช้แผนภูมิเส้นด้วยตนเอง แผนภูมิข้อมูลแสดงจำนวนผู้เสียชีวิตจากวัณโรคในสหรัฐอเมริกา[ 8 ]พร้อมกับการเปลี่ยนแปลงรายปีและการเปลี่ยนแปลงเป็นเปอร์เซ็นต์จากปีต่อปี จำนวนผู้เสียชีวิตทั้งหมดลดลงในทุกปีจนถึงกลางทศวรรษ 1980 หลังจากนั้นก็มีการเพิ่มขึ้นเป็นครั้งคราว ซึ่งมักจะเพิ่มขึ้นตามสัดส่วน แต่ไม่ใช่เพิ่มขึ้นในเชิงสัมบูรณ์ค่อนข้างมาก

การศึกษาของนักวิเคราะห์ข้อมูลองค์กรพบความท้าทายสองประการในการวิเคราะห์อนุกรมเวลาเชิงสำรวจ ได้แก่ การค้นพบรูปร่างของรูปแบบที่น่าสนใจ และการหาคำอธิบายสำหรับรูปแบบเหล่านี้[ 9 ]เครื่องมือภาพที่แสดงข้อมูลอนุกรมเวลาเป็นเมทริกซ์แผนที่ความร้อนสามารถช่วยเอาชนะความท้าทายเหล่านี้ได้

การประมาณค่า การกรอง และการปรับให้เรียบ

วิธีการนี้อาจอาศัยการวิเคราะห์ฮาร์มอนิกและการกรองสัญญาณในโดเมนความถี่โดยใช้การแปลงฟูริเยร์และการประมาณความหนาแน่นสเปกตรัมการพัฒนาวิธีการนี้ได้รับการเร่งอย่างมากในช่วงสงครามโลกครั้งที่สองโดยนักคณิตศาสตร์Norbert Wienerวิศวกรไฟฟ้าRudolf E. Kálmán , Dennis Gaborและคนอื่นๆ เพื่อกรองสัญญาณจากสัญญาณรบกวนและทำนายค่าสัญญาณ ณ จุดเวลาใดจุดหนึ่ง

ผลลัพธ์ที่เทียบเท่ากันสามารถทำได้ในโดเมนเวลา เช่น ในตัวกรอง Kalmanดูหัวข้อการกรองและการปรับให้เรียบสำหรับเทคนิคเพิ่มเติม

เทคนิคอื่นๆ ที่เกี่ยวข้อง ได้แก่:

การปรับเส้นโค้งให้เหมาะสม

การปรับเส้นโค้ง[ 12 ] [ 13 ]คือกระบวนการสร้างเส้นโค้งหรือฟังก์ชันทางคณิตศาสตร์ที่เหมาะสมที่สุดกับชุดจุดข้อมูล[ 14 ]ซึ่งอาจอยู่ภายใต้ข้อจำกัด[ 15 ] [ 16 ]การปรับเส้นโค้งอาจเกี่ยวข้องกับการแทรกสอด [ 17 ] [ 18 ] ซึ่งต้องการความพอดีที่ แน่นอนกับข้อมูล หรือ การปรับ ให้เรียบ[ 19 ] [ 20 ]ซึ่งสร้างฟังก์ชัน "เรียบ" ที่พอดีกับข้อมูลโดยประมาณ หัวข้อที่เกี่ยวข้องคือการวิเคราะห์การถดถอย[ 21 ] [ 22 ]ซึ่งมุ่งเน้นไปที่คำถามเกี่ยวกับการอนุมานทางสถิติเช่น ความไม่แน่นอนที่มีอยู่ในเส้นโค้งที่พอดีกับข้อมูลที่สังเกตได้โดยมีข้อผิดพลาดแบบสุ่ม เส้นโค้งที่ปรับแล้วสามารถใช้เป็นเครื่องมือช่วยในการแสดงภาพข้อมูล[ 23 ] [ 24 ]เพื่ออนุมานค่าของฟังก์ชันในกรณีที่ไม่มีข้อมูล[ 25 ]และเพื่อสรุปความสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นไป[ 26 ]การขยายขอบเขตหมายถึงการใช้เส้นโค้งที่เหมาะสมเกินขอบเขตของข้อมูลที่สังเกตได้[ 27 ]และขึ้นอยู่กับระดับความไม่แน่นอน[ 28 ]เนื่องจากอาจสะท้อนถึงวิธีการที่ใช้ในการสร้างเส้นโค้งมากพอๆ กับที่สะท้อนถึงข้อมูลที่สังเกตได้

สมการการเติบโต

สำหรับกระบวนการที่คาดว่าจะเติบโตขึ้นโดยทั่วไป เส้นโค้งเส้นใดเส้นหนึ่งในกราฟ (และอีกหลายเส้น) สามารถปรับให้เข้ากับข้อมูลได้โดยการประมาณค่าพารามิเตอร์ของกระบวนการเหล่านั้น

การสร้างอนุกรมเวลาทางเศรษฐกิจเกี่ยวข้องกับการประมาณค่าส่วนประกอบบางอย่างสำหรับบางวันที่โดยการประมาณค่าระหว่างค่า ("เกณฑ์มาตรฐาน") สำหรับวันที่ก่อนหน้าและวันที่หลังจากนั้น การประมาณค่าคือการประมาณค่าปริมาณที่ไม่ทราบค่าระหว่างปริมาณที่ทราบค่าสองค่า (ข้อมูลในอดีต) หรือการสรุปเกี่ยวกับข้อมูลที่ขาดหายไปจากข้อมูลที่มีอยู่ ("การอ่านระหว่างบรรทัด") [ 29 ]การประมาณค่ามีประโยชน์ในกรณีที่ข้อมูลรอบ ๆ ข้อมูลที่ขาดหายไปมีอยู่ และทราบแนวโน้ม ฤดูกาล และวัฏจักรระยะยาว ซึ่งมักทำโดยใช้ชุดข้อมูลที่เกี่ยวข้องที่ทราบสำหรับทุกวันที่เกี่ยวข้อง[ 30 ]หรืออาจ ใช้ การประมาณค่าพหุนามหรือการประมาณค่าแบบสปลายน์โดยที่ ฟังก์ชัน พหุนาม แบบแบ่งส่วน จะถูกปรับให้เข้ากับช่วงเวลาเพื่อให้เข้ากันได้อย่างราบรื่น ปัญหาที่แตกต่างกันซึ่งเกี่ยวข้องอย่างใกล้ชิดกับการประมาณค่าคือการประมาณฟังก์ชันที่ซับซ้อนด้วยฟังก์ชันที่เรียบง่าย (เรียกอีกอย่างว่าการถดถอย ) ความแตกต่างหลักระหว่างการถดถอยและการประมาณค่าคือการถดถอยพหุนามจะให้พหุนามเดียวที่จำลองชุดข้อมูลทั้งหมด อย่างไรก็ตาม การประมาณค่าแบบสปลายน์จะให้ฟังก์ชันต่อเนื่องเป็นช่วงๆ ซึ่งประกอบด้วยพหุนามจำนวนมาก เพื่อใช้ในการจำลองชุดข้อมูล

การประมาณค่าแบบนอกช่วง (Extrapolation)คือกระบวนการประมาณค่าของตัวแปรหนึ่งที่อยู่นอกเหนือช่วงการสังเกตเดิม โดยอาศัยความสัมพันธ์กับตัวแปรอื่น กระบวนการนี้คล้ายกับการประมาณค่าแบบในช่วง (Interpolation ) ซึ่งเป็นการประมาณค่าระหว่างค่าที่ทราบแล้ว แต่การประมาณค่าแบบนอกช่วงมีความไม่แน่นอน มากกว่า และมีความเสี่ยงที่จะได้ผลลัพธ์ที่ไม่มีความหมายสูงกว่า

การประมาณฟังก์ชัน

โดยทั่วไป ปัญหาการประมาณค่าฟังก์ชันนั้นต้องการให้เราเลือกฟังก์ชันจากกลุ่มฟังก์ชันที่กำหนดไว้อย่างชัดเจน ซึ่งตรงกับ ("ประมาณค่า") ฟังก์ชันเป้าหมายในลักษณะที่เฉพาะเจาะจงกับงานนั้นๆ เราสามารถแบ่งปัญหาการประมาณค่าฟังก์ชันออกเป็นสองประเภทหลักๆ ได้แก่: ประการแรก สำหรับฟังก์ชันเป้าหมายที่ทราบแล้วทฤษฎีการประมาณค่า เป็นสาขาหนึ่งของการวิเคราะห์เชิงตัวเลขที่ศึกษาว่าฟังก์ชันที่ทราบแล้วบางฟังก์ชัน (เช่นฟังก์ชันพิเศษ ) สามารถประมาณค่าได้ด้วยกลุ่มฟังก์ชันเฉพาะ (เช่นพหุนามหรือฟังก์ชันตรรกยะ ) ซึ่งมักจะมีคุณสมบัติที่พึงประสงค์ (การคำนวณที่ไม่แพง ความต่อเนื่อง ค่าอินทิกรัลและค่าลิมิต เป็นต้น) ได้อย่างไร

ประการที่สอง ฟังก์ชันเป้าหมาย เรียกว่าgอาจไม่เป็นที่รู้จัก แทนที่จะใช้สูตรที่ชัดเจน จะมีเพียงชุดของจุด (อนุกรมเวลา) ในรูปแบบ ( x , g ( x )) เท่านั้น ขึ้นอยู่กับโครงสร้างของโดเมนและโคโดเมนของg อาจมี เทคนิคหลายอย่างในการประมาณค่าgได้ ตัวอย่างเช่น หากgเป็นการดำเนินการกับจำนวนจริง สามารถใช้ เทคนิคการแทรกสอด การประมาณค่าภายนอกการวิเคราะห์การ ถดถอย และการปรับเส้นโค้งได้หากโคโดเมน (ช่วงหรือเซตเป้าหมาย) ของgเป็นเซตจำกัด จะต้องจัดการกับ ปัญหา การจำแนกประเภทแทน ปัญหาที่เกี่ยวข้องกับการประมาณอนุกรมเวลาแบบออนไลน์[ 31 ]คือการสรุปข้อมูลในครั้งเดียวและสร้างการแสดงแทนโดยประมาณที่สามารถรองรับการสอบถามอนุกรมเวลาที่หลากหลายพร้อมขอบเขตของข้อผิดพลาดกรณีที่เลวร้ายที่สุด

ในระดับหนึ่ง ปัญหาต่างๆ ( การถดถอย การจำแนกประเภทการประมาณค่าความเหมาะสม ) ได้รับการแก้ไขอย่างเป็นเอกภาพในทฤษฎีการเรียนรู้ทางสถิติโดยมองว่าเป็นปัญหา การเรียนรู้แบบมีผู้กำกับดูแล

การทำนายและการพยากรณ์

ในทางสถิติการทำนายเป็นส่วนหนึ่งของการอนุมานทางสถิติแนวทางหนึ่งในการอนุมานดังกล่าวเรียกว่าการอนุมานเชิงทำนายแต่การทำนายสามารถทำได้ภายในแนวทางใดๆ ก็ได้ของการอนุมานทางสถิติ อันที่จริง คำอธิบายหนึ่งของสถิติคือ สถิติเป็นวิธีการถ่ายทอดความรู้เกี่ยวกับกลุ่มตัวอย่างของประชากรไปยังประชากรทั้งหมด และไปยังประชากรอื่นๆ ที่เกี่ยวข้อง ซึ่งไม่จำเป็นต้องเหมือนกับการทำนายในช่วงเวลาต่างๆ เมื่อข้อมูลถูกถ่ายทอดข้ามเวลา มักจะไปยังจุดเวลาที่เฉพาะเจาะจง กระบวนการนี้เรียกว่าการ พยากรณ์

  • แบบจำลองทางสถิติที่สมบูรณ์สำหรับการจำลองแบบสุ่มเพื่อสร้างอนุกรมเวลาเวอร์ชันทางเลือก ซึ่งแสดงถึงสิ่งที่อาจเกิดขึ้นในช่วงเวลาที่ไม่เจาะจงในอนาคต
  • แบบจำลองทางสถิติแบบง่ายหรือแบบสมบูรณ์ เพื่ออธิบายผลลัพธ์ที่น่าจะเป็นไปได้ของอนุกรมเวลาในอนาคตอันใกล้ โดยอาศัยความรู้เกี่ยวกับผลลัพธ์ล่าสุด (การพยากรณ์)
  • การพยากรณ์อนุกรมเวลาโดยทั่วไปจะทำโดยใช้ซอฟต์แวร์ทางสถิติอัตโนมัติและภาษาโปรแกรมต่างๆ เช่นJulia , Python , R , SAS , SPSSและอื่นๆ อีกมากมาย
  • การพยากรณ์ข้อมูลขนาดใหญ่สามารถทำได้ด้วยApache Sparkโดยใช้ไลบรารี Spark-TS ซึ่งเป็นแพ็กเกจของบุคคลที่สาม[ 32 ]

การจำแนกประเภท

การกำหนดรูปแบบอนุกรมเวลาให้กับหมวดหมู่เฉพาะ เช่น การระบุคำศัพท์จากชุดการเคลื่อนไหวของมือในภาษามือ

การแบ่งส่วน

การแบ่งอนุกรมเวลาออกเป็นส่วนย่อยๆ บ่อยครั้งที่อนุกรมเวลาสามารถแสดงได้ในรูปของส่วนย่อยๆ แต่ละส่วนมีคุณสมบัติเฉพาะของตนเอง ตัวอย่างเช่น สัญญาณเสียงจากการประชุมทางโทรศัพท์สามารถแบ่งออกเป็นส่วนๆ ตามช่วงเวลาที่แต่ละคนพูด ในการแบ่งส่วนอนุกรมเวลา เป้าหมายคือการระบุจุดแบ่งส่วนในอนุกรมเวลา และกำหนดลักษณะสมบัติทางพลวัตที่เกี่ยวข้องกับแต่ละส่วน เราสามารถแก้ปัญหานี้ได้โดยใช้การตรวจจับจุดเปลี่ยนหรือโดยการจำลองอนุกรมเวลาเป็นระบบที่ซับซ้อนกว่า เช่น ระบบเชิงเส้นแบบกระโดดมาร์คอฟ

การจัดกลุ่ม

ข้อมูลอนุกรมเวลาอาจถูกจัดกลุ่ม อย่างไรก็ตามต้องระมัดระวังเป็นพิเศษเมื่อพิจารณาการจัดกลุ่มลำดับย่อย[ 33 ] [ 34 ] การจัดกลุ่มอนุกรมเวลาอาจแบ่งออกเป็น

  • การจัดกลุ่มอนุกรมเวลาทั้งหมด (อนุกรมเวลาหลายชุดที่ต้องการหาคลัสเตอร์)
  • การจัดกลุ่มอนุกรมเวลาแบบลำดับย่อย (อนุกรมเวลาเดียว แบ่งออกเป็นส่วนย่อยโดยใช้หน้าต่างเลื่อน)
  • การจัดกลุ่มจุดเวลา

การจัดกลุ่มอนุกรมเวลาลำดับย่อย

การจัดกลุ่มอนุกรมเวลาลำดับย่อยส่งผลให้เกิดคลัสเตอร์ที่ไม่เสถียร (สุ่ม) ที่เกิดจากการสกัดคุณลักษณะโดยใช้การแบ่งกลุ่มด้วยหน้าต่างเลื่อน[ 35 ]พบว่าศูนย์กลางคลัสเตอร์ (ค่าเฉลี่ยของอนุกรมเวลาในคลัสเตอร์ - ซึ่งก็คืออนุกรมเวลาเช่นกัน) เป็นไปตามรูปแบบไซน์ที่เลื่อนไปตามอำเภอใจ (โดยไม่คำนึงถึงชุดข้อมูล แม้แต่ในการรับรู้ของการเดินแบบสุ่ม ) ซึ่งหมายความว่าศูนย์กลางคลัสเตอร์ที่พบนั้นไม่สามารถอธิบายชุดข้อมูลได้ เนื่องจากศูนย์กลางคลัสเตอร์เป็นคลื่นไซน์ที่ไม่เป็นตัวแทนเสมอ

นางแบบ

แบบจำลองคลาสสิก (AR, ARMA, ARIMA และแบบจำลองที่รู้จักกันดีอื่นๆ)

แบบจำลองสำหรับข้อมูลอนุกรมเวลาสามารถมีได้หลายรูปแบบและแสดงถึงกระบวนการสุ่ม ที่แตกต่างกัน เมื่อสร้างแบบจำลองความแปรผันในระดับของกระบวนการ แบบจำลองสามประเภทหลักที่มีความสำคัญในทางปฏิบัติ ได้แก่ แบบจำลอง อัตถารีเกรสซีฟ (AR) แบบ จำลองอินทิเกรต (I) และ แบบจำลอง ค่าเฉลี่ยเคลื่อนที่ (MA) แบบจำลองทั้งสามประเภทนี้ขึ้นอยู่กับจุดข้อมูลก่อนหน้าแบบเชิง เส้น [ 36 ]การผสมผสานแนวคิดเหล่านี้ทำให้เกิดแบบจำลองอัตถารีเกรสซีฟเคลื่อนที่เฉลี่ย (ARMA) และแบบจำลอง อัตถารี เกรสซีฟอินทิเกรตเคลื่อนที่เฉลี่ย (ARIMA) แบบจำลอง อัตถารีเกรสซีฟเศษส่วนอินทิเกรตเคลื่อนที่เฉลี่ย (ARFIMA) เป็นการขยายแบบจำลองสามแบบแรก การขยายที่สำคัญอีกประการหนึ่งคือแบบจำลองอัตถารีเกรสซีฟแปรผันตามเวลา (TVAR) ซึ่งอนุญาตให้สัมประสิทธิ์ AR เปลี่ยนแปลงไปตามเวลา ทำให้แบบจำลองสามารถจับพลวัตที่เปลี่ยนแปลงหรือไม่คงที่ได้ ส่วนขยายของคลาสเหล่านี้เพื่อจัดการกับข้อมูลที่มีค่าเป็นเวกเตอร์นั้นมีอยู่ภายใต้หัวข้อแบบจำลองอนุกรมเวลาหลายตัวแปร และบางครั้งตัวย่อข้างต้นจะถูกขยายโดยการเพิ่ม "V" นำหน้าสำหรับ "เวกเตอร์" เช่น VAR สำหรับเวกเตอร์อัตถารีเกรสชันนอกจากนี้ยังมีส่วนขยายเพิ่มเติมของแบบจำลองเหล่านี้สำหรับการใช้งานในกรณีที่อนุกรมเวลาที่สังเกตได้ถูกขับเคลื่อนโดยอนุกรมเวลา "บังคับ" บางอย่าง (ซึ่งอาจไม่มีผลกระทบเชิงสาเหตุต่ออนุกรมที่สังเกตได้) ความแตกต่างจากกรณีหลายตัวแปรคืออนุกรมบังคับอาจเป็นแบบกำหนดได้หรืออยู่ภายใต้การควบคุมของผู้ทำการทดลอง สำหรับแบบจำลองเหล่านี้ ตัวย่อจะถูกขยายโดยการเพิ่ม "X" สุดท้ายสำหรับ "ภายนอก"

แบบจำลองอัตถารีเกรสซีฟแปรผันตามเวลา (TVAR)

แบบจำลองอัตถารีเกรสซีฟแปรผันตามเวลา (TVAR) มีประโยชน์อย่างยิ่งสำหรับการวิเคราะห์อนุกรมเวลาที่ไม่คงที่ ซึ่งพลวัตพื้นฐานเปลี่ยนแปลงไปตามเวลาในรูปแบบที่ซับซ้อน ไม่จำกัดเฉพาะรูปแบบการเปลี่ยนแปลงแบบคลาสสิก เช่น แนวโน้มหรือรูปแบบตามฤดูกาล แตกต่างจากแบบจำลอง AR แบบคลาสสิกที่มีพารามิเตอร์คงที่ แบบจำลอง TVAR อนุญาตให้สัมประสิทธิ์อัตถารีเกรสซีฟเปลี่ยนแปลงไปตามฟังก์ชันของเวลา โดยทั่วไปจะแสดงผ่านการขยายฟังก์ชันพื้นฐาน ซึ่งรูปแบบและความซับซ้อนถูกกำหนดโดยผู้ใช้ ทำให้สามารถสร้างแบบจำลองพฤติกรรมที่เปลี่ยนแปลงตามเวลาได้อย่างยืดหยุ่นสูง ซึ่งช่วยให้สามารถจับภาพรูปแบบที่ไม่คงที่เฉพาะที่แสดงโดยข้อมูลได้ ความยืดหยุ่นนี้ทำให้เหมาะอย่างยิ่งสำหรับการสร้างแบบจำลองการเปลี่ยนแปลงโครงสร้าง การเปลี่ยนแปลงระบอบ หรือวิวัฒนาการทีละน้อยในพฤติกรรมของระบบ แบบจำลองอนุกรมเวลา TVAR ถูกนำไปใช้อย่างกว้างขวางในสาขาต่างๆ เช่น การประมวลผลสัญญาณ[ 37 ] [ 38 ]เศรษฐศาสตร์[ 39 ]การเงิน[ 40 ]ความน่าเชื่อถือและการตรวจสอบสภาพ [ 41 ] [ 42 ] [ 43 ]โทรคมนาคม[ 44 ] [ 45 ]ประสาทวิทยา[ 46 ]วิทยาศาสตร์ภูมิอากาศ[ 47 ]และอุทกวิทยา[ 48 ] ซึ่งอนุกรมเวลามักแสดงพลวัต ที่แบบจำลองเชิงเส้นแบบดั้งเดิมไม่สามารถแสดงได้อย่างเพียงพอ การประมาณค่าแบบจำลอง TVAR โดยทั่วไปเกี่ยวข้องกับวิธีการต่างๆ เช่น การปรับเรียบเคอร์เนล[ 49 ]กำลังสองน้อยที่สุดแบบวนซ้ำ[ 50 ]หรือการกรอง Kalman [ 51 ]

แบบจำลองที่ไม่เป็นเชิงเส้น

การพึ่งพาแบบไม่เชิงเส้นของระดับของอนุกรมกับจุดข้อมูลก่อนหน้าเป็นสิ่งที่น่าสนใจ ส่วนหนึ่งเป็นเพราะความเป็นไปได้ในการสร้าง อนุกรมเวลา ที่วุ่นวายอย่างไรก็ตาม ที่สำคัญกว่านั้น การตรวจสอบเชิงประจักษ์สามารถบ่งชี้ถึงข้อดีของการใช้การคาดการณ์ที่ได้มาจากแบบจำลองที่ไม่เชิงเส้น มากกว่าการคาดการณ์ที่ได้มาจากแบบจำลองเชิงเส้น เช่น ในแบบจำลองอัตถารีเกรสซีฟภายนอกที่ไม่เชิงเส้น เอกสารอ้างอิงเพิ่มเติมเกี่ยวกับการวิเคราะห์อนุกรมเวลาที่ไม่เชิงเส้น: (Kantz และ Schreiber), [ 52 ]และ (Abarbanel) [ 53 ]

ในบรรดาแบบจำลองอนุกรมเวลาแบบไม่เชิงเส้นประเภทอื่นๆ นั้น มีแบบจำลองที่ใช้แสดงการเปลี่ยนแปลงของความแปรปรวนเมื่อเวลาผ่านไป ( ความแปรปรวนไม่คงที่ ) แบบจำลองเหล่านี้แสดงถึงความแปรปรวนไม่คงที่แบบมีเงื่อนไขแบบอัตถารีเกรสซีฟ (ARCH) และชุดของแบบจำลองนี้ประกอบด้วยรูปแบบการแสดงผลที่หลากหลาย ( GARCH , TARCH, EGARCH, FIGARCH, CGARCH เป็นต้น) ในที่นี้ การเปลี่ยนแปลงของความแปรปรวนมีความสัมพันธ์หรือถูกทำนายโดยค่าในอดีตที่ผ่านมาของอนุกรมที่สังเกตได้ ซึ่งแตกต่างจากการแสดงความแปรปรวนที่เปลี่ยนแปลงในระดับท้องถิ่นแบบอื่นๆ ที่ความแปรปรวนอาจถูกจำลองว่าถูกขับเคลื่อนโดยกระบวนการที่เปลี่ยนแปลงตามเวลาแยกต่างหาก เช่นใน แบบ จำลอง สุ่มสองชั้น

แนวทางการสร้างแบบจำลองอื่นๆ

ในงานวิจัยล่าสุดเกี่ยวกับการวิเคราะห์แบบ "ไร้แบบจำลอง" (ซึ่งเป็นคำที่มักใช้เพื่ออ้างถึงการวิเคราะห์ที่ไม่ต้องอาศัยการสร้างแบบจำลองวิวัฒนาการของกระบวนการเมื่อเวลาผ่านไปด้วยการแสดงออกทางคณิตศาสตร์แบบพาราเมตริก) วิธีการที่ใช้การแปลงเวฟเล็ต (เช่น เวฟเล็ตแบบอยู่กับที่ในระดับท้องถิ่นและเครือข่ายประสาทที่แยกส่วนด้วยเวฟเล็ต) ได้รับความนิยมมากขึ้น[ 54 ]เทคนิคหลายระดับ (มักเรียกว่าหลายความละเอียด) จะแยกส่วนอนุกรมเวลาที่กำหนด โดยพยายามแสดงให้เห็นถึงการพึ่งพาเวลาในหลายระดับ ดูเพิ่มเติมที่ เทคนิค มัลติแฟรกทัลแบบสลับมาร์คอฟ (MSMF) สำหรับการสร้างแบบจำลองวิวัฒนาการของความผันผวน

แบบ จำลองมาร์คอฟแบบซ่อนเร้น (Hidden Markov Model: HMM) เป็นแบบจำลองมาร์คอฟเชิงสถิติที่ถือว่าระบบที่กำลังจำลองนั้นเป็นกระบวนการมาร์คอฟที่มีสถานะที่ไม่สามารถสังเกตได้ (ซ่อนเร้น) HMM สามารถพิจารณาได้ว่าเป็นเครือข่ายเบย์เซียนแบบไดนามิก ที่ง่ายที่สุด แบบจำลอง HMM ถูกนำมาใช้กันอย่างแพร่หลายในการรู้จำเสียงพูดเพื่อแปลงอนุกรมเวลาของคำพูดเป็นข้อความ

โมเดลเหล่านี้จำนวนมากถูกรวบรวมไว้ในแพ็กเกจsktime ของ Python

สัญกรณ์

มีการใช้สัญลักษณ์หลายแบบในการวิเคราะห์อนุกรมเวลา สัญลักษณ์ที่ใช้กันทั่วไปซึ่งระบุอนุกรมเวลาXที่มีดัชนีเป็นจำนวนธรรมชาติเขียนได้ดังนี้

X = ( X 1 , X 2 , ...) .

สัญลักษณ์อีกแบบที่นิยมใช้คือ

Y = ( Y t : tT ) ,

โดยที่T คือเซตดัชนี

เงื่อนไข

ทฤษฎีส่วนใหญ่ตั้งอยู่บนพื้นฐานของเงื่อนไขสองชุด:

ภาวะเออร์โกดิก (Ergodicity) บ่งชี้ถึงภาวะสเตชันนารี (Stationarity) แต่ในทางกลับกันนั้นไม่จำเป็นต้องเป็นเช่นนั้นเสมอไป ภาวะสเตชันนารีมักถูกจำแนกออกเป็นสเตชันนารีแบบเข้มงวด (strict stationarity ) และสเตชันนารีแบบกว้างหรือสเตชันนารีอันดับสอง (wide-sense or second-order stationarity)ทั้งแบบจำลองและการประยุกต์ใช้สามารถพัฒนาได้ภายใต้เงื่อนไขเหล่านี้ แม้ว่าแบบจำลองในกรณีหลังอาจถือได้ว่ามีการกำหนดรายละเอียดเพียงบางส่วนเท่านั้น

นอกจากนี้ การวิเคราะห์อนุกรมเวลาสามารถนำไปใช้ได้ในกรณีที่อนุกรมเวลาคงที่ตามฤดูกาลหรือไม่คงที่ สถานการณ์ที่แอมพลิจูดของส่วนประกอบความถี่เปลี่ยนแปลงตามเวลาสามารถจัดการได้ในการวิเคราะห์เวลา-ความถี่ซึ่งใช้การแสดงเวลา-ความถี่ของอนุกรมเวลาหรือสัญญาณ[ 55 ]

เครื่องมือ

เครื่องมือสำหรับการวิเคราะห์ข้อมูลอนุกรมเวลา ได้แก่:

มาตรการ

เมตริกหรือ คุณลักษณะอนุกรมเวลาที่สามารถใช้สำหรับการจำแนก อนุกรมเวลา หรือการวิเคราะห์การถดถอย : [ 59 ]

การแสดงภาพ

อนุกรมเวลาสามารถแสดงภาพได้ด้วยแผนภูมิสองประเภท: แผนภูมิแบบซ้อนทับและแผนภูมิแบบแยก แผนภูมิแบบซ้อนทับจะแสดงอนุกรมเวลาทั้งหมดบนเค้าโครงเดียวกัน ในขณะที่แผนภูมิแบบแยกจะแสดงอนุกรมเวลาบนเค้าโครงที่แตกต่างกัน (แต่จัดเรียงเพื่อวัตถุประสงค์ในการเปรียบเทียบ) [ 63 ]

แผนภูมิที่ซ้อนทับกัน

แผนภูมิแยก

  • กราฟขอบฟ้า
  • แผนภูมิเส้นย่อ (จำนวนเท่าขนาดเล็ก)
  • กราฟเงา
  • กราฟเงาวงกลม

ประวัติศาสตร์

เจวอนส์เป็นคนแรกที่ศึกษาอนุกรมเวลา[ 64 ]ในหนังสือของเขา เขาได้ตรวจสอบอนุกรมเวลาทางการเงินรายสัปดาห์จำนวนหนึ่งระหว่างปี พ.ศ. 2468 ถึง พ.ศ. 2403 ซึ่งรวมถึงอนุกรมเวลาของการล้มละลาย การหมุนเวียนของสกุลเงิน และอัตราส่วนลด

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • De Gooijer, Jan G.; Hyndman, Rob J. (2006). "25 ปีแห่งการพยากรณ์อนุกรมเวลา". วารสารการพยากรณ์นานาชาติ . ยี่สิบห้าปีแห่งการพยากรณ์. 22 (3): 443– 473. CiteSeerX  10.1.1.154.9227 . doi : 10.1016/j.ijforecast.2006.01.001 . S2CID  14996235 .
  • Box, George ; Jenkins, Gwilym (1976), การวิเคราะห์อนุกรมเวลา: การพยากรณ์และการควบคุม ฉบับปรับปรุงโอ๊คแลนด์ แคลิฟอร์เนีย: Holden-Day
  • Durbin J. , Koopman SJ (2001), การวิเคราะห์อนุกรมเวลาด้วยวิธีการปริภูมิสถานะ , สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์
  • เกอร์เชนเฟลด์, นีล (2000), ธรรมชาติของการสร้างแบบจำลองทางคณิตศาสตร์ , สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ , ISBN 978-0-521-57095-4, OCLC  174825352
  • แฮมิลตัน, เจมส์ (1994), การวิเคราะห์อนุกรมเวลา , สำนักพิมพ์มหาวิทยาลัยพรินซ์ตัน , ISBN 978-0-691-04289-3
  • Priestley, MB (1981), การวิเคราะห์สเปกตรัมและอนุกรมเวลา , สำนักพิมพ์ Academic Press . ISBN 978-0-12-564901-8
  • Shasha, D. (2004), การค้นพบประสิทธิภาพสูงในอนุกรมเวลา , Springer , ISBN 978-0-387-00857-8
  • Shumway RH, Stoffer DS (2017), การวิเคราะห์อนุกรมเวลาและการประยุกต์ใช้: พร้อมตัวอย่าง R (ฉบับที่ 4) , Springer, ISBN 978-3-319-52451-1
  • Weigend AS, Gershenfeld NA (บรรณาธิการ) (1994), การพยากรณ์อนุกรมเวลา: การพยากรณ์อนาคตและการทำความเข้าใจอดีตรายงานการประชุมเชิงปฏิบัติการวิจัยขั้นสูงของ NATO ว่าด้วยการวิเคราะห์อนุกรมเวลาเชิงเปรียบเทียบ (ซานตาเฟ, พฤษภาคม 1992), Addison- Wesley
  • Wiener, Norbert . การคาดการณ์ การแทรกสอด และการปรับเรียบอนุกรมเวลาคงที่: พร้อมการประยุกต์ใช้ทางวิศวกรรม . สำนักพิมพ์ MIT . ISBN 978-0-262-25719-0.
  • Woodward, WA, Gray, HL และ Elliott, AC (2012), การวิเคราะห์อนุกรมเวลาประยุกต์ , CRC Press .
  • Auffarth, Ben (2021). การเรียนรู้ของเครื่องจักรสำหรับอนุกรมเวลาด้วย Python: การพยากรณ์ ทำนาย และตรวจจับความผิดปกติด้วยวิธีการเรียนรู้ของเครื่องจักรที่ทันสมัย ​​(ฉบับพิมพ์ครั้งที่ 1). สำนักพิมพ์ Packt. ISBN 978-1-80181-962-6สืบค้นข้อมูลเมื่อวันที่ 5 พฤศจิกายน 2021
  • บทนำสู่การวิเคราะห์อนุกรมเวลา (คู่มือสถิติทางวิศวกรรม) — คู่มือปฏิบัติสำหรับการวิเคราะห์อนุกรมเวลา
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Time_series&oldid=1351921655 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ อนุกรมเวลา

ใน ทางคณิตศาสตร์ อนุกรม เวลา คือลำดับของ จุดข้อมูล ที่จัดเรียง จัดทำรายการ หรือแสดงเป็นกราฟตามลำดับเวลา โดยทั่วไปแล้ว อนุกรมเวลาประกอบด้วยการสังเกตที่บันทึกไว้ ณ...

วิธีการวิเคราะห์

วิธีการวิเคราะห์อนุกรมเวลาสามารถแบ่งออกได้เป็นสองประเภท ได้แก่ วิธีการ ในโดเมนความถี่ และ วิธีการ ในโดเมนเวลา ประเภทแรกได้แก่ การวิเคราะห์สเปกตรัม และ การวิเคราะห์เวฟเล็ต ส่วนประเภทหลังได้แก่ การวิเคราะห์ ความสัมพันธ์อัตโนมัติ และ การวิเคราะห์...

ข้อมูลแผง

อนุกรมเวลาเป็น ข้อมูลประเภทหนึ่งของข้อมูลแบบพาเนล ข้อมูลแบบพาเนลเป็นกลุ่มข้อมูลทั่วไป ซึ่งเป็นชุดข้อมูลหลายมิติ ในขณะที่ชุดข้อมูลอนุกรมเวลาเป็นข้อมูลแบบพาเนลมิติเดียว (เช่นเดียวกับ ชุดข้อมูลแบบภาคตัดขวาง )...

การวิเคราะห์

มีวิธีการวิเคราะห์ข้อมูลและแรงจูงใจหลายประเภทสำหรับอนุกรมเวลา ซึ่งเหมาะสมกับวัตถุประสงค์ที่แตกต่างกัน