อ่าน 4 นาที
การวิเคราะห์ส่วนประกอบเชิงทิศทาง
การวิเคราะห์องค์ประกอบทิศทาง ( DCA ) เป็นวิธีการทางสถิติที่ใช้ในวิทยาศาสตร์ภูมิอากาศเพื่อระบุรูปแบบตัวแทนของความแปรปรวนในชุดข้อมูลเชิงพื้นที่และเวลา เช่น
การวิเคราะห์ส่วนประกอบเชิงทิศทาง
การวิเคราะห์องค์ประกอบทิศทาง ( DCA ) [ 1 ] [ 2 ] [ 3 ] เป็นวิธีการทางสถิติที่ใช้ในวิทยาศาสตร์ภูมิอากาศเพื่อระบุรูปแบบตัวแทนของความแปรปรวนในชุดข้อมูลเชิงพื้นที่และเวลา เช่น การสังเกตสภาพภูมิอากาศในอดีต[ 1 ]กลุ่มการพยากรณ์อากาศ[ 2 ]หรือกลุ่มสภาพภูมิอากาศ[ 3 ]
รูปแบบ DCA แรกคือรูปแบบความแปรปรวนของสภาพอากาศหรือภูมิอากาศที่ทั้งมีแนวโน้มที่จะเกิดขึ้น (วัดโดยใช้ความน่าจะเป็น ) และมีผลกระทบอย่างมาก (สำหรับฟังก์ชันผลกระทบเชิงเส้นที่กำหนด และภายใต้เงื่อนไขทางคณิตศาสตร์บางประการ: ดูด้านล่าง)
รูปแบบ DCA แรกนั้นแตกต่างจาก รูปแบบ PCA แรก ซึ่งมีแนวโน้มที่จะเกิดขึ้น แต่ผลกระทบอาจไม่มากนัก และแตกต่างจากรูปแบบที่ได้มาจากความชันของฟังก์ชันผลกระทบ ซึ่งมีผลกระทบมาก แต่โอกาสที่จะเกิดขึ้นอาจไม่มากนัก
DCA แตกต่างจากวิธีการระบุรูปแบบอื่นๆ ที่ใช้ในการวิจัยสภาพภูมิอากาศ เช่นEOF [ 4 ] EOF ที่หมุน[ 5 ]และ EOF ที่ขยาย[ 6 ]ตรงที่คำนึงถึงเวกเตอร์ภายนอก ซึ่งก็คือเกรเดียนต์ของผล กระทบ
DCA นำเสนอวิธีการลดกลุ่มตัวอย่างขนาดใหญ่จากการพยากรณ์อากาศ[ 2 ]หรือแบบจำลองสภาพภูมิอากาศ[ 3 ]ให้เหลือเพียงสองรูปแบบ รูปแบบแรกคือค่าเฉลี่ยของกลุ่มตัวอย่าง และรูปแบบที่สองคือรูปแบบ DCA ซึ่งแสดงถึงความแปรปรวนรอบค่าเฉลี่ยของกลุ่มตัวอย่างในลักษณะที่คำนึงถึงผลกระทบ DCA แตกต่างจากวิธีการอื่น ๆ ที่ได้รับการเสนอสำหรับการลดกลุ่มตัวอย่าง[ 7 ] [ 8 ]ตรงที่มันคำนึงถึงผลกระทบนอกเหนือจากโครงสร้างของกลุ่มตัวอย่าง
ภาพรวม
ข้อมูลนำเข้า
DCA คำนวณจากอินพุตสองรายการ: [ 1 ] [ 2 ] [ 3 ]
- ชุดข้อมูลหลายตัวแปรของข้อมูลสภาพอากาศหรือภูมิอากาศ เช่น ข้อมูลการสังเกตการณ์ภูมิอากาศในอดีต หรือชุดข้อมูลสภาพอากาศหรือภูมิอากาศแบบรวมกลุ่ม
- ฟังก์ชันผลกระทบเชิงเส้น ฟังก์ชันผลกระทบเชิงเส้นเป็นฟังก์ชันที่กำหนดระดับผลกระทบสำหรับรูปแบบเชิงพื้นที่แต่ละรูปแบบในข้อมูลสภาพอากาศหรือภูมิอากาศ โดยเป็นผลรวมถ่วงน้ำหนักของค่าที่ตำแหน่งต่างๆ ในรูปแบบเชิงพื้นที่ ตัวอย่างเช่น ค่าเฉลี่ยตลอดรูปแบบเชิงพื้นที่ ฟังก์ชันผลกระทบเชิงเส้นสามารถสร้างขึ้นเป็นพจน์แรกในอนุกรมเทย์เลอร์แบบ หลายตัวแปร ของฟังก์ชันผลกระทบที่ไม่เป็นเชิงเส้น[ 3 ]
สูตร
พิจารณาชุดข้อมูลเวลาและพื้นที่ซึ่งประกอบด้วยเวกเตอร์รูปแบบเชิงพื้นที่แต่ละรายการโดยที่แต่ละรูปแบบถือเป็นตัวอย่างเดี่ยวจาก1 การแจกแจงปกติแบบหลายตัวแปรที่มีค่าเฉลี่ยเป็นศูนย์และเมทริกซ์ความแปรปรวนร่วม
เรากำหนดฟังก์ชันผลกระทบเชิงเส้นของรูปแบบเชิงพื้นที่เป็น โดยที่คือเวกเตอร์ของน้ำหนักเชิงพื้นที่
รูปแบบ DCA แรกกำหนดโดยเมทริกซ์ความแปรปรวนร่วมและน้ำหนักโดยนิพจน์ สัดส่วน [ 1 ] [ 2 ] [ 3 ]
จากนั้นรูปแบบสามารถปรับให้เป็นมาตรฐานตามความยาวที่ต้องการได้[ 1 ]
คุณสมบัติ
หากข้อมูลสภาพอากาศหรือภูมิอากาศมีการกระจายแบบวงรี (เช่น มีการกระจายแบบการแจกแจงปกติหลายตัวแปรหรือการแจกแจง t หลายตัวแปร ) รูปแบบ DCA แรก (DCA1) จะถูกกำหนดให้เป็นรูปแบบเชิงพื้นที่ที่มีคุณสมบัติทางคณิตศาสตร์ดังต่อไปนี้:
- DCA1 เพิ่มความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับค่าผลกระทบที่กำหนด[ 1 ]
- DCA1 เพิ่มผลกระทบสูงสุดสำหรับค่าความหนาแน่นความน่าจะเป็นที่กำหนด[ 1 ]
- DCA1 เพิ่มผลคูณของผลกระทบและความหนาแน่นของความน่าจะเป็นให้สูงสุด[ 3 ]
- DCA1 คือความคาดหวังแบบมีเงื่อนไขโดยมีเงื่อนไขว่าต้องเกินระดับผลกระทบที่กำหนด[ 3 ]
- DCA1 คือค่าเฉลี่ยของกลุ่มที่ถ่วงน้ำหนักตามผลกระทบ[ 3 ]
- การปรับเปลี่ยนใดๆ ของ DCA1 จะส่งผลให้เกิดรูปแบบที่มีความรุนแรงน้อยลง หรือมีความหนาแน่นของความน่าจะเป็นต่ำลง
ตัวอย่างปริมาณน้ำฝน
ตัวอย่างเช่น ในชุดข้อมูลความผิดปกติของปริมาณน้ำฝน โดยใช้ตัวชี้วัดผลกระทบที่กำหนดเป็นความผิดปกติของปริมาณน้ำฝนรวม รูปแบบ DCA แรกคือรูปแบบเชิงพื้นที่ที่มีความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับความผิดปกติของปริมาณน้ำฝนรวมที่กำหนด หากเลือกความผิดปกติของปริมาณน้ำฝนรวมที่มีค่ามาก รูปแบบนี้จะรวมเอาความเป็นสุดขั้วในแง่ของตัวชี้วัด (เช่น แสดงถึงปริมาณน้ำฝนรวมจำนวนมาก) เข้ากับความเป็นไปได้ในแง่ของรูปแบบ ดังนั้นจึงเหมาะสมอย่างยิ่งที่จะใช้เป็นรูปแบบสุดขั้วที่เป็นตัวแทน
การเปรียบเทียบกับ PCA
ความแตกต่างหลักระหว่างการวิเคราะห์ส่วนประกอบหลัก (PCA) และ DCA คือ[ 1 ]
- PCA เป็นฟังก์ชันของเมทริกซ์ความแปรปรวนร่วมเท่านั้น และรูปแบบ PCA แรกถูกกำหนดขึ้นเพื่อเพิ่มความแปรปรวนที่อธิบายได้สูงสุด
- DCA เป็นฟังก์ชันของเมทริกซ์ความแปรปรวนร่วมและทิศทางเวกเตอร์ (เกรเดียนต์ของฟังก์ชันผลกระทบ) และรูปแบบ DCA แรกถูกกำหนดขึ้นเพื่อเพิ่มความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับค่าที่กำหนดของตัวชี้วัดผลกระทบ
ดังนั้น สำหรับ รูปแบบเชิงพื้นที่ ของเวกเตอร์หน่วย :
- รูปแบบเชิงพื้นที่ PCA แรกมักสอดคล้องกับค่าความแปรปรวนที่อธิบายได้สูงกว่า แต่จะมีค่าตัวชี้วัดผลกระทบต่ำกว่า (เช่น ความผิดปกติของปริมาณน้ำฝนรวม) ยกเว้นในกรณีพิเศษ
- รูปแบบเชิงพื้นที่ DCA แรกมักสอดคล้องกับค่าตัวชี้วัดผลกระทบที่สูงกว่า แต่มีค่าความแปรปรวนที่อธิบายได้ต่ำกว่า ยกเว้นในกรณีพิเศษ
กรณีที่ผิดปกติเกิดขึ้นเมื่อรูปแบบ PCA และ DCA เท่ากัน
นอกจากนี้ เมื่อพิจารณารูปแบบ PCA แรกแล้ว รูปแบบ DCA สามารถปรับขนาดได้ดังนี้:
- รูปแบบ DCA ที่ปรับขนาดแล้วมีความหนาแน่นของความน่าจะเป็นเท่ากับรูปแบบ PCA แรก แต่มีผลกระทบที่สูงกว่า หรือ
- รูปแบบ DCA ที่ปรับขนาดแล้วมีผลกระทบเช่นเดียวกับรูปแบบ PCA แรก แต่มีความหนาแน่นของความน่าจะเป็นสูงกว่า
ตัวอย่างสองมิติ
แหล่งที่มา: [ 1 ]

ภาพที่ 1 แสดงตัวอย่าง ซึ่งสามารถเข้าใจได้ดังนี้:
- แกนทั้งสองแสดงถึงค่าความผิดปกติของปริมาณน้ำฝนเฉลี่ยรายปี ณ สองตำแหน่ง โดยค่าความผิดปกติของปริมาณน้ำฝนรวมสูงสุดจะอยู่ทางมุมขวาบนของแผนภาพ
- สันนิษฐานว่าความแปรปรวนร่วมของปริมาณน้ำฝนที่ผิดปกติ ณ สองตำแหน่งนั้น เป็นไปตามการแจกแจงปกติแบบสองตัวแปร
- วงรีแสดงถึงเส้นโค้งความหนาแน่นของความน่าจะเป็นเส้นเดียวจากค่าปกติแบบสองตัวแปร โดยค่าที่สูงกว่าจะอยู่ภายในวงรี
- จุดสีแดงตรงกลางวงรีแสดงว่าปริมาณฝนไม่เป็นค่าผิดปกติในทั้งสองตำแหน่ง
- ลูกศรเส้นขนานสีน้ำเงินแสดงแกนหลักของวงรี ซึ่งเป็นเวกเตอร์รูปแบบเชิงพื้นที่ PCA ตัวแรกด้วย
- ในกรณีนี้ รูปแบบ PCA จะถูกปรับขนาดเพื่อให้สัมผัสกับวงรี
- เส้นตรงแนวทแยงแสดงถึงค่าความผิดปกติของปริมาณน้ำฝนรวมที่เป็นบวกคงที่ ซึ่งสันนิษฐานว่าอยู่ในระดับที่ค่อนข้างสูงมาก
- ลูกศรเส้นประสีแดงแสดงถึงรูปแบบ DCA แรก ซึ่งชี้ไปยังจุดที่เส้นทแยงมุมสัมผัสกับวงรี
- ในกรณีนี้ รูปแบบ DCA จะถูกปรับขนาดเพื่อให้สัมผัสกับวงรี
จากแผนภาพนี้ จะเห็นได้ว่ารูปแบบ DCA มีคุณสมบัติดังต่อไปนี้:
- ในบรรดาจุดทั้งหมดที่อยู่บนเส้นทแยงมุม จุดนี้เป็นจุดที่มีความหนาแน่นของความน่าจะเป็นสูงสุด
- ในบรรดาจุดทั้งหมดบนวงรี จุดนี้เป็นจุดที่มีปริมาณน้ำฝนรวมผิดปกติมากที่สุด
- มีความหนาแน่นของความน่าจะเป็นเท่ากับรูปแบบ PCA แต่แสดงถึงปริมาณน้ำฝนรวมที่สูงกว่า (กล่าวคือ จุดต่างๆ จะอยู่ค่อนไปทางมุมขวาบนของแผนภาพมากกว่า)
- การเปลี่ยนแปลงใดๆ ของรูปแบบ DCA จะลดความหนาแน่นของความน่าจะเป็น (หากเคลื่อนออกจากวงรี) หรือลดความผิดปกติของปริมาณน้ำฝนโดยรวม (หากเคลื่อนไปตามหรือเข้าไปในวงรี)
ในกรณีนี้ ค่าความผิดปกติของปริมาณน้ำฝนรวมของรูปแบบ PCA ค่อนข้างน้อย เนื่องจากความสัมพันธ์ผกผันระหว่างค่าความผิดปกติของปริมาณน้ำฝนในสองตำแหน่ง ส่งผลให้รูปแบบ PCA แรกไม่ใช่ตัวอย่างที่ดีของรูปแบบที่มีค่าความผิดปกติของปริมาณน้ำฝนรวมมาก ในขณะที่รูปแบบ DCA แรกนั้นเป็นตัวอย่างที่ดี
ในมิติอื่น วงรีจะกลายเป็นทรงรี เส้นทแยงมุมจะกลายเป็นระนาบในมิติอื่น และรูปแบบ PCA และ DCA จะเป็นเวกเตอร์ในมิติอื่น
แอปพลิเคชัน
การประยุกต์ใช้กับความแปรปรวนของสภาพภูมิอากาศ
DCA ได้ถูกนำไปใช้กับชุดข้อมูลCRU ของความแปรปรวนของปริมาณน้ำฝนในอดีต [ 9 ]เพื่อทำความเข้าใจรูปแบบที่เป็นไปได้มากที่สุดของปริมาณน้ำฝนสุดขั้วในสหรัฐอเมริกาและจีน[ 1 ]
การประยุกต์ใช้กับการพยากรณ์อากาศแบบกลุ่ม
DCA ได้ถูกนำไปใช้กับ ชุดพยากรณ์อากาศระยะกลาง ของ ECMWFเพื่อระบุรูปแบบอุณหภูมิสุดขั้วที่มีแนวโน้มมากที่สุดในชุดพยากรณ์[ 2 ]
การประยุกต์ใช้กับการคาดการณ์แบบจำลองสภาพภูมิอากาศแบบกลุ่ม
DCA ได้ถูกนำไปใช้กับการคาดการณ์แบบจำลองสภาพภูมิอากาศแบบกลุ่มเพื่อระบุรูปแบบที่เป็นไปได้มากที่สุดของปริมาณน้ำฝนในอนาคตที่รุนแรง[ 3 ]
ที่มาของรูปแบบ DCA แรก
แหล่งที่มา: [ 1 ]
พิจารณาชุดข้อมูลเวลาและพื้นที่ซึ่งประกอบด้วยเวกเตอร์รูปแบบเชิงพื้นที่แต่ละรายการโดยที่แต่ละรูปแบบถือเป็นตัวอย่างเดี่ยวจาก1การแจกแจงปกติแบบหลายตัวแปรที่มีค่าเฉลี่ยเป็นศูนย์และเมทริกซ์ความแปรปรวนร่วม
ฟังก์ชันของ ความหนาแน่น ความน่าจะเป็นแบบลอการิทึมจะเป็น สัดส่วนกับ
เรากำหนดฟังก์ชันผลกระทบเชิงเส้นของรูปแบบเชิงพื้นที่เป็น โดยที่คือเวกเตอร์ของน้ำหนักเชิงพื้นที่
จากนั้นเราจะพยายามหารูปแบบเชิงพื้นที่ที่ทำให้ความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับค่าที่กำหนดของฟังก์ชันผลกระทบเชิงเส้น ซึ่งเทียบเท่ากับการหารูปแบบเชิงพื้นที่ที่ทำให้ ความหนาแน่นของความน่าจะเป็นแบบ ลอการิทึม สูงสุด สำหรับค่าที่กำหนดของฟังก์ชันผลกระทบเชิงเส้น ซึ่งง่ายต่อการแก้ปัญหามากกว่าเล็กน้อย
นี่คือปัญหาการหาค่าสูงสุดภายใต้ข้อจำกัด และสามารถแก้ไขได้โดยใช้วิธีตัวคูณลากรางจ์
ฟังก์ชันลากรางจ์กำหนดโดย
การหาอนุพันธ์เทียบกับและกำหนดให้เท่ากับศูนย์ จะได้คำตอบ
การทำให้เป็นเวกเตอร์หน่วยจะได้ว่า
นี่คือรูปแบบ DCA แรก
สามารถสร้างรูปแบบต่อมาซึ่งตั้งฉากกับรูปแบบแรก เพื่อสร้างเซตเชิงตั้งฉากปกติและวิธีการแยกตัวประกอบเมทริกซ์ได้
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การวิเคราะห์ส่วนประกอบเชิงทิศทาง
การวิเคราะห์องค์ประกอบทิศทาง ( DCA ) เป็นวิธีการทางสถิติที่ใช้ในวิทยาศาสตร์ภูมิอากาศเพื่อระบุรูปแบบตัวแทนของความแปรปรวนในชุดข้อมูลเชิงพื้นที่และเวลา เช่น
ข้อมูลนำเข้า
DCA คำนวณจากอินพุตสองรายการ: [ 1 ] [ 2 ] [ 3 ]
สูตร
พิจารณาชุดข้อมูลเวลาและพื้นที่ซึ่งประกอบด้วยเวกเตอร์รูปแบบเชิงพื้นที่แต่ละรายการโดยที่แต่ละรูปแบบถือเป็นตัวอย่างเดี่ยวจาก1 การแจกแจงปกติแบบหลายตัวแปร ที่มีค่าเฉลี่ยเป็นศูนย์และ เมทริกซ์ความแปรปรวน ร่วม X {\displaystyle X} x {\displaystyle x} ซี {\displaystyle...
คุณสมบัติ
หากข้อมูลสภาพอากาศหรือภูมิอากาศมีการกระจายแบบวงรี (เช่น มีการกระจายแบบ การแจกแจงปกติหลายตัวแปร หรือ การแจกแจง t หลายตัวแปร ) รูปแบบ DCA แรก (DCA1) จะถูกกำหนดให้เป็นรูปแบบเชิงพื้นที่ที่มีคุณสมบัติทางคณิตศาสตร์ดังต่อไปนี้: