กลับไปหน้าบทความ

อ่าน 4 นาที

การวิเคราะห์ส่วนประกอบเชิงทิศทาง

การวิเคราะห์องค์ประกอบทิศทาง ( DCA ) เป็นวิธีการทางสถิติที่ใช้ในวิทยาศาสตร์ภูมิอากาศเพื่อระบุรูปแบบตัวแทนของความแปรปรวนในชุดข้อมูลเชิงพื้นที่และเวลา เช่น

การวิเคราะห์ส่วนประกอบเชิงทิศทาง

การวิเคราะห์องค์ประกอบทิศทาง ( DCA ) [ 1 ] [ 2 ] [ 3 ] เป็นวิธีการทางสถิติที่ใช้ในวิทยาศาสตร์ภูมิอากาศเพื่อระบุรูปแบบตัวแทนของความแปรปรวนในชุดข้อมูลเชิงพื้นที่และเวลา เช่น การสังเกตสภาพภูมิอากาศในอดีต[ 1 ]กลุ่มการพยากรณ์อากาศ[ 2 ]หรือกลุ่มสภาพภูมิอากาศ[ 3 ]

รูปแบบ DCA แรกคือรูปแบบความแปรปรวนของสภาพอากาศหรือภูมิอากาศที่ทั้งมีแนวโน้มที่จะเกิดขึ้น (วัดโดยใช้ความน่าจะเป็น ) และมีผลกระทบอย่างมาก (สำหรับฟังก์ชันผลกระทบเชิงเส้นที่กำหนด และภายใต้เงื่อนไขทางคณิตศาสตร์บางประการ: ดูด้านล่าง)

รูปแบบ DCA แรกนั้นแตกต่างจาก รูปแบบ PCA แรก ซึ่งมีแนวโน้มที่จะเกิดขึ้น แต่ผลกระทบอาจไม่มากนัก และแตกต่างจากรูปแบบที่ได้มาจากความชันของฟังก์ชันผลกระทบ ซึ่งมีผลกระทบมาก แต่โอกาสที่จะเกิดขึ้นอาจไม่มากนัก

DCA แตกต่างจากวิธีการระบุรูปแบบอื่นๆ ที่ใช้ในการวิจัยสภาพภูมิอากาศ เช่นEOF [ 4 ] EOF ที่หมุน[ 5 ]และ EOF ที่ขยาย[ 6 ]ตรงที่คำนึงถึงเวกเตอร์ภายนอก ซึ่งก็คือเกรเดียนต์ของผล กระทบ

DCA นำเสนอวิธีการลดกลุ่มตัวอย่างขนาดใหญ่จากการพยากรณ์อากาศ[ 2 ]หรือแบบจำลองสภาพภูมิอากาศ[ 3 ]ให้เหลือเพียงสองรูปแบบ รูปแบบแรกคือค่าเฉลี่ยของกลุ่มตัวอย่าง และรูปแบบที่สองคือรูปแบบ DCA ซึ่งแสดงถึงความแปรปรวนรอบค่าเฉลี่ยของกลุ่มตัวอย่างในลักษณะที่คำนึงถึงผลกระทบ DCA แตกต่างจากวิธีการอื่น ๆ ที่ได้รับการเสนอสำหรับการลดกลุ่มตัวอย่าง[ 7 ] [ 8 ]ตรงที่มันคำนึงถึงผลกระทบนอกเหนือจากโครงสร้างของกลุ่มตัวอย่าง

ภาพรวม

ข้อมูลนำเข้า

DCA คำนวณจากอินพุตสองรายการ: [ 1 ] [ 2 ] [ 3 ]

  • ชุดข้อมูลหลายตัวแปรของข้อมูลสภาพอากาศหรือภูมิอากาศ เช่น ข้อมูลการสังเกตการณ์ภูมิอากาศในอดีต หรือชุดข้อมูลสภาพอากาศหรือภูมิอากาศแบบรวมกลุ่ม
  • ฟังก์ชันผลกระทบเชิงเส้น ฟังก์ชันผลกระทบเชิงเส้นเป็นฟังก์ชันที่กำหนดระดับผลกระทบสำหรับรูปแบบเชิงพื้นที่แต่ละรูปแบบในข้อมูลสภาพอากาศหรือภูมิอากาศ โดยเป็นผลรวมถ่วงน้ำหนักของค่าที่ตำแหน่งต่างๆ ในรูปแบบเชิงพื้นที่ ตัวอย่างเช่น ค่าเฉลี่ยตลอดรูปแบบเชิงพื้นที่ ฟังก์ชันผลกระทบเชิงเส้นสามารถสร้างขึ้นเป็นพจน์แรกในอนุกรมเทย์เลอร์แบบ หลายตัวแปร ของฟังก์ชันผลกระทบที่ไม่เป็นเชิงเส้น[ 3 ]

สูตร

พิจารณาชุดข้อมูลเวลาและพื้นที่ซึ่งประกอบด้วยเวกเตอร์รูปแบบเชิงพื้นที่แต่ละรายการโดยที่แต่ละรูปแบบถือเป็นตัวอย่างเดี่ยวจาก1 การแจกแจงปกติแบบหลายตัวแปรที่มีค่าเฉลี่ยเป็นศูนย์และเมทริกซ์ความแปรปรวนร่วม

เรากำหนดฟังก์ชันผลกระทบเชิงเส้นของรูปแบบเชิงพื้นที่เป็น โดยที่คือเวกเตอร์ของน้ำหนักเชิงพื้นที่

รูปแบบ DCA แรกกำหนดโดยเมทริกซ์ความแปรปรวนร่วมและน้ำหนักโดยนิพจน์ สัดส่วน [ 1 ] [ 2 ] [ 3 ]

จากนั้นรูปแบบสามารถปรับให้เป็นมาตรฐานตามความยาวที่ต้องการได้[ 1 ]

คุณสมบัติ

หากข้อมูลสภาพอากาศหรือภูมิอากาศมีการกระจายแบบวงรี (เช่น มีการกระจายแบบการแจกแจงปกติหลายตัวแปรหรือการแจกแจง t หลายตัวแปร ) รูปแบบ DCA แรก (DCA1) จะถูกกำหนดให้เป็นรูปแบบเชิงพื้นที่ที่มีคุณสมบัติทางคณิตศาสตร์ดังต่อไปนี้:

  • DCA1 เพิ่มความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับค่าผลกระทบที่กำหนด[ 1 ]
  • DCA1 เพิ่มผลกระทบสูงสุดสำหรับค่าความหนาแน่นความน่าจะเป็นที่กำหนด[ 1 ]
  • DCA1 เพิ่มผลคูณของผลกระทบและความหนาแน่นของความน่าจะเป็นให้สูงสุด[ 3 ]
  • DCA1 คือความคาดหวังแบบมีเงื่อนไขโดยมีเงื่อนไขว่าต้องเกินระดับผลกระทบที่กำหนด[ 3 ]
  • DCA1 คือค่าเฉลี่ยของกลุ่มที่ถ่วงน้ำหนักตามผลกระทบ[ 3 ]
  • การปรับเปลี่ยนใดๆ ของ DCA1 จะส่งผลให้เกิดรูปแบบที่มีความรุนแรงน้อยลง หรือมีความหนาแน่นของความน่าจะเป็นต่ำลง

ตัวอย่างปริมาณน้ำฝน

ตัวอย่างเช่น ในชุดข้อมูลความผิดปกติของปริมาณน้ำฝน โดยใช้ตัวชี้วัดผลกระทบที่กำหนดเป็นความผิดปกติของปริมาณน้ำฝนรวม รูปแบบ DCA แรกคือรูปแบบเชิงพื้นที่ที่มีความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับความผิดปกติของปริมาณน้ำฝนรวมที่กำหนด หากเลือกความผิดปกติของปริมาณน้ำฝนรวมที่มีค่ามาก รูปแบบนี้จะรวมเอาความเป็นสุดขั้วในแง่ของตัวชี้วัด (เช่น แสดงถึงปริมาณน้ำฝนรวมจำนวนมาก) เข้ากับความเป็นไปได้ในแง่ของรูปแบบ ดังนั้นจึงเหมาะสมอย่างยิ่งที่จะใช้เป็นรูปแบบสุดขั้วที่เป็นตัวแทน

การเปรียบเทียบกับ PCA

ความแตกต่างหลักระหว่างการวิเคราะห์ส่วนประกอบหลัก (PCA) และ DCA คือ[ 1 ]

  • PCA เป็นฟังก์ชันของเมทริกซ์ความแปรปรวนร่วมเท่านั้น และรูปแบบ PCA แรกถูกกำหนดขึ้นเพื่อเพิ่มความแปรปรวนที่อธิบายได้สูงสุด
  • DCA เป็นฟังก์ชันของเมทริกซ์ความแปรปรวนร่วมและทิศทางเวกเตอร์ (เกรเดียนต์ของฟังก์ชันผลกระทบ) และรูปแบบ DCA แรกถูกกำหนดขึ้นเพื่อเพิ่มความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับค่าที่กำหนดของตัวชี้วัดผลกระทบ

ดังนั้น สำหรับ รูปแบบเชิงพื้นที่ ของเวกเตอร์หน่วย :

  • รูปแบบเชิงพื้นที่ PCA แรกมักสอดคล้องกับค่าความแปรปรวนที่อธิบายได้สูงกว่า แต่จะมีค่าตัวชี้วัดผลกระทบต่ำกว่า (เช่น ความผิดปกติของปริมาณน้ำฝนรวม) ยกเว้นในกรณีพิเศษ
  • รูปแบบเชิงพื้นที่ DCA แรกมักสอดคล้องกับค่าตัวชี้วัดผลกระทบที่สูงกว่า แต่มีค่าความแปรปรวนที่อธิบายได้ต่ำกว่า ยกเว้นในกรณีพิเศษ

กรณีที่ผิดปกติเกิดขึ้นเมื่อรูปแบบ PCA และ DCA เท่ากัน

นอกจากนี้ เมื่อพิจารณารูปแบบ PCA แรกแล้ว รูปแบบ DCA สามารถปรับขนาดได้ดังนี้:

  • รูปแบบ DCA ที่ปรับขนาดแล้วมีความหนาแน่นของความน่าจะเป็นเท่ากับรูปแบบ PCA แรก แต่มีผลกระทบที่สูงกว่า หรือ
  • รูปแบบ DCA ที่ปรับขนาดแล้วมีผลกระทบเช่นเดียวกับรูปแบบ PCA แรก แต่มีความหนาแน่นของความน่าจะเป็นสูงกว่า

ตัวอย่างสองมิติ

แหล่งที่มา: [ 1 ]

รูปที่ 1: เวกเตอร์ PCA (สีน้ำเงิน) และ DCA (สีแดง) ในตัวอย่างสองมิติ

ภาพที่ 1 แสดงตัวอย่าง ซึ่งสามารถเข้าใจได้ดังนี้:

  • แกนทั้งสองแสดงถึงค่าความผิดปกติของปริมาณน้ำฝนเฉลี่ยรายปี ณ สองตำแหน่ง โดยค่าความผิดปกติของปริมาณน้ำฝนรวมสูงสุดจะอยู่ทางมุมขวาบนของแผนภาพ
  • สันนิษฐานว่าความแปรปรวนร่วมของปริมาณน้ำฝนที่ผิดปกติ ณ สองตำแหน่งนั้น เป็นไปตามการแจกแจงปกติแบบสองตัวแปร
  • วงรีแสดงถึงเส้นโค้งความหนาแน่นของความน่าจะเป็นเส้นเดียวจากค่าปกติแบบสองตัวแปร โดยค่าที่สูงกว่าจะอยู่ภายในวงรี
  • จุดสีแดงตรงกลางวงรีแสดงว่าปริมาณฝนไม่เป็นค่าผิดปกติในทั้งสองตำแหน่ง
  • ลูกศรเส้นขนานสีน้ำเงินแสดงแกนหลักของวงรี ซึ่งเป็นเวกเตอร์รูปแบบเชิงพื้นที่ PCA ตัวแรกด้วย
  • ในกรณีนี้ รูปแบบ PCA จะถูกปรับขนาดเพื่อให้สัมผัสกับวงรี
  • เส้นตรงแนวทแยงแสดงถึงค่าความผิดปกติของปริมาณน้ำฝนรวมที่เป็นบวกคงที่ ซึ่งสันนิษฐานว่าอยู่ในระดับที่ค่อนข้างสูงมาก
  • ลูกศรเส้นประสีแดงแสดงถึงรูปแบบ DCA แรก ซึ่งชี้ไปยังจุดที่เส้นทแยงมุมสัมผัสกับวงรี
  • ในกรณีนี้ รูปแบบ DCA จะถูกปรับขนาดเพื่อให้สัมผัสกับวงรี

จากแผนภาพนี้ จะเห็นได้ว่ารูปแบบ DCA มีคุณสมบัติดังต่อไปนี้:

  • ในบรรดาจุดทั้งหมดที่อยู่บนเส้นทแยงมุม จุดนี้เป็นจุดที่มีความหนาแน่นของความน่าจะเป็นสูงสุด
  • ในบรรดาจุดทั้งหมดบนวงรี จุดนี้เป็นจุดที่มีปริมาณน้ำฝนรวมผิดปกติมากที่สุด
  • มีความหนาแน่นของความน่าจะเป็นเท่ากับรูปแบบ PCA แต่แสดงถึงปริมาณน้ำฝนรวมที่สูงกว่า (กล่าวคือ จุดต่างๆ จะอยู่ค่อนไปทางมุมขวาบนของแผนภาพมากกว่า)
  • การเปลี่ยนแปลงใดๆ ของรูปแบบ DCA จะลดความหนาแน่นของความน่าจะเป็น (หากเคลื่อนออกจากวงรี) หรือลดความผิดปกติของปริมาณน้ำฝนโดยรวม (หากเคลื่อนไปตามหรือเข้าไปในวงรี)

ในกรณีนี้ ค่าความผิดปกติของปริมาณน้ำฝนรวมของรูปแบบ PCA ค่อนข้างน้อย เนื่องจากความสัมพันธ์ผกผันระหว่างค่าความผิดปกติของปริมาณน้ำฝนในสองตำแหน่ง ส่งผลให้รูปแบบ PCA แรกไม่ใช่ตัวอย่างที่ดีของรูปแบบที่มีค่าความผิดปกติของปริมาณน้ำฝนรวมมาก ในขณะที่รูปแบบ DCA แรกนั้นเป็นตัวอย่างที่ดี

ในมิติอื่น วงรีจะกลายเป็นทรงรี เส้นทแยงมุมจะกลายเป็นระนาบในมิติอื่น และรูปแบบ PCA และ DCA จะเป็นเวกเตอร์ในมิติอื่น

แอปพลิเคชัน

การประยุกต์ใช้กับความแปรปรวนของสภาพภูมิอากาศ

DCA ได้ถูกนำไปใช้กับชุดข้อมูลCRU ของความแปรปรวนของปริมาณน้ำฝนในอดีต [ 9 ]เพื่อทำความเข้าใจรูปแบบที่เป็นไปได้มากที่สุดของปริมาณน้ำฝนสุดขั้วในสหรัฐอเมริกาและจีน[ 1 ]

การประยุกต์ใช้กับการพยากรณ์อากาศแบบกลุ่ม

DCA ได้ถูกนำไปใช้กับ ชุดพยากรณ์อากาศระยะกลาง ของ ECMWFเพื่อระบุรูปแบบอุณหภูมิสุดขั้วที่มีแนวโน้มมากที่สุดในชุดพยากรณ์[ 2 ]

การประยุกต์ใช้กับการคาดการณ์แบบจำลองสภาพภูมิอากาศแบบกลุ่ม

DCA ได้ถูกนำไปใช้กับการคาดการณ์แบบจำลองสภาพภูมิอากาศแบบกลุ่มเพื่อระบุรูปแบบที่เป็นไปได้มากที่สุดของปริมาณน้ำฝนในอนาคตที่รุนแรง[ 3 ]

ที่มาของรูปแบบ DCA แรก

แหล่งที่มา: [ 1 ]

พิจารณาชุดข้อมูลเวลาและพื้นที่ซึ่งประกอบด้วยเวกเตอร์รูปแบบเชิงพื้นที่แต่ละรายการโดยที่แต่ละรูปแบบถือเป็นตัวอย่างเดี่ยวจาก1การแจกแจงปกติแบบหลายตัวแปรที่มีค่าเฉลี่ยเป็นศูนย์และเมทริกซ์ความแปรปรวนร่วม

ฟังก์ชันของ ความหนาแน่น ความน่าจะเป็นแบบลอการิทึมจะเป็น สัดส่วนกับ

เรากำหนดฟังก์ชันผลกระทบเชิงเส้นของรูปแบบเชิงพื้นที่เป็น โดยที่คือเวกเตอร์ของน้ำหนักเชิงพื้นที่

จากนั้นเราจะพยายามหารูปแบบเชิงพื้นที่ที่ทำให้ความหนาแน่นของความน่าจะเป็นสูงสุดสำหรับค่าที่กำหนดของฟังก์ชันผลกระทบเชิงเส้น ซึ่งเทียบเท่ากับการหารูปแบบเชิงพื้นที่ที่ทำให้ ความหนาแน่นของความน่าจะเป็นแบบ ลอการิทึม สูงสุด สำหรับค่าที่กำหนดของฟังก์ชันผลกระทบเชิงเส้น ซึ่งง่ายต่อการแก้ปัญหามากกว่าเล็กน้อย

นี่คือปัญหาการหาค่าสูงสุดภายใต้ข้อจำกัด และสามารถแก้ไขได้โดยใช้วิธีตัวคูณลากรางจ์

ฟังก์ชันลากรางจ์กำหนดโดย

การหาอนุพันธ์เทียบกับและกำหนดให้เท่ากับศูนย์ จะได้คำตอบ

การทำให้เป็นเวกเตอร์หน่วยจะได้ว่า

นี่คือรูปแบบ DCA แรก

สามารถสร้างรูปแบบต่อมาซึ่งตั้งฉากกับรูปแบบแรก เพื่อสร้างเซตเชิงตั้งฉากปกติและวิธีการแยกตัวประกอบเมทริกซ์ได้

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Directional_component_analysis&oldid=1359700065 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การวิเคราะห์ส่วนประกอบเชิงทิศทาง

การวิเคราะห์องค์ประกอบทิศทาง ( DCA ) เป็นวิธีการทางสถิติที่ใช้ในวิทยาศาสตร์ภูมิอากาศเพื่อระบุรูปแบบตัวแทนของความแปรปรวนในชุดข้อมูลเชิงพื้นที่และเวลา เช่น

ข้อมูลนำเข้า

DCA คำนวณจากอินพุตสองรายการ: [ 1 ] [ 2 ] [ 3 ]

สูตร

พิจารณาชุดข้อมูลเวลาและพื้นที่ซึ่งประกอบด้วยเวกเตอร์รูปแบบเชิงพื้นที่แต่ละรายการโดยที่แต่ละรูปแบบถือเป็นตัวอย่างเดี่ยวจาก1 การแจกแจงปกติแบบหลายตัวแปร ที่มีค่าเฉลี่ยเป็นศูนย์และ เมทริกซ์ความแปรปรวน ร่วม X {\displaystyle X} x {\displaystyle x} ซี {\displaystyle...

คุณสมบัติ

หากข้อมูลสภาพอากาศหรือภูมิอากาศมีการกระจายแบบวงรี (เช่น มีการกระจายแบบ การแจกแจงปกติหลายตัวแปร หรือ การแจกแจง t หลายตัวแปร ) รูปแบบ DCA แรก (DCA1) จะถูกกำหนดให้เป็นรูปแบบเชิงพื้นที่ที่มีคุณสมบัติทางคณิตศาสตร์ดังต่อไปนี้: