กลับไปหน้าบทความ

อ่าน 8 นาที

เมทริกซ์สุ่ม

ในทางคณิตศาสตร์เมทริกซ์สุ่ม (stochastic matrix)คือเมทริกซ์จัตุรัสที่ใช้อธิบายการเปลี่ยนสถานะของห่วง โซ่มาร์คอฟ (Markov chain ) แต่ละองค์ประกอบเป็นจำนวนจริงที่ไม่เป็นลบ...

เมทริกซ์สุ่ม

ในทางคณิตศาสตร์เมทริกซ์สุ่ม (stochastic matrix)คือเมทริกซ์จัตุรัสที่ใช้อธิบายการเปลี่ยนสถานะของห่วง โซ่มาร์คอฟ (Markov chain ) แต่ละองค์ประกอบเป็นจำนวนจริงที่ไม่เป็นลบ ซึ่งแสดงถึงความน่าจะเป็น [ 1 ] [ 2 ] : 10 เรียกอีกอย่างว่าเมทริกซ์ความน่าจะเป็น เมทริกซ์การเปลี่ยนสถานะ เมทริกซ์การแทนที่หรือเมทริก ซ์มาร์คอฟ เมทริก ซ์สุ่มได้รับการพัฒนาขึ้นครั้งแรกโดยAndrey Markovในช่วงต้นศตวรรษที่ 20 และถูกนำไปใช้ในหลากหลายสาขาวิทยาศาสตร์ รวมถึงทฤษฎีความน่าจะเป็นสถิติการเงินเชิงคณิตศาสตร์และพีชคณิตเชิงเส้น ตลอด จนวิทยาศาสตร์คอมพิวเตอร์และพันธุศาสตร์ประชากรมีคำจำกัดความและประเภทของเมทริกซ์สุ่มหลายแบบ:

  • เมทริกซ์สุ่มด้านขวา (Right Stochastic Matrix ) คือเมทริกซ์จัตุรัสที่ประกอบด้วยจำนวนจริงที่ไม่เป็นลบ โดยแต่ละแถวมีผลรวมเท่ากับ 1 (ดังนั้นจึงเรียกอีกอย่างว่าเมทริกซ์สุ่มแถว )
  • เมทริกซ์สุ่มด้านซ้ายคือเมทริกซ์จัตุรัสที่ประกอบด้วยจำนวนจริงที่ไม่เป็นลบ โดยแต่ละคอลัมน์มีผลรวมเท่ากับ 1 (ดังนั้นจึงเรียกว่าเมทริกซ์สุ่มคอลัมน์ ด้วย )
  • เมทริกซ์สุ่มสองชั้น (Doubly stochastic matrix ) คือเมทริกซ์จัตุรัสที่ประกอบด้วยจำนวนจริงที่ไม่เป็นลบ โดยที่ผลรวมของแต่ละแถวและแต่ละคอลัมน์เท่ากับ 1
  • เมทริกซ์ย่อยสุ่ม (Substochastic matrix)คือเมทริกซ์จัตุรัสจริงที่มีผลรวมของแถวทุกแถวเป็นจำนวนจริง

ในทำนองเดียวกัน เราอาจนิยามเวกเตอร์ความน่าจะเป็นว่าเป็นเวกเตอร์ที่มีองค์ประกอบเป็นจำนวนจริงที่ไม่เป็นลบและรวมกันได้เท่ากับ 1 ดังนั้น แต่ละแถวของเมทริกซ์สุ่มทางขวา (หรือคอลัมน์ของเมทริกซ์สุ่มทางซ้าย) จึงเป็นเวกเตอร์ความน่าจะเป็น เมทริกซ์สุ่มทางขวาจะกระทำกับเวกเตอร์ความน่าจะเป็นแบบแถวโดยการคูณจากทางขวา (จึงเป็นที่มาของชื่อ) และค่าใน แถวที่ iและ คอลัมน์ที่ jของเมทริกซ์คือความน่าจะเป็นของการเปลี่ยนสถานะจากสถานะiไปยังสถานะj ส่วน เมทริกซ์สุ่มทางซ้ายจะกระทำกับเวกเตอร์ความน่าจะเป็นแบบคอลัมน์โดยการคูณจากทางซ้าย (จึงเป็นที่มาของชื่อ) และค่าใน แถวที่ iและ คอลัมน์ที่ jของเมทริกซ์คือความน่าจะเป็นของการเปลี่ยนสถานะจากสถานะj ไป ยัง สถานะi

บทความนี้ใช้แบบแผนเมทริกซ์สุ่มแบบขวา/แถว

ประวัติศาสตร์

อันเดรย์ มาร์คอฟในปี 1886

เมทริกซ์สุ่มได้รับการพัฒนาควบคู่ไปกับห่วงโซ่มาร์คอฟโดยอันเดรย์ มาร์คอฟนักคณิตศาสตร์ชาวรัสเซียและศาสตราจารย์ที่มหาวิทยาลัยเซนต์ปีเตอร์สเบิร์กซึ่งตีพิมพ์ผลงานเกี่ยวกับหัวข้อนี้เป็นครั้งแรกในปี พ.ศ. 2449 [ 3 ]การใช้งานเริ่มต้นของเขาคือการวิเคราะห์ทางภาษาศาสตร์และวิชาคณิตศาสตร์อื่นๆ เช่นการสับไพ่แต่ทั้งห่วงโซ่มาร์คอฟและเมทริกซ์ก็ถูกนำไปใช้ในสาขาอื่นๆ อย่างรวดเร็ว[ 3 ] [ 4 ]

เมทริกซ์สุ่มได้รับการพัฒนาเพิ่มเติมโดยนักวิชาการเช่นAndrey Kolmogorovซึ่งขยายความเป็นไปได้โดยอนุญาตให้มีกระบวนการ Markov แบบต่อเนื่อง[ 5 ]ในช่วงทศวรรษที่ 1950 บทความที่ใช้เมทริกซ์สุ่มได้ปรากฏในสาขาเศรษฐศาสตร์เชิงปริมาณ[ 6 ]และทฤษฎีวงจร [ 7 ] ในช่วงทศวรรษที่ 1960 เมทริกซ์สุ่มปรากฏในงานทางวิทยาศาสตร์ที่หลากหลายยิ่งขึ้น ตั้งแต่วิทยาศาสตร์พฤติกรรม[ 8 ]ไปจนถึงธรณีวิทยา[ 9 ] [ 10 ]และการวางแผนที่อยู่อาศัย [ 11 ] นอกจากนี้ ยังมีการทำงานทางคณิตศาสตร์มากมายในช่วงหลายทศวรรษนี้เพื่อปรับปรุงขอบเขตการใช้งานและฟังก์ชันการทำงานของเมทริกซ์สุ่มและกระบวนการ Markovianโดยทั่วไปให้ดียิ่งขึ้น

ตั้งแต่ทศวรรษ 1970 จนถึงปัจจุบัน เมทริกซ์สุ่มถูกนำไปใช้ในเกือบทุกสาขาที่ต้องการการวิเคราะห์เชิงรูปแบบ ตั้งแต่วิทยาศาสตร์โครงสร้าง[ 12 ]ไปจนถึงการวินิจฉัยทางการแพทย์[ 13 ]และการจัดการบุคลากร[ 14 ]นอกจากนี้ เมทริกซ์สุ่มยังถูกนำไปใช้อย่างกว้างขวางในการสร้างแบบจำลองการเปลี่ยนแปลงที่ดินซึ่งโดยทั่วไปเรียกว่าเมทริกซ์มาร์คอฟ[ 15 ]

คำจำกัดความและคุณสมบัติ

เมทริกซ์สุ่มอธิบายห่วงโซ่มาร์คอฟX tบนปริภูมิสถานะจำกัดSที่ มีจำนวนสมาชิกα

ถ้าความน่าจะเป็นของการเคลื่อนที่จากiไปjในหนึ่งช่วงเวลาคือPr( j | i ) = P i , jเมทริกซ์สุ่มPจะได้มาจากการใช้P i , jเป็น องค์ประกอบแถวที่ iและ คอลัมน์ที่ jตัวอย่างเช่น

เนื่องจากผลรวมของความน่าจะเป็นของการเปลี่ยนสถานะจากสถานะiไปยังสถานะอื่นๆ ทั้งหมดต้องเท่ากับ 1 ดังนั้นเมทริกซ์นี้จึงเป็นเมทริกซ์สุ่มทางขวา

ผลรวมของแต่ละแถวiของP ข้างต้น สามารถเขียนได้กระชับยิ่งขึ้นเป็นP 1 = 1โดยที่1คือ เวกเตอร์คอลัมน์มิติ αที่มีค่าเป็นหนึ่งทั้งหมด เมื่อใช้สิ่งนี้ จะเห็นได้ว่าผลคูณของเมทริกซ์สุ่มขวาPและP ′′ก็เป็นเมทริกซ์สุ่มขวาเช่นกัน: PP ′′ 1 = P ′ ( P1 ) = P1 = 1โดยทั่วไปกำลังkของเมทริกซ์สุ่มขวาP kก็เป็นเมทริกซ์สุ่มขวาเช่นกัน ความน่าจะเป็นของการเปลี่ยนจากiไปjในสองขั้นตอนจะกำหนดโดย องค์ประกอบที่ ( i , j )ของกำลังสองของP :

โดยทั่วไป ความน่าจะเป็นของการเปลี่ยนจากสถานะหนึ่งไปยังอีกสถานะหนึ่งในห่วงโซ่มาร์คอฟแบบจำกัดที่กำหนดโดยเมทริกซ์P ใน k ขั้นตอน จะกำหนดโดยP k

การกระจายความน่าจะเป็นเริ่มต้นของสถานะ ซึ่งระบุว่าระบบอาจอยู่ที่ใดในตอนเริ่มต้นและมีความน่าจะเป็นเท่าใด จะถูกกำหนดเป็น เวก เตอร์ แถว

เวกเตอร์ความน่าจะเป็นคงที่πถูกกำหนดให้เป็นการแจกแจงที่เขียนในรูปเวกเตอร์แถว ซึ่งจะไม่เปลี่ยนแปลงภายใต้การประยุกต์ใช้เมทริกซ์การเปลี่ยนผ่าน กล่าวคือ ถูกกำหนดให้เป็นการแจกแจงความน่าจะเป็นบนเซต{1, …, n }ซึ่งเป็นเวกเตอร์ลักษณะเฉพาะด้านซ้ายของเมทริกซ์ความน่าจะเป็นที่เกี่ยวข้องกับค่าลักษณะเฉพาะ 1:

ภูมิภาค Karpelevič สำหรับn = 3 และn = 4

สามารถแสดงได้ว่ารัศมีสเปกตรัมของเมทริกซ์สุ่มใดๆ มีค่าเท่ากับหนึ่ง ตามทฤษฎีบทวงกลมของ Gershgorinค่าลักษณะเฉพาะทั้งหมดของเมทริกซ์สุ่มจะมีค่าสัมบูรณ์น้อยกว่าหรือเท่ากับหนึ่ง กล่าวคือ ค่าลักษณะเฉพาะของ เมทริกซ์สุ่ม ขนาด n x n จะถูกจำกัดให้อยู่ภายในเซตย่อยของดิสก์หน่วยเชิงซ้อนที่เรียกว่าบริเวณ Karpelevič [ 16 ]ผลลัพธ์นี้เดิมทีได้รับโดยFridrikh Karpelevich [ 17 ]ตามคำถามที่ Kolmogorov [ 18 ] ตั้งขึ้นและ Nikolay DmitriyevและEugene Dynkin [ 19 ] ได้ตอบ ไว้บาง ส่วน

นอกจากนี้ เมทริกซ์สุ่มทางขวาทุกเมทริกซ์จะมีเวกเตอร์ลักษณะเฉพาะคอลัมน์ที่ "ชัดเจน" ซึ่งสัมพันธ์กับค่าลักษณะเฉพาะ 1: เวกเตอร์1ที่ใช้ข้างต้น ซึ่งพิกัดทั้งหมดเท่ากับ 1 เนื่องจากค่าลักษณะเฉพาะด้านซ้ายและด้านขวาของเมทริกซ์จัตุรัสเหมือนกัน เมทริกซ์สุ่มทุกเมทริกซ์จึงมีอย่างน้อยเวกเตอร์ลักษณะเฉพาะด้านซ้ายที่สัมพันธ์กับค่าลักษณะเฉพาะ 1 และค่าสัมบูรณ์ที่มากที่สุดของค่าลักษณะเฉพาะทั้งหมดก็คือ 1 เช่นกัน สุดท้ายทฤษฎีบทจุดตรึงของ Brouwer (ที่ใช้กับเซตแบบนูนกระชับของฟังก์ชันความน่าจะเป็นทั้งหมดของเซตจำกัด{1, ..., n } ) บ่งชี้ว่ามีเวกเตอร์ลักษณะเฉพาะด้านซ้ายบางตัวซึ่งเป็นเวกเตอร์ความน่าจะเป็นแบบอยู่กับที่ด้วย

ในทางกลับกันทฤษฎีบท Perron–Frobeniusยังรับประกันว่า เมทริกซ์สุ่ม ที่ไม่สามารถแยก ตัวประกอบได้ทุก เมทริกซ์จะมีเวกเตอร์คงที่ดังกล่าว และค่าสัมบูรณ์ที่มากที่สุดของค่าลักษณะเฉพาะจะมีค่าเท่ากับ 1 เสมอ อย่างไรก็ตาม ทฤษฎีบทนี้ไม่สามารถนำไปใช้กับเมทริกซ์ดังกล่าวได้โดยตรง เพราะเมทริกซ์เหล่านั้นไม่จำเป็นต้องเป็นเมทริกซ์ที่ไม่สามารถแยกตัวประกอบได้ โดยทั่วไป อาจมีเวกเตอร์ดังกล่าวหลายตัว แต่สำหรับเมทริกซ์ที่มีค่าเป็นบวกอย่างเคร่งครัด (หรือโดยทั่วไปแล้ว สำหรับเมทริกซ์สุ่มที่ไม่สามารถแยกตัวประกอบได้และไม่มีคาบ) เวกเตอร์นี้จะมีเพียงหนึ่งเดียวและสามารถคำนวณได้โดยการสังเกตว่าสำหรับi ใดๆ เราจะได้ลิมิตดังต่อไปนี้

โดยที่π jคือองค์ประกอบที่jของเวกเตอร์แถวπสิ่งนี้แสดงให้เห็นว่า ความน่าจะเป็นในระยะยาวของการอยู่ในสถานะjนั้นเป็นอิสระจากสถานะเริ่มต้นiการที่การคำนวณทั้งสองให้เวกเตอร์สถานะคงที่เดียวกันนั้น เป็นรูปแบบหนึ่งของทฤษฎีบทเออร์โกดิก ซึ่งโดยทั่วไปแล้วจะเป็นจริงใน ระบบพลวัตแบบกระจายพลังงานหลากหลายประเภท: ระบบจะวิวัฒนาการไปสู่สถานะคงที่เมื่อ เวลาผ่านไป

โดยสัญชาตญาณ เมทริกซ์สุ่มแสดงถึงลูกโซ่ Markov การประยุกต์ใช้เมทริกซ์สุ่มกับการกระจายความน่าจะเป็นจะกระจายมวลความน่าจะเป็นของการกระจายเดิมใหม่ในขณะที่ยังคงรักษามวลรวมไว้ หากกระบวนการนี้ถูกนำไปใช้ซ้ำ ๆ การกระจายจะลู่เข้าสู่การกระจายแบบคงที่สำหรับลูกโซ่ Markov [ 2 ] : 14–17 [ 20 ] : 116

เมทริกซ์สุ่มและผลคูณของเมทริกซ์เหล่านั้นก่อให้เกิดหมวดหมู่หนึ่งซึ่งเป็นทั้งหมวดหมู่ย่อยของหมวดหมู่เมทริกซ์และหมวดหมู่เคอร์เนลของมาร์คอ

ตัวอย่าง: แมวไล่หนู

สมมติว่ามีตัวจับเวลาและกล่องห้ากล่องเรียงกัน ณ เวลาศูนย์ แมวอยู่ในกล่องแรก และหนูอยู่ในกล่องที่ห้า ทั้งแมวและหนูจะกระโดดไปยัง กล่อง ที่อยู่ติดกัน แบบสุ่ม เมื่อเวลาเดินไปเรื่อยๆ ตัวอย่างเช่น ถ้าแมวอยู่ในกล่องที่สองและหนูอยู่ในกล่องที่สี่ ความน่าจะเป็นที่แมวจะอยู่ในกล่องแรกและหนูจะอยู่ในกล่องที่ห้าหลังจากเวลาเดินไปเรื่อยๆคือหนึ่งในสี่ ถ้าแมวอยู่ในกล่องแรกและหนูอยู่ในกล่องที่ห้า ความน่าจะเป็นที่แมวจะอยู่ในกล่องที่สองและหนูจะอยู่ในกล่องที่สี่หลังจากเวลาเดินไปเรื่อยๆคือหนึ่ง แมวจะกินหนูถ้าทั้งคู่ไปอยู่ในกล่องเดียวกัน ซึ่งในเวลานั้นเกมจะจบลง ให้ตัวแปรสุ่มKเป็นเวลาที่หนูอยู่ในเกม

ห่วง โซ่มาร์คอฟที่แสดงถึงเกมนี้ประกอบด้วยสถานะห้าสถานะต่อไปนี้ ซึ่งระบุโดยการรวมกันของตำแหน่ง (แมว, หนู) โปรดทราบว่า ในขณะที่การแจงนับสถานะแบบง่ายๆ จะแสดงสถานะ 25 สถานะ แต่หลายสถานะเป็นไปไม่ได้ ไม่ว่าจะเป็นเพราะหนูไม่สามารถมีดัชนีต่ำกว่าแมวได้ (เพราะนั่นหมายความว่าหนูเข้าไปอยู่ในกล่องของแมวและรอดชีวิตจนเคลื่อนที่ผ่านไปได้) หรือเพราะผลรวมของดัชนีทั้งสองจะมีค่าเป็นเลขคู่เสมอนอกจากนี้ สถานะที่เป็นไปได้ 3 สถานะที่นำไปสู่ความตายของหนูจะถูกรวมเข้าเป็นสถานะเดียว:

  • สถานะ 1: (1,3)
  • สถานะ 2: (1,5)
  • สถานะ 3: (2,4)
  • สถานะ 4: (3,5)
  • สถานะ 5: จบเกม: (2,2), (3,3) และ (4,4)

เราใช้เมทริกซ์สุ่ม(ด้านล่าง) เพื่อแสดงความน่าจะเป็นของการเปลี่ยนสถานะของระบบนี้ (แถวและคอลัมน์ในเมทริกซ์นี้จะถูกจัดทำดัชนีตามสถานะที่เป็นไปได้ที่ระบุไว้ข้างต้น โดยสถานะก่อนการเปลี่ยนสถานะเป็นแถว และสถานะหลังการเปลี่ยนสถานะเป็นคอลัมน์) ตัวอย่างเช่น เริ่มจากสถานะที่ 1 – แถวที่ 1 – เป็นไปไม่ได้ที่ระบบจะอยู่ในสถานะนี้ ดังนั้น; ระบบยังไม่สามารถเปลี่ยนสถานะไปยังสถานะที่ 2 ได้ – เพราะแมวจะยังคงอยู่ในกล่องเดิม – ดังนั้นและด้วยเหตุผลที่คล้ายกันสำหรับหนูการเปลี่ยนสถานะไปยังสถานะที่ 3 หรือ 5 นั้นเป็นไปได้ดังนั้น

ค่าเฉลี่ยระยะยาว

ไม่ว่าสถานะเริ่มต้นจะเป็นอย่างไร ในที่สุดแมวก็จะจับหนูได้ (ด้วยความน่าจะเป็น 1) และสถานะคงที่π = (0,0,0,0,1) จะถูกเข้าใกล้เป็นขีดจำกัด ในการคำนวณค่าเฉลี่ยระยะยาวหรือค่าที่คาดหวังของตัวแปรสุ่มสำหรับแต่ละสถานะและเวลาจะมีส่วนประกอบของการอยู่รอดสามารถพิจารณาได้ว่าเป็นตัวแปรไบนารี โดยที่สำหรับสถานะที่อยู่รอด และสำหรับสถานะที่สิ้นสุด สถานะที่มีจะไม่นำมาคำนวณในค่าเฉลี่ยระยะยาว

การแสดงผลแบบเฟส

หน้าที่การเอาชีวิตรอดของหนู หนูจะสามารถเอาชีวิตรอดได้อย่างน้อยในขั้นตอนแรก

เนื่องจากสถานะที่ 5 เป็นสถานะดูดซับ การกระจายของเวลาในการดูดซับจึงเป็นการกระจายแบบเฟสแบบไม่ต่อเนื่องสมมติว่าระบบเริ่มต้นในสถานะที่ 2 ซึ่งแสดงด้วยเวกเตอร์สถานะที่หนูตายจะไม่ส่งผลต่อค่าเฉลี่ยการอยู่รอด ดังนั้นจึงสามารถละเลยสถานะที่ห้าได้ เมทริกซ์สถานะเริ่มต้นและเมทริกซ์การเปลี่ยนสถานะสามารถลดรูปได้เป็น

และ

โดยที่คือเมทริกซ์เอกลักษณ์และแทนเมทริกซ์คอลัมน์ที่มีค่าเป็นหนึ่งทั้งหมด ซึ่งทำหน้าที่เป็นผลรวมของสถานะต่างๆ

เนื่องจากแต่ละสถานะจะถูกครอบครองเป็นเวลาหนึ่งช่วงเวลา ดังนั้นเวลาที่คาดหวังในการมีชีวิตรอดของหนูจึงเท่ากับผลรวมของความน่าจะเป็นของการครอบครองสถานะต่างๆ ในทุกสถานะและทุกช่วงเวลาที่หนูยังมีชีวิตอยู่

โมเมนต์ลำดับสูงกว่าจะได้รับจาก

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Stochastic_matrix&oldid=1353839801 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เมทริกซ์สุ่ม

ในทางคณิตศาสตร์เมทริกซ์สุ่ม (stochastic matrix)คือเมทริกซ์จัตุรัสที่ใช้อธิบายการเปลี่ยนสถานะของห่วง โซ่มาร์คอฟ (Markov chain ) แต่ละองค์ประกอบเป็นจำนวนจริงที่ไม่เป็นลบ...

ประวัติศาสตร์

เมทริกซ์สุ่มได้รับการพัฒนาควบคู่ไปกับห่วงโซ่มาร์คอฟโดย อันเดรย์ มาร์คอฟ นัก คณิตศาสตร์ชาวรัสเซีย และศาสตราจารย์ที่ มหาวิทยาลัยเซนต์ปีเตอร์สเบิร์ก ซึ่งตีพิมพ์ผลงานเกี่ยวกับหัวข้อนี้เป็นครั้งแรกในปี พ.ศ.

คำจำกัดความและคุณสมบัติ

เมทริกซ์สุ่มอธิบายห่วง โซ่มาร์คอฟ X t บน ปริภูมิสถานะ จำกัด S ที่ มี จำนวนสมาชิก α

ตัวอย่าง: แมวไล่หนู

สมมติว่ามีตัวจับเวลาและกล่องห้ากล่องเรียงกัน ณ เวลาศูนย์ แมวอยู่ในกล่องแรก และหนูอยู่ในกล่องที่ห้า ทั้งแมวและหนูจะกระโดดไปยัง กล่อง ที่อยู่ติดกัน แบบสุ่ม เมื่อเวลาเดินไปเรื่อยๆ ตัวอย่างเช่น ถ้าแมวอยู่ในกล่องที่สองและหนูอยู่ในกล่องที่สี่ ความน่าจะเป็นที่...