อ่าน 9 นาที
สนามสุ่มมาร์คอฟ
ในขอบเขตของฟิสิกส์และความน่าจะเป็นสนามสุ่มมาร์คอฟ ( MRF ) เครือข่ายมาร์คอฟหรือแบบจำลองกราฟิกแบบไม่มีทิศทางคือชุดของตัวแปรสุ่มที่มีคุณสมบัติมาร์คอฟซึ่งอธิบายโดยกราฟแบบไม่มีทิศทาง...
สนามสุ่มมาร์คอฟ

ในขอบเขตของฟิสิกส์และความน่าจะเป็นสนามสุ่มมาร์คอฟ ( MRF ) เครือข่ายมาร์คอฟหรือแบบจำลองกราฟิกแบบไม่มีทิศทางคือชุดของตัวแปรสุ่มที่มีคุณสมบัติมาร์คอฟซึ่งอธิบายโดยกราฟแบบไม่มีทิศทาง กล่าว อีกนัยหนึ่งสนามสุ่มจะเรียกว่า สนามสุ่ม มาร์คอฟได้ก็ต่อเมื่อมันมีคุณสมบัติมาร์คอฟ แนวคิดนี้มีต้นกำเนิดมาจากแบบจำลองเชอร์ริงตัน-เคิร์กแพทริก[ 1 ]
เครือข่ายมาร์คอฟหรือ MRF มีความคล้ายคลึงกับเครือข่ายเบย์เซียนในแง่ของการแสดงความสัมพันธ์ โดยมีความแตกต่างกันคือ เครือข่ายเบย์เซียนเป็นแบบมีทิศทางและไม่มีวงจร ในขณะที่เครือข่ายมาร์คอฟเป็นแบบไม่มีทิศทางและอาจมีวงจร ดังนั้น เครือข่ายมาร์คอฟจึงสามารถแสดงความสัมพันธ์บางอย่างที่เครือข่ายเบย์เซียนไม่สามารถแสดงได้ (เช่น ความสัมพันธ์แบบวงจร) ในทางกลับกัน เครือข่ายมาร์คอฟไม่สามารถแสดงความสัมพันธ์บางอย่างที่เครือข่ายเบย์เซียนสามารถแสดงได้ (เช่น ความสัมพันธ์แบบเหนี่ยวนำ) กราฟพื้นฐานของฟิลด์สุ่มมาร์คอฟอาจมีขนาดจำกัดหรืออนันต์ก็ได้
เมื่อความหนาแน่นความน่าจะเป็นร่วมของตัวแปรสุ่มเป็นบวกอย่างเคร่งครัด จะถูกเรียกว่าฟิลด์สุ่มกิบส์ ด้วยเช่นกัน เพราะตามทฤษฎีบทแฮมเมอร์สลีย์-คลิฟฟอร์ดจะสามารถแสดงได้ด้วยการวัดกิบส์สำหรับฟังก์ชันพลังงานที่เหมาะสม (ที่กำหนดในท้องถิ่น) ฟิลด์สุ่มมาร์คอฟต้นแบบคือแบบจำลองไอซิงอันที่จริง ฟิลด์สุ่มมาร์คอฟถูกนำเสนอเป็นการตั้งค่าทั่วไปสำหรับแบบจำลองไอซิง[ 2 ]ในโดเมนของปัญญาประดิษฐ์ฟิลด์สุ่มมาร์คอฟถูกใช้เพื่อจำลองงานระดับต่ำถึงระดับกลางต่างๆ ในการประมวลผลภาพและคอมพิวเตอร์วิชั่น[ 3 ]
คำนิยาม
เมื่อกำหนดกราฟแบบไม่มีทิศทางชุดของตัวแปรสุ่มที่มีดัชนี n จะก่อให้เกิดสนามสุ่มมาร์คอฟตาม n หากตัวแปรสุ่มเหล่านั้นมีคุณสมบัติมาร์คอฟเฉพาะที่ดังต่อไปนี้:
- คุณสมบัติมาร์คอฟแบบคู่: ตัวแปรสองตัวใดๆ ที่ไม่ติดกันจะมีความเป็นอิสระต่อกันแบบมีเงื่อนไขเมื่อกำหนดตัวแปรอื่นๆ ทั้งหมดแล้ว:
- คุณสมบัติมาร์คอฟเฉพาะที่: ตัวแปรหนึ่งเป็นอิสระจากตัวแปรอื่น ๆ แบบมีเงื่อนไข เมื่อพิจารณาจากตัวแปรข้างเคียง:
- โดยที่คือเซตของเพื่อนบ้านของและคือย่านใกล้เคียงแบบปิดของ
- คุณสมบัติมาร์คอฟแบบทั่วโลก: ตัวแปรสองกลุ่มย่อยใดๆ จะเป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนดกลุ่มย่อยที่คั่นกลาง:
- โดยทุกเส้นทางจากโหนดหนึ่งไปยังอีกโหนดหนึ่งจะผ่าน โหนด นั้น
คุณสมบัติมาร์คอฟแบบทั่วโลกนั้นแข็งแกร่งกว่าคุณสมบัติมาร์คอฟแบบท้องถิ่น ซึ่งแข็งแกร่งกว่าคุณสมบัติมาร์คอฟแบบจับคู่[ 4 ]อย่างไรก็ตาม คุณสมบัติมาร์คอฟทั้งสามข้างต้นนั้นเทียบเท่ากันสำหรับการแจกแจงเชิงบวก[ 5 ] (ซึ่งกำหนดความน่าจะเป็นที่ไม่เป็นศูนย์ให้กับตัวแปรที่เกี่ยวข้องเท่านั้น)
ความสัมพันธ์ระหว่างคุณสมบัติทั้งสามของมาร์คอฟนั้นชัดเจนเป็นพิเศษในรูปแบบต่อไปนี้:
- การจับคู่: สำหรับคู่ใดๆ ที่ไม่เท่ากันหรืออยู่ติดกัน.
- ท้องถิ่น: สำหรับใดๆและไม่ประกอบด้วยหรืออยู่ติดกับ, .
- ทั่วโลก: สำหรับเส้นใดๆที่ไม่ตัดกันหรืออยู่ติดกัน.
การแยกตัวประกอบคลิก
เนื่องจากเป็นการยากที่จะพิสูจน์คุณสมบัติของมาร์คอฟสำหรับฟังก์ชันความน่าจะเป็นใดๆ ดังนั้นกลุ่มของฟิลด์สุ่มมาร์คอฟที่นิยมใช้กันทั่วไปจึงเป็นกลุ่มที่สามารถแยกตัวประกอบได้ตามคลิกของกราฟ
กำหนดให้เซตของตัวแปรสุ่มให้เป็นความน่าจะเป็นของการจัดเรียงฟิลด์เฉพาะในเซต นั่นคือคือความน่าจะเป็นที่จะพบว่าตัวแปรสุ่มมีค่าเฉพาะเนื่องจากเป็นเซต ความน่าจะเป็นของ จึงควรเข้าใจว่าเป็นความน่า จะ เป็นที่พิจารณาจากความน่าจะเป็นร่วมของ
หากความหนาแน่นร่วมนี้สามารถแยกตัวประกอบได้เหนือคลิกของas
จากนั้นจึงสร้างสนามสุ่มมาร์คอฟโดยสัมพันธ์กับ โดยที่คือเซตของคลิกของนิยามนี้จะเทียบเท่ากันหากใช้เฉพาะคลิกสูงสุดเท่านั้น ฟังก์ชันเหล่านี้บางครั้งเรียกว่าศักยภาพปัจจัยหรือศักยภาพคลิกอย่างไรก็ตาม โปรดทราบว่ามีการใช้คำศัพท์ที่ขัดแย้งกัน คำว่าศักยภาพมักถูกนำไปใช้กับลอการิทึมของเนื่องจากในกลศาสตร์เชิงสถิติมีการตีความโดยตรงว่าเป็นพลังงานศักยภาพของการจัดเรียง
MRF บางตัวไม่สามารถแยกตัวประกอบได้: ตัวอย่างง่ายๆ สามารถสร้างได้จากวงจรของโหนด 4 โหนดที่มีพลังงานอนันต์บางส่วน กล่าวคือ การกำหนดค่าที่มีความน่าจะเป็นเป็นศูนย์[ 6 ]แม้ว่าพลังงานอนันต์จะกระทำบนกราฟที่สมบูรณ์ได้อย่างเหมาะสมกว่าก็ตาม[ 7 ]
MRF จะสามารถแยกตัวประกอบได้ก็ต่อเมื่อตรงตามเงื่อนไขอย่างน้อยหนึ่งข้อต่อไปนี้:
- ความหนาแน่นเป็นค่าบวกอย่างแน่นอน (ตามทฤษฎีบทแฮมเมอร์สลีย์-คลิฟฟอร์ด )
- กราฟนี้เป็นกราฟคอร์ดัล (โดยเทียบเท่ากับเครือข่ายเบย์เซียน )
เมื่อมีการแยกตัวประกอบดังกล่าวอยู่จริง ก็สามารถสร้างกราฟตัวประกอบสำหรับเครือข่ายได้
ตระกูลเลขชี้กำลัง
สนามสุ่มมาร์คอฟบวกใดๆ สามารถเขียนได้ในรูปตระกูลเอกซ์โพเนนเชียลในรูปแบบมาตรฐาน โดยมีฟังก์ชันคุณลักษณะที่ทำให้การแจกแจงร่วมทั้งหมดสามารถเขียนได้ดังนี้
โดยที่สัญลักษณ์นั้น
เป็นเพียงผลคูณดอทของค่าการกำหนดค่าฟิลด์ และZคือฟังก์ชันการแบ่งส่วน :
ในที่นี้หมายถึงเซตของการกำหนดค่าที่เป็นไปได้ทั้งหมดให้กับตัวแปรสุ่มทั้งหมดของเครือข่าย โดยปกติแล้ว ฟังก์ชันคุณลักษณะจะถูกกำหนดให้เป็นตัวบ่งชี้การกำหนดค่าของกลุ่มย่อย กล่าว คือถ้าสอดคล้องกับ การกำหนดค่าที่เป็นไปได้ลำดับที่ iของ กลุ่มย่อยที่ kและเป็น 0 ในกรณีอื่น ๆ โมเดลนี้เทียบเท่ากับโมเดลการแยกตัวประกอบกลุ่มย่อยที่กล่าวไว้ข้างต้น ถ้าคือจำนวนสมาชิกในกลุ่มย่อย และน้ำหนักของคุณลักษณะสอดคล้องกับลอการิทึมของตัวประกอบกลุ่มย่อยที่เกี่ยวข้อง กล่าวคือโดยที่คือการกำหนดค่าที่เป็นไปได้ลำดับที่i ของ กลุ่มย่อยที่k กล่าว คือค่า ที่ iในโดเมนของกลุ่มย่อย
ความน่าจะเป็นPมักเรียกว่ามาตรวัดของกิบบส์ การแสดงฟิลด์มาร์คอฟในรูปแบบโมเดลโลจิสติกส์นี้จะเป็นไปได้ก็ต่อเมื่อปัจจัยคลิกทั้งหมดไม่เป็นศูนย์ กล่าว คือหากไม่มีองค์ประกอบใดถูกกำหนดความน่าจะเป็นเป็น 0 ซึ่งทำให้สามารถนำเทคนิคจากพีชคณิตเมทริกซ์มาประยุกต์ใช้ได้เช่นร่องรอย ของเมทริก ซ์คือลอการิทึมของดีเทอร์มิแนนต์ โดยที่การแสดงเมทริกซ์ของกราฟเกิดขึ้นจาก เมทริกซ์เหตุการณ์ของกราฟนั้น
ความสำคัญของฟังก์ชันแบ่งส่วนZคือ แนวคิดหลายอย่างจากกลศาสตร์เชิงสถิติเช่นเอนโทรปีสามารถนำมาใช้กับกรณีของเครือข่ายมาร์คอฟได้โดยตรง และ ทำให้เข้าใจ ได้ง่ายขึ้นนอกจากนี้ ฟังก์ชันแบ่งส่วนยังช่วยให้ สามารถใช้ วิธีการแปรผันในการแก้ปัญหาได้ กล่าวคือ เราสามารถกำหนดแรงขับเคลื่อนให้กับตัวแปรสุ่มหนึ่งตัวหรือมากกว่า และสำรวจปฏิกิริยาของเครือข่ายต่อการรบกวน นี้ ตัวอย่างเช่น เราอาจเพิ่มพจน์ขับเคลื่อนJ vสำหรับแต่ละจุดยอดvของกราฟ ลงในฟังก์ชันแบ่งส่วนเพื่อให้ได้:
การหาอนุพันธ์อย่างเป็นทางการเทียบกับJ vจะได้ค่าคาดหวังของตัวแปรสุ่มX vที่เกี่ยวข้องกับจุดยอดv :
ฟังก์ชันสหสัมพันธ์คำนวณในลักษณะเดียวกัน โดยสหสัมพันธ์ระหว่างสองจุดมีดังนี้:
น่าเสียดายที่ถึงแม้ความน่าจะเป็นของเครือข่ายมาร์คอฟแบบโลจิสติกจะเป็นแบบนูน แต่การประเมินความน่าจะเป็นหรือเกรเดียนต์ของความน่าจะเป็นของแบบจำลองนั้นจำเป็นต้องใช้การอนุมานภายในแบบจำลอง ซึ่งโดยทั่วไปแล้วเป็นไปไม่ได้ในเชิงการคำนวณ (ดูหัวข้อ'การอนุมาน'ด้านล่าง)
ตัวอย่าง
เกาส์เซียน
การแจกแจงปกติแบบหลายตัวแปรก่อให้เกิดสนามสุ่มมาร์คอฟเมื่อเทียบกับกราฟหากขอบที่หายไปสอดคล้องกับศูนย์ในเมทริกซ์ความแม่นยำ ( เมทริกซ์ผกผันของความแปรปรวน ร่วม ):
โดยที่
การอนุมาน
เช่นเดียวกับในเครือข่ายเบย์เซียนเราสามารถคำนวณการแจกแจงแบบมีเงื่อนไขของชุดโหนดหนึ่งเมื่อกำหนดค่าให้กับอีกชุดโหนดหนึ่งในฟิลด์สุ่มมาร์คอฟได้โดยการรวมค่าจากทุกการกำหนดค่าที่เป็นไปได้ทั้งหมดซึ่งเรียกว่าการอนุมานที่แม่นยำอย่างไรก็ตาม การอนุมานที่แม่นยำเป็น ปัญหา #P-completeและดังนั้นจึงไม่สามารถคำนวณได้ในกรณีทั่วไป เทคนิคการประมาณค่า เช่นMarkov chain Monte Carloและ loopy belief propagationมักจะทำได้ง่ายกว่าในทางปฏิบัติ ฟิลด์สุ่มมาร์คอฟบางประเภท เช่น ต้นไม้ (ดูต้นไม้ Chow–Liu ) มีอัลกอริธึมการอนุมานแบบใช้เวลาพหุนาม การค้นพบประเภทดังกล่าวเป็นหัวข้อการวิจัยที่กำลังดำเนินอยู่ นอกจากนี้ยังมีประเภทย่อยของฟิลด์สุ่มมาร์คอฟที่อนุญาตให้มีการอนุมานMAPหรือการกำหนดค่าที่น่าจะเป็นไปได้มากที่สุดอย่างมีประสิทธิภาพ ตัวอย่างเช่น เครือข่ายแบบเชื่อมโยง[ 9 ] [ 10 ]กลุ่มย่อยที่น่าสนใจอีกกลุ่มหนึ่งคือกลุ่มของแบบจำลองที่สามารถแยกส่วนได้ (เมื่อกราฟเป็นแบบคอร์ดัล ): เมื่อมีรูปแบบปิดสำหรับMLEก็สามารถค้นพบโครงสร้างที่สอดคล้องกันสำหรับตัวแปรหลายร้อยตัวได้[ 11 ]
ฟิลด์สุ่มแบบมีเงื่อนไข
รูปแบบหนึ่งที่น่าสนใจของฟิลด์สุ่มมาร์คอฟคือฟิลด์สุ่มแบบมีเงื่อนไข ซึ่งตัวแปรสุ่มแต่ละตัวอาจมีเงื่อนไขขึ้นอยู่กับชุดของการสังเกตทั่วโลกในแบบจำลองนี้ ฟังก์ชันแต่ละฟังก์ชันเป็นการแมปจากการกำหนดค่าทั้งหมดให้กับทั้งคลิกkและการสังเกตไปยังจำนวนจริงที่ไม่เป็นลบ รูปแบบของเครือข่ายมาร์คอฟนี้อาจเหมาะสมกว่าสำหรับการสร้างตัวจำแนกแบบแยกแยะซึ่งไม่ได้จำลองการกระจายของการสังเกต CRF ได้รับการเสนอโดยJohn D. Lafferty , Andrew McCallumและFernando CN Pereiraในปี 2001 [ 12 ]
การใช้งานที่หลากหลาย
ฟิลด์สุ่มมาร์คอฟมีการประยุกต์ใช้ในหลากหลายสาขา ตั้งแต่กราฟิกคอมพิวเตอร์ไปจนถึงคอมพิวเตอร์วิชั่น[ 13 ]การเรียนรู้ของเครื่องหรือชีววิทยาเชิงคำนวณ [ 2 ] [ 14 ]และ การ ดึงข้อมูล[ 15 ] MRF ถูกใช้ในการประมวลผลภาพเพื่อสร้างพื้นผิว เนื่องจากสามารถใช้สร้างแบบจำลองภาพ ที่ยืดหยุ่นและสุ่มได้ ในการสร้างแบบจำลองภาพ งานคือการค้นหาการกระจายความเข้มที่เหมาะสมของภาพที่กำหนด โดยความเหมาะสมขึ้นอยู่กับประเภทของงาน และ MRF มีความยืดหยุ่นเพียงพอที่จะใช้สำหรับการสังเคราะห์ภาพและพื้นผิวการบีบอัดและการฟื้นฟูภาพ การแบ่งส่วนภาพ การอนุมานภาพ 3 มิติจากภาพ 2 มิติการลงทะเบียนภาพการสังเคราะห์พื้นผิวความละเอียดสูงการจับคู่สเตอริโอและการดึงข้อมูลวิธีการทางสถิติเชิงกลยังถูกนำมาใช้ในการวิเคราะห์แบบจำลอง MRF สำหรับการฟื้นฟูภาพแบบเบย์เซียน คาซูยูกิ ทานากะ และสึโยชิ โฮริกุจิ ศึกษาแบบจำลอง MRF ที่สามารถแก้ไขได้สำหรับการฟื้นฟูภาพสีและวิธีการคำนวณแบบวนซ้ำที่เกี่ยวข้องสำหรับการฟื้นฟูระดับสีเทา[ 16 ] [ 17 ]สามารถนำมาใช้แก้ปัญหาการมองเห็นด้วยคอมพิวเตอร์ต่างๆ ซึ่งสามารถกำหนดเป็นปัญหาการลดพลังงานหรือปัญหาที่ต้องแยกแยะภูมิภาคต่างๆ โดยใช้ชุดคุณลักษณะที่แยกแยะได้ ภายในกรอบงานฟิลด์สุ่มมาร์คอฟ เพื่อทำนายหมวดหมู่ของภูมิภาค[ 18 ] ฟิลด์สุ่มมาร์คอฟเป็นการขยายความของแบบจำลองไอซิง และตั้งแต่นั้นมาก็ถูกนำมาใช้กันอย่างแพร่หลายในการเพิ่มประสิทธิภาพเชิงรวมและเครือข่าย
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ สนามสุ่มมาร์คอฟ
ในขอบเขตของฟิสิกส์และความน่าจะเป็นสนามสุ่มมาร์คอฟ ( MRF ) เครือข่ายมาร์คอฟหรือแบบจำลองกราฟิกแบบไม่มีทิศทางคือชุดของตัวแปรสุ่มที่มีคุณสมบัติมาร์คอฟซึ่งอธิบายโดยกราฟแบบไม่มีทิศทาง...
คำนิยาม
เมื่อกำหนดกราฟแบบไม่มีทิศทางชุดของตัวแปรสุ่มที่มีดัชนี n จะก่อให้เกิดสนามสุ่มมาร์คอฟตาม n หากตัวแปรสุ่มเหล่านั้นมีคุณสมบัติมาร์คอฟเฉพาะที่ดังต่อไปนี้: จี = ( วี , อี ) {\displaystyle G=(V,E)} X = ( X วี ) วี ∈ วี {\displaystyle X=(X_{v})_{v\ใน V}} วี...
การแยกตัวประกอบคลิก
เนื่องจากเป็นการยากที่จะพิสูจน์คุณสมบัติของมาร์คอฟสำหรับฟังก์ชันความน่าจะเป็นใดๆ ดังนั้นกลุ่มของฟิลด์สุ่มมาร์คอฟที่นิยมใช้กันทั่วไปจึงเป็นกลุ่มที่สามารถแยกตัวประกอบได้ตาม คลิก ของกราฟ
ตระกูลเลขชี้กำลัง
สนามสุ่มมาร์คอฟบวกใดๆ สามารถเขียนได้ในรูปตระกูลเอกซ์โพเนนเชียลในรูปแบบมาตรฐาน โดยมีฟังก์ชันคุณลักษณะที่ทำให้การแจกแจงร่วมทั้งหมดสามารถเขียนได้ดังนี้ เอฟ เค {\displaystyle f_{k}}