กลับไปหน้าบทความ

อ่าน 9 นาที

สนามสุ่มมาร์คอฟ

ในขอบเขตของฟิสิกส์และความน่าจะเป็นสนามสุ่มมาร์คอฟ ( MRF ) เครือข่ายมาร์คอฟหรือแบบจำลองกราฟิกแบบไม่มีทิศทางคือชุดของตัวแปรสุ่มที่มีคุณสมบัติมาร์คอฟซึ่งอธิบายโดยกราฟแบบไม่มีทิศทาง...

สนามสุ่มมาร์คอฟ

ตัวอย่างของฟิลด์สุ่มมาร์คอฟ
ตัวอย่างของฟิลด์สุ่มมาร์คอฟ แต่ละเส้นเชื่อมแสดงถึงความสัมพันธ์ ในตัวอย่างนี้: A ขึ้นอยู่กับ B และ D, B ขึ้นอยู่กับ A และ D, D ขึ้นอยู่กับ A, B และ E, E ขึ้นอยู่กับ D และ C, C ขึ้นอยู่กับ E

ในขอบเขตของฟิสิกส์และความน่าจะเป็นสนามสุ่มมาร์คอฟ ( MRF ) เครือข่ายมาร์คอฟหรือแบบจำลองกราฟิกแบบไม่มีทิศทางคือชุดของตัวแปรสุ่มที่มีคุณสมบัติมาร์คอฟซึ่งอธิบายโดยกราฟแบบไม่มีทิศทาง กล่าว อีกนัยหนึ่งสนามสุ่มจะเรียกว่า สนามสุ่ม มาร์คอฟได้ก็ต่อเมื่อมันมีคุณสมบัติมาร์คอฟ แนวคิดนี้มีต้นกำเนิดมาจากแบบจำลองเชอร์ริงตัน-เคิร์กแพทริก[ 1 ]

เครือข่ายมาร์คอฟหรือ MRF มีความคล้ายคลึงกับเครือข่ายเบย์เซียนในแง่ของการแสดงความสัมพันธ์ โดยมีความแตกต่างกันคือ เครือข่ายเบย์เซียนเป็นแบบมีทิศทางและไม่มีวงจร ในขณะที่เครือข่ายมาร์คอฟเป็นแบบไม่มีทิศทางและอาจมีวงจร ดังนั้น เครือข่ายมาร์คอฟจึงสามารถแสดงความสัมพันธ์บางอย่างที่เครือข่ายเบย์เซียนไม่สามารถแสดงได้ (เช่น ความสัมพันธ์แบบวงจร) ในทางกลับกัน เครือข่ายมาร์คอฟไม่สามารถแสดงความสัมพันธ์บางอย่างที่เครือข่ายเบย์เซียนสามารถแสดงได้ (เช่น ความสัมพันธ์แบบเหนี่ยวนำ) กราฟพื้นฐานของฟิลด์สุ่มมาร์คอฟอาจมีขนาดจำกัดหรืออนันต์ก็ได้

เมื่อความหนาแน่นความน่าจะเป็นร่วมของตัวแปรสุ่มเป็นบวกอย่างเคร่งครัด จะถูกเรียกว่าฟิลด์สุ่มกิบส์ ด้วยเช่นกัน เพราะตามทฤษฎีบทแฮมเมอร์สลีย์-คลิฟฟอร์ดจะสามารถแสดงได้ด้วยการวัดกิบส์สำหรับฟังก์ชันพลังงานที่เหมาะสม (ที่กำหนดในท้องถิ่น) ฟิลด์สุ่มมาร์คอฟต้นแบบคือแบบจำลองไอซิงอันที่จริง ฟิลด์สุ่มมาร์คอฟถูกนำเสนอเป็นการตั้งค่าทั่วไปสำหรับแบบจำลองไอซิง[ 2 ]ในโดเมนของปัญญาประดิษฐ์ฟิลด์สุ่มมาร์คอฟถูกใช้เพื่อจำลองงานระดับต่ำถึงระดับกลางต่างๆ ในการประมวลผลภาพและคอมพิวเตอร์วิชั่น[ 3 ]

คำนิยาม

เมื่อกำหนดกราฟแบบไม่มีทิศทางชุดของตัวแปรสุ่มที่มีดัชนี n จะก่อให้เกิดสนามสุ่มมาร์คอฟตาม n หากตัวแปรสุ่มเหล่านั้นมีคุณสมบัติมาร์คอฟเฉพาะที่ดังต่อไปนี้:

คุณสมบัติมาร์คอฟแบบคู่: ตัวแปรสองตัวใดๆ ที่ไม่ติดกันจะมีความเป็นอิสระต่อกันแบบมีเงื่อนไขเมื่อกำหนดตัวแปรอื่นๆ ทั้งหมดแล้ว:
คุณสมบัติมาร์คอฟเฉพาะที่: ตัวแปรหนึ่งเป็นอิสระจากตัวแปรอื่น ๆ แบบมีเงื่อนไข เมื่อพิจารณาจากตัวแปรข้างเคียง:
โดยที่คือเซตของเพื่อนบ้านของและคือย่านใกล้เคียงแบบปิดของ
คุณสมบัติมาร์คอฟแบบทั่วโลก: ตัวแปรสองกลุ่มย่อยใดๆ จะเป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนดกลุ่มย่อยที่คั่นกลาง:
โดยทุกเส้นทางจากโหนดหนึ่งไปยังอีกโหนดหนึ่งจะผ่าน โหนด นั้น

คุณสมบัติมาร์คอฟแบบทั่วโลกนั้นแข็งแกร่งกว่าคุณสมบัติมาร์คอฟแบบท้องถิ่น ซึ่งแข็งแกร่งกว่าคุณสมบัติมาร์คอฟแบบจับคู่[ 4 ]อย่างไรก็ตาม คุณสมบัติมาร์คอฟทั้งสามข้างต้นนั้นเทียบเท่ากันสำหรับการแจกแจงเชิงบวก[ 5 ] (ซึ่งกำหนดความน่าจะเป็นที่ไม่เป็นศูนย์ให้กับตัวแปรที่เกี่ยวข้องเท่านั้น)

ความสัมพันธ์ระหว่างคุณสมบัติทั้งสามของมาร์คอฟนั้นชัดเจนเป็นพิเศษในรูปแบบต่อไปนี้:

  • การจับคู่: สำหรับคู่ใดๆ ที่ไม่เท่ากันหรืออยู่ติดกัน.
  • ท้องถิ่น: สำหรับใดๆและไม่ประกอบด้วยหรืออยู่ติดกับ, .
  • ทั่วโลก: สำหรับเส้นใดๆที่ไม่ตัดกันหรืออยู่ติดกัน.

การแยกตัวประกอบคลิก

เนื่องจากเป็นการยากที่จะพิสูจน์คุณสมบัติของมาร์คอฟสำหรับฟังก์ชันความน่าจะเป็นใดๆ ดังนั้นกลุ่มของฟิลด์สุ่มมาร์คอฟที่นิยมใช้กันทั่วไปจึงเป็นกลุ่มที่สามารถแยกตัวประกอบได้ตามคลิกของกราฟ

กำหนดให้เซตของตัวแปรสุ่มให้เป็นความน่าจะเป็นของการจัดเรียงฟิลด์เฉพาะในเซต นั่นคือคือความน่าจะเป็นที่จะพบว่าตัวแปรสุ่มมีค่าเฉพาะเนื่องจากเป็นเซต ความน่าจะเป็นของ จึงควรเข้าใจว่าเป็นความน่า จะ เป็นที่พิจารณาจากความน่าจะเป็นร่วมของ

หากความหนาแน่นร่วมนี้สามารถแยกตัวประกอบได้เหนือคลิกของas

จากนั้นจึงสร้างสนามสุ่มมาร์คอฟโดยสัมพันธ์กับ โดยที่คือเซตของคลิกของนิยามนี้จะเทียบเท่ากันหากใช้เฉพาะคลิกสูงสุดเท่านั้น ฟังก์ชันเหล่านี้บางครั้งเรียกว่าศักยภาพปัจจัยหรือศักยภาพคลิกอย่างไรก็ตาม โปรดทราบว่ามีการใช้คำศัพท์ที่ขัดแย้งกัน คำว่าศักยภาพมักถูกนำไปใช้กับลอการิทึมของเนื่องจากในกลศาสตร์เชิงสถิติมีการตีความโดยตรงว่าเป็นพลังงานศักยภาพของการจัดเรียง

MRF บางตัวไม่สามารถแยกตัวประกอบได้: ตัวอย่างง่ายๆ สามารถสร้างได้จากวงจรของโหนด 4 โหนดที่มีพลังงานอนันต์บางส่วน กล่าวคือ การกำหนดค่าที่มีความน่าจะเป็นเป็นศูนย์[ 6 ]แม้ว่าพลังงานอนันต์จะกระทำบนกราฟที่สมบูรณ์ได้อย่างเหมาะสมกว่าก็ตาม[ 7 ]

MRF จะสามารถแยกตัวประกอบได้ก็ต่อเมื่อตรงตามเงื่อนไขอย่างน้อยหนึ่งข้อต่อไปนี้:

เมื่อมีการแยกตัวประกอบดังกล่าวอยู่จริง ก็สามารถสร้างกราฟตัวประกอบสำหรับเครือข่ายได้

ตระกูลเลขชี้กำลัง

สนามสุ่มมาร์คอฟบวกใดๆ สามารถเขียนได้ในรูปตระกูลเอกซ์โพเนนเชียลในรูปแบบมาตรฐาน โดยมีฟังก์ชันคุณลักษณะที่ทำให้การแจกแจงร่วมทั้งหมดสามารถเขียนได้ดังนี้

โดยที่สัญลักษณ์นั้น

เป็นเพียงผลคูณดอทของค่าการกำหนดค่าฟิลด์ และZคือฟังก์ชันการแบ่งส่วน :

ในที่นี้หมายถึงเซตของการกำหนดค่าที่เป็นไปได้ทั้งหมดให้กับตัวแปรสุ่มทั้งหมดของเครือข่าย โดยปกติแล้ว ฟังก์ชันคุณลักษณะจะถูกกำหนดให้เป็นตัวบ่งชี้การกำหนดค่าของกลุ่มย่อย กล่าว คือถ้าสอดคล้องกับ การกำหนดค่าที่เป็นไปได้ลำดับที่ iของ กลุ่มย่อยที่ kและเป็น 0 ในกรณีอื่น ๆ โมเดลนี้เทียบเท่ากับโมเดลการแยกตัวประกอบกลุ่มย่อยที่กล่าวไว้ข้างต้น ถ้าคือจำนวนสมาชิกในกลุ่มย่อย และน้ำหนักของคุณลักษณะสอดคล้องกับลอการิทึมของตัวประกอบกลุ่มย่อยที่เกี่ยวข้อง กล่าวคือโดยที่คือการกำหนดค่าที่เป็นไปได้ลำดับที่i ของ กลุ่มย่อยที่k กล่าว คือค่า ที่ iในโดเมนของกลุ่มย่อย

ความน่าจะเป็นPมักเรียกว่ามาตรวัดของกิบบส์ การแสดงฟิลด์มาร์คอฟในรูปแบบโมเดลโลจิสติกส์นี้จะเป็นไปได้ก็ต่อเมื่อปัจจัยคลิกทั้งหมดไม่เป็นศูนย์ กล่าว คือหากไม่มีองค์ประกอบใดถูกกำหนดความน่าจะเป็นเป็น 0 ซึ่งทำให้สามารถนำเทคนิคจากพีชคณิตเมทริกซ์มาประยุกต์ใช้ได้เช่นร่องรอย ของเมทริก ซ์คือลอการิทึมของดีเทอร์มิแนนต์ โดยที่การแสดงเมทริกซ์ของกราฟเกิดขึ้นจาก เมทริกซ์เหตุการณ์ของกราฟนั้น

ความสำคัญของฟังก์ชันแบ่งส่วนZคือ แนวคิดหลายอย่างจากกลศาสตร์เชิงสถิติเช่นเอนโทรปีสามารถนำมาใช้กับกรณีของเครือข่ายมาร์คอฟได้โดยตรง และ ทำให้เข้าใจ ได้ง่ายขึ้นนอกจากนี้ ฟังก์ชันแบ่งส่วนยังช่วยให้ สามารถใช้ วิธีการแปรผันในการแก้ปัญหาได้ กล่าวคือ เราสามารถกำหนดแรงขับเคลื่อนให้กับตัวแปรสุ่มหนึ่งตัวหรือมากกว่า และสำรวจปฏิกิริยาของเครือข่ายต่อการรบกวน นี้ ตัวอย่างเช่น เราอาจเพิ่มพจน์ขับเคลื่อนJ vสำหรับแต่ละจุดยอดvของกราฟ ลงในฟังก์ชันแบ่งส่วนเพื่อให้ได้:

การหาอนุพันธ์อย่างเป็นทางการเทียบกับJ vจะได้ค่าคาดหวังของตัวแปรสุ่มX vที่เกี่ยวข้องกับจุดยอดv :

ฟังก์ชันสหสัมพันธ์คำนวณในลักษณะเดียวกัน โดยสหสัมพันธ์ระหว่างสองจุดมีดังนี้:

น่าเสียดายที่ถึงแม้ความน่าจะเป็นของเครือข่ายมาร์คอฟแบบโลจิสติกจะเป็นแบบนูน แต่การประเมินความน่าจะเป็นหรือเกรเดียนต์ของความน่าจะเป็นของแบบจำลองนั้นจำเป็นต้องใช้การอนุมานภายในแบบจำลอง ซึ่งโดยทั่วไปแล้วเป็นไปไม่ได้ในเชิงการคำนวณ (ดูหัวข้อ'การอนุมาน'ด้านล่าง)

ตัวอย่าง

เกาส์เซียน

การแจกแจงปกติแบบหลายตัวแปรก่อให้เกิดสนามสุ่มมาร์คอฟเมื่อเทียบกับกราฟหากขอบที่หายไปสอดคล้องกับศูนย์ในเมทริกซ์ความแม่นยำ ( เมทริกซ์ผกผันของความแปรปรวน ร่วม ):

โดยที่

[ 8 ]

การอนุมาน

เช่นเดียวกับในเครือข่ายเบย์เซียนเราสามารถคำนวณการแจกแจงแบบมีเงื่อนไขของชุดโหนดหนึ่งเมื่อกำหนดค่าให้กับอีกชุดโหนดหนึ่งในฟิลด์สุ่มมาร์คอฟได้โดยการรวมค่าจากทุกการกำหนดค่าที่เป็นไปได้ทั้งหมดซึ่งเรียกว่าการอนุมานที่แม่นยำอย่างไรก็ตาม การอนุมานที่แม่นยำเป็น ปัญหา #P-completeและดังนั้นจึงไม่สามารถคำนวณได้ในกรณีทั่วไป เทคนิคการประมาณค่า เช่นMarkov chain Monte Carloและ loopy belief propagationมักจะทำได้ง่ายกว่าในทางปฏิบัติ ฟิลด์สุ่มมาร์คอฟบางประเภท เช่น ต้นไม้ (ดูต้นไม้ Chow–Liu ) มีอัลกอริธึมการอนุมานแบบใช้เวลาพหุนาม การค้นพบประเภทดังกล่าวเป็นหัวข้อการวิจัยที่กำลังดำเนินอยู่ นอกจากนี้ยังมีประเภทย่อยของฟิลด์สุ่มมาร์คอฟที่อนุญาตให้มีการอนุมานMAPหรือการกำหนดค่าที่น่าจะเป็นไปได้มากที่สุดอย่างมีประสิทธิภาพ ตัวอย่างเช่น เครือข่ายแบบเชื่อมโยง[ 9 ] [ 10 ]กลุ่มย่อยที่น่าสนใจอีกกลุ่มหนึ่งคือกลุ่มของแบบจำลองที่สามารถแยกส่วนได้ (เมื่อกราฟเป็นแบบคอร์ดัล ): เมื่อมีรูปแบบปิดสำหรับMLEก็สามารถค้นพบโครงสร้างที่สอดคล้องกันสำหรับตัวแปรหลายร้อยตัวได้[ 11 ]

ฟิลด์สุ่มแบบมีเงื่อนไข

รูปแบบหนึ่งที่น่าสนใจของฟิลด์สุ่มมาร์คอฟคือฟิลด์สุ่มแบบมีเงื่อนไข ซึ่งตัวแปรสุ่มแต่ละตัวอาจมีเงื่อนไขขึ้นอยู่กับชุดของการสังเกตทั่วโลกในแบบจำลองนี้ ฟังก์ชันแต่ละฟังก์ชันเป็นการแมปจากการกำหนดค่าทั้งหมดให้กับทั้งคลิกkและการสังเกตไปยังจำนวนจริงที่ไม่เป็นลบ รูปแบบของเครือข่ายมาร์คอฟนี้อาจเหมาะสมกว่าสำหรับการสร้างตัวจำแนกแบบแยกแยะซึ่งไม่ได้จำลองการกระจายของการสังเกต CRF ได้รับการเสนอโดยJohn D. Lafferty , Andrew McCallumและFernando CN Pereiraในปี 2001 [ 12 ]

การใช้งานที่หลากหลาย

ฟิลด์สุ่มมาร์คอฟมีการประยุกต์ใช้ในหลากหลายสาขา ตั้งแต่กราฟิกคอมพิวเตอร์ไปจนถึงคอมพิวเตอร์วิชั่น[ 13 ]การเรียนรู้ของเครื่องหรือชีววิทยาเชิงคำนวณ [ 2 ] [ 14 ]และ การ ดึงข้อมูล[ 15 ] MRF ถูกใช้ในการประมวลผลภาพเพื่อสร้างพื้นผิว เนื่องจากสามารถใช้สร้างแบบจำลองภาพ ที่ยืดหยุ่นและสุ่มได้ ในการสร้างแบบจำลองภาพ งานคือการค้นหาการกระจายความเข้มที่เหมาะสมของภาพที่กำหนด โดยความเหมาะสมขึ้นอยู่กับประเภทของงาน และ MRF มีความยืดหยุ่นเพียงพอที่จะใช้สำหรับการสังเคราะห์ภาพและพื้นผิวการบีบอัดและการฟื้นฟูภาพ การแบ่งส่วนภาพ การอนุมานภาพ 3 มิติจากภาพ 2 มิติการลงทะเบียนภาพการสังเคราะห์พื้นผิวความละเอียดสูงการจับคู่สเตอริโอและการดึงข้อมูลวิธีการทางสถิติเชิงกลยังถูกนำมาใช้ในการวิเคราะห์แบบจำลอง MRF สำหรับการฟื้นฟูภาพแบบเบย์เซียน คาซูยูกิ ทานากะ และสึโยชิ โฮริกุจิ ศึกษาแบบจำลอง MRF ที่สามารถแก้ไขได้สำหรับการฟื้นฟูภาพสีและวิธีการคำนวณแบบวนซ้ำที่เกี่ยวข้องสำหรับการฟื้นฟูระดับสีเทา[ 16 ] [ 17 ]สามารถนำมาใช้แก้ปัญหาการมองเห็นด้วยคอมพิวเตอร์ต่างๆ ซึ่งสามารถกำหนดเป็นปัญหาการลดพลังงานหรือปัญหาที่ต้องแยกแยะภูมิภาคต่างๆ โดยใช้ชุดคุณลักษณะที่แยกแยะได้ ภายในกรอบงานฟิลด์สุ่มมาร์คอฟ เพื่อทำนายหมวดหมู่ของภูมิภาค[ 18 ] ฟิลด์สุ่มมาร์คอฟเป็นการขยายความของแบบจำลองไอซิง และตั้งแต่นั้นมาก็ถูกนำมาใช้กันอย่างแพร่หลายในการเพิ่มประสิทธิภาพเชิงรวมและเครือข่าย

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Markov_random_field&oldid=1349880216 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ สนามสุ่มมาร์คอฟ

ในขอบเขตของฟิสิกส์และความน่าจะเป็นสนามสุ่มมาร์คอฟ ( MRF ) เครือข่ายมาร์คอฟหรือแบบจำลองกราฟิกแบบไม่มีทิศทางคือชุดของตัวแปรสุ่มที่มีคุณสมบัติมาร์คอฟซึ่งอธิบายโดยกราฟแบบไม่มีทิศทาง...

คำนิยาม

เมื่อกำหนดกราฟแบบไม่มีทิศทางชุดของตัวแปรสุ่มที่มีดัชนี n จะก่อให้เกิดสนามสุ่มมาร์คอฟตาม n หากตัวแปรสุ่มเหล่านั้นมีคุณสมบัติมาร์คอฟเฉพาะที่ดังต่อไปนี้: จี = ( วี , อี ) {\displaystyle G=(V,E)} X = ( X วี ) วี ∈ วี {\displaystyle X=(X_{v})_{v\ใน V}} วี...

การแยกตัวประกอบคลิก

เนื่องจากเป็นการยากที่จะพิสูจน์คุณสมบัติของมาร์คอฟสำหรับฟังก์ชันความน่าจะเป็นใดๆ ดังนั้นกลุ่มของฟิลด์สุ่มมาร์คอฟที่นิยมใช้กันทั่วไปจึงเป็นกลุ่มที่สามารถแยกตัวประกอบได้ตาม คลิก ของกราฟ

ตระกูลเลขชี้กำลัง

สนามสุ่มมาร์คอฟบวกใดๆ สามารถเขียนได้ในรูปตระกูลเอกซ์โพเนนเชียลในรูปแบบมาตรฐาน โดยมีฟังก์ชันคุณลักษณะที่ทำให้การแจกแจงร่วมทั้งหมดสามารถเขียนได้ดังนี้ เอฟ เค {\displaystyle f_{k}}