สนามสุ่มมาร์คอฟ

ในขอบเขตของฟิสิกส์และความน่าจะเป็นสนามสุ่มมาร์คอฟ ( MRF ) เครือข่ายมาร์คอฟหรือแบบจำลองกราฟิกแบบไม่มีทิศทางคือชุดของตัวแปรสุ่มที่มีคุณสมบัติมาร์คอฟซึ่งอธิบายโดยกราฟแบบไม่มีทิศทาง กล่าว อีกนัยหนึ่งสนามสุ่มจะเรียกว่า สนามสุ่ม มาร์คอฟได้ก็ต่อเมื่อมันมีคุณสมบัติมาร์คอฟ แนวคิดนี้มีต้นกำเนิดมาจากแบบจำลองเชอร์ริงตัน-เคิร์กแพทริก^{[ 1 ]}

เครือข่ายมาร์คอฟหรือ MRF มีความคล้ายคลึงกับเครือข่ายเบย์เซียนในแง่ของการแสดงความสัมพันธ์ โดยมีความแตกต่างกันคือ เครือข่ายเบย์เซียนเป็นแบบมีทิศทางและไม่มีวงจร ในขณะที่เครือข่ายมาร์คอฟเป็นแบบไม่มีทิศทางและอาจมีวงจร ดังนั้น เครือข่ายมาร์คอฟจึงสามารถแสดงความสัมพันธ์บางอย่างที่เครือข่ายเบย์เซียนไม่สามารถแสดงได้ (เช่น ความสัมพันธ์แบบวงจร) ในทางกลับกัน เครือข่ายมาร์คอฟไม่สามารถแสดงความสัมพันธ์บางอย่างที่เครือข่ายเบย์เซียนสามารถแสดงได้ (เช่น ความสัมพันธ์แบบเหนี่ยวนำ) กราฟพื้นฐานของฟิลด์สุ่มมาร์คอฟอาจมีขนาดจำกัดหรืออนันต์ก็ได้

เมื่อความหนาแน่นความน่าจะเป็นร่วมของตัวแปรสุ่มเป็นบวกอย่างเคร่งครัด จะถูกเรียกว่าฟิลด์สุ่มกิบส์ ด้วยเช่นกัน เพราะตามทฤษฎีบทแฮมเมอร์สลีย์-คลิฟฟอร์ดจะสามารถแสดงได้ด้วยการวัดกิบส์สำหรับฟังก์ชันพลังงานที่เหมาะสม (ที่กำหนดในท้องถิ่น) ฟิลด์สุ่มมาร์คอฟต้นแบบคือแบบจำลองไอซิงอันที่จริง ฟิลด์สุ่มมาร์คอฟถูกนำเสนอเป็นการตั้งค่าทั่วไปสำหรับแบบจำลองไอซิง^{[ 2 ]}ในโดเมนของปัญญาประดิษฐ์ฟิลด์สุ่มมาร์คอฟถูกใช้เพื่อจำลองงานระดับต่ำถึงระดับกลางต่างๆ ในการประมวลผลภาพและคอมพิวเตอร์วิชั่น^{[ 3 ]}

คำนิยาม

เมื่อกำหนดกราฟแบบไม่มีทิศทางชุดของตัวแปรสุ่มที่มีดัชนี n จะก่อให้เกิดสนามสุ่มมาร์คอฟตาม n หากตัวแปรสุ่มเหล่านั้นมีคุณสมบัติมาร์คอฟเฉพาะที่ดังต่อไปนี้: $G=(V,E)$ $X=(X_{v})_{v\ใน V}$ $V$ $G$

คุณสมบัติมาร์คอฟแบบคู่: ตัวแปรสองตัวใดๆ ที่ไม่ติดกันจะมีความเป็นอิสระต่อกันแบบมีเงื่อนไขเมื่อกำหนดตัวแปรอื่นๆ ทั้งหมดแล้ว:

X_{u}\perp \!\!\!\perp X_{v}\mid X_{V\smallsetminus \{u,v\}}

คุณสมบัติมาร์คอฟเฉพาะที่: ตัวแปรหนึ่งเป็นอิสระจากตัวแปรอื่น ๆ แบบมีเงื่อนไข เมื่อพิจารณาจากตัวแปรข้างเคียง:

X_{v}\perp \!\!\!\perp X_{V\smallsetminus \operatorname {N} [v]}\mid X_{\operatorname {N} (v)}

โดยที่คือเซตของเพื่อนบ้านของและคือย่านใกล้เคียงแบบปิดของ

{\textstyle \ชื่อผู้ดำเนินการ {N} (v)}

v

\ชื่อผู้ดำเนินการ {N} [v]=v\cup \ชื่อผู้ดำเนินการ {N} (v)

v

คุณสมบัติมาร์คอฟแบบทั่วโลก: ตัวแปรสองกลุ่มย่อยใดๆ จะเป็นอิสระต่อกันแบบมีเงื่อนไข เมื่อกำหนดกลุ่มย่อยที่คั่นกลาง:

X_{A}\perp \!\!\!\perp X_{B}\mid X_{S}

โดยทุกเส้นทางจากโหนดหนึ่งไปยังอีกโหนดหนึ่งจะผ่าน โหนด นั้น

A

B

S

คุณสมบัติมาร์คอฟแบบทั่วโลกนั้นแข็งแกร่งกว่าคุณสมบัติมาร์คอฟแบบท้องถิ่น ซึ่งแข็งแกร่งกว่าคุณสมบัติมาร์คอฟแบบจับคู่^{[ 4 ]}อย่างไรก็ตาม คุณสมบัติมาร์คอฟทั้งสามข้างต้นนั้นเทียบเท่ากันสำหรับการแจกแจงเชิงบวก^{[ 5 ]} (ซึ่งกำหนดความน่าจะเป็นที่ไม่เป็นศูนย์ให้กับตัวแปรที่เกี่ยวข้องเท่านั้น)

ความสัมพันธ์ระหว่างคุณสมบัติทั้งสามของมาร์คอฟนั้นชัดเจนเป็นพิเศษในรูปแบบต่อไปนี้:

การจับคู่: สำหรับคู่ใดๆ ที่ไม่เท่ากันหรืออยู่ติดกัน. $i,j\in V$ $X_{i}\perp \!\!\!\perp X_{j}|X_{V\smallsetminus \{i,j\}}$
ท้องถิ่น: สำหรับใดๆและไม่ประกอบด้วยหรืออยู่ติดกับ, . $i\in V$ $J\subset V$ $i$ $X_{i}\perp \!\!\!\perp X_{J}|X_{V\smallsetminus (\{i\}\cup J)}$
ทั่วโลก: สำหรับเส้นใดๆที่ไม่ตัดกันหรืออยู่ติดกัน. $I,J\subset V$ $X_{I}\perp \!\!\!\perp X_{J}|X_{V\smallsetminus (I\cup J)}$

การแยกตัวประกอบคลิก

เนื่องจากเป็นการยากที่จะพิสูจน์คุณสมบัติของมาร์คอฟสำหรับฟังก์ชันความน่าจะเป็นใดๆ ดังนั้นกลุ่มของฟิลด์สุ่มมาร์คอฟที่นิยมใช้กันทั่วไปจึงเป็นกลุ่มที่สามารถแยกตัวประกอบได้ตามคลิกของกราฟ

กำหนดให้เซตของตัวแปรสุ่มให้เป็นความน่าจะเป็นของการจัดเรียงฟิลด์เฉพาะในเซต นั่นคือคือความน่าจะเป็นที่จะพบว่าตัวแปรสุ่มมีค่าเฉพาะเนื่องจากเป็นเซต ความน่าจะเป็นของ จึงควรเข้าใจว่าเป็นความน่า จะ เป็นที่พิจารณาจากความน่าจะเป็นร่วมของ $X=(X_{v})_{v\ใน V}$ $P(X=x)$ $x$ $X$ $P(X=x)$ $X$ $x$ $X$ $x$ $X_{v}$

หากความหนาแน่นร่วมนี้สามารถแยกตัวประกอบได้เหนือคลิกของas $G$

P(X=x)=\prod _{C\in \operatorname {cl} (G)}\varphi _{C}(x_{C})

จากนั้นจึงสร้างสนามสุ่มมาร์คอฟโดยสัมพันธ์กับ โดยที่คือเซตของคลิกของนิยามนี้จะเทียบเท่ากันหากใช้เฉพาะคลิกสูงสุดเท่านั้น ฟังก์ชันเหล่านี้บางครั้งเรียกว่าศักยภาพปัจจัยหรือศักยภาพคลิกอย่างไรก็ตาม โปรดทราบว่ามีการใช้คำศัพท์ที่ขัดแย้งกัน คำว่าศักยภาพมักถูกนำไปใช้กับลอการิทึมของเนื่องจากในกลศาสตร์เชิงสถิติมีการตีความโดยตรงว่าเป็นพลังงานศักยภาพของการจัดเรียง $X$ $G$ $\operatorname {cl} (G)$ $G$ $\varphi _{C}$ $\varphi _{C}$ $\log(\varphi _{C})$ $x_{C}$

MRF บางตัวไม่สามารถแยกตัวประกอบได้: ตัวอย่างง่ายๆ สามารถสร้างได้จากวงจรของโหนด 4 โหนดที่มีพลังงานอนันต์บางส่วน กล่าวคือ การกำหนดค่าที่มีความน่าจะเป็นเป็นศูนย์^{[ 6 ]}แม้ว่าพลังงานอนันต์จะกระทำบนกราฟที่สมบูรณ์ได้อย่างเหมาะสมกว่าก็ตาม^[⁷^] $V$

MRF จะสามารถแยกตัวประกอบได้ก็ต่อเมื่อตรงตามเงื่อนไขอย่างน้อยหนึ่งข้อต่อไปนี้:

ความหนาแน่นเป็นค่าบวกอย่างแน่นอน (ตามทฤษฎีบทแฮมเมอร์สลีย์-คลิฟฟอร์ด )
กราฟนี้เป็นกราฟคอร์ดัล (โดยเทียบเท่ากับเครือข่ายเบย์เซียน )

เมื่อมีการแยกตัวประกอบดังกล่าวอยู่จริง ก็สามารถสร้างกราฟตัวประกอบสำหรับเครือข่ายได้

ตระกูลเลขชี้กำลัง

สนามสุ่มมาร์คอฟบวกใดๆ สามารถเขียนได้ในรูปตระกูลเอกซ์โพเนนเชียลในรูปแบบมาตรฐาน โดยมีฟังก์ชันคุณลักษณะที่ทำให้การแจกแจงร่วมทั้งหมดสามารถเขียนได้ดังนี้ $f_{k}$

P(X=x)={\frac {1}{Z}}\exp \left(\sum _{k}w_{k}^{\top }f_{k}(x_{\{k\}})\right)

โดยที่สัญลักษณ์นั้น

w_{k}^{\top }f_{k}(x_{\{k\}})=\sum _{i=1}^{N_{k}}w_{k,i}\cdot f_{k,i}(x_{\{k\}})

เป็นเพียงผลคูณดอทของค่าการกำหนดค่าฟิลด์ และZคือฟังก์ชันการแบ่งส่วน :

Z=\sum _{x\in {\mathcal {X}}}\exp \left(\sum _{k}w_{k}^{\top }f_{k}(x_{\{k\}})\right).

ในที่นี้หมายถึงเซตของการกำหนดค่าที่เป็นไปได้ทั้งหมดให้กับตัวแปรสุ่มทั้งหมดของเครือข่าย โดยปกติแล้ว ฟังก์ชันคุณลักษณะจะถูกกำหนดให้เป็นตัวบ่งชี้การกำหนดค่าของกลุ่มย่อย กล่าว คือถ้าสอดคล้องกับ การกำหนดค่าที่เป็นไปได้ลำดับที่ iของ กลุ่มย่อยที่ kและเป็น 0 ในกรณีอื่น ๆ โมเดลนี้เทียบเท่ากับโมเดลการแยกตัวประกอบกลุ่มย่อยที่กล่าวไว้ข้างต้น ถ้าคือจำนวนสมาชิกในกลุ่มย่อย และน้ำหนักของคุณลักษณะสอดคล้องกับลอการิทึมของตัวประกอบกลุ่มย่อยที่เกี่ยวข้อง กล่าวคือโดยที่คือการกำหนดค่าที่เป็นไปได้ลำดับที่i ของ กลุ่มย่อยที่k กล่าว คือค่า ที่ iในโดเมนของกลุ่มย่อย ${\mathcal {X}}$ $f_{k,i}$ $f_{k,i}(x_{\{k\}})=1$ $x_{\{k\}}$ $N_{k}=|\operatorname {dom} (C_{k})|$ $f_{k,i}$ $w_{k,i}=\log \varphi (c_{k,i})$ $c_{k,i}$ $C_{k}$

ความน่าจะเป็นPมักเรียกว่ามาตรวัดของกิบบส์ การแสดงฟิลด์มาร์คอฟในรูปแบบโมเดลโลจิสติกส์นี้จะเป็นไปได้ก็ต่อเมื่อปัจจัยคลิกทั้งหมดไม่เป็นศูนย์ กล่าว คือหากไม่มีองค์ประกอบใดถูกกำหนดความน่าจะเป็นเป็น 0 ซึ่งทำให้สามารถนำเทคนิคจากพีชคณิตเมทริกซ์มาประยุกต์ใช้ได้เช่นร่องรอย ของเมทริก ซ์คือลอการิทึมของดีเทอร์มิแนนต์ โดยที่การแสดงเมทริกซ์ของกราฟเกิดขึ้นจาก เมทริกซ์เหตุการณ์ของกราฟนั้น ${\mathcal {X}}$

ความสำคัญของฟังก์ชันแบ่งส่วนZคือ แนวคิดหลายอย่างจากกลศาสตร์เชิงสถิติเช่นเอนโทรปีสามารถนำมาใช้กับกรณีของเครือข่ายมาร์คอฟได้โดยตรง และ ทำให้เข้าใจ ได้ง่ายขึ้นนอกจากนี้ ฟังก์ชันแบ่งส่วนยังช่วยให้ สามารถใช้ วิธีการแปรผันในการแก้ปัญหาได้ กล่าวคือ เราสามารถกำหนดแรงขับเคลื่อนให้กับตัวแปรสุ่มหนึ่งตัวหรือมากกว่า และสำรวจปฏิกิริยาของเครือข่ายต่อการรบกวน นี้ ตัวอย่างเช่น เราอาจเพิ่มพจน์ขับเคลื่อนJ _vสำหรับแต่ละจุดยอดvของกราฟ ลงในฟังก์ชันแบ่งส่วนเพื่อให้ได้:

Z[J]=\sum _{x\in {\mathcal {X}}}\exp \left(\sum _{k}w_{k}^{\top }f_{k}(x_{\{k\}})+\sum _{v}J_{v}x_{v}\right)

การหาอนุพันธ์อย่างเป็นทางการเทียบกับJ _vจะได้ค่าคาดหวังของตัวแปรสุ่มX _vที่เกี่ยวข้องกับจุดยอดv :

E[X_{v}]={\frac {1}{Z}}\left.{\frac {\partial Z[J]}{\partial J_{v}}}\right|_{J_{v}=0}.

ฟังก์ชันสหสัมพันธ์คำนวณในลักษณะเดียวกัน โดยสหสัมพันธ์ระหว่างสองจุดมีดังนี้:

C[X_{u},X_{v}]={\frac {1}{Z}}\left.{\frac {\partial ^{2}Z[J]}{\partial J_{u}\,\partial J_{v}}}\right|_{J_{u}=0,J_{v}=0}.

น่าเสียดายที่ถึงแม้ความน่าจะเป็นของเครือข่ายมาร์คอฟแบบโลจิสติกจะเป็นแบบนูน แต่การประเมินความน่าจะเป็นหรือเกรเดียนต์ของความน่าจะเป็นของแบบจำลองนั้นจำเป็นต้องใช้การอนุมานภายในแบบจำลอง ซึ่งโดยทั่วไปแล้วเป็นไปไม่ได้ในเชิงการคำนวณ (ดูหัวข้อ'การอนุมาน'ด้านล่าง)

ตัวอย่าง

เกาส์เซียน

การแจกแจงปกติแบบหลายตัวแปรก่อให้เกิดสนามสุ่มมาร์คอฟเมื่อเทียบกับกราฟหากขอบที่หายไปสอดคล้องกับศูนย์ในเมทริกซ์ความแม่นยำ ( เมทริกซ์ผกผันของความแปรปรวน ร่วม ): $G=(V,E)$

X=(X_{v})_{v\in V}\sim {\mathcal {N}}({\boldsymbol {\mu }},\Sigma )

โดยที่

(\Sigma ^{-1})_{uv}=0\quad {\text{iff}}\quad \{u,v\}\notin E.

^{[ 8 ]}

การอนุมาน

เช่นเดียวกับในเครือข่ายเบย์เซียนเราสามารถคำนวณการแจกแจงแบบมีเงื่อนไขของชุดโหนดหนึ่งเมื่อกำหนดค่าให้กับอีกชุดโหนดหนึ่งในฟิลด์สุ่มมาร์คอฟได้โดยการรวมค่าจากทุกการกำหนดค่าที่เป็นไปได้ทั้งหมดซึ่งเรียกว่าการอนุมานที่แม่นยำอย่างไรก็ตาม การอนุมานที่แม่นยำเป็น ปัญหา #P-completeและดังนั้นจึงไม่สามารถคำนวณได้ในกรณีทั่วไป เทคนิคการประมาณค่า เช่นMarkov chain Monte Carloและ loopy belief propagationมักจะทำได้ง่ายกว่าในทางปฏิบัติ ฟิลด์สุ่มมาร์คอฟบางประเภท เช่น ต้นไม้ (ดูต้นไม้ Chow–Liu ) มีอัลกอริธึมการอนุมานแบบใช้เวลาพหุนาม การค้นพบประเภทดังกล่าวเป็นหัวข้อการวิจัยที่กำลังดำเนินอยู่ นอกจากนี้ยังมีประเภทย่อยของฟิลด์สุ่มมาร์คอฟที่อนุญาตให้มีการอนุมานMAPหรือการกำหนดค่าที่น่าจะเป็นไปได้มากที่สุดอย่างมีประสิทธิภาพ ตัวอย่างเช่น เครือข่ายแบบเชื่อมโยง^[⁹^]^[¹⁰^]กลุ่มย่อยที่น่าสนใจอีกกลุ่มหนึ่งคือกลุ่มของแบบจำลองที่สามารถแยกส่วนได้ (เมื่อกราฟเป็นแบบคอร์ดัล ): เมื่อมีรูปแบบปิดสำหรับMLEก็สามารถค้นพบโครงสร้างที่สอดคล้องกันสำหรับตัวแปรหลายร้อยตัวได้^[¹¹^] $V'=\{v_{1},\ldots ,v_{i}\}$ $W'=\{w_{1},\ldots ,w_{j}\}$ $u\notin V',W'$

ฟิลด์สุ่มแบบมีเงื่อนไข

รูปแบบหนึ่งที่น่าสนใจของฟิลด์สุ่มมาร์คอฟคือฟิลด์สุ่มแบบมีเงื่อนไข ซึ่งตัวแปรสุ่มแต่ละตัวอาจมีเงื่อนไขขึ้นอยู่กับชุดของการสังเกตทั่วโลกในแบบจำลองนี้ ฟังก์ชันแต่ละฟังก์ชันเป็นการแมปจากการกำหนดค่าทั้งหมดให้กับทั้งคลิกkและการสังเกตไปยังจำนวนจริงที่ไม่เป็นลบ รูปแบบของเครือข่ายมาร์คอฟนี้อาจเหมาะสมกว่าสำหรับการสร้างตัวจำแนกแบบแยกแยะซึ่งไม่ได้จำลองการกระจายของการสังเกต CRF ได้รับการเสนอโดยJohn D. Lafferty , Andrew McCallumและFernando CN Pereiraในปี 2001 ^[¹²^] $o$ $\varphi _{k}$ $o$

การใช้งานที่หลากหลาย

ฟิลด์สุ่มมาร์คอฟมีการประยุกต์ใช้ในหลากหลายสาขา ตั้งแต่กราฟิกคอมพิวเตอร์ไปจนถึงคอมพิวเตอร์วิชั่น^{[ 13 ]}การเรียนรู้ของเครื่องหรือชีววิทยาเชิงคำนวณ [ ^{2 ]}^{[ 14 ]}และ การ ดึงข้อมูล^{[ 15 ]}^{MRF ถูกใช้ในการประมวลผลภาพเพื่อสร้างพื้นผิว เนื่องจากสามารถใช้สร้างแบบจำลองภาพ ที่}ยืดหยุ่นและสุ่มได้ ในการสร้างแบบจำลองภาพ งานคือการค้นหาการกระจายความเข้มที่เหมาะสมของภาพที่กำหนด โดยความเหมาะสมขึ้นอยู่กับประเภทของงาน และ MRF มีความยืดหยุ่นเพียงพอที่จะใช้สำหรับการสังเคราะห์ภาพและพื้นผิวการบีบอัดและการฟื้นฟูภาพ การแบ่งส่วนภาพ การอนุมานภาพ 3 มิติจากภาพ 2 มิติการลงทะเบียนภาพการสังเคราะห์พื้นผิวความละเอียดสูงการจับคู่สเตอริโอและการดึงข้อมูลวิธีการทางสถิติเชิงกลยังถูกนำมาใช้ในการวิเคราะห์แบบจำลอง MRF สำหรับการฟื้นฟูภาพแบบเบย์เซียน คาซูยูกิ ทานากะ และสึโยชิ โฮริกุจิ ศึกษาแบบจำลอง MRF ที่สามารถแก้ไขได้สำหรับการฟื้นฟูภาพสีและวิธีการคำนวณแบบวนซ้ำที่เกี่ยวข้องสำหรับการฟื้นฟูระดับสีเทา^{[ 16 ]}^{[ 17 ]}สามารถนำมาใช้แก้ปัญหาการมองเห็นด้วยคอมพิวเตอร์ต่างๆ ซึ่งสามารถกำหนดเป็นปัญหาการลดพลังงานหรือปัญหาที่ต้องแยกแยะภูมิภาคต่างๆ โดยใช้ชุดคุณลักษณะที่แยกแยะได้ ภายในกรอบงานฟิลด์สุ่มมาร์คอฟ เพื่อทำนายหมวดหมู่ของภูมิภาค^{[ 18 ]} ฟิลด์สุ่มมาร์คอฟเป็นการขยายความของแบบจำลองไอซิง และตั้งแต่นั้นมาก็ถูกนำมาใช้กันอย่างแพร่หลายในการเพิ่มประสิทธิภาพเชิงรวมและเครือข่าย

ดูเพิ่มเติม

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[

[ 8 ]

[

[

[

[

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]