แบบจำลองมาร์คอฟลำดับตัวแปร

Q: ตัวอย่าง

ยกตัวอย่างเช่น ลำดับของ ตัวแปรสุ่ม ซึ่งแต่ละตัวรับค่าจาก ตัวอักษรไตร ภาค { a , b , c } โดยเฉพาะอย่างยิ่ง ลองพิจารณาสตริงที่สร้างขึ้นจากการต่อกันอย่างไม่สิ้นสุดของสตริงย่อย aaabc : aaabcaaabcaaabcaaabc… aaabc

Q: คำนิยาม

ให้ A เป็นปริภูมิสถานะ ( ตัวอักษร จำกัด ) ที่มีขนาดเท่ากับ | เอ | {\displaystyle |A|}

ในทฤษฎีทางคณิตศาสตร์ของกระบวนการสุ่มโมเดลMarkov ลำดับตัวแปร (VOM)เป็นโมเดลที่สำคัญประเภทหนึ่งซึ่งต่อยอดจาก โมเดล ลูกโซ่ Markov ที่เป็นที่รู้จักกันดี แตกต่างจากโมเดลลูกโซ่ Markov ที่ตัวแปรสุ่ม แต่ละตัว ในลำดับที่มีคุณสมบัติ Markovขึ้นอยู่กับตัวแปรสุ่มจำนวนคงที่ ในโมเดล VOM จำนวนตัวแปรสุ่มเงื่อนไขนี้อาจแตกต่างกันไปตามการสังเกตที่เกิดขึ้นจริง

ลำดับการรับรู้ดังกล่าวนี้มักเรียกว่าบริบทดังนั้นโมเดล VOM จึงเรียกว่าต้นไม้บริบท [ ^{1 ] โมเดล} VOM แสดงผลได้อย่างสวยงามด้วยต้นไม้คำต่อท้ายความน่าจะเป็นแบบมีสี (PST) ^{[ 2 ]}ความยืดหยุ่นในจำนวนตัวแปรสุ่มเงื่อนไขกลายเป็นข้อได้เปรียบที่แท้จริงสำหรับการใช้งานหลายอย่าง เช่นการวิเคราะห์ทางสถิติการจำแนกประเภทและการทำนาย^{[ 3 ]}^{[ 4 ]}^{[ 5 ]}

ตัวอย่าง

ยกตัวอย่างเช่น ลำดับของตัวแปรสุ่มซึ่งแต่ละตัวรับค่าจากตัวอักษรไตร ภาค ${a, b, c}$ โดยเฉพาะอย่างยิ่ง ลองพิจารณาสตริงที่สร้างขึ้นจากการต่อกันอย่างไม่สิ้นสุดของสตริงย่อย $aaabc$ : $aaabcaaabcaaabcaaabc\dots$ aaabc

แบบจำลอง VOM ที่มีลำดับสูงสุด 2 สามารถประมาณสตริงข้างต้นได้โดยใช้ส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไขเพียงห้าส่วนต่อไปนี้ : $Pr($ $a$ $|$ $aa$ $) = 0.5$ , $Pr$ $($ $b$ $|$ $aa$ $)$ = 0.5 , Pr( $c$ $|$ $b$ $) = 1.0$ , $Pr($ $a$ $|$ $c$ $)= 1.0$ , $Pr($ $a$ $|$ $ca$ $) =$ 1.0

ในตัวอย่างนี้ $Pr(c | ab) = Pr(c | b) = 1.0$ ดังนั้น บริบทที่สั้นกว่าอย่าง $b$ จึงเพียงพอที่จะกำหนดอักขระตัวถัดไปได้ ในทำนองเดียวกัน โมเดล VOM ที่มีลำดับสูงสุด 3 สามารถสร้างสตริงได้อย่างแม่นยำโดยใช้ส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไขเพียงห้าส่วน ซึ่งทั้งหมดมีค่าเท่ากับ 1.0

ในทางปฏิบัติ มักมีข้อมูลไม่เพียงพอที่จะประมาณ จำนวนส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไข ที่เพิ่มขึ้นแบบทวีคูณตามลำดับของห่วงโซ่มาร์คอฟ ได้อย่างแม่นยำ

แบบจำลองมาร์คอฟลำดับตัวแปรถือว่าในการตั้งค่าที่สมจริง จะมีสถานะที่เกิดขึ้นจริงบางอย่าง (แสดงโดยบริบท) ซึ่งสถานะในอดีตบางสถานะเป็นอิสระจากสถานะในอนาคต ดังนั้น "สามารถลดจำนวนพารามิเตอร์ของแบบจำลองลงได้มาก" ^{[ 1 ]}

คำนิยาม

ให้ $A$ เป็นปริภูมิสถานะ ( ตัวอักษร จำกัด ) ที่มีขนาดเท่ากับ $|A|$

พิจารณา ลำดับที่มีคุณสมบัติมาร์คอฟ ของตัวแปรสุ่ม $n$ ตัว โดยที่คือสถานะ (สัญลักษณ์) ณ ตำแหน่ง $i$ และคือ การเชื่อมต่อของสถานะ และ $x_{1}^{n}=x_{1}x_{2}\dots x_{n}$ $x_{i}\in A$ $\scriptstyle (1\leq i\leq n)$ $x_{i}$ $x_{i+1}$ $x_{i}x_{i+1}$

เมื่อกำหนดชุดฝึกฝนของสถานะที่สังเกตได้อัลกอริทึมการสร้างโมเดล VOM ^[³^]^[⁴^]^[⁵^]จะเรียนรู้โมเดล $P$ ที่ให้ การกำหนด ความน่าจะเป็นสำหรับแต่ละสถานะในลำดับโดยพิจารณาจากสถานะในอดีต (สัญลักษณ์ที่สังเกตก่อนหน้านี้) หรือสถานะในอนาคต $x_{1}^{n}$

โดยเฉพาะอย่างยิ่ง ผู้เรียนจะสร้างการแจกแจงความน่าจะเป็นแบบมีเงื่อนไข สำหรับสัญลักษณ์หนึ่งๆ โดยกำหนดบริบทให้ซึ่งเครื่องหมาย * แทนลำดับของสถานะต่างๆ ที่มีความยาวใดๆ ก็ได้ รวมถึงบริบทว่างเปล่าด้วย $P(x_{i}\mid s)$ $x_{i}\in A$ $s\in A^{*}$

แบบจำลอง VOM พยายามประมาณการการแจกแจงแบบมีเงื่อนไขในรูปแบบที่ความยาวของบริบทเปลี่ยนแปลงไปตามสถิติที่มีอยู่ ในทางตรงกันข้ามแบบจำลองมาร์คอฟ แบบดั้งเดิม พยายามประมาณการการแจกแจงแบบมีเงื่อนไข เหล่านี้ โดยสมมติว่าความยาวของบริบทคงที่ดังนั้นจึงสามารถพิจารณาได้ว่าเป็นกรณีพิเศษของแบบจำลอง VOM $P(x_{i}\mid s)$ $|s|\leq D$ $|s|=D$

โดยหลักแล้ว สำหรับลำดับการฝึกอบรมที่กำหนด โมเดล VOM พบว่าได้พารามิเตอร์โมเดลที่ดีกว่า โมเดล Markovลำดับคงที่ ซึ่งนำไปสู่ ความสมดุลระหว่าง ความแปรปรวนและอคติของโมเดลที่เรียนรู้ ได้ดีกว่า ^{[ 3 ]}^{[ 4 ]}^{[ 5 ]}

ขอบเขตการใช้งาน

มีการคิดค้นอัลกอริธึมที่มีประสิทธิภาพต่างๆ เพื่อประมาณค่าพารามิเตอร์ของแบบจำลอง VOM ^{[ 4 ]}

โมเดล VOM ได้ถูกนำไปประยุกต์ใช้อย่างประสบความสำเร็จในด้านต่างๆ เช่น การเรียนรู้ ของเครื่อง ทฤษฎีสารสนเทศและชีวสารสนเทศรวมถึงการประยุกต์ใช้งานเฉพาะ เช่นการเข้ารหัสและการบีบอัดข้อมูล^{[ 1 ]}การบีบอัดเอกสาร^{[ 4 ]}การจำแนกและการระบุ ลำดับ DNAและโปรตีน [ ⁶^]^[ 1] ^{[ 3 ]} การควบคุมกระบวนการทางสถิติ^{[ 5 ]} การกรองสแปม^{[ 7 ]}แฮพลอไทป์ [ ^{8 ] การ}รู้จำเสียงพูด^{[ 9 ]} การวิเคราะห์ลำดับ ในสังคมศาสตร์^{[ 2 ]} และอื่นๆ

ดูเพิ่มเติม

1 ] โมเดล

[ 3 ]

[ 4 ]

[ 5 ]

6

[ 7 ]

8 ] การ

[ 9 ]

แบบจำลองมาร์คอฟลำดับตัวแปร

ตัวอย่าง

คำนิยาม

ขอบเขตการใช้งาน

ดูเพิ่มเติม

ข้อมูลสำคัญจากบทความ