กลับไปหน้าบทความ

อ่าน 4 นาที

แบบจำลองมาร์คอฟลำดับตัวแปร

ในทฤษฎีทางคณิตศาสตร์ของกระบวนการสุ่มโมเดลMarkov ลำดับตัวแปร (VOM)เป็นโมเดลที่สำคัญประเภทหนึ่งซึ่งต่อยอดจาก โมเดล ลูกโซ่ Markov ที่เป็นที่รู้จักกันดี แตกต่างจากโมเดลลูกโซ่ Markov...

แบบจำลองมาร์คอฟลำดับตัวแปร

ในทฤษฎีทางคณิตศาสตร์ของกระบวนการสุ่มโมเดลMarkov ลำดับตัวแปร (VOM)เป็นโมเดลที่สำคัญประเภทหนึ่งซึ่งต่อยอดจาก โมเดล ลูกโซ่ Markov ที่เป็นที่รู้จักกันดี แตกต่างจากโมเดลลูกโซ่ Markov ที่ตัวแปรสุ่ม แต่ละตัว ในลำดับที่มีคุณสมบัติ Markovขึ้นอยู่กับตัวแปรสุ่มจำนวนคงที่ ในโมเดล VOM จำนวนตัวแปรสุ่มเงื่อนไขนี้อาจแตกต่างกันไปตามการสังเกตที่เกิดขึ้นจริง

ลำดับการรับรู้ดังกล่าวนี้มักเรียกว่าบริบทดังนั้นโมเดล VOM จึงเรียกว่าต้นไม้บริบท [ 1 ] โมเดล VOM แสดงผลได้อย่างสวยงามด้วยต้นไม้คำต่อท้ายความน่าจะเป็นแบบมีสี (PST) [ 2 ]ความยืดหยุ่นในจำนวนตัวแปรสุ่มเงื่อนไขกลายเป็นข้อได้เปรียบที่แท้จริงสำหรับการใช้งานหลายอย่าง เช่นการวิเคราะห์ทางสถิติการจำแนกประเภทและการทำนาย[ 3 ] [ 4 ] [ 5 ]

ตัวอย่าง

ยกตัวอย่างเช่น ลำดับของตัวแปรสุ่มซึ่งแต่ละตัวรับค่าจากตัวอักษรไตร ภาค { a , b , c }โดยเฉพาะอย่างยิ่ง ลองพิจารณาสตริงที่สร้างขึ้นจากการต่อกันอย่างไม่สิ้นสุดของสตริงย่อยaaabc : aaabcaaabcaaabcaaabc… aaabc

แบบจำลอง VOM ที่มีลำดับสูงสุด 2 สามารถประมาณสตริงข้างต้นได้โดยใช้ส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไขเพียงห้าส่วนต่อไปนี้ : Pr( a | aa ) = 0.5 , Pr ( b | aa ) = 0.5 , Pr( c | b ) = 1.0 , Pr( a | c )= 1.0 , Pr( a | ca ) = 1.0

ในตัวอย่างนี้Pr( c | ab ) = Pr( c | b ) = 1.0ดังนั้น บริบทที่สั้นกว่าอย่างbจึงเพียงพอที่จะกำหนดอักขระตัวถัดไปได้ ในทำนองเดียวกัน โมเดล VOM ที่มีลำดับสูงสุด 3 สามารถสร้างสตริงได้อย่างแม่นยำโดยใช้ส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไขเพียงห้าส่วน ซึ่งทั้งหมดมีค่าเท่ากับ 1.0

ในการสร้างลูกโซ่ Markovอันดับ 1 สำหรับอักขระตัวถัดไปในสตริงนั้น จำเป็นต้องประมาณค่าส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไข 9 ส่วนต่อไปนี้: Pr( a | a ) , Pr( a | b ) , Pr ( a | c ) , Pr( b | a ) , Pr( b | b ) , Pr ( b | c ) , Pr( c | a ) , Pr( c | b ) , Pr( c | c )ในการสร้างลูกโซ่ Markov อันดับ 2 สำหรับอักขระตัวถัดไป จำเป็นต้องประมาณค่าส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไข 27 ส่วน: Pr( a | aa ) , Pr( a | ab ) , , Pr( c | cc )และในการสร้างลูกโซ่ Markov อันดับ 3 สำหรับอักขระตัวถัดไป จำเป็นต้องประมาณค่าส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไข 81 ส่วนต่อไปนี้: Pr( a | aaa ) , Pr( a | aab ) , , Pr ( c | ccc )

ในทางปฏิบัติ มักมีข้อมูลไม่เพียงพอที่จะประมาณ จำนวนส่วนประกอบความน่าจะเป็นแบบมีเงื่อนไข ที่เพิ่มขึ้นแบบทวีคูณตามลำดับของห่วงโซ่มาร์คอฟ ได้อย่างแม่นยำ

แบบจำลองมาร์คอฟลำดับตัวแปรถือว่าในการตั้งค่าที่สมจริง จะมีสถานะที่เกิดขึ้นจริงบางอย่าง (แสดงโดยบริบท) ซึ่งสถานะในอดีตบางสถานะเป็นอิสระจากสถานะในอนาคต ดังนั้น "สามารถลดจำนวนพารามิเตอร์ของแบบจำลองลงได้มาก" [ 1 ]

คำนิยาม

ให้Aเป็นปริภูมิสถานะ ( ตัวอักษร จำกัด ) ที่มีขนาดเท่ากับ

พิจารณา ลำดับที่มีคุณสมบัติมาร์คอฟ ของตัวแปรสุ่มn ตัว โดยที่คือสถานะ (สัญลักษณ์) ณ ตำแหน่งiและคือ การเชื่อมต่อของสถานะ และ

เมื่อกำหนดชุดฝึกฝนของสถานะที่สังเกตได้อัลกอริทึมการสร้างโมเดล VOM [ 3 ] [ 4 ] [ 5 ]จะเรียนรู้โมเดลPที่ให้ การกำหนด ความน่าจะเป็นสำหรับแต่ละสถานะในลำดับโดยพิจารณาจากสถานะในอดีต (สัญลักษณ์ที่สังเกตก่อนหน้านี้) หรือสถานะในอนาคต

โดยเฉพาะอย่างยิ่ง ผู้เรียนจะสร้างการแจกแจงความน่าจะเป็นแบบมีเงื่อนไข สำหรับสัญลักษณ์หนึ่งๆ โดยกำหนดบริบทให้ซึ่งเครื่องหมาย * แทนลำดับของสถานะต่างๆ ที่มีความยาวใดๆ ก็ได้ รวมถึงบริบทว่างเปล่าด้วย

แบบจำลอง VOM พยายามประมาณการการแจกแจงแบบมีเงื่อนไขในรูปแบบที่ความยาวของบริบทเปลี่ยนแปลงไปตามสถิติที่มีอยู่ ในทางตรงกันข้ามแบบจำลองมาร์คอฟ แบบดั้งเดิม พยายามประมาณการการแจกแจงแบบมีเงื่อนไข เหล่านี้ โดยสมมติว่าความยาวของบริบทคงที่ดังนั้นจึงสามารถพิจารณาได้ว่าเป็นกรณีพิเศษของแบบจำลอง VOM

โดยหลักแล้ว สำหรับลำดับการฝึกอบรมที่กำหนด โมเดล VOM พบว่าได้พารามิเตอร์โมเดลที่ดีกว่า โมเดล Markovลำดับคงที่ ซึ่งนำไปสู่ ความสมดุลระหว่าง ความแปรปรวนและอคติของโมเดลที่เรียนรู้ ได้ดีกว่า [ 3 ] [ 4 ] [ 5 ]

ขอบเขตการใช้งาน

มีการคิดค้นอัลกอริธึมที่มีประสิทธิภาพต่างๆ เพื่อประมาณค่าพารามิเตอร์ของแบบจำลอง VOM [ 4 ]

โมเดล VOM ได้ถูกนำไปประยุกต์ใช้อย่างประสบความสำเร็จในด้านต่างๆ เช่น การเรียนรู้ ของเครื่องทฤษฎีสารสนเทศและชีวสารสนเทศรวมถึงการประยุกต์ใช้งานเฉพาะ เช่นการเข้ารหัสและการบีบอัดข้อมูล[ 1 ]การบีบอัดเอกสาร[ 4 ]การจำแนกและการระบุ ลำดับ DNAและโปรตีน [ 6 ] [ 1] [ 3 ] การควบคุมกระบวนการทางสถิติ[ 5 ] การกรองสแปม[ 7 ]แฮพลอไทป์ [ 8 ] การรู้จำเสียงพูด[ 9 ] การวิเคราะห์ลำดับ ในสังคมศาสตร์[ 2 ] และอื่นๆ

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Variable-order_Markov_model&oldid=1308122463 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ แบบจำลองมาร์คอฟลำดับตัวแปร

ในทฤษฎีทางคณิตศาสตร์ของกระบวนการสุ่มโมเดลMarkov ลำดับตัวแปร (VOM)เป็นโมเดลที่สำคัญประเภทหนึ่งซึ่งต่อยอดจาก โมเดล ลูกโซ่ Markov ที่เป็นที่รู้จักกันดี แตกต่างจากโมเดลลูกโซ่ Markov...

ตัวอย่าง

ยกตัวอย่างเช่น ลำดับของ ตัวแปรสุ่ม ซึ่งแต่ละตัวรับค่าจาก ตัวอักษรไตร ภาค { a , b , c } โดยเฉพาะอย่างยิ่ง ลองพิจารณาสตริงที่สร้างขึ้นจากการต่อกันอย่างไม่สิ้นสุดของสตริงย่อย aaabc : aaabcaaabcaaabcaaabc… aaabc

คำนิยาม

ให้ A เป็นปริภูมิสถานะ ( ตัวอักษร จำกัด ) ที่มีขนาดเท่ากับ | เอ | {\displaystyle |A|}

ขอบเขตการใช้งาน

มีการคิดค้นอัลกอริธึมที่มีประสิทธิภาพต่างๆ เพื่อประมาณค่าพารามิเตอร์ของแบบจำลอง VOM [ 4 ]