อ่าน 8 นาที
การหยุดที่เหมาะสมที่สุด
ใน ทางคณิตศาสตร์ ทฤษฎี การหยุดที่เหมาะสมที่สุด [ 1 ] [ 2 ] หรือ การหยุดก่อนกำหนด [ 3 ] เกี่ยวข้องกับปัญหาการเลือกเวลาที่จะดำเนินการเฉพาะอย่าง เพื่อเพิ่ม ผล ตอบแทนที่คาดหวังให้...
การหยุดที่เหมาะสมที่สุด
ในทางคณิตศาสตร์ทฤษฎีการหยุดที่เหมาะสมที่สุด[ 1 ] [ 2 ]หรือการหยุดก่อนกำหนด[ 3 ]เกี่ยวข้องกับปัญหาการเลือกเวลาที่จะดำเนินการเฉพาะอย่าง เพื่อเพิ่มผล ตอบแทนที่คาดหวังให้ สูงสุดหรือลดต้นทุนที่คาดหวังให้น้อยที่สุด ปัญหาการหยุดที่เหมาะสมที่สุดสามารถพบได้ในสาขาสถิติเศรษฐศาสตร์และการเงินเชิงคณิตศาสตร์ (ที่เกี่ยวข้องกับการกำหนดราคาของออปชั่นแบบอเมริกัน ) ตัวอย่างสำคัญของปัญหาการหยุดที่เหมาะสมที่สุดคือปัญหาเลขานุการปัญหาการหยุดที่เหมาะสมที่สุดมักจะเขียนได้ในรูปสมการเบลล์แมนและมักจะแก้โดยใช้ การ เขียน โปรแกรมแบบไดนามิก
คำนิยาม
กรณีเวลาไม่ต่อเนื่อง
ปัญหาเกี่ยวกับกฎการหยุดนั้นเกี่ยวข้องกับสองสิ่ง:
- ลำดับของตัวแปรสุ่มซึ่งการแจกแจงร่วมของตัวแปรเหล่านั้นเป็นสิ่งที่สันนิษฐานว่าทราบอยู่แล้ว
- ลำดับของฟังก์ชัน 'รางวัล' ซึ่งขึ้นอยู่กับค่าที่สังเกตได้ของตัวแปรสุ่มในข้อ 1:
เมื่อพิจารณาจากวัตถุเหล่านั้น ปัญหาจึงเป็นดังนี้:
- คุณกำลังสังเกตลำดับของตัวแปรสุ่ม และในแต่ละขั้นตอนคุณสามารถเลือกได้ว่าจะหยุดการสังเกตหรือสังเกตต่อไป
- หากคุณหยุดสังเกตการณ์ที่ขั้นตอนนี้คุณจะได้รับรางวัล
- คุณต้องการเลือกกฎการหยุดเพื่อเพิ่มผลตอบแทนที่คาดหวังให้สูงสุด (หรือในทางกลับกัน ลดการขาดทุนที่คาดหวังให้น้อยที่สุด)
กรณีเวลาต่อเนื่อง
พิจารณาถึงกระบวนการได้กำไรที่กำหนดไว้บนปริภูมิความน่าจะเป็นแบบกรองและสมมติว่ากระบวนการนั้นปรับให้เข้ากับการกรองแล้ว ปัญหาการหยุดที่เหมาะสมที่สุดคือการหาเวลาหยุดที่ทำให้กำไรที่คาดหวังสูงสุด
โดยที่เรียกว่าฟังก์ชันค่าซึ่งสามารถรับค่าได้
การกำหนดสูตรที่เฉพาะเจาะจงมากขึ้นมีดังนี้ เราพิจารณาถึงกระบวนการมาร์คอฟ ที่ปรับตัวได้ ซึ่งกำหนดไว้บนปริภูมิความน่าจะเป็นแบบกรองโดยที่แทนการวัดความน่าจะเป็นที่กระบวนการสุ่มเริ่มต้นที่เมื่อกำหนดฟังก์ชันต่อเนื่อง, และปัญหาการหยุดที่เหมาะสมที่สุดคือ
บางครั้งเรียกว่าสูตร MLS (ซึ่งย่อมาจาก Mayer, Lagrange และ supremum ตามลำดับ) [ 4 ]
วิธีการแก้ปัญหา
โดยทั่วไปมีแนวทางสองทางในการแก้ปัญหาการหยุดที่เหมาะสมที่สุด[ 4 ]เมื่อกระบวนการพื้นฐาน (หรือกระบวนการกำไร) อธิบายโดยการกระจายมิติจำกัดแบบ ไม่มีเงื่อนไข เทคนิคการแก้ปัญหาที่เหมาะสมคือแนวทางมาร์ติงเกล ซึ่งเรียกเช่นนั้นเพราะใช้ ทฤษฎี มาร์ติงเกลโดยแนวคิดที่สำคัญที่สุดคือซองสเนลล์ในกรณีเวลาไม่ต่อเนื่อง หากขอบเขตการวางแผนมีจำกัด ปัญหาสามารถแก้ไขได้ง่ายด้วยการเขียนโปรแกรมแบบไดนามิก
เมื่อกระบวนการพื้นฐานถูกกำหนดโดยตระกูลของฟังก์ชันการเปลี่ยนสถานะ (แบบมีเงื่อนไข) ซึ่งนำไปสู่ตระกูลความน่าจะเป็นการเปลี่ยนสถานะแบบมาร์คอฟ เครื่องมือวิเคราะห์ที่มีประสิทธิภาพซึ่งได้มาจากทฤษฎีของกระบวนการมาร์คอฟมักจะสามารถนำมาใช้ได้ และวิธีการนี้เรียกว่าวิธีมาร์คอฟ โดยปกติแล้วจะได้คำตอบโดยการแก้ปัญหาขอบเขตอิสระ ที่เกี่ยวข้อง ( ปัญหาของสเตฟาน )
ผลลัพธ์การแพร่กระจายแบบกระโดด
ให้เป็นการ แพร่แบบ เลวี (Lévy diffusion) ที่กำหนดโดยSDE
โดยที่เป็นการ เคลื่อนที่แบบบราวน์ในมิติ, เป็นการวัดสุ่มแบบปัวซงที่มีการชดเชย ในมิติ , , , , และเป็นฟังก์ชันที่กำหนดให้ซึ่งมีคำตอบเฉพาะตัวอยู่ ให้เป็นเซตเปิด (บริเวณที่มีคำตอบ) และ
เป็นเวลาที่เกิดการล้มละลาย ปัญหาการหยุดที่เหมาะสมที่สุดคือ:
ปรากฏว่าภายใต้เงื่อนไขความสม่ำเสมอบางประการ[ 5 ]ทฤษฎีบทการตรวจสอบต่อไปนี้เป็นจริง:
ถ้าฟังก์ชันนั้นตรงตามเงื่อนไข
- โดยที่บริเวณต่อเนื่องคือ,
- บนและ
- บนโดยที่คือตัวสร้างอนันต์ของ
ดังนั้นสำหรับทั้งหมดยิ่งไปกว่านั้น ถ้า
- บน
จากนั้นสำหรับทุกกรณีและเป็นเวลาหยุดที่เหมาะสมที่สุด
เงื่อนไขเหล่านี้สามารถเขียนในรูปแบบที่กระชับกว่าได้เช่นกัน ( อสมการเชิงอินทิกรัลแปรผัน ):
- บน
ตัวอย่าง
การโยนเหรียญ
(ตัวอย่างที่ลู่เข้า)
คุณมีเหรียญที่ยุติธรรมหนึ่งเหรียญและกำลังโยนมันซ้ำๆ ในแต่ละครั้ง ก่อนที่จะโยน คุณสามารถเลือกที่จะหยุดโยนและรับเงิน (เป็นดอลลาร์ เช่น) ตามจำนวนหัวเฉลี่ยที่สังเกตได้
คุณต้องการเพิ่มจำนวนเงินที่คุณจะได้รับให้สูงสุดโดยการเลือกกฎการหยุด หากX i (สำหรับi ≥ 1) เป็นลำดับของตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกัน โดยมีการแจกแจงแบบเบอร์นูลลี
และถ้า
ดังนั้นลำดับ, และจึงเป็นวัตถุที่เกี่ยวข้องกับปัญหานี้
ขายบ้าน
(ตัวอย่างที่การลู่เข้าไม่จำเป็นต้องเกิดขึ้นเสมอไป)
คุณมีบ้านหลังหนึ่งและต้องการขาย ในแต่ละวันจะมีคนเสนอซื้อบ้านของคุณ และคุณต้องจ่ายเงินเพื่อลงโฆษณาต่อไป ถ้าคุณขายบ้านได้ในวันที่ ... คุณจะได้รับเงิน... โดยที่...
คุณต้องการเพิ่มผลตอบแทนสูงสุดโดยการเลือกกฎการหยุดการถอน
ในตัวอย่างนี้ ลำดับ ( ) คือลำดับของข้อเสนอสำหรับบ้านของคุณ และลำดับของฟังก์ชันรางวัลคือจำนวนเงินที่คุณจะได้รับ[ 6 ]
ปัญหาเลขานุการ

- ชุดการสำรวจที่เล็กเกินไปจะเลือกตัวเลือกที่ไม่เหมาะสมก่อนที่จะเห็นตัวเลือกที่ดีที่สุด (*)
- ชุดที่เหมาะสมที่สุดจะระบุสิ่งที่ดีที่สุด
- หากชุดข้อมูลที่มีขนาดใหญ่เกินไปนั้นรวมถึงผู้สมัครที่ดีที่สุดไว้ด้วย ผู้สมัครคนสุดท้ายจะถูกเลือก
(ตัวอย่างที่ลำดับเป็นลำดับจำกัด)
คุณกำลังสังเกตลำดับของวัตถุที่สามารถจัดอันดับจากดีที่สุดไปแย่ที่สุด คุณต้องการเลือกกฎการหยุดที่เพิ่มโอกาสในการเลือกวัตถุที่ดีที่สุดให้มากที่สุด
ในที่นี้ ถ้า( nเป็นจำนวนมาก) คือลำดับของวัตถุ และคือโอกาสที่คุณจะเลือกวัตถุที่ดีที่สุดหากคุณหยุดการปฏิเสธวัตถุโดยเจตนาในขั้นตอนที่ i แล้วและคือลำดับที่เกี่ยวข้องกับปัญหานี้ ปัญหานี้ได้รับการแก้ไขในช่วงต้นทศวรรษ 1960 โดยหลายคน วิธีแก้ปัญหาที่สง่างามสำหรับปัญหาเลขานุการและการดัดแปลงหลายอย่างของปัญหานี้ได้รับการนำเสนอโดยอัลกอริทึมความน่าจะเป็นของการหยุดที่เหมาะสมที่สุด (อัลกอริทึม Bruss) ที่ใหม่กว่า
ทฤษฎีการค้นหา
นักเศรษฐศาสตร์ได้ศึกษาปัญหาการหยุดที่เหมาะสมที่สุดหลายปัญหาที่คล้ายกับ 'ปัญหาเลขานุการ' และโดยทั่วไปเรียกการวิเคราะห์ประเภทนี้ว่า 'ทฤษฎีการค้นหา' ทฤษฎีการค้นหามุ่งเน้นเป็นพิเศษไปที่การค้นหางานที่มีค่าจ้างสูงของคนงาน หรือการค้นหาสินค้าที่มีราคาต่ำของผู้บริโภค
ปัญหาการจอดรถ
ตัวอย่างพิเศษของการประยุกต์ใช้ทฤษฎีการค้นหาคือภารกิจการเลือกที่จอดรถที่เหมาะสมที่สุดสำหรับผู้ขับขี่ที่กำลังจะไปชมโอเปร่า (โรงละคร ช้อปปิ้ง ฯลฯ) เมื่อใกล้ถึงจุดหมายปลายทาง ผู้ขับขี่จะขับไปตามถนนที่มีที่จอดรถ – โดยปกติจะมีที่ว่างเพียงบางส่วนในลานจอดรถเท่านั้น เป้าหมายสามารถมองเห็นได้อย่างชัดเจน ดังนั้นจึงสามารถประเมินระยะทางจากเป้าหมายได้อย่างง่ายดาย ภารกิจของผู้ขับขี่คือการเลือกที่จอดรถว่างที่ใกล้กับจุดหมายปลายทางมากที่สุดโดยไม่ต้องหันกลับ เพื่อให้ระยะทางจากจุดนั้นไปยังจุดหมายปลายทางสั้นที่สุด[ 7 ]
การซื้อขายออปชั่น
ในการซื้อขายออปชั่นในตลาดการเงินผู้ถือออปชั่นแบบอเมริกันจะได้รับสิทธิ์ในการซื้อ (หรือขาย) สินทรัพย์อ้างอิงในราคาที่กำหนดไว้ล่วงหน้าได้ตลอดเวลาก่อนหรือในวันหมดอายุ ดังนั้น การประเมินมูลค่าของออปชั่นแบบอเมริกันจึงเป็นปัญหาการหยุดที่เหมาะสมที่สุด (optimal stopping problem) ลองพิจารณาการตั้งค่า แบบ Black–Scholes แบบคลาสสิก โดยให้ เป็นอัตราดอกเบี้ยที่ปราศจากความเสี่ยงและและเป็นอัตราเงินปันผลและความผันผวนของหุ้น ราคาหุ้นเป็นไปตามการเคลื่อนที่แบบบราวน์แบบเรขาคณิต (geometric Brownian motion)
ภายใต้ มาตรการ ที่ ปราศจากความเสี่ยง
เมื่อออปชั่นนั้นเป็นแบบไม่จำกัดระยะเวลา ปัญหาการหยุดที่เหมาะสมที่สุดคือ
โดยที่ฟังก์ชันผลตอบแทนใช้สำหรับออปชั่นซื้อและออปชั่นขาย อสมการแปรผันคือ
สำหรับทุกกรณี ที่ขอบเขตการออกกำลังกายอยู่ วิธีแก้ปัญหาเป็นที่ทราบกันดีอยู่แล้วคือ[ 8 ]
- (การเรียกอย่างต่อเนื่อง) ที่ไหนและ
- (การขายแบบไม่จำกัดระยะเวลา) ที่และ
ในทางกลับกัน เมื่อวันหมดอายุมีขอบเขตจำกัด ปัญหาจะเกี่ยวข้องกับปัญหาขอบเขตอิสระแบบ 2 มิติ ซึ่งไม่มีคำตอบในรูปแบบปิดที่ทราบ อย่างไรก็ตาม สามารถใช้วิธีการเชิงตัวเลขต่างๆ ได้ ดูแบบจำลอง Black–Scholes#American optionsสำหรับวิธีการประเมินมูลค่าต่างๆ ได้ที่นี่ รวมถึงFugitสำหรับการคำนวณเวลาที่เหมาะสมที่สุดในการใช้สิทธิ แบบไม่ต่อเนื่องโดย ใช้โครงสร้างต้นไม้
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การหยุดที่เหมาะสมที่สุด
ใน ทางคณิตศาสตร์ ทฤษฎี การหยุดที่เหมาะสมที่สุด [ 1 ] [ 2 ] หรือ การหยุดก่อนกำหนด [ 3 ] เกี่ยวข้องกับปัญหาการเลือกเวลาที่จะดำเนินการเฉพาะอย่าง เพื่อเพิ่ม ผล ตอบแทนที่คาดหวังให้...
กรณีเวลาไม่ต่อเนื่อง
ปัญหาเกี่ยวกับกฎการหยุดนั้นเกี่ยวข้องกับสองสิ่ง:
กรณีเวลาต่อเนื่อง
พิจารณาถึงกระบวนการได้กำไรที่กำหนดไว้บน ปริภูมิความน่าจะเป็นแบบกรอง และสมมติว่ากระบวนการนั้นปรับ ให้เข้า กับการกรองแล้ว ปัญหาการหยุดที่เหมาะสมที่สุดคือการหา เวลาหยุด ที่ทำให้กำไรที่คาดหวังสูงสุด จี = ( จี ที ) ที ≥ 0 {\displaystyle G=(G_{t})_{t\geq 0}} ( Ω ,...
วิธีการแก้ปัญหา
โดยทั่วไปมีแนวทางสองทางในการแก้ปัญหาการหยุดที่เหมาะสมที่สุด [ 4 ] เมื่อกระบวนการพื้นฐาน (หรือกระบวนการกำไร) อธิบายโดย การกระจายมิติจำกัดแบบ ไม่มีเงื่อนไข เทคนิคการแก้ปัญหาที่เหมาะสมคือแนวทางมาร์ติงเกล ซึ่งเรียกเช่นนั้นเพราะใช้ ทฤษฎี มาร์ติงเกล...