กลับไปหน้าบทความ

อ่าน 8 นาที

การหยุดที่เหมาะสมที่สุด

ใน ทางคณิตศาสตร์ ทฤษฎี การหยุดที่เหมาะสมที่สุด [ 1 ] [ 2 ] หรือ การหยุดก่อนกำหนด [ 3 ] เกี่ยวข้องกับปัญหาการเลือกเวลาที่จะดำเนินการเฉพาะอย่าง เพื่อเพิ่ม ผล ตอบแทนที่คาดหวังให้...

การหยุดที่เหมาะสมที่สุด

ในทางคณิตศาสตร์ทฤษฎีการหยุดที่เหมาะสมที่สุด[ 1 ] [ 2 ]หรือการหยุดก่อนกำหนด[ 3 ]เกี่ยวข้องกับปัญหาการเลือกเวลาที่จะดำเนินการเฉพาะอย่าง เพื่อเพิ่มผล ตอบแทนที่คาดหวังให้ สูงสุดหรือลดต้นทุนที่คาดหวังให้น้อยที่สุด ปัญหาการหยุดที่เหมาะสมที่สุดสามารถพบได้ในสาขาสถิติเศรษฐศาสตร์และการเงินเชิงคณิตศาสตร์ (ที่เกี่ยวข้องกับการกำหนดราคาของออปชั่นแบบอเมริกัน ) ตัวอย่างสำคัญของปัญหาการหยุดที่เหมาะสมที่สุดคือปัญหาเลขานุการปัญหาการหยุดที่เหมาะสมที่สุดมักจะเขียนได้ในรูปสมการเบลล์แมนและมักจะแก้โดยใช้ การ เขียน โปรแกรมแบบไดนามิก

คำนิยาม

กรณีเวลาไม่ต่อเนื่อง

ปัญหาเกี่ยวกับกฎการหยุดนั้นเกี่ยวข้องกับสองสิ่ง:

  1. ลำดับของตัวแปรสุ่มซึ่งการแจกแจงร่วมของตัวแปรเหล่านั้นเป็นสิ่งที่สันนิษฐานว่าทราบอยู่แล้ว
  2. ลำดับของฟังก์ชัน 'รางวัล' ซึ่งขึ้นอยู่กับค่าที่สังเกตได้ของตัวแปรสุ่มในข้อ 1:

เมื่อพิจารณาจากวัตถุเหล่านั้น ปัญหาจึงเป็นดังนี้:

  • คุณกำลังสังเกตลำดับของตัวแปรสุ่ม และในแต่ละขั้นตอนคุณสามารถเลือกได้ว่าจะหยุดการสังเกตหรือสังเกตต่อไป
  • หากคุณหยุดสังเกตการณ์ที่ขั้นตอนนี้คุณจะได้รับรางวัล
  • คุณต้องการเลือกกฎการหยุดเพื่อเพิ่มผลตอบแทนที่คาดหวังให้สูงสุด (หรือในทางกลับกัน ลดการขาดทุนที่คาดหวังให้น้อยที่สุด)

กรณีเวลาต่อเนื่อง

พิจารณาถึงกระบวนการได้กำไรที่กำหนดไว้บนปริภูมิความน่าจะเป็นแบบกรองและสมมติว่ากระบวนการนั้นปรับให้เข้ากับการกรองแล้ว ปัญหาการหยุดที่เหมาะสมที่สุดคือการหาเวลาหยุดที่ทำให้กำไรที่คาดหวังสูงสุด

โดยที่เรียกว่าฟังก์ชันค่าซึ่งสามารถรับค่าได้

การกำหนดสูตรที่เฉพาะเจาะจงมากขึ้นมีดังนี้ เราพิจารณาถึงกระบวนการมาร์คอฟ ที่ปรับตัวได้ ซึ่งกำหนดไว้บนปริภูมิความน่าจะเป็นแบบกรองโดยที่แทนการวัดความน่าจะเป็นที่กระบวนการสุ่มเริ่มต้นที่เมื่อกำหนดฟังก์ชันต่อเนื่อง, และปัญหาการหยุดที่เหมาะสมที่สุดคือ

บางครั้งเรียกว่าสูตร MLS (ซึ่งย่อมาจาก Mayer, Lagrange และ supremum ตามลำดับ) [ 4 ]

วิธีการแก้ปัญหา

โดยทั่วไปมีแนวทางสองทางในการแก้ปัญหาการหยุดที่เหมาะสมที่สุด[ 4 ]เมื่อกระบวนการพื้นฐาน (หรือกระบวนการกำไร) อธิบายโดยการกระจายมิติจำกัดแบบ ไม่มีเงื่อนไข เทคนิคการแก้ปัญหาที่เหมาะสมคือแนวทางมาร์ติงเกล ซึ่งเรียกเช่นนั้นเพราะใช้ ทฤษฎี มาร์ติงเกลโดยแนวคิดที่สำคัญที่สุดคือซองสเนลล์ในกรณีเวลาไม่ต่อเนื่อง หากขอบเขตการวางแผนมีจำกัด ปัญหาสามารถแก้ไขได้ง่ายด้วยการเขียนโปรแกรมแบบไดนามิก

เมื่อกระบวนการพื้นฐานถูกกำหนดโดยตระกูลของฟังก์ชันการเปลี่ยนสถานะ (แบบมีเงื่อนไข) ซึ่งนำไปสู่ตระกูลความน่าจะเป็นการเปลี่ยนสถานะแบบมาร์คอฟ เครื่องมือวิเคราะห์ที่มีประสิทธิภาพซึ่งได้มาจากทฤษฎีของกระบวนการมาร์คอฟมักจะสามารถนำมาใช้ได้ และวิธีการนี้เรียกว่าวิธีมาร์คอฟ โดยปกติแล้วจะได้คำตอบโดยการแก้ปัญหาขอบเขตอิสระ ที่เกี่ยวข้อง ( ปัญหาของสเตฟาน )

ผลลัพธ์การแพร่กระจายแบบกระโดด

ให้เป็นการ แพร่แบบ เลวี (Lévy diffusion) ที่กำหนดโดยSDE

โดยที่เป็นการ เคลื่อนที่แบบบราวน์ในมิติ, เป็นการวัดสุ่มแบบปัวซงที่มีการชดเชย ในมิติ , , , , และเป็นฟังก์ชันที่กำหนดให้ซึ่งมีคำตอบเฉพาะตัวอยู่ ให้เป็นเซตเปิด (บริเวณที่มีคำตอบ) และ

เป็นเวลาที่เกิดการล้มละลาย ปัญหาการหยุดที่เหมาะสมที่สุดคือ:

ปรากฏว่าภายใต้เงื่อนไขความสม่ำเสมอบางประการ[ 5 ]ทฤษฎีบทการตรวจสอบต่อไปนี้เป็นจริง:

ถ้าฟังก์ชันนั้นตรงตามเงื่อนไข

  • โดยที่บริเวณต่อเนื่องคือ,
  • บนและ
  • บนโดยที่คือตัวสร้างอนันต์ของ

ดังนั้นสำหรับทั้งหมดยิ่งไปกว่านั้น ถ้า

  • บน

จากนั้นสำหรับทุกกรณีและเป็นเวลาหยุดที่เหมาะสมที่สุด

เงื่อนไขเหล่านี้สามารถเขียนในรูปแบบที่กระชับกว่าได้เช่นกัน ( อสมการเชิงอินทิกรัลแปรผัน ):

  • บน

ตัวอย่าง

การโยนเหรียญ

(ตัวอย่างที่ลู่เข้า)

คุณมีเหรียญที่ยุติธรรมหนึ่งเหรียญและกำลังโยนมันซ้ำๆ ในแต่ละครั้ง ก่อนที่จะโยน คุณสามารถเลือกที่จะหยุดโยนและรับเงิน (เป็นดอลลาร์ เช่น) ตามจำนวนหัวเฉลี่ยที่สังเกตได้

คุณต้องการเพิ่มจำนวนเงินที่คุณจะได้รับให้สูงสุดโดยการเลือกกฎการหยุด หากX i (สำหรับi ≥ 1) เป็นลำดับของตัวแปรสุ่มอิสระที่มีการแจกแจงเหมือนกัน โดยมีการแจกแจงแบบเบอร์นูลลี

และถ้า

ดังนั้นลำดับ, และจึงเป็นวัตถุที่เกี่ยวข้องกับปัญหานี้

ขายบ้าน

(ตัวอย่างที่การลู่เข้าไม่จำเป็นต้องเกิดขึ้นเสมอไป)

คุณมีบ้านหลังหนึ่งและต้องการขาย ในแต่ละวันจะมีคนเสนอซื้อบ้านของคุณ และคุณต้องจ่ายเงินเพื่อลงโฆษณาต่อไป ถ้าคุณขายบ้านได้ในวันที่ ... คุณจะได้รับเงิน... โดยที่...

คุณต้องการเพิ่มผลตอบแทนสูงสุดโดยการเลือกกฎการหยุดการถอน

ในตัวอย่างนี้ ลำดับ ( ) คือลำดับของข้อเสนอสำหรับบ้านของคุณ และลำดับของฟังก์ชันรางวัลคือจำนวนเงินที่คุณจะได้รับ[ 6 ]

ปัญหาเลขานุการ

ตัวอย่างปัญหาเลขานุการ 3 กรณี โดยความสูงของไอคอนบ่งบอกถึงความเหมาะสม:
  1. ชุดการสำรวจที่เล็กเกินไปจะเลือกตัวเลือกที่ไม่เหมาะสมก่อนที่จะเห็นตัวเลือกที่ดีที่สุด (*)
  2. ชุดที่เหมาะสมที่สุดจะระบุสิ่งที่ดีที่สุด
  3. หากชุดข้อมูลที่มีขนาดใหญ่เกินไปนั้นรวมถึงผู้สมัครที่ดีที่สุดไว้ด้วย ผู้สมัครคนสุดท้ายจะถูกเลือก

(ตัวอย่างที่ลำดับเป็นลำดับจำกัด)

คุณกำลังสังเกตลำดับของวัตถุที่สามารถจัดอันดับจากดีที่สุดไปแย่ที่สุด คุณต้องการเลือกกฎการหยุดที่เพิ่มโอกาสในการเลือกวัตถุที่ดีที่สุดให้มากที่สุด

ในที่นี้ ถ้า( nเป็นจำนวนมาก) คือลำดับของวัตถุ และคือโอกาสที่คุณจะเลือกวัตถุที่ดีที่สุดหากคุณหยุดการปฏิเสธวัตถุโดยเจตนาในขั้นตอนที่ i แล้วและคือลำดับที่เกี่ยวข้องกับปัญหานี้ ปัญหานี้ได้รับการแก้ไขในช่วงต้นทศวรรษ 1960 โดยหลายคน วิธีแก้ปัญหาที่สง่างามสำหรับปัญหาเลขานุการและการดัดแปลงหลายอย่างของปัญหานี้ได้รับการนำเสนอโดยอัลกอริทึมความน่าจะเป็นของการหยุดที่เหมาะสมที่สุด (อัลกอริทึม Bruss) ที่ใหม่กว่า

ทฤษฎีการค้นหา

นักเศรษฐศาสตร์ได้ศึกษาปัญหาการหยุดที่เหมาะสมที่สุดหลายปัญหาที่คล้ายกับ 'ปัญหาเลขานุการ' และโดยทั่วไปเรียกการวิเคราะห์ประเภทนี้ว่า 'ทฤษฎีการค้นหา' ทฤษฎีการค้นหามุ่งเน้นเป็นพิเศษไปที่การค้นหางานที่มีค่าจ้างสูงของคนงาน หรือการค้นหาสินค้าที่มีราคาต่ำของผู้บริโภค

ปัญหาการจอดรถ

ตัวอย่างพิเศษของการประยุกต์ใช้ทฤษฎีการค้นหาคือภารกิจการเลือกที่จอดรถที่เหมาะสมที่สุดสำหรับผู้ขับขี่ที่กำลังจะไปชมโอเปร่า (โรงละคร ช้อปปิ้ง ฯลฯ) เมื่อใกล้ถึงจุดหมายปลายทาง ผู้ขับขี่จะขับไปตามถนนที่มีที่จอดรถ – โดยปกติจะมีที่ว่างเพียงบางส่วนในลานจอดรถเท่านั้น เป้าหมายสามารถมองเห็นได้อย่างชัดเจน ดังนั้นจึงสามารถประเมินระยะทางจากเป้าหมายได้อย่างง่ายดาย ภารกิจของผู้ขับขี่คือการเลือกที่จอดรถว่างที่ใกล้กับจุดหมายปลายทางมากที่สุดโดยไม่ต้องหันกลับ เพื่อให้ระยะทางจากจุดนั้นไปยังจุดหมายปลายทางสั้นที่สุด[ 7 ]

การซื้อขายออปชั่น

ในการซื้อขายออปชั่นในตลาดการเงินผู้ถือออปชั่นแบบอเมริกันจะได้รับสิทธิ์ในการซื้อ (หรือขาย) สินทรัพย์อ้างอิงในราคาที่กำหนดไว้ล่วงหน้าได้ตลอดเวลาก่อนหรือในวันหมดอายุ ดังนั้น การประเมินมูลค่าของออปชั่นแบบอเมริกันจึงเป็นปัญหาการหยุดที่เหมาะสมที่สุด (optimal stopping problem) ลองพิจารณาการตั้งค่า แบบ Black–Scholes แบบคลาสสิก โดยให้ เป็นอัตราดอกเบี้ยที่ปราศจากความเสี่ยงและและเป็นอัตราเงินปันผลและความผันผวนของหุ้น ราคาหุ้นเป็นไปตามการเคลื่อนที่แบบบราวน์แบบเรขาคณิต (geometric Brownian motion)

ภายใต้ มาตรการ ที่ ปราศจากความเสี่ยง

เมื่อออปชั่นนั้นเป็นแบบไม่จำกัดระยะเวลา ปัญหาการหยุดที่เหมาะสมที่สุดคือ

โดยที่ฟังก์ชันผลตอบแทนใช้สำหรับออปชั่นซื้อและออปชั่นขาย อสมการแปรผันคือ

สำหรับทุกกรณี ที่ขอบเขตการออกกำลังกายอยู่ วิธีแก้ปัญหาเป็นที่ทราบกันดีอยู่แล้วคือ[ 8 ]

  • (การเรียกอย่างต่อเนื่อง) ที่ไหนและ
  • (การขายแบบไม่จำกัดระยะเวลา) ที่และ

ในทางกลับกัน เมื่อวันหมดอายุมีขอบเขตจำกัด ปัญหาจะเกี่ยวข้องกับปัญหาขอบเขตอิสระแบบ 2 มิติ ซึ่งไม่มีคำตอบในรูปแบบปิดที่ทราบ อย่างไรก็ตาม สามารถใช้วิธีการเชิงตัวเลขต่างๆ ได้ ดูแบบจำลอง Black–Scholes#American optionsสำหรับวิธีการประเมินมูลค่าต่างๆ ได้ที่นี่ รวมถึงFugitสำหรับการคำนวณเวลาที่เหมาะสมที่สุดในการใช้สิทธิ แบบไม่ต่อเนื่องโดย ใช้โครงสร้างต้นไม้

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Optimal_stopping&oldid=1290094266 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การหยุดที่เหมาะสมที่สุด

ใน ทางคณิตศาสตร์ ทฤษฎี การหยุดที่เหมาะสมที่สุด [ 1 ] [ 2 ] หรือ การหยุดก่อนกำหนด [ 3 ] เกี่ยวข้องกับปัญหาการเลือกเวลาที่จะดำเนินการเฉพาะอย่าง เพื่อเพิ่ม ผล ตอบแทนที่คาดหวังให้...

กรณีเวลาไม่ต่อเนื่อง

ปัญหาเกี่ยวกับกฎการหยุดนั้นเกี่ยวข้องกับสองสิ่ง:

กรณีเวลาต่อเนื่อง

พิจารณาถึงกระบวนการได้กำไรที่กำหนดไว้บน ปริภูมิความน่าจะเป็นแบบกรอง และสมมติว่ากระบวนการนั้นปรับ ให้เข้า กับการกรองแล้ว ปัญหาการหยุดที่เหมาะสมที่สุดคือการหา เวลาหยุด ที่ทำให้กำไรที่คาดหวังสูงสุด จี = ( จี ที ) ที ≥ 0 {\displaystyle G=(G_{t})_{t\geq 0}} ( Ω ,...

วิธีการแก้ปัญหา

โดยทั่วไปมีแนวทางสองทางในการแก้ปัญหาการหยุดที่เหมาะสมที่สุด [ 4 ] เมื่อกระบวนการพื้นฐาน (หรือกระบวนการกำไร) อธิบายโดย การกระจายมิติจำกัดแบบ ไม่มีเงื่อนไข เทคนิคการแก้ปัญหาที่เหมาะสมคือแนวทางมาร์ติงเกล ซึ่งเรียกเช่นนั้นเพราะใช้ ทฤษฎี มาร์ติงเกล...