อ่าน 7 นาที
นักเล่นโป๊กเกอร์คอมพิวเตอร์
โปรแกรมเล่นโป๊กเกอร์คอมพิวเตอร์คือโปรแกรมคอมพิวเตอร์ที่ออกแบบมาเพื่อเล่นเกมโป๊กเกอร์ (โดยทั่วไปคือ เวอร์ชัน เท็กซัสโฮลด์เอ็ม )...
นักเล่นโป๊กเกอร์คอมพิวเตอร์
โปรแกรมเล่นโป๊กเกอร์คอมพิวเตอร์คือโปรแกรมคอมพิวเตอร์ที่ออกแบบมาเพื่อเล่นเกมโป๊กเกอร์ (โดยทั่วไปคือ เวอร์ชัน เท็กซัสโฮลด์เอ็ม ) กับคู่ต่อสู้ที่เป็นมนุษย์หรือคู่ต่อสู้ที่เป็นคอมพิวเตอร์ด้วยกันเอง โดยทั่วไปจะเรียกว่าโป๊กเกอร์บอทหรือเรียกสั้นๆ ว่าบอท ณ ปี 2019 คอมพิวเตอร์สามารถเอาชนะผู้เล่นที่เป็นมนุษย์ทุกคนในเกมโป๊กเกอร์ได้[ 1 ] [ 2 ] [ 3 ]
บนอินเทอร์เน็ต
บอทหรือโปรแกรมคอมพิวเตอร์ เหล่านี้ มักถูกใช้ใน สถานการณ์ โป๊กเกอร์ออนไลน์ทั้งในฐานะคู่ต่อสู้ที่ถูกต้องตามกฎสำหรับผู้เล่นที่เป็นมนุษย์ หรือในฐานะรูปแบบหนึ่งของการโกงณ ปี 2020 การใช้โปรแกรมช่วยเหลือแบบเรียลไทม์ (RTA) หรือบอทอัตโนมัติทั้งหมดถือเป็นการโกงโดยเว็บไซต์โป๊กเกอร์ออนไลน์ทุกแห่ง แม้ว่าระดับการบังคับใช้จากผู้ให้บริการเว็บไซต์จะแตกต่างกันอย่างมากก็ตาม
บอทผู้เล่น
การใช้บอทผู้เล่นหรือความช่วยเหลือจากคอมพิวเตอร์ขณะเล่นโป๊กเกอร์ออนไลน์เป็นสิ่งต้องห้ามในเว็บไซต์ออนไลน์ส่วนใหญ่ หากไม่ใช่ทั้งหมด มาตรการลงโทษสำหรับการฝ่าฝืน ได้แก่ การแบนถาวรและการริบเงินรางวัล บอทประเภทหนึ่งสามารถเชื่อมต่อกับไคลเอนต์โป๊กเกอร์ (กล่าวคือ เล่นเองโดยอัตโนมัติ) โดยไม่ต้องอาศัยผู้ควบคุมที่เป็นมนุษย์ ความช่วยเหลือแบบเรียลไทม์ (RTA) เป็นอีกวิธีหนึ่งในการใช้โปรแกรมคอมพิวเตอร์ RTA คือเมื่อผู้เล่นที่เป็นมนุษย์ใช้โปรแกรมที่เรียกว่า "ตัวแก้ปัญหา" เช่น PioSOLVER หรือ PokerSnowie [ 4 ]ที่ทำงานบนคอมพิวเตอร์เครื่องอื่น[ 5 ]เพื่อทำการตัดสินใจ
ปัญหาเรื่องความได้เปรียบที่ไม่เป็นธรรมมีสองด้าน ประการแรก บอทสามารถเล่นได้หลายชั่วโมงติดต่อกันโดยปราศจากจุดอ่อนของมนุษย์ เช่นความเหนื่อยล้าและสามารถทนต่อความผันผวนตามธรรมชาติของเกมได้โดยไม่ได้รับอิทธิพลจากอารมณ์ ของมนุษย์ (หรือ " อาการหัวเสีย ") ประการที่สอง ตั้งแต่ปี 2019 โปรแกรมคอมพิวเตอร์Pluribus (บอทโป๊กเกอร์)ประสบความสำเร็จในการอ่านการบลัฟ คำนวณอัตราต่อรอง และปรับกลยุทธ์จนสามารถเอาชนะผู้เล่นโป๊กเกอร์มืออาชีพได้อย่างสม่ำเสมอในเกม Hold'em แบบไม่มีลิมิต 6 ผู้เล่น[ 6 ] [ 7 ] [ 8 ]
การบังคับใช้กฎหมายภายในบ้าน
แม้ว่าข้อกำหนดและเงื่อนไขของเว็บไซต์โป๊กเกอร์โดยทั่วไปจะห้ามการใช้บอท แต่ระดับการบังคับใช้ขึ้นอยู่กับผู้ให้บริการเว็บไซต์ บางแห่งจะค้นหาและแบนผู้ใช้บอทโดยใช้เครื่องมือซอฟต์แวร์ต่างๆ โปรแกรมไคลเอนต์โป๊กเกอร์สามารถตั้งโปรแกรมให้พยายามตรวจจับบอทได้ แม้ว่าวิธีนี้จะเป็นที่ถกเถียงกันอยู่ เพราะอาจถูกมองว่าเทียบเท่ากับการฝังสปายแวร์ ไว้ ในซอฟต์แวร์ไคลเอนต์ อีกวิธีหนึ่งคือการใช้CAPTCHAในช่วงเวลาสุ่มระหว่างการเล่นเพื่อจับบอทอัตโนมัติ แม้ว่าจะไม่ได้ผลกับระบบช่วยเหลือแบบเรียลไทม์ก็ตาม
บอทบ้าน
“บอทของคาสิโน” อาจก่อให้เกิดผลประโยชน์ทับซ้อน ตามความหมายที่เข้มงวดที่สุด บอทของคาสิโนคือผู้เล่นอัตโนมัติที่ดำเนินการโดยห้องโป๊กเกอร์ออนไลน์นั้นเอง บอทประเภทนี้เทียบได้กับตัวแทนรับจ้างของ คาสิ โน แบบดั้งเดิม
ทั้งพนักงานของคาสิโนแบบดั้งเดิมและบอทของคาสิโนออนไลน์ไม่ควรเข้าถึงข้อมูลใดๆ ที่ผู้เล่นคนอื่นๆ ในเกมเดียวกันไม่สามารถเข้าถึงได้ ปัญหาคือ ในสภาพแวดล้อมออนไลน์ เจ้ามือไม่มีวิธีพิสูจน์ว่าบอทของพวกเขาไม่ได้รับข้อมูลที่ละเอียดอ่อนจากเซิร์ฟเวอร์ไพ่ ปัญหานี้ยิ่งทวีความรุนแรงขึ้นเนื่องจากการแบ่งปันข้อมูลลับสามารถทำได้ง่ายในสภาพแวดล้อมดิจิทัล แม้แต่เจ้ามือเองก็แทบเป็นไปไม่ได้ที่จะพิสูจน์ว่าพวกเขาไม่ได้ควบคุมผู้เล่นบางคน
ปัญญาประดิษฐ์
เช่นเดียวกับในเกมหมากรุกเกมโกะและเกมอื่นๆ อีกมากมาย ระบบ ปัญญาประดิษฐ์สามารถเอาชนะแม้กระทั่งมนุษย์ที่เก่งที่สุดในโป๊กเกอร์ได้[ 9 ] [ 10 ]โป๊กเกอร์เป็นเกมที่มีข้อมูลไม่สมบูรณ์ (เนื่องจากไพ่บางใบในการเล่นถูกซ่อนไว้) ทำให้ยากสำหรับทุกคน (รวมถึงคอมพิวเตอร์) ที่จะคาดเดาผลลัพธ์สุดท้ายของมือ เนื่องจากขาดข้อมูลนี้ โปรแกรมเมอร์ของคอมพิวเตอร์จึงต้องใช้ระบบที่อิงตามทฤษฎีบทของเบย์สสมดุลแนชการ จำลองมอน เตคาร์โลหรือโครงข่ายประสาทเทียมซึ่งทั้งหมดนี้เป็นเทคนิคที่ไม่สมบูรณ์ อย่างไรก็ตาม Pluribusได้พัฒนาโป๊กเกอร์ให้สมบูรณ์แบบโดยการมองไปข้างหน้าเพียงไม่กี่ตาเพื่อพิจารณาว่าควรดำเนินการอย่างไร แทนที่จะพยายามประเมินทุกตาจนกว่าจะจบเกม
AI รุ่นเก่าอย่าง PokerSnowie และClaudicoถูกสร้างขึ้นโดยการปล่อยให้คอมพิวเตอร์กำหนดกลยุทธ์ที่ดีที่สุดโดยการให้มันเล่นกับตัวเองเป็นจำนวนมหาศาล เป็นเวลาหลายปีที่วิธีการนี้เป็นแนวทางในการสร้าง AI สำหรับโป๊กเกอร์ ซึ่งแตกต่างจากการพยายามสร้างคอมพิวเตอร์ที่เล่นเหมือนมนุษย์ ส่งผลให้ขนาดการเดิมพันแปลกประหลาดและกลยุทธ์แตกต่างจากที่มนุษย์คุ้นเคย
วิธีการต่างๆ ถูกพัฒนาขึ้นมาเพื่อประมาณกลยุทธ์โป๊กเกอร์ที่สมบูรณ์แบบจาก มุมมอง ของทฤษฎีเกมในเกมแบบตัวต่อตัว (ผู้เล่นสองคน) ก่อน จากนั้นจึงพัฒนาสำหรับเกมแบบหลายผู้เล่น กลยุทธ์ที่สมบูรณ์แบบในบริบทนี้มีความหมายหลายอย่าง จากมุมมองของกลยุทธ์ที่เหมาะสมที่สุดในเชิงทฤษฎีเกม กลยุทธ์ที่สมบูรณ์แบบคือกลยุทธ์ที่ไม่สามารถคาดหวังว่าจะแพ้กลยุทธ์ของผู้เล่นคนอื่นได้ อย่างไรก็ตาม กลยุทธ์ที่เหมาะสมที่สุดอาจแตกต่างกันไปเมื่อมีผู้เล่นที่ด้อยกว่าซึ่งมีจุดอ่อนที่สามารถนำมาใช้ประโยชน์ได้ ในกรณีนี้ กลยุทธ์ที่สมบูรณ์แบบคือกลยุทธ์ที่จำลองจุดอ่อนเหล่านั้นได้อย่างถูกต้องหรือใกล้เคียง และใช้ประโยชน์จากจุดอ่อนเหล่านั้นเพื่อสร้างผลกำไร เช่นเดียวกับที่อธิบายไว้ข้างต้น
AI ประสบความสำเร็จในการเล่นโป๊กเกอร์ในระดับเหนือมนุษย์ในช่วงทศวรรษ 2010 โดยมีลำดับเหตุการณ์ดังนี้ ในปี 2015 คอมพิวเตอร์สามารถแก้ปัญหาเกมโฮลด์เอ็มแบบจำกัดวงเงินโดยใช้Cepheusได้ ความสำเร็จครั้งนี้เกิดขึ้นโดยใช้อัลกอริทึม CFR+ (Counterfactual Regret Minimization Plus) ซึ่งวิเคราะห์จุดตัดสินใจ 3.19×10^14 จุดเพื่อแก้ปัญหาเกมได้อย่างมีประสิทธิภาพ[ 11 ] CFR+ ทำงานโดยการเล่นซ้ำกับตัวเองและวิเคราะห์ความเสียใจเชิงสมมติ ซึ่งเป็นความแตกต่างระหว่างค่าที่คาดหวังของการกระทำที่เกิดขึ้นกับการกระทำที่ดีที่สุดที่เป็นไปได้ ในปี 2018 Libratusได้แสดงให้เห็นถึงความสามารถเหนือมนุษย์ในเกมโฮลด์เอ็มแบบไม่จำกัดวงเงิน ในปี 2019 Pluribus (เวอร์ชันใหม่กว่าของ Libratus) [ 12 ]ได้แสดงให้เห็นถึงความสามารถเหนือมนุษย์ในเกมโฮลด์เอ็มแบบไม่จำกัดวงเงินสำหรับผู้เล่นหกคน ซึ่งเป็นรูปแบบโป๊กเกอร์แบบเล่นคนเดียวที่ได้รับความนิยมมากที่สุดในโลก[ 13 ]ในปี 2021 ไมโครซอฟต์ได้วางจำหน่ายโปรแกรมเล่นโป๊กเกอร์ Libratus เวอร์ชันเก่าในเชิงพาณิชย์ ซึ่งต่อมาได้เอาชนะผู้เล่นโป๊กเกอร์มืออาชีพ 4 คนในการแข่งขันโป๊กเกอร์ที่ Rivers Casino เป็นเวลา 20 วัน
การพัฒนาล่าสุดได้นำแนวทางโมเดลภาษาขนาดใหญ่ (LLM) มาใช้กับ AI โป๊กเกอร์ โดยเฉพาะอย่างยิ่ง PokerGPT ซึ่งแตกต่างจากระบบ Counterfactual Regret Minimization (CFR) แบบดั้งเดิมที่ต้องการทรัพยากรการคำนวณจำนวนมาก PokerGPT แสดงถึงการเปลี่ยนแปลงกระบวนทัศน์ไปสู่ AI โป๊กเกอร์แบบข้อความที่มีน้ำหนักเบา[ 14 ]แนวทางนี้ใช้ประโยชน์จากโมเดลภาษาที่ปรับแต่งมาอย่างดีซึ่งได้รับการฝึกฝนจากประวัติการเล่นโป๊กเกอร์จริงหลายล้านรายการ ทำให้ AI สามารถตัดสินใจได้ในแบบที่มนุษย์อ่านได้ ในขณะที่ใช้ทรัพยากรการคำนวณน้อยกว่าวิธีการแบบดั้งเดิมอย่างมาก
กลุ่มวิจัย
ห้องปฏิบัติการนีโอโป๊กเกอร์
Neo Poker Lab เป็นทีมวิจัยทางวิทยาศาสตร์ที่มุ่งเน้นการวิจัยปัญญาประดิษฐ์ในเกมโป๊กเกอร์ เป็นเวลาหลายปีที่ทีมได้พัฒนาและประยุกต์ใช้อัลกอริธึมและกระบวนการที่ทันสมัย เช่น การลดความเสียใจ (regret minimization) และการประมาณค่าสมดุลการค้นหาแบบไล่ระดับ (gradient search equilibrium approximation) ต้นไม้ตัดสินใจ วิธีการค้นหาแบบเรียกซ้ำ รวมถึงอัลกอริธึมผู้เชี่ยวชาญ เพื่อแก้ปัญหาต่างๆ ที่เกี่ยวข้องกับเกมโป๊กเกอร์ เว็บไซต์ของ Neo Poker Lab ที่neopokerlab.comนั้นปิดตัวลงแล้ว
กลุ่มวิจัยปัญญาประดิษฐ์ด้านเกม มหาวิทยาลัยโอ๊คแลนด์
จนถึงปี 2017 ทีมงานจากมหาวิทยาลัยโอ๊คแลนด์ซึ่งประกอบด้วยนักวิทยาศาสตร์จำนวนไม่มาก ได้ใช้การให้เหตุผลโดยอิงจากกรณีศึกษาเพื่อสร้างและปรับปรุงตัวแทนในเกมโป๊กเกอร์เท็กซัสโฮลเด็ม กลุ่มนี้ได้ประยุกต์ใช้เทคนิค AI ที่แตกต่างกันในเกมหลายเกม รวมถึงการมีส่วนร่วมในโครงการเชิงพาณิชย์อย่าง Small Worlds และCivilization (วิดีโอเกม )
กลุ่มวิจัยโป๊กเกอร์คอมพิวเตอร์ (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา)
จนถึงปี 2019 งานวิจัยจำนวนมากเกี่ยวกับผู้เล่นโป๊กเกอร์คอมพิวเตอร์ได้ดำเนินการที่มหาวิทยาลัยอัลเบอร์ตาโดยกลุ่มวิจัยโป๊กเกอร์คอมพิวเตอร์ นำโดย ดร. ไมเคิล โบว์ลิ่ง กลุ่มนี้ได้พัฒนาโปรแกรมPoki, PsOpti, Hyperborean และ Polaris Poki ได้รับลิขสิทธิ์สำหรับเกมบันเทิงSTACKEDซึ่ง มีนักโป๊กเกอร์ชาวแคนาดาแดเนียล เนเกรนูเป็น ตัวละครหลัก PsOptiมีให้ใช้งานภายใต้ชื่อ "SparBot" ในโปรแกรมฝึกโป๊กเกอร์ "Poker Academy" โปรแกรมHyperboreanได้เข้าร่วมการแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปี โดยล่าสุดได้รับเหรียญทอง 3 เหรียญจาก 6 รายการในการแข่งขันปี 2012 งานวิจัยเดียวกันนี้ยังได้สร้างPolarisซึ่งได้แข่งขันกับนักโป๊กเกอร์มืออาชีพในปี 2007 และ 2008 และกลายเป็นโปรแกรมโป๊กเกอร์คอมพิวเตอร์ตัวแรกที่ชนะการแข่งขันโป๊กเกอร์ที่มีความสำคัญ
ในเดือนมกราคม พ.ศ. 2558 บทความในScience [ 15 ]โดย Michael Bowling, Neil Burch, Michael Johanson และ Oskari Tammelin อ้างว่าบอทโป๊กเกอร์Cepheus ของพวกเขา สามารถ "แก้ปัญหาแบบอ่อนๆ" ของเกมโป๊กเกอร์ Texas hold 'em แบบหัวต่อหัวได้[ 16 ] [ 17 ] [ 18 ]
คณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยคาร์เนกีเมลลอน
ที. แซนด์โฮล์ม และ เอ. กิลปิน จากมหาวิทยาลัยคาร์เนกีเมลลอนเริ่มทำการวิจัยปัญญาประดิษฐ์ (AI) สำหรับโป๊กเกอร์ในปี 2004 โดยเริ่มต้นจากโปรแกรม AI ที่ไม่มีใครเอาชนะได้ในเกมโป๊กเกอร์ 3 ใบที่เรียกว่า โรดไอส์แลนด์ โฮลด์เอ็ม ขั้นต่อไปคือ GS1 ซึ่งมีประสิทธิภาพเหนือกว่าบอทโป๊กเกอร์ที่ดีที่สุดที่มีจำหน่ายในเชิงพาณิชย์ ในปี 2006 โปรแกรม AI โป๊กเกอร์จากกลุ่มนี้เริ่มเข้าร่วมการแข่งขันคอมพิวเตอร์ประจำปี “สักวันหนึ่งเราจะมีโปรแกรมที่ดีกว่าผู้เล่นมนุษย์ที่เก่งที่สุด” แซนด์โฮล์มกล่าว ซึ่งบอทของเขาชื่อClaudicoได้เผชิญหน้ากับคู่ต่อสู้ที่เป็นมนุษย์ 4 คนในปี 2015
ในปี 2017 ซอฟต์แวร์ของโปรแกรมLibratusได้เผชิญหน้ากับผู้เล่นโป๊กเกอร์มืออาชีพ 4 คน เมื่อสิ้นสุดการทดลอง ผู้เล่นที่เป็นมนุษย์ทั้ง 4 คนได้เสียเงินจำลองรวมกัน 1.8 ล้านดอลลาร์ให้กับ Libratus [ 19 ]
ในปี 2019 Libratus ถูกแทนที่ด้วยเวอร์ชันสุดท้ายที่ชื่อว่าPluribus (บอทโป๊กเกอร์ )
การแข่งขันทางประวัติศาสตร์
การแข่งขันโป๊กเกอร์บอท ICCM 2004
หนึ่งในการแข่งขันบอทโป๊กเกอร์แบบไม่จำกัดครั้งแรกจัดขึ้นในปี 2547 โดยการประชุมนานาชาติว่าด้วยการสร้างแบบจำลองทางปัญญา[ 20 ]การแข่งขันนี้มีบอท 5 ตัวจากมหาวิทยาลัยต่างๆ ทั่วโลกเข้าร่วม ผู้ชนะคือ Ace Gruber จากมหาวิทยาลัยโทรอนโต[ 21 ]
การแข่งขัน ACM
สมาคมเครื่องจักรคำนวณ (ACM)เคยจัดการแข่งขันที่ผู้เข้าแข่งขันส่งซอฟต์แวร์ที่สามารถเล่นโป๊กเกอร์บนแพลตฟอร์มเฉพาะของตน โดยผู้จัดงานจะดำเนินการแข่งขันโดยการใช้งานซอฟต์แวร์และรายงานผลการแข่งขัน
การแข่งขันโป๊กเกอร์หุ่นยนต์ระดับโลก ปี 2005
ในช่วงฤดูร้อนปี 2005 ห้องโป๊กเกอร์ออนไลน์ Golden Palace ได้จัดการแข่งขันโปรโมชั่นขึ้นที่ลาสเวกัส ณ โรงแรม Binions เก่า โดยมีเงินรางวัลรวม 100,000 ดอลลาร์สหรัฐ การแข่งขันนี้ถูกขนานนามว่า "World Series of Poker Robots ปี 2005" เป็นการแข่งขันที่ใช้บอทเท่านั้น ไม่มีค่าธรรมเนียมการสมัคร ผู้พัฒนาบอทเป็นนักวิทยาศาสตร์คอมพิวเตอร์จาก 6 สัญชาติ ซึ่งเดินทางมาเข้าร่วมการแข่งขันด้วยค่าใช้จ่ายของตนเอง แพลตฟอร์มที่ใช้จัดการแข่งขันคือ Poker Academy นอกจากนี้ ในงานยังมีการสาธิตการเล่นแบบตัวต่อตัวกับ Phil Laak อีกด้วย
การทดลองมนุษย์ปะทะเครื่องจักรของมหาวิทยาลัยอัลเบอร์ตา
ในฤดูร้อนปี 2007 มหาวิทยาลัยอัลเบอร์ตาได้จัดการแข่งขันโป๊กเกอร์แบบตัวต่อตัวสุดพิเศษระหว่างมนุษย์และบอท Polaris ของพวกเขา ในงานประชุม AAAI ที่แวนคูเวอร์ รัฐบริติชโคลัมเบีย ประเทศแคนาดา แพลตฟอร์มที่ใช้ในการแข่งขันนั้นเขียนขึ้นโดยมหาวิทยาลัยอัลเบอร์ตามีเงินรางวัลสูงสุด 50,000 ดอลลาร์สหรัฐ พร้อมกฎพิเศษเพื่อกระตุ้นให้มนุษย์เล่นอย่างเต็มที่ มนุษย์ไม่ต้องเสียค่าธรรมเนียมการเข้าร่วม การแข่งขันที่ไม่เหมือนใครนี้ประกอบด้วยสี่รอบการแข่งขันแบบ Duplicate Style รอบละ 500 มือ ผลปรากฏว่ามนุษย์เป็นฝ่ายชนะด้วยคะแนนที่เฉียดฉิว
ในช่วงฤดูร้อนปี 2008 มหาวิทยาลัยอัลเบอร์ตาและเว็บไซต์สอนโป๊กเกอร์ Stoxpoker ได้จัดการแข่งขันโป๊กเกอร์รายการที่สองขึ้นระหว่างการแข่งขัน World Series of Poker ที่ลาสเวกัส การแข่งขันประกอบด้วยรอบการเล่นแบบคู่ 6 รอบ รอบละ 500 มือ และผู้เล่นที่เป็นมนุษย์ล้วนเป็นผู้เชี่ยวชาญด้าน Heads-Up Limit Polaris คว้าแชมป์ด้วยสถิติชนะ 3 ครั้ง แพ้ 2 ครั้ง และเสมอ 1 ครั้ง ผลการแข่งขันรวมถึงประวัติการเล่นแต่ละแมตช์สามารถดูได้ที่เว็บไซต์การแข่งขัน
การแข่งขัน Brains vs AI ประจำปี 2015 จัดโดย Rivers Casino, CMU และ Microsoft
ระหว่างเดือนเมษายน-พฤษภาคม 2558 บอทClaudico ของมหาวิทยาลัย Carnegie Mellon Sandholm ได้แข่งขันกับคู่ต่อสู้ที่เป็นมนุษย์ 4 คน ในการแข่งขัน Texas Hold'em แบบไม่จำกัดวงเงิน[ 22 ] [ 23 ]ในที่สุด หลังจากเล่นไป 80,000 มือ มนุษย์ก็ชนะด้วยเงินรางวัลรวม 732,713 ดอลลาร์ แต่ถึงแม้ว่ามนุษย์จะชนะในทางเทคนิค นักวิทยาศาสตร์ก็ถือว่าชัยชนะนั้นไม่มีนัยสำคัญทางสถิติ (หรือเรียกได้ว่าเสมอกันทางสถิติ) เมื่อเทียบกับเงินเดิมพันทั้งหมด 170,000,000 ดอลลาร์ (170 ล้านดอลลาร์) อย่างไรก็ตาม บางคนได้ตัดสินว่าข้ออ้างนี้ไม่จริงใจ[ 24 ]ไม่มีนัยสำคัญทางสถิติในที่นี้หมายความว่าโปรแกรมเมอร์ของ Claudico ไม่สามารถพูดได้อย่างมั่นใจ 95% (ช่วงความเชื่อมั่น 95%) ว่ามนุษย์เก่งกว่าโปรแกรมคอมพิวเตอร์ อย่างไรก็ตาม ถือเป็นชัยชนะที่มีนัยสำคัญทางสถิติในช่วงความเชื่อมั่น 90% ซึ่งหมายความว่าผู้เล่นที่เป็นมนุษย์มีโอกาสชนะอยู่ระหว่าง 10 ต่อ 1 ถึง 20 ต่อ 1 [ 24 ]
รูปแบบการแข่งขันแบ่งออกเป็นสองเซ็ต เซ็ตละสองคน โดยในแต่ละเซ็ต ผู้เล่นจะได้รับไพ่ตรงข้ามกัน หมายความว่า ถ้าคอมพิวเตอร์มี As9c (เอซโพธิ์ดำและเก้าดอกจิก) และผู้เล่นที่เป็นมนุษย์มี Jh8d ในเซ็ตหนึ่ง ผู้เล่นอีกคนในเซ็ตนั้นก็จะมี As9c เช่นกัน และต้องเจอกับ Jh8d ของคอมพิวเตอร์ อย่างไรก็ตาม แม้ว่าผู้เล่นที่เป็นมนุษย์จะชนะมากกว่าคอมพิวเตอร์ แต่ก็ไม่ใช่ว่าทุกคนจะชนะในการแข่งขันแบบตัวต่อตัว
ยอดเงินรางวัลรวมของผู้เล่นแต่ละคนมีดังนี้:
- ดักลาส โพลค์: +213,671 ดอลลาร์สหรัฐ
- ดง คิม: +70,491 ดอลลาร์สหรัฐ
- บียอร์น ลี: +529,033 ดอลลาร์สหรัฐ
- เจสัน เลส: -80,482 ดอลลาร์[ 25 ]
การแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปี
ตั้งแต่ปี 2006 ถึง 2018 การแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปีได้จัดการแข่งขันสำหรับโปรแกรมโป๊กเกอร์หลายรายการ ตั้งแต่ปี 2010 มีการเล่นโป๊กเกอร์สามประเภท ได้แก่ Heads-Up Limit Texas Hold'em, Heads-Up No-Limit Texas Hold'em และ 3-player Limit Texas Hold'em ในแต่ละรายการ จะมีการประกาศผู้ชนะสองคน ได้แก่ เอเจนต์ที่ชนะการแข่งขันมากที่สุด (Bankroll Instant Run-off) และเอเจนต์ที่ชนะเงินมากที่สุด (Total Bankroll) ผู้ชนะทั้งสองมักจะไม่ใช่เอเจนต์เดียวกัน เนื่องจาก Bankroll Instant Run-off ให้รางวัลแก่ผู้เล่นที่แข็งแกร่ง ในขณะที่ Total Bankroll ให้รางวัลแก่ผู้เล่นที่เก่งในการใช้ประโยชน์จากความผิดพลาดของเอเจนต์อื่น การแข่งขันนี้ได้รับแรงบันดาลใจจากการวิจัยทางวิทยาศาสตร์ และมีการเน้นย้ำในการตรวจสอบให้แน่ใจว่าผลลัพธ์ทั้งหมดมีความสำคัญทางสถิติโดยการเล่นโป๊กเกอร์หลายล้านมือ การแข่งขันในปี 2012 ใช้รูปแบบเดียวกัน แต่มีการเล่นมากกว่า 70 ล้านมือเพื่อขจัดปัจจัยด้านโชค
นักวิจัยบางกลุ่มได้พัฒนาแอปพลิเคชันบนเว็บที่ผู้คนสามารถเล่นและประเมินคุณภาพของ AI ได้ ดังนั้น ณ เดือนธันวาคม 2012 จึงสามารถพบกลุ่มชั้นนำและตัวแทนของนักวิจัยรายบุคคลได้ดังต่อไปนี้:
- ไฮเปอร์โบเรียน (ทอง 9 ชิ้น เงิน 5 ชิ้น และทองสัมฤทธิ์ 3 ชิ้น)
- บลัฟบอต (1 เหรียญทอง 3 เหรียญเงิน และ 2 เหรียญทองแดง)
- ซาร์ตร์ (1 เหรียญทอง 5 เหรียญเงิน และ 3 เหรียญทองแดง)
- บอทโป๊กเกอร์ Neo (1 เหรียญทอง, 5 เหรียญทองแดง)
ผลลัพธ์
| 2010 [ 26 ] | |
| เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. PULPO (Marv Andersen, สหราชอาณาจักร) 2. Hyperborean-TBR (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Sartre (มหาวิทยาลัยโอ๊คแลนด์, นิวซีแลนด์) | 1. Rockhopper (David Lin, USA) 2. GGValuta (Mihai Ciucu, โรมาเนีย) 3. Hyperborean-IRO (University of Alberta, Canada) |
| เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Tartanian4-TBR (มหาวิทยาลัยคาร์เนกีเมลลอน สหรัฐอเมริกา) 2. PokerBotSLO (มหาวิทยาลัยมาริบอร์และลูบลิยานา สโลวีเนีย) 3. HyperboreanNL-TBR (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) | 1. HyperboreanNL-IRO (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. SartreNL (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) 3. Tartanian4-IRO (มหาวิทยาลัยคาร์เนกีเมลลอน ประเทศสหรัฐอเมริกา) |
| เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Hyperborean3P-TBR (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย) 3. Bender (มหาวิทยาลัยเทคนิคดาร์มสตัดท์ ประเทศเยอรมนี) | 1. Hyperborean3P-IRO (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. dcu3pl-IRO (มหาวิทยาลัยดับลินซิตี้ ประเทศไอร์แลนด์) 3. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย) |
| 2011 [ 27 ] | |
| เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Calamari (Marv Andersen, สหราชอาณาจักร) 2. Sartre (มหาวิทยาลัยโอ๊คแลนด์, นิวซีแลนด์) 3. Hyperborean-2011-2p-limit-tbr (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) | 1. Hyperborean-2011-2p-limit-iro (University of Alberta, Canada) 2. Slumbot (Eric Jackson, USA) 3. Calamari (Marv Andersen, UK) |
| เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Lucky7 (Mikrospin doo, สโลวีเนีย) 2. SartreNL (มหาวิทยาลัยโอ๊คแลนด์, นิวซีแลนด์) 3. Hyperborean-2011-2p-nolimit-tbr (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) | 1. Hyperborean-2011-2p-nolimit-iro (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. SartreNL (มหาวิทยาลัยโอ๊คแลนด์ นิวซีแลนด์) 3. Hugh (สหรัฐอเมริกาและแคนาดา) |
| เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Sartre3p (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) 2. Hyperborean-2011-3p-limit-tbr (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 3. AAIMontybot (มหาวิทยาลัยชาร์ลส์ในกรุงปราก สาธารณรัฐเช็ก) 3. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย) | 1. Hyperborean-2011-3p-limit-iro (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Sartre3p (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) 3. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย) |
| 2012 | |
| เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. สลัมบอต (เอริค แจ็คสัน, สหรัฐอเมริกา) 2. ลิตเติ้ล ร็อค (ร็อด เบิร์นส์, ออสเตรเลีย) 2. ซบอต (อิลกา ราจาลา, ฟินแลนด์) | 1. Slumbot (Eric Jackson, USA) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Zbot (Ilkka Rajala, ฟินแลนด์) |
| เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Little Rock (Rod Byrnes, ออสเตรเลีย) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Tartanian 5 (มหาวิทยาลัยคาร์เนกีเมลลอน, สหรัฐอเมริกา) | 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Tartanian5 (มหาวิทยาลัยคาร์เนกีเมลลอน ประเทศสหรัฐอเมริกา) 3. Neo Poker Bot (อเล็กซานเดอร์ ลี ประเทศสเปน) |
| เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน) 3. Sartre (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) | 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน) 3. Sartre (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) |
| 2013 | |
| เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Marv (Marv Anderson, สหราชอาณาจักร) 2. Feste (François Pays, ฝรั่งเศส) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) | 1. Neo Poker Bot (อเล็กซานเดอร์ ลี, สเปน) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Zbot (Ilkka Rajala, ฟินแลนด์) 3. Marv (Marv Anderson, สหราชอาณาจักร) |
| เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Slumbot NL (Eric Jackson, USA) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Tartanian6 (มหาวิทยาลัย Carnegie Mellon, USA) | 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 2. Slumbot NL (Eric Jackson, สหรัฐอเมริกา) 3. Tartanian6 (มหาวิทยาลัย Carnegie Mellon, สหรัฐอเมริกา) 3. Nyx (มหาวิทยาลัย Charles, สาธารณรัฐเช็ก) |
| เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน) | 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน) |
| 2014 | |
| เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Escabeche (Marv Andersen, สหราชอาณาจักร) 2. SmooCT (University College London, สหราชอาณาจักร) 3. Hyperborean (University of Alberta, แคนาดา) 3. Feste (Francois Pays, ฝรั่งเศส) | |
| เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Tartanian7 (มหาวิทยาลัยคาร์เนกีเมลลอน สหรัฐอเมริกา) 2. Nyx (มหาวิทยาลัยชาร์ลส์ สาธารณรัฐเช็ก) 2. Prelude (Unfold Poker สหรัฐอเมริกา) 2. Slumbot (Eric Jackson สหรัฐอเมริกา) | 1. Tartanian7 (มหาวิทยาลัยคาร์เนกีเมลลอน สหรัฐอเมริกา) 2. Prelude (Unfold Poker สหรัฐอเมริกา) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. Slumbot (Eric Jackson สหรัฐอเมริกา) |
| เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว | |
| เงินทุนทั้งหมด | การยุติธุรกรรมทันทีของ Bankroll |
| 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. SmooCT (University College London สหราชอาณาจักร) 3. KEmpfer (Technische Universität Darmstadt ประเทศเยอรมนี) | 1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. SmooCT (University College London สหราชอาณาจักร) 3. KEmpfer (Technische Universität Darmstadt ประเทศเยอรมนี) |
พลูริบัส
การแข่งขันโป๊กเกอร์รอบสุดท้ายไม่ได้เปิดเผยต่อสาธารณะ เมื่อ โปรแกรม Pluribus (บอทโป๊กเกอร์)เอาชนะมืออาชีพได้อย่างต่อเนื่องในการแข่งขัน Hold'em แบบไม่มีลิมิต 6 มือ ผลลัพธ์จึงถูกประกาศอย่างเงียบๆ บนโพสต์ Facebook [ 29 ]
ดูเพิ่มเติม
ลิงก์ภายนอก
- การแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปี (จัดครั้งล่าสุดในปี 2018)
- บทความเรื่อง "การเขียนโปรแกรม AI สำหรับโป๊กเกอร์" เขียนโดยโปรแกรมเมอร์ผู้พัฒนา AI สำหรับการแข่งขันโป๊กเกอร์เวิลด์ซีรีส์ พฤศจิกายน 2548
- แคโรไลน์ ฮสู. "บอทโป๊กเกอร์สามารถเอาชนะมนุษย์ได้หรือไม่?" . USnews.com. เก็บถาวรจากต้นฉบับเมื่อวันที่ 27 มีนาคม 2552
- บทความจาก MSNBC - กันยายน 2004
- ข่าววิทยาศาสตร์: ใบหน้าโป๊กเกอร์ขั้นสุดยอด (ลิงก์ที่เก็บถาวร) มิถุนายน 2551
- NYTimes.com: บอทโป๊กเกอร์บุกวงการพนันออนไลน์ 13 มีนาคม 2554
- NYTimes.com (บทความที่เก็บถาวร) “ปัญญาประดิษฐ์พิชิตโป๊กเกอร์ได้อย่างไร” 18 มกราคม 2022
- NYTimes.com (บทความที่เก็บถาวร) “แชทบอทไม่สามารถฉลาดกว่าคุณได้ ในตอนนี้” 20 มกราคม 2023
- CMU สร้างความสำเร็จครั้งใหญ่ในเกมเท็กซัสโฮลเอ็มบทความเกี่ยวกับกลุ่มวิจัย AI ด้านโป๊กเกอร์ของมหาวิทยาลัยคาร์เนกีเมลลอน
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ นักเล่นโป๊กเกอร์คอมพิวเตอร์
โปรแกรมเล่นโป๊กเกอร์คอมพิวเตอร์คือโปรแกรมคอมพิวเตอร์ที่ออกแบบมาเพื่อเล่นเกมโป๊กเกอร์ (โดยทั่วไปคือ เวอร์ชัน เท็กซัสโฮลด์เอ็ม )...
บนอินเทอร์เน็ต
บอทหรือ โปรแกรมคอมพิวเตอร์ เหล่านี้ มักถูกใช้ใน สถานการณ์ โป๊กเกอร์ออนไลน์ ทั้งในฐานะคู่ต่อสู้ที่ถูกต้องตามกฎสำหรับผู้เล่นที่เป็นมนุษย์ หรือในฐานะรูปแบบหนึ่งของ การโกง ณ ปี 2020 การใช้โปรแกรมช่วยเหลือแบบเรียลไทม์ (RTA)...
บอทผู้เล่น
การใช้บอทผู้เล่นหรือความช่วยเหลือจากคอมพิวเตอร์ขณะเล่นโป๊กเกอร์ออนไลน์เป็นสิ่งต้องห้ามในเว็บไซต์ออนไลน์ส่วนใหญ่ หากไม่ใช่ทั้งหมด มาตรการลงโทษสำหรับการฝ่าฝืน ได้แก่ การแบนถาวรและการริบเงินรางวัล บอทประเภทหนึ่งสามารถเชื่อมต่อกับไคลเอนต์โป๊กเกอร์ (กล่าวคือ...
บอทบ้าน
“บอทของคาสิโน” อาจก่อให้เกิดผลประโยชน์ทับซ้อน ตามความหมายที่เข้มงวดที่สุด บอทของคาสิโนคือผู้เล่นอัตโนมัติที่ดำเนินการโดยห้องโป๊กเกอร์ออนไลน์นั้นเอง บอทประเภทนี้เทียบได้กับ ตัวแทนรับจ้างของ คาสิ โน แบบดั้งเดิม