กลับไปหน้าบทความ

อ่าน 7 นาที

นักเล่นโป๊กเกอร์คอมพิวเตอร์

โปรแกรมเล่นโป๊กเกอร์คอมพิวเตอร์คือโปรแกรมคอมพิวเตอร์ที่ออกแบบมาเพื่อเล่นเกมโป๊กเกอร์ (โดยทั่วไปคือ เวอร์ชัน เท็กซัสโฮลด์เอ็ม )...

นักเล่นโป๊กเกอร์คอมพิวเตอร์

โปรแกรมเล่นโป๊กเกอร์คอมพิวเตอร์คือโปรแกรมคอมพิวเตอร์ที่ออกแบบมาเพื่อเล่นเกมโป๊กเกอร์ (โดยทั่วไปคือ เวอร์ชัน เท็กซัสโฮลด์เอ็ม ) กับคู่ต่อสู้ที่เป็นมนุษย์หรือคู่ต่อสู้ที่เป็นคอมพิวเตอร์ด้วยกันเอง โดยทั่วไปจะเรียกว่าโป๊กเกอร์บอทหรือเรียกสั้นๆ ว่าบอท ณ ปี 2019 คอมพิวเตอร์สามารถเอาชนะผู้เล่นที่เป็นมนุษย์ทุกคนในเกมโป๊กเกอร์ได้[ 1 ] [ 2 ] [ 3 ]

บนอินเทอร์เน็ต

บอทหรือโปรแกรมคอมพิวเตอร์ เหล่านี้ มักถูกใช้ใน สถานการณ์ โป๊กเกอร์ออนไลน์ทั้งในฐานะคู่ต่อสู้ที่ถูกต้องตามกฎสำหรับผู้เล่นที่เป็นมนุษย์ หรือในฐานะรูปแบบหนึ่งของการโกงณ ปี 2020 การใช้โปรแกรมช่วยเหลือแบบเรียลไทม์ (RTA) หรือบอทอัตโนมัติทั้งหมดถือเป็นการโกงโดยเว็บไซต์โป๊กเกอร์ออนไลน์ทุกแห่ง แม้ว่าระดับการบังคับใช้จากผู้ให้บริการเว็บไซต์จะแตกต่างกันอย่างมากก็ตาม

บอทผู้เล่น

การใช้บอทผู้เล่นหรือความช่วยเหลือจากคอมพิวเตอร์ขณะเล่นโป๊กเกอร์ออนไลน์เป็นสิ่งต้องห้ามในเว็บไซต์ออนไลน์ส่วนใหญ่ หากไม่ใช่ทั้งหมด มาตรการลงโทษสำหรับการฝ่าฝืน ได้แก่ การแบนถาวรและการริบเงินรางวัล บอทประเภทหนึ่งสามารถเชื่อมต่อกับไคลเอนต์โป๊กเกอร์ (กล่าวคือ เล่นเองโดยอัตโนมัติ) โดยไม่ต้องอาศัยผู้ควบคุมที่เป็นมนุษย์ ความช่วยเหลือแบบเรียลไทม์ (RTA) เป็นอีกวิธีหนึ่งในการใช้โปรแกรมคอมพิวเตอร์ RTA คือเมื่อผู้เล่นที่เป็นมนุษย์ใช้โปรแกรมที่เรียกว่า "ตัวแก้ปัญหา" เช่น PioSOLVER หรือ PokerSnowie [ 4 ]ที่ทำงานบนคอมพิวเตอร์เครื่องอื่น[ 5 ]เพื่อทำการตัดสินใจ

ปัญหาเรื่องความได้เปรียบที่ไม่เป็นธรรมมีสองด้าน ประการแรก บอทสามารถเล่นได้หลายชั่วโมงติดต่อกันโดยปราศจากจุดอ่อนของมนุษย์ เช่นความเหนื่อยล้าและสามารถทนต่อความผันผวนตามธรรมชาติของเกมได้โดยไม่ได้รับอิทธิพลจากอารมณ์ ของมนุษย์ (หรือ " อาการหัวเสีย ") ประการที่สอง ตั้งแต่ปี 2019 โปรแกรมคอมพิวเตอร์Pluribus (บอทโป๊กเกอร์)ประสบความสำเร็จในการอ่านการบลัฟ คำนวณอัตราต่อรอง และปรับกลยุทธ์จนสามารถเอาชนะผู้เล่นโป๊กเกอร์มืออาชีพได้อย่างสม่ำเสมอในเกม Hold'em แบบไม่มีลิมิต 6 ผู้เล่น[ 6 ] [ 7 ] [ 8 ]

การบังคับใช้กฎหมายภายในบ้าน

แม้ว่าข้อกำหนดและเงื่อนไขของเว็บไซต์โป๊กเกอร์โดยทั่วไปจะห้ามการใช้บอท แต่ระดับการบังคับใช้ขึ้นอยู่กับผู้ให้บริการเว็บไซต์ บางแห่งจะค้นหาและแบนผู้ใช้บอทโดยใช้เครื่องมือซอฟต์แวร์ต่างๆ โปรแกรมไคลเอนต์โป๊กเกอร์สามารถตั้งโปรแกรมให้พยายามตรวจจับบอทได้ แม้ว่าวิธีนี้จะเป็นที่ถกเถียงกันอยู่ เพราะอาจถูกมองว่าเทียบเท่ากับการฝังสปายแวร์ ไว้ ในซอฟต์แวร์ไคลเอนต์ อีกวิธีหนึ่งคือการใช้CAPTCHAในช่วงเวลาสุ่มระหว่างการเล่นเพื่อจับบอทอัตโนมัติ แม้ว่าจะไม่ได้ผลกับระบบช่วยเหลือแบบเรียลไทม์ก็ตาม

บอทบ้าน

“บอทของคาสิโน” อาจก่อให้เกิดผลประโยชน์ทับซ้อน ตามความหมายที่เข้มงวดที่สุด บอทของคาสิโนคือผู้เล่นอัตโนมัติที่ดำเนินการโดยห้องโป๊กเกอร์ออนไลน์นั้นเอง บอทประเภทนี้เทียบได้กับตัวแทนรับจ้างของ คาสิ โน แบบดั้งเดิม

ทั้งพนักงานของคาสิโนแบบดั้งเดิมและบอทของคาสิโนออนไลน์ไม่ควรเข้าถึงข้อมูลใดๆ ที่ผู้เล่นคนอื่นๆ ในเกมเดียวกันไม่สามารถเข้าถึงได้ ปัญหาคือ ในสภาพแวดล้อมออนไลน์ เจ้ามือไม่มีวิธีพิสูจน์ว่าบอทของพวกเขาไม่ได้รับข้อมูลที่ละเอียดอ่อนจากเซิร์ฟเวอร์ไพ่ ปัญหานี้ยิ่งทวีความรุนแรงขึ้นเนื่องจากการแบ่งปันข้อมูลลับสามารถทำได้ง่ายในสภาพแวดล้อมดิจิทัล แม้แต่เจ้ามือเองก็แทบเป็นไปไม่ได้ที่จะพิสูจน์ว่าพวกเขาไม่ได้ควบคุมผู้เล่นบางคน

ปัญญาประดิษฐ์

เช่นเดียวกับในเกมหมากรุกเกมโกะและเกมอื่นๆ อีกมากมาย ระบบ ปัญญาประดิษฐ์สามารถเอาชนะแม้กระทั่งมนุษย์ที่เก่งที่สุดในโป๊กเกอร์ได้[ 9 ] [ 10 ]โป๊กเกอร์เป็นเกมที่มีข้อมูลไม่สมบูรณ์ (เนื่องจากไพ่บางใบในการเล่นถูกซ่อนไว้) ทำให้ยากสำหรับทุกคน (รวมถึงคอมพิวเตอร์) ที่จะคาดเดาผลลัพธ์สุดท้ายของมือ เนื่องจากขาดข้อมูลนี้ โปรแกรมเมอร์ของคอมพิวเตอร์จึงต้องใช้ระบบที่อิงตามทฤษฎีบทของเบย์สสมดุลแนชการ จำลองมอน เตคาร์โลหรือโครงข่ายประสาทเทียมซึ่งทั้งหมดนี้เป็นเทคนิคที่ไม่สมบูรณ์ อย่างไรก็ตาม Pluribusได้พัฒนาโป๊กเกอร์ให้สมบูรณ์แบบโดยการมองไปข้างหน้าเพียงไม่กี่ตาเพื่อพิจารณาว่าควรดำเนินการอย่างไร แทนที่จะพยายามประเมินทุกตาจนกว่าจะจบเกม

AI รุ่นเก่าอย่าง PokerSnowie และClaudicoถูกสร้างขึ้นโดยการปล่อยให้คอมพิวเตอร์กำหนดกลยุทธ์ที่ดีที่สุดโดยการให้มันเล่นกับตัวเองเป็นจำนวนมหาศาล เป็นเวลาหลายปีที่วิธีการนี้เป็นแนวทางในการสร้าง AI สำหรับโป๊กเกอร์ ซึ่งแตกต่างจากการพยายามสร้างคอมพิวเตอร์ที่เล่นเหมือนมนุษย์ ส่งผลให้ขนาดการเดิมพันแปลกประหลาดและกลยุทธ์แตกต่างจากที่มนุษย์คุ้นเคย

วิธีการต่างๆ ถูกพัฒนาขึ้นมาเพื่อประมาณกลยุทธ์โป๊กเกอร์ที่สมบูรณ์แบบจาก มุมมอง ของทฤษฎีเกมในเกมแบบตัวต่อตัว (ผู้เล่นสองคน) ก่อน จากนั้นจึงพัฒนาสำหรับเกมแบบหลายผู้เล่น กลยุทธ์ที่สมบูรณ์แบบในบริบทนี้มีความหมายหลายอย่าง จากมุมมองของกลยุทธ์ที่เหมาะสมที่สุดในเชิงทฤษฎีเกม กลยุทธ์ที่สมบูรณ์แบบคือกลยุทธ์ที่ไม่สามารถคาดหวังว่าจะแพ้กลยุทธ์ของผู้เล่นคนอื่นได้ อย่างไรก็ตาม กลยุทธ์ที่เหมาะสมที่สุดอาจแตกต่างกันไปเมื่อมีผู้เล่นที่ด้อยกว่าซึ่งมีจุดอ่อนที่สามารถนำมาใช้ประโยชน์ได้ ในกรณีนี้ กลยุทธ์ที่สมบูรณ์แบบคือกลยุทธ์ที่จำลองจุดอ่อนเหล่านั้นได้อย่างถูกต้องหรือใกล้เคียง และใช้ประโยชน์จากจุดอ่อนเหล่านั้นเพื่อสร้างผลกำไร เช่นเดียวกับที่อธิบายไว้ข้างต้น

AI ประสบความสำเร็จในการเล่นโป๊กเกอร์ในระดับเหนือมนุษย์ในช่วงทศวรรษ 2010 โดยมีลำดับเหตุการณ์ดังนี้ ในปี 2015 คอมพิวเตอร์สามารถแก้ปัญหาเกมโฮลด์เอ็มแบบจำกัดวงเงินโดยใช้Cepheusได้ ความสำเร็จครั้งนี้เกิดขึ้นโดยใช้อัลกอริทึม CFR+ (Counterfactual Regret Minimization Plus) ซึ่งวิเคราะห์จุดตัดสินใจ 3.19×10^14 จุดเพื่อแก้ปัญหาเกมได้อย่างมีประสิทธิภาพ[ 11 ] CFR+ ทำงานโดยการเล่นซ้ำกับตัวเองและวิเคราะห์ความเสียใจเชิงสมมติ ซึ่งเป็นความแตกต่างระหว่างค่าที่คาดหวังของการกระทำที่เกิดขึ้นกับการกระทำที่ดีที่สุดที่เป็นไปได้ ในปี 2018 Libratusได้แสดงให้เห็นถึงความสามารถเหนือมนุษย์ในเกมโฮลด์เอ็มแบบไม่จำกัดวงเงิน ในปี 2019 Pluribus (เวอร์ชันใหม่กว่าของ Libratus) [ 12 ]ได้แสดงให้เห็นถึงความสามารถเหนือมนุษย์ในเกมโฮลด์เอ็มแบบไม่จำกัดวงเงินสำหรับผู้เล่นหกคน ซึ่งเป็นรูปแบบโป๊กเกอร์แบบเล่นคนเดียวที่ได้รับความนิยมมากที่สุดในโลก[ 13 ]ในปี 2021 ไมโครซอฟต์ได้วางจำหน่ายโปรแกรมเล่นโป๊กเกอร์ Libratus เวอร์ชันเก่าในเชิงพาณิชย์ ซึ่งต่อมาได้เอาชนะผู้เล่นโป๊กเกอร์มืออาชีพ 4 คนในการแข่งขันโป๊กเกอร์ที่ Rivers Casino เป็นเวลา 20 วัน

การพัฒนาล่าสุดได้นำแนวทางโมเดลภาษาขนาดใหญ่ (LLM) มาใช้กับ AI โป๊กเกอร์ โดยเฉพาะอย่างยิ่ง PokerGPT ซึ่งแตกต่างจากระบบ Counterfactual Regret Minimization (CFR) แบบดั้งเดิมที่ต้องการทรัพยากรการคำนวณจำนวนมาก PokerGPT แสดงถึงการเปลี่ยนแปลงกระบวนทัศน์ไปสู่ ​​AI โป๊กเกอร์แบบข้อความที่มีน้ำหนักเบา[ 14 ]แนวทางนี้ใช้ประโยชน์จากโมเดลภาษาที่ปรับแต่งมาอย่างดีซึ่งได้รับการฝึกฝนจากประวัติการเล่นโป๊กเกอร์จริงหลายล้านรายการ ทำให้ AI สามารถตัดสินใจได้ในแบบที่มนุษย์อ่านได้ ในขณะที่ใช้ทรัพยากรการคำนวณน้อยกว่าวิธีการแบบดั้งเดิมอย่างมาก

กลุ่มวิจัย

ห้องปฏิบัติการนีโอโป๊กเกอร์

Neo Poker Lab เป็นทีมวิจัยทางวิทยาศาสตร์ที่มุ่งเน้นการวิจัยปัญญาประดิษฐ์ในเกมโป๊กเกอร์ เป็นเวลาหลายปีที่ทีมได้พัฒนาและประยุกต์ใช้อัลกอริธึมและกระบวนการที่ทันสมัย ​​เช่น การลดความเสียใจ (regret minimization) และการประมาณค่าสมดุลการค้นหาแบบไล่ระดับ (gradient search equilibrium approximation) ต้นไม้ตัดสินใจ วิธีการค้นหาแบบเรียกซ้ำ รวมถึงอัลกอริธึมผู้เชี่ยวชาญ เพื่อแก้ปัญหาต่างๆ ที่เกี่ยวข้องกับเกมโป๊กเกอร์ เว็บไซต์ของ Neo Poker Lab ที่neopokerlab.comนั้นปิดตัวลงแล้ว

กลุ่มวิจัยปัญญาประดิษฐ์ด้านเกม มหาวิทยาลัยโอ๊คแลนด์

จนถึงปี 2017 ทีมงานจากมหาวิทยาลัยโอ๊คแลนด์ซึ่งประกอบด้วยนักวิทยาศาสตร์จำนวนไม่มาก ได้ใช้การให้เหตุผลโดยอิงจากกรณีศึกษาเพื่อสร้างและปรับปรุงตัวแทนในเกมโป๊กเกอร์เท็กซัสโฮลเด็ม กลุ่มนี้ได้ประยุกต์ใช้เทคนิค AI ที่แตกต่างกันในเกมหลายเกม รวมถึงการมีส่วนร่วมในโครงการเชิงพาณิชย์อย่าง Small Worlds และCivilization (วิดีโอเกม )

กลุ่มวิจัยโป๊กเกอร์คอมพิวเตอร์ (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา)

จนถึงปี 2019 งานวิจัยจำนวนมากเกี่ยวกับผู้เล่นโป๊กเกอร์คอมพิวเตอร์ได้ดำเนินการที่มหาวิทยาลัยอัลเบอร์ตาโดยกลุ่มวิจัยโป๊กเกอร์คอมพิวเตอร์ นำโดย ดร. ไมเคิล โบว์ลิ่ง กลุ่มนี้ได้พัฒนาโปรแกรมPoki, PsOpti, Hyperborean และ Polaris Poki ได้รับลิขสิทธิ์สำหรับเกมบันเทิงSTACKEDซึ่ง มีนักโป๊กเกอร์ชาวแคนาดาแดเนียล เนเกรนูเป็น ตัวละครหลัก PsOptiมีให้ใช้งานภายใต้ชื่อ "SparBot" ในโปรแกรมฝึกโป๊กเกอร์ "Poker Academy" โปรแกรมHyperboreanได้เข้าร่วมการแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปี โดยล่าสุดได้รับเหรียญทอง 3 เหรียญจาก 6 รายการในการแข่งขันปี 2012 งานวิจัยเดียวกันนี้ยังได้สร้างPolarisซึ่งได้แข่งขันกับนักโป๊กเกอร์มืออาชีพในปี 2007 และ 2008 และกลายเป็นโปรแกรมโป๊กเกอร์คอมพิวเตอร์ตัวแรกที่ชนะการแข่งขันโป๊กเกอร์ที่มีความสำคัญ

ในเดือนมกราคม พ.ศ. 2558 บทความในScience [ 15 ]โดย Michael Bowling, Neil Burch, Michael Johanson และ Oskari Tammelin อ้างว่าบอทโป๊กเกอร์Cepheus ของพวกเขา สามารถ "แก้ปัญหาแบบอ่อนๆ" ของเกมโป๊กเกอร์ Texas hold 'em แบบหัวต่อหัวได้[ 16 ] [ 17 ] [ 18 ]

คณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยคาร์เนกีเมลลอน

ที. แซนด์โฮล์ม และ เอ. กิลปิน จากมหาวิทยาลัยคาร์เนกีเมลลอนเริ่มทำการวิจัยปัญญาประดิษฐ์ (AI) สำหรับโป๊กเกอร์ในปี 2004 โดยเริ่มต้นจากโปรแกรม AI ที่ไม่มีใครเอาชนะได้ในเกมโป๊กเกอร์ 3 ใบที่เรียกว่า โรดไอส์แลนด์ โฮลด์เอ็ม ขั้นต่อไปคือ GS1 ซึ่งมีประสิทธิภาพเหนือกว่าบอทโป๊กเกอร์ที่ดีที่สุดที่มีจำหน่ายในเชิงพาณิชย์ ในปี 2006 โปรแกรม AI โป๊กเกอร์จากกลุ่มนี้เริ่มเข้าร่วมการแข่งขันคอมพิวเตอร์ประจำปี “สักวันหนึ่งเราจะมีโปรแกรมที่ดีกว่าผู้เล่นมนุษย์ที่เก่งที่สุด” แซนด์โฮล์มกล่าว ซึ่งบอทของเขาชื่อClaudicoได้เผชิญหน้ากับคู่ต่อสู้ที่เป็นมนุษย์ 4 คนในปี 2015

ในปี 2017 ซอฟต์แวร์ของโปรแกรมLibratusได้เผชิญหน้ากับผู้เล่นโป๊กเกอร์มืออาชีพ 4 คน เมื่อสิ้นสุดการทดลอง ผู้เล่นที่เป็นมนุษย์ทั้ง 4 คนได้เสียเงินจำลองรวมกัน 1.8 ล้านดอลลาร์ให้กับ Libratus [ 19 ]

ในปี 2019 Libratus ถูกแทนที่ด้วยเวอร์ชันสุดท้ายที่ชื่อว่าPluribus (บอทโป๊กเกอร์ )

การแข่งขันทางประวัติศาสตร์

การแข่งขันโป๊กเกอร์บอท ICCM 2004

หนึ่งในการแข่งขันบอทโป๊กเกอร์แบบไม่จำกัดครั้งแรกจัดขึ้นในปี 2547 โดยการประชุมนานาชาติว่าด้วยการสร้างแบบจำลองทางปัญญา[ 20 ]การแข่งขันนี้มีบอท 5 ตัวจากมหาวิทยาลัยต่างๆ ทั่วโลกเข้าร่วม ผู้ชนะคือ Ace Gruber จากมหาวิทยาลัยโทรอนโต[ 21 ]

การแข่งขัน ACM

สมาคมเครื่องจักรคำนวณ (ACM)เคยจัดการแข่งขันที่ผู้เข้าแข่งขันส่งซอฟต์แวร์ที่สามารถเล่นโป๊กเกอร์บนแพลตฟอร์มเฉพาะของตน โดยผู้จัดงานจะดำเนินการแข่งขันโดยการใช้งานซอฟต์แวร์และรายงานผลการแข่งขัน

การแข่งขันโป๊กเกอร์หุ่นยนต์ระดับโลก ปี 2005

ในช่วงฤดูร้อนปี 2005 ห้องโป๊กเกอร์ออนไลน์ Golden Palace ได้จัดการแข่งขันโปรโมชั่นขึ้นที่ลาสเวกัส ณ โรงแรม Binions เก่า โดยมีเงินรางวัลรวม 100,000 ดอลลาร์สหรัฐ การแข่งขันนี้ถูกขนานนามว่า "World Series of Poker Robots ปี 2005" เป็นการแข่งขันที่ใช้บอทเท่านั้น ไม่มีค่าธรรมเนียมการสมัคร ผู้พัฒนาบอทเป็นนักวิทยาศาสตร์คอมพิวเตอร์จาก 6 สัญชาติ ซึ่งเดินทางมาเข้าร่วมการแข่งขันด้วยค่าใช้จ่ายของตนเอง แพลตฟอร์มที่ใช้จัดการแข่งขันคือ Poker Academy นอกจากนี้ ในงานยังมีการสาธิตการเล่นแบบตัวต่อตัวกับ Phil Laak อีกด้วย

การทดลองมนุษย์ปะทะเครื่องจักรของมหาวิทยาลัยอัลเบอร์ตา

ในฤดูร้อนปี 2007 มหาวิทยาลัยอัลเบอร์ตาได้จัดการแข่งขันโป๊กเกอร์แบบตัวต่อตัวสุดพิเศษระหว่างมนุษย์และบอท Polaris ของพวกเขา ในงานประชุม AAAI ที่แวนคูเวอร์ รัฐบริติชโคลัมเบีย ประเทศแคนาดา แพลตฟอร์มที่ใช้ในการแข่งขันนั้นเขียนขึ้นโดยมหาวิทยาลัยอัลเบอร์ตามีเงินรางวัลสูงสุด 50,000 ดอลลาร์สหรัฐ พร้อมกฎพิเศษเพื่อกระตุ้นให้มนุษย์เล่นอย่างเต็มที่ มนุษย์ไม่ต้องเสียค่าธรรมเนียมการเข้าร่วม การแข่งขันที่ไม่เหมือนใครนี้ประกอบด้วยสี่รอบการแข่งขันแบบ Duplicate Style รอบละ 500 มือ ผลปรากฏว่ามนุษย์เป็นฝ่ายชนะด้วยคะแนนที่เฉียดฉิว

ในช่วงฤดูร้อนปี 2008 มหาวิทยาลัยอัลเบอร์ตาและเว็บไซต์สอนโป๊กเกอร์ Stoxpoker ได้จัดการแข่งขันโป๊กเกอร์รายการที่สองขึ้นระหว่างการแข่งขัน World Series of Poker ที่ลาสเวกัส การแข่งขันประกอบด้วยรอบการเล่นแบบคู่ 6 รอบ รอบละ 500 มือ และผู้เล่นที่เป็นมนุษย์ล้วนเป็นผู้เชี่ยวชาญด้าน Heads-Up Limit Polaris คว้าแชมป์ด้วยสถิติชนะ 3 ครั้ง แพ้ 2 ครั้ง และเสมอ 1 ครั้ง ผลการแข่งขันรวมถึงประวัติการเล่นแต่ละแมตช์สามารถดูได้ที่เว็บไซต์การแข่งขัน

การแข่งขัน Brains vs AI ประจำปี 2015 จัดโดย Rivers Casino, CMU และ Microsoft

ระหว่างเดือนเมษายน-พฤษภาคม 2558 บอทClaudico ของมหาวิทยาลัย Carnegie Mellon Sandholm ได้แข่งขันกับคู่ต่อสู้ที่เป็นมนุษย์ 4 คน ในการแข่งขัน Texas Hold'em แบบไม่จำกัดวงเงิน[ 22 ] [ 23 ]ในที่สุด หลังจากเล่นไป 80,000 มือ มนุษย์ก็ชนะด้วยเงินรางวัลรวม 732,713 ดอลลาร์ แต่ถึงแม้ว่ามนุษย์จะชนะในทางเทคนิค นักวิทยาศาสตร์ก็ถือว่าชัยชนะนั้นไม่มีนัยสำคัญทางสถิติ (หรือเรียกได้ว่าเสมอกันทางสถิติ) เมื่อเทียบกับเงินเดิมพันทั้งหมด 170,000,000 ดอลลาร์ (170 ล้านดอลลาร์) อย่างไรก็ตาม บางคนได้ตัดสินว่าข้ออ้างนี้ไม่จริงใจ[ 24 ]ไม่มีนัยสำคัญทางสถิติในที่นี้หมายความว่าโปรแกรมเมอร์ของ Claudico ไม่สามารถพูดได้อย่างมั่นใจ 95% (ช่วงความเชื่อมั่น 95%) ว่ามนุษย์เก่งกว่าโปรแกรมคอมพิวเตอร์ อย่างไรก็ตาม ถือเป็นชัยชนะที่มีนัยสำคัญทางสถิติในช่วงความเชื่อมั่น 90% ซึ่งหมายความว่าผู้เล่นที่เป็นมนุษย์มีโอกาสชนะอยู่ระหว่าง 10 ต่อ 1 ถึง 20 ต่อ 1 [ 24 ]

รูปแบบการแข่งขันแบ่งออกเป็นสองเซ็ต เซ็ตละสองคน โดยในแต่ละเซ็ต ผู้เล่นจะได้รับไพ่ตรงข้ามกัน หมายความว่า ถ้าคอมพิวเตอร์มี As9c (เอซโพธิ์ดำและเก้าดอกจิก) และผู้เล่นที่เป็นมนุษย์มี Jh8d ในเซ็ตหนึ่ง ผู้เล่นอีกคนในเซ็ตนั้นก็จะมี As9c เช่นกัน และต้องเจอกับ Jh8d ของคอมพิวเตอร์ อย่างไรก็ตาม แม้ว่าผู้เล่นที่เป็นมนุษย์จะชนะมากกว่าคอมพิวเตอร์ แต่ก็ไม่ใช่ว่าทุกคนจะชนะในการแข่งขันแบบตัวต่อตัว

ยอดเงินรางวัลรวมของผู้เล่นแต่ละคนมีดังนี้:

  • ดักลาส โพลค์: +213,671 ดอลลาร์สหรัฐ
  • ดง คิม: +70,491 ดอลลาร์สหรัฐ
  • บียอร์น ลี: +529,033 ดอลลาร์สหรัฐ
  • เจสัน เลส: -80,482 ดอลลาร์[ 25 ]

การแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปี

ตั้งแต่ปี 2006 ถึง 2018 การแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปีได้จัดการแข่งขันสำหรับโปรแกรมโป๊กเกอร์หลายรายการ ตั้งแต่ปี 2010 มีการเล่นโป๊กเกอร์สามประเภท ได้แก่ Heads-Up Limit Texas Hold'em, Heads-Up No-Limit Texas Hold'em และ 3-player Limit Texas Hold'em ในแต่ละรายการ จะมีการประกาศผู้ชนะสองคน ได้แก่ เอเจนต์ที่ชนะการแข่งขันมากที่สุด (Bankroll Instant Run-off) และเอเจนต์ที่ชนะเงินมากที่สุด (Total Bankroll) ผู้ชนะทั้งสองมักจะไม่ใช่เอเจนต์เดียวกัน เนื่องจาก Bankroll Instant Run-off ให้รางวัลแก่ผู้เล่นที่แข็งแกร่ง ในขณะที่ Total Bankroll ให้รางวัลแก่ผู้เล่นที่เก่งในการใช้ประโยชน์จากความผิดพลาดของเอเจนต์อื่น การแข่งขันนี้ได้รับแรงบันดาลใจจากการวิจัยทางวิทยาศาสตร์ และมีการเน้นย้ำในการตรวจสอบให้แน่ใจว่าผลลัพธ์ทั้งหมดมีความสำคัญทางสถิติโดยการเล่นโป๊กเกอร์หลายล้านมือ การแข่งขันในปี 2012 ใช้รูปแบบเดียวกัน แต่มีการเล่นมากกว่า 70 ล้านมือเพื่อขจัดปัจจัยด้านโชค

นักวิจัยบางกลุ่มได้พัฒนาแอปพลิเคชันบนเว็บที่ผู้คนสามารถเล่นและประเมินคุณภาพของ AI ได้ ดังนั้น ณ เดือนธันวาคม 2012 จึงสามารถพบกลุ่มชั้นนำและตัวแทนของนักวิจัยรายบุคคลได้ดังต่อไปนี้:

  • ไฮเปอร์โบเรียน (ทอง 9 ชิ้น เงิน 5 ชิ้น และทองสัมฤทธิ์ 3 ชิ้น)
  • บลัฟบอต (1 เหรียญทอง 3 เหรียญเงิน และ 2 เหรียญทองแดง)
  • ซาร์ตร์ (1 เหรียญทอง 5 เหรียญเงิน และ 3 เหรียญทองแดง)
  • บอทโป๊กเกอร์ Neo (1 เหรียญทอง, 5 เหรียญทองแดง)

ผลลัพธ์

2010 [ 26 ]
เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. PULPO (Marv Andersen, สหราชอาณาจักร) 2. Hyperborean-TBR (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Sartre (มหาวิทยาลัยโอ๊คแลนด์, นิวซีแลนด์)1. Rockhopper (David Lin, USA) 2. GGValuta (Mihai Ciucu, โรมาเนีย) 3. Hyperborean-IRO (University of Alberta, Canada)
เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Tartanian4-TBR (มหาวิทยาลัยคาร์เนกีเมลลอน สหรัฐอเมริกา) 2. PokerBotSLO (มหาวิทยาลัยมาริบอร์และลูบลิยานา สโลวีเนีย) 3. HyperboreanNL-TBR (มหาวิทยาลัยอัลเบอร์ตา แคนาดา)1. HyperboreanNL-IRO (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. SartreNL (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) 3. Tartanian4-IRO (มหาวิทยาลัยคาร์เนกีเมลลอน ประเทศสหรัฐอเมริกา)
เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Hyperborean3P-TBR (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย) 3. Bender (มหาวิทยาลัยเทคนิคดาร์มสตัดท์ ประเทศเยอรมนี)1. Hyperborean3P-IRO (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. dcu3pl-IRO (มหาวิทยาลัยดับลินซิตี้ ประเทศไอร์แลนด์) 3. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย)
2011 [ 27 ]

[ 28 ]

เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Calamari (Marv Andersen, สหราชอาณาจักร) 2. Sartre (มหาวิทยาลัยโอ๊คแลนด์, นิวซีแลนด์) 3. Hyperborean-2011-2p-limit-tbr (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา)1. Hyperborean-2011-2p-limit-iro (University of Alberta, Canada) 2. Slumbot (Eric Jackson, USA) 3. Calamari (Marv Andersen, UK)
เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Lucky7 (Mikrospin doo, สโลวีเนีย) 2. SartreNL (มหาวิทยาลัยโอ๊คแลนด์, นิวซีแลนด์) 3. Hyperborean-2011-2p-nolimit-tbr (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา)1. Hyperborean-2011-2p-nolimit-iro (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. SartreNL (มหาวิทยาลัยโอ๊คแลนด์ นิวซีแลนด์) 3. Hugh (สหรัฐอเมริกาและแคนาดา)
เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Sartre3p (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) 2. Hyperborean-2011-3p-limit-tbr (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 3. AAIMontybot (มหาวิทยาลัยชาร์ลส์ในกรุงปราก สาธารณรัฐเช็ก) 3. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย)1. Hyperborean-2011-3p-limit-iro (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Sartre3p (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์) 3. LittleRock (ร็อด ไบรน์ส ประเทศออสเตรเลีย)
2012
เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. สลัมบอต (เอริค แจ็คสัน, สหรัฐอเมริกา) 2. ลิตเติ้ล ร็อค (ร็อด เบิร์นส์, ออสเตรเลีย) 2. ซบอต (อิลกา ราจาลา, ฟินแลนด์)1. Slumbot (Eric Jackson, USA) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Zbot (Ilkka Rajala, ฟินแลนด์)
เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Little Rock (Rod Byrnes, ออสเตรเลีย) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Tartanian 5 (มหาวิทยาลัยคาร์เนกีเมลลอน, สหรัฐอเมริกา)1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Tartanian5 (มหาวิทยาลัยคาร์เนกีเมลลอน ประเทศสหรัฐอเมริกา) 3. Neo Poker Bot (อเล็กซานเดอร์ ลี ประเทศสเปน)
เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน) 3. Sartre (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์)1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน) 3. Sartre (มหาวิทยาลัยโอ๊คแลนด์ ประเทศนิวซีแลนด์)
2013
เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Marv (Marv Anderson, สหราชอาณาจักร) 2. Feste (François Pays, ฝรั่งเศส) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา)1. Neo Poker Bot (อเล็กซานเดอร์ ลี, สเปน) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Zbot (Ilkka Rajala, ฟินแลนด์) 3. Marv (Marv Anderson, สหราชอาณาจักร)
เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Slumbot NL (Eric Jackson, USA) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 3. Tartanian6 (มหาวิทยาลัย Carnegie Mellon, USA)1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา, แคนาดา) 2. Slumbot NL (Eric Jackson, สหรัฐอเมริกา) 3. Tartanian6 (มหาวิทยาลัย Carnegie Mellon, สหรัฐอเมริกา) 3. Nyx (มหาวิทยาลัย Charles, สาธารณรัฐเช็ก)
เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน)1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา ประเทศแคนาดา) 2. Little Rock (Rod Byrnes ประเทศออสเตรเลีย) 3. Neo Poker Bot (Alexander Lee ประเทศสเปน)
2014
เท็กซัสโฮลเด็มแบบเฮดส์อัพลิมิต
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Escabeche (Marv Andersen, สหราชอาณาจักร) 2. SmooCT (University College London, สหราชอาณาจักร) 3. Hyperborean (University of Alberta, แคนาดา) 3. Feste (Francois Pays, ฝรั่งเศส)
เฮดส์อัพ โนลิมิต เท็กซัส โฮลเด็ม
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Tartanian7 (มหาวิทยาลัยคาร์เนกีเมลลอน สหรัฐอเมริกา) 2. Nyx (มหาวิทยาลัยชาร์ลส์ สาธารณรัฐเช็ก) 2. Prelude (Unfold Poker สหรัฐอเมริกา) 2. Slumbot (Eric Jackson สหรัฐอเมริกา)1. Tartanian7 (มหาวิทยาลัยคาร์เนกีเมลลอน สหรัฐอเมริกา) 2. Prelude (Unfold Poker สหรัฐอเมริกา) 2. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. Slumbot (Eric Jackson สหรัฐอเมริกา)
เท็กซัสโฮลเด็มแบบจำกัดสูงสุด 3 ตัว
เงินทุนทั้งหมดการยุติธุรกรรมทันทีของ Bankroll
1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. SmooCT (University College London สหราชอาณาจักร) 3. KEmpfer (Technische Universität Darmstadt ประเทศเยอรมนี)1. Hyperborean (มหาวิทยาลัยอัลเบอร์ตา แคนาดา) 2. SmooCT (University College London สหราชอาณาจักร) 3. KEmpfer (Technische Universität Darmstadt ประเทศเยอรมนี)

พลูริบัส

การแข่งขันโป๊กเกอร์รอบสุดท้ายไม่ได้เปิดเผยต่อสาธารณะ เมื่อ โปรแกรม Pluribus (บอทโป๊กเกอร์)เอาชนะมืออาชีพได้อย่างต่อเนื่องในการแข่งขัน Hold'em แบบไม่มีลิมิต 6 มือ ผลลัพธ์จึงถูกประกาศอย่างเงียบๆ บนโพสต์ Facebook [ 29 ]

ดูเพิ่มเติม

  • การแข่งขันโป๊กเกอร์คอมพิวเตอร์ประจำปี (จัดครั้งล่าสุดในปี 2018)
  • บทความเรื่อง "การเขียนโปรแกรม AI สำหรับโป๊กเกอร์" เขียนโดยโปรแกรมเมอร์ผู้พัฒนา AI สำหรับการแข่งขันโป๊กเกอร์เวิลด์ซีรีส์ พฤศจิกายน 2548
  • แคโรไลน์ ฮสู. "บอทโป๊กเกอร์สามารถเอาชนะมนุษย์ได้หรือไม่?" . USnews.com. เก็บถาวรจากต้นฉบับเมื่อวันที่ 27 มีนาคม 2552
  • บทความจาก MSNBC - กันยายน 2004
  • ข่าววิทยาศาสตร์: ใบหน้าโป๊กเกอร์ขั้นสุดยอด (ลิงก์ที่เก็บถาวร) มิถุนายน 2551
  • NYTimes.com: บอทโป๊กเกอร์บุกวงการพนันออนไลน์ 13 มีนาคม 2554
  • NYTimes.com (บทความที่เก็บถาวร) “ปัญญาประดิษฐ์พิชิตโป๊กเกอร์ได้อย่างไร” 18 มกราคม 2022
  • NYTimes.com (บทความที่เก็บถาวร) “แชทบอทไม่สามารถฉลาดกว่าคุณได้ ในตอนนี้” 20 มกราคม 2023
  • CMU สร้างความสำเร็จครั้งใหญ่ในเกมเท็กซัสโฮลเอ็มบทความเกี่ยวกับกลุ่มวิจัย AI ด้านโป๊กเกอร์ของมหาวิทยาลัยคาร์เนกีเมลลอน
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Computer_poker_player&oldid=1350101927 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ นักเล่นโป๊กเกอร์คอมพิวเตอร์

โปรแกรมเล่นโป๊กเกอร์คอมพิวเตอร์คือโปรแกรมคอมพิวเตอร์ที่ออกแบบมาเพื่อเล่นเกมโป๊กเกอร์ (โดยทั่วไปคือ เวอร์ชัน เท็กซัสโฮลด์เอ็ม )...

บนอินเทอร์เน็ต

บอทหรือ โปรแกรมคอมพิวเตอร์ เหล่านี้ มักถูกใช้ใน สถานการณ์ โป๊กเกอร์ออนไลน์ ทั้งในฐานะคู่ต่อสู้ที่ถูกต้องตามกฎสำหรับผู้เล่นที่เป็นมนุษย์ หรือในฐานะรูปแบบหนึ่งของ การโกง ณ ปี 2020 การใช้โปรแกรมช่วยเหลือแบบเรียลไทม์ (RTA)...

บอทผู้เล่น

การใช้บอทผู้เล่นหรือความช่วยเหลือจากคอมพิวเตอร์ขณะเล่นโป๊กเกอร์ออนไลน์เป็นสิ่งต้องห้ามในเว็บไซต์ออนไลน์ส่วนใหญ่ หากไม่ใช่ทั้งหมด มาตรการลงโทษสำหรับการฝ่าฝืน ได้แก่ การแบนถาวรและการริบเงินรางวัล บอทประเภทหนึ่งสามารถเชื่อมต่อกับไคลเอนต์โป๊กเกอร์ (กล่าวคือ...

บอทบ้าน

“บอทของคาสิโน” อาจก่อให้เกิดผลประโยชน์ทับซ้อน ตามความหมายที่เข้มงวดที่สุด บอทของคาสิโนคือผู้เล่นอัตโนมัติที่ดำเนินการโดยห้องโป๊กเกอร์ออนไลน์นั้นเอง บอทประเภทนี้เทียบได้กับ ตัวแทนรับจ้างของ คาสิ โน แบบดั้งเดิม