กลับไปหน้าบทความ

อ่าน 4 นาที

ลีลาซีโร่

ซอฟต์แวร์ปี 2017/การเรียนรู้ของเครื่องประยุกต์/แหล่งที่มาภาษาจีน CS1 (zh)/CS1 แหล่งที่มาภาษาเกาหลี (ko)/ซอฟต์แวร์ฟรีที่ตั้งโปรแกรมใน C/ไปเครื่องยนต์/ซอฟต์แวร์ที่ใช้ GNU General Public License

Leela Zeroเป็น โปรแกรม โกะคอมพิวเตอร์แบบโอเพ่นซอร์สและฟรีที่เปิดตัว เมื่อวันที่ 25 ตุลาคม 2017 พัฒนาโดยโปรแกรมเมอร์ชาวเบลเยียมGian-Carlo Pascutto...

ลีลาซีโร่

ลีลาซีโร่
ผู้เขียนต้นฉบับจิอัน-คาร์โล ปาสคูโต
นักพัฒนาจิอัน-คาร์โล ปาสคูโต
ปล่อย25  ตุลาคม 2560 ( 25 ตุลาคม 2017 )
เวอร์ชันสุดท้าย
0.17 / 4  เมษายน 2562 (2019-04-04)
เขียนเป็นซี++
พิมพ์ซอฟต์แวร์ Go
ใบอนุญาตจีพีแอล-3.0
เว็บไซต์ศูนย์.sjeng .org
ที่เก็บข้อมูล
  • github.com/gcp/leela-zero

Leela Zeroเป็น โปรแกรม โกะคอมพิวเตอร์แบบโอเพ่นซอร์สและฟรีที่เปิดตัว เมื่อวันที่ 25 ตุลาคม 2017 พัฒนาโดยโปรแกรมเมอร์ชาวเบลเยียมGian-Carlo Pascutto [ 1 ] [ 2 ] [ 3 ] ผู้เขียนโปรแกรมหมากรุกSjengและโปรแกรมโกะ Leela [ 4 ] [ 5 ]

อัลกอริทึมของ Leela Zero อิงตามเอกสารของDeepMind ในปี 2017 เกี่ยวกับ AlphaGo Zero [ 3 ] [ 6 ] แตก ต่างจาก Leela ดั้งเดิมซึ่งมีความรู้และหลักการเชิงฮิวริสติกของมนุษย์จำนวนมากที่ถูกโปรแกรมไว้ โปรแกรมใน Leela Zero รู้เพียงกฎพื้นฐานเท่านั้น ความรู้ที่ทำให้ Leela Zero เป็นผู้เล่นที่แข็งแกร่งนั้นบรรจุอยู่ในโครงข่ายประสาทเทียมซึ่งได้รับการฝึกฝนโดยอิงจากผลลัพธ์ของเกมก่อนหน้าที่โปรแกรมเล่น[ 7 ]

Leela Zero ได้รับการฝึกฝนโดยความพยายามแบบกระจายศูนย์ ซึ่งได้รับการประสานงานที่เว็บไซต์ Leela Zero สมาชิกของชุมชนจัดหาทรัพยากรการคำนวณโดยการเรียกใช้ไคลเอนต์ ซึ่งสร้าง เกม เล่นเองและส่งไปยังเซิร์ฟเวอร์ เกมเล่นเองเหล่านี้ใช้เพื่อฝึกฝนเครือข่ายใหม่ โดยทั่วไปแล้ว มีไคลเอนต์มากกว่า 500 รายที่เชื่อมต่อกับเซิร์ฟเวอร์เพื่อร่วมบริจาคทรัพยากร[ 7 ]ชุมชนยังได้ให้การสนับสนุนโค้ดคุณภาพสูงอีกด้วย[ 7 ]

ประวัติเวอร์ชัน

Leela Zero จบอันดับสามในการแข่งขัน BerryGenomics Cup World AI Go Tournament ที่เมืองฝูโจวมณฑลฝูเจี้ยนประเทศจีน เมื่อวันที่ 28 เมษายน 2561 [ 8 ]นิตยสาร The New Yorkerในช่วงปลายปี 2561 ได้กล่าวถึง Leela และ Leela Zero ว่าเป็น "เอนจิ้นโกะโอเพนซอร์สที่ประสบความสำเร็จมากที่สุดในโลก" [ 9 ]

ในช่วงต้นปี 2018 ทีมอื่นได้แยกLeela Chess Zeroออกจากฐานรหัสเดียวกัน เพื่อตรวจสอบวิธีการใน เอกสาร AlphaZeroที่นำไปใช้กับเกมหมากรุกเช่นกัน การใช้ Google TPU ของ AlphaZero ถูกแทนที่ด้วยโครงสร้างพื้นฐานแบบ crowdsourcing และความสามารถในการใช้ GPU ของการ์ดกราฟิกผ่านไลบรารี OpenCL ถึงกระนั้น ก็คาดว่าจะต้องใช้เวลาฝึกฝนแบบ crowdsourcing เป็นเวลาหนึ่งปีเพื่อชดเชยเวลาฝึกฝนเพียงไม่กี่ชั่วโมงที่ AlphaZero ได้รับอนุญาตให้ฝึกฝนสำหรับการแข่งขันหมากรุกในเอกสาร[ 10 ]

เซิร์ฟเวอร์ฝึกอบรมแบบกระจายถูกปิดลงเมื่อวันที่ 15 กุมภาพันธ์ 2021 ซึ่งถือเป็นการสิ้นสุดโครงการ Leela Zero ขณะนี้หน้าเว็บจะนำผู้เข้าชมไปยังKataGoและ SAI [ 11 ]

ขนาดของโมเดลเพิ่มขึ้นอย่างต่อเนื่องเมื่อเวลาผ่านไป โมเดลแรกที่เผยแพร่มีชื่อแฮช d645af97 ขนาด 1x8 (1 เลเยอร์ 8 ช่อง) และเผยแพร่เมื่อ 2017-11-10 13:04 โมเดลสุดท้ายที่เผยแพร่มีชื่อแฮช 0e9ea880 ขนาด 40x256 และเผยแพร่เมื่อ 2021-02-15 09:04 [ 12 ]

เทคโนโลยี

Leela Zero เป็นการจำลองAlphaGo Zero ที่ (เกือบ) เหมือนกันทุกประการ ทั้งในกระบวนการฝึกฝนและสถาปัตยกรรม[ 13 ]

กระบวนการฝึกฝนคือการค้นหาแบบต้นไม้ด้วยวิธีมอนเตคาร์โล (Monte-Carlo Tree Search)พร้อมการเล่นด้วยตนเองซึ่งเหมือนกับ AlphaGo Zero ทุกประการ

สถาปัตยกรรมเหมือนกับ AlphaGo Zero (โดยมีข้อแตกต่างหนึ่งประการ) ลองพิจารณาโมเดลที่วางจำหน่ายล่าสุด 0e9ea880 ซึ่งมีพารามิเตอร์ 47 ล้านตัว และมีสถาปัตยกรรมดังต่อไปนี้: [ 14 ] [ 6 ]

  • ส่วนหลักของเครือข่ายรับข้อมูลเข้าเป็นเทนเซอร์ขนาด 18x19x19 ที่แสดงถึงกระดานโกะ
    • ช่องทั้ง 8 ช่องแสดงตำแหน่งของหมากของผู้เล่นปัจจุบันในช่วง 8 ช่วงเวลาที่ผ่านมา (1 ถ้ามีหมาก 0 ถ้าไม่มีหมาก ถ้าช่วงเวลาเริ่มต้นก่อนเริ่มเกม ค่าจะเป็น 0 ในทุกตำแหน่ง)
    • ช่องทั้ง 8 ช่อง คือตำแหน่งของหมากของผู้เล่นอีกฝ่ายในช่วง 8 ช่วงเวลาที่ผ่านมา
    • ช่องสัญญาณที่ 1 จะมีค่าเป็น 1 ทั้งหมดหากสีดำเคลื่อนที่ และมีค่าเป็น 0 หากไม่ใช่
    • ช่องที่ 1 จะมีค่าเป็น 1 ทั้งหมดหากสีขาวเป็นฝ่ายเคลื่อนที่ และมีค่าเป็น 0 หากไม่ใช่ (ช่องนี้ไม่มีอยู่ใน AlphaGo Zero รุ่นดั้งเดิม)
  • โครงสร้างร่างกายเป็นResNetที่ประกอบด้วยบล็อกตกค้าง 40 บล็อก และ 256 ช่องสัญญาณ
  • มีสองส่วนหลัก คือ ส่วนนโยบายและส่วนคุณค่า
    • ฟังก์ชัน Policy head จะส่งออก อาร์เรย์ logitขนาดซึ่งแสดงถึง logit ของการเคลื่อนไหว ณ จุดใดจุดหนึ่ง บวกกับ logit ของการไม่เคลื่อนไหว
    • ฟังก์ชัน `value head` จะส่งค่าตัวเลขในช่วง `-1` ซึ่งแสดงถึงคะแนนที่คาดหวังสำหรับผู้เล่นปัจจุบัน โดย `-1` หมายถึงผู้เล่นปัจจุบันแพ้ และ `+1` หมายถึงผู้เล่นปัจจุบันชนะ
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Leela_Zero&oldid=1327447098 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ลีลาซีโร่

Leela Zeroเป็น โปรแกรม โกะคอมพิวเตอร์แบบโอเพ่นซอร์สและฟรีที่เปิดตัว เมื่อวันที่ 25 ตุลาคม 2017 พัฒนาโดยโปรแกรมเมอร์ชาวเบลเยียมGian-Carlo Pascutto...

ประวัติเวอร์ชัน

Leela Zero จบอันดับสามในการแข่งขัน BerryGenomics Cup World AI Go Tournament ที่ เมืองฝูโจว มณฑล ฝูเจี้ยน ประเทศจีน เมื่อวันที่ 28 เมษายน 2561 [ 8 ] นิตยสาร The New Yorker ในช่วงปลายปี 2561 ได้กล่าวถึง Leela และ Leela Zero ว่าเป็น...

เทคโนโลยี

Leela Zero เป็นการจำลอง AlphaGo Zero ที่ (เกือบ) เหมือนกันทุกประการ ทั้งในกระบวนการฝึกฝนและสถาปัตยกรรม [ 13 ]

ลิงก์ภายนอก

เว็บไซต์อย่างเป็นทางการ Leela Zeroบน GitHub ลีล่า ซีโร่ใน ห้องสมุดของเซนเซ่ เล่นเกม Leela Zeroบน ZBaduk ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Leela_Zero&oldid=1327447098 "