อ่าน 4 นาที
ลีลาซีโร่
ซอฟต์แวร์ปี 2017/การเรียนรู้ของเครื่องประยุกต์/แหล่งที่มาภาษาจีน CS1 (zh)/CS1 แหล่งที่มาภาษาเกาหลี (ko)/ซอฟต์แวร์ฟรีที่ตั้งโปรแกรมใน C/ไปเครื่องยนต์/ซอฟต์แวร์ที่ใช้ GNU General Public License
Leela Zeroเป็น โปรแกรม โกะคอมพิวเตอร์แบบโอเพ่นซอร์สและฟรีที่เปิดตัว เมื่อวันที่ 25 ตุลาคม 2017 พัฒนาโดยโปรแกรมเมอร์ชาวเบลเยียมGian-Carlo Pascutto...
ลีลาซีโร่
| ลีลาซีโร่ | |
|---|---|
| ผู้เขียนต้นฉบับ | จิอัน-คาร์โล ปาสคูโต |
| นักพัฒนา | จิอัน-คาร์โล ปาสคูโต |
| ปล่อย | 25 ตุลาคม 2560 |
| เวอร์ชันสุดท้าย | 0.17 / 4 เมษายน 2562 |
| เขียนเป็น | ซี++ |
| พิมพ์ | ซอฟต์แวร์ Go |
| ใบอนุญาต | จีพีแอล-3.0 |
| เว็บไซต์ | ศูนย์ |
| ที่เก็บข้อมูล |
|
Leela Zeroเป็น โปรแกรม โกะคอมพิวเตอร์แบบโอเพ่นซอร์สและฟรีที่เปิดตัว เมื่อวันที่ 25 ตุลาคม 2017 พัฒนาโดยโปรแกรมเมอร์ชาวเบลเยียมGian-Carlo Pascutto [ 1 ] [ 2 ] [ 3 ] ผู้เขียนโปรแกรมหมากรุกSjengและโปรแกรมโกะ Leela [ 4 ] [ 5 ]
อัลกอริทึมของ Leela Zero อิงตามเอกสารของDeepMind ในปี 2017 เกี่ยวกับ AlphaGo Zero [ 3 ] [ 6 ] แตก ต่างจาก Leela ดั้งเดิมซึ่งมีความรู้และหลักการเชิงฮิวริสติกของมนุษย์จำนวนมากที่ถูกโปรแกรมไว้ โปรแกรมใน Leela Zero รู้เพียงกฎพื้นฐานเท่านั้น ความรู้ที่ทำให้ Leela Zero เป็นผู้เล่นที่แข็งแกร่งนั้นบรรจุอยู่ในโครงข่ายประสาทเทียมซึ่งได้รับการฝึกฝนโดยอิงจากผลลัพธ์ของเกมก่อนหน้าที่โปรแกรมเล่น[ 7 ]
Leela Zero ได้รับการฝึกฝนโดยความพยายามแบบกระจายศูนย์ ซึ่งได้รับการประสานงานที่เว็บไซต์ Leela Zero สมาชิกของชุมชนจัดหาทรัพยากรการคำนวณโดยการเรียกใช้ไคลเอนต์ ซึ่งสร้าง เกม เล่นเองและส่งไปยังเซิร์ฟเวอร์ เกมเล่นเองเหล่านี้ใช้เพื่อฝึกฝนเครือข่ายใหม่ โดยทั่วไปแล้ว มีไคลเอนต์มากกว่า 500 รายที่เชื่อมต่อกับเซิร์ฟเวอร์เพื่อร่วมบริจาคทรัพยากร[ 7 ]ชุมชนยังได้ให้การสนับสนุนโค้ดคุณภาพสูงอีกด้วย[ 7 ]
ประวัติเวอร์ชัน
Leela Zero จบอันดับสามในการแข่งขัน BerryGenomics Cup World AI Go Tournament ที่เมืองฝูโจวมณฑลฝูเจี้ยนประเทศจีน เมื่อวันที่ 28 เมษายน 2561 [ 8 ]นิตยสาร The New Yorkerในช่วงปลายปี 2561 ได้กล่าวถึง Leela และ Leela Zero ว่าเป็น "เอนจิ้นโกะโอเพนซอร์สที่ประสบความสำเร็จมากที่สุดในโลก" [ 9 ]
ในช่วงต้นปี 2018 ทีมอื่นได้แยกLeela Chess Zeroออกจากฐานรหัสเดียวกัน เพื่อตรวจสอบวิธีการใน เอกสาร AlphaZeroที่นำไปใช้กับเกมหมากรุกเช่นกัน การใช้ Google TPU ของ AlphaZero ถูกแทนที่ด้วยโครงสร้างพื้นฐานแบบ crowdsourcing และความสามารถในการใช้ GPU ของการ์ดกราฟิกผ่านไลบรารี OpenCL ถึงกระนั้น ก็คาดว่าจะต้องใช้เวลาฝึกฝนแบบ crowdsourcing เป็นเวลาหนึ่งปีเพื่อชดเชยเวลาฝึกฝนเพียงไม่กี่ชั่วโมงที่ AlphaZero ได้รับอนุญาตให้ฝึกฝนสำหรับการแข่งขันหมากรุกในเอกสาร[ 10 ]
เซิร์ฟเวอร์ฝึกอบรมแบบกระจายถูกปิดลงเมื่อวันที่ 15 กุมภาพันธ์ 2021 ซึ่งถือเป็นการสิ้นสุดโครงการ Leela Zero ขณะนี้หน้าเว็บจะนำผู้เข้าชมไปยังKataGoและ SAI [ 11 ]
ขนาดของโมเดลเพิ่มขึ้นอย่างต่อเนื่องเมื่อเวลาผ่านไป โมเดลแรกที่เผยแพร่มีชื่อแฮช d645af97 ขนาด 1x8 (1 เลเยอร์ 8 ช่อง) และเผยแพร่เมื่อ 2017-11-10 13:04 โมเดลสุดท้ายที่เผยแพร่มีชื่อแฮช 0e9ea880 ขนาด 40x256 และเผยแพร่เมื่อ 2021-02-15 09:04 [ 12 ]
เทคโนโลยี
Leela Zero เป็นการจำลองAlphaGo Zero ที่ (เกือบ) เหมือนกันทุกประการ ทั้งในกระบวนการฝึกฝนและสถาปัตยกรรม[ 13 ]
กระบวนการฝึกฝนคือการค้นหาแบบต้นไม้ด้วยวิธีมอนเตคาร์โล (Monte-Carlo Tree Search)พร้อมการเล่นด้วยตนเองซึ่งเหมือนกับ AlphaGo Zero ทุกประการ
สถาปัตยกรรมเหมือนกับ AlphaGo Zero (โดยมีข้อแตกต่างหนึ่งประการ) ลองพิจารณาโมเดลที่วางจำหน่ายล่าสุด 0e9ea880 ซึ่งมีพารามิเตอร์ 47 ล้านตัว และมีสถาปัตยกรรมดังต่อไปนี้: [ 14 ] [ 6 ]
- ส่วนหลักของเครือข่ายรับข้อมูลเข้าเป็นเทนเซอร์ขนาด 18x19x19 ที่แสดงถึงกระดานโกะ
- ช่องทั้ง 8 ช่องแสดงตำแหน่งของหมากของผู้เล่นปัจจุบันในช่วง 8 ช่วงเวลาที่ผ่านมา (1 ถ้ามีหมาก 0 ถ้าไม่มีหมาก ถ้าช่วงเวลาเริ่มต้นก่อนเริ่มเกม ค่าจะเป็น 0 ในทุกตำแหน่ง)
- ช่องทั้ง 8 ช่อง คือตำแหน่งของหมากของผู้เล่นอีกฝ่ายในช่วง 8 ช่วงเวลาที่ผ่านมา
- ช่องสัญญาณที่ 1 จะมีค่าเป็น 1 ทั้งหมดหากสีดำเคลื่อนที่ และมีค่าเป็น 0 หากไม่ใช่
- ช่องที่ 1 จะมีค่าเป็น 1 ทั้งหมดหากสีขาวเป็นฝ่ายเคลื่อนที่ และมีค่าเป็น 0 หากไม่ใช่ (ช่องนี้ไม่มีอยู่ใน AlphaGo Zero รุ่นดั้งเดิม)
- โครงสร้างร่างกายเป็นResNetที่ประกอบด้วยบล็อกตกค้าง 40 บล็อก และ 256 ช่องสัญญาณ
- มีสองส่วนหลัก คือ ส่วนนโยบายและส่วนคุณค่า
- ฟังก์ชัน Policy head จะส่งออก อาร์เรย์ logitขนาดซึ่งแสดงถึง logit ของการเคลื่อนไหว ณ จุดใดจุดหนึ่ง บวกกับ logit ของการไม่เคลื่อนไหว
- ฟังก์ชัน `value head` จะส่งค่าตัวเลขในช่วง `-1` ซึ่งแสดงถึงคะแนนที่คาดหวังสำหรับผู้เล่นปัจจุบัน โดย `-1` หมายถึงผู้เล่นปัจจุบันแพ้ และ `+1` หมายถึงผู้เล่นปัจจุบันชนะ
ลิงก์ภายนอก
- เว็บไซต์อย่างเป็นทางการ
- Leela ZeroบนGitHub
- ลีล่า ซีโร่ในห้องสมุดของเซนเซ่
- เล่นเกม Leela ZeroบนZBaduk
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ลีลาซีโร่
Leela Zeroเป็น โปรแกรม โกะคอมพิวเตอร์แบบโอเพ่นซอร์สและฟรีที่เปิดตัว เมื่อวันที่ 25 ตุลาคม 2017 พัฒนาโดยโปรแกรมเมอร์ชาวเบลเยียมGian-Carlo Pascutto...
ประวัติเวอร์ชัน
Leela Zero จบอันดับสามในการแข่งขัน BerryGenomics Cup World AI Go Tournament ที่ เมืองฝูโจว มณฑล ฝูเจี้ยน ประเทศจีน เมื่อวันที่ 28 เมษายน 2561 [ 8 ] นิตยสาร The New Yorker ในช่วงปลายปี 2561 ได้กล่าวถึง Leela และ Leela Zero ว่าเป็น...
เทคโนโลยี
Leela Zero เป็นการจำลอง AlphaGo Zero ที่ (เกือบ) เหมือนกันทุกประการ ทั้งในกระบวนการฝึกฝนและสถาปัตยกรรม [ 13 ]
ลิงก์ภายนอก
เว็บไซต์อย่างเป็นทางการ Leela Zeroบน GitHub ลีล่า ซีโร่ใน ห้องสมุดของเซนเซ่ เล่นเกม Leela Zeroบน ZBaduk ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Leela_Zero&oldid=1327447098 "