ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร

ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร ( MLIPs ) หรือเรียกสั้น ๆ ว่าศักยภาพการเรียนรู้ด้วยเครื่องจักร ( MLPs ) คือศักยภาพระหว่างอะตอมที่สร้างขึ้นโดยใช้การเรียนรู้ของเครื่องจักร ตั้งแต่ทศวรรษ 1990 เป็นต้น มา นักวิจัยได้ใช้โปรแกรมดังกล่าวในการสร้างศักยภาพระหว่างอะตอมโดยการจับคู่โครงสร้างอะตอมกับพลังงานศักยภาพของพวกมัน ศักยภาพเหล่านี้เรียกว่าMLIPsหรือMLPs

ศักยภาพการเรียนรู้ของเครื่องจักรดังกล่าวสัญญาว่าจะเติมเต็มช่องว่างระหว่างทฤษฎีฟังก์ชันความหนาแน่นซึ่งเป็นวิธีการสร้างแบบจำลองที่มีความแม่นยำสูงแต่ต้องใช้การคำนวณอย่างมาก และศักยภาพที่ได้มาจากประสบการณ์หรือประมาณการโดยสัญชาตญาณ ซึ่งใช้การคำนวณน้อยกว่ามากแต่มีความแม่นยำน้อยกว่าอย่างมาก การพัฒนา เทคโนโลยี ปัญญาประดิษฐ์ทำให้ความแม่นยำของ MLP เพิ่มสูงขึ้นในขณะที่ลดต้นทุนการคำนวณ ทำให้บทบาทของการเรียนรู้ของเครื่องจักรในการปรับศักยภาพเพิ่มมากขึ้น^{[ 1 ]}^{[ 2 ]}

ศักยภาพของการเรียนรู้ของเครื่องเริ่มต้นจากการใช้เครือข่ายประสาทเทียมเพื่อจัดการกับระบบมิติที่ต่ำ แม้ว่าจะมีแนวโน้มที่ดี แต่แบบจำลองเหล่านี้ไม่สามารถอธิบายปฏิสัมพันธ์ของพลังงานระหว่างอะตอมได้อย่างเป็นระบบ สามารถนำไปใช้กับโมเลกุลขนาดเล็กในสุญญากาศ หรือโมเลกุลที่โต้ตอบกับพื้นผิวแช่แข็งได้ แต่ไม่สามารถนำไปใช้กับสิ่งอื่นได้มากนัก และแม้แต่ในการใช้งานเหล่านี้ แบบจำลองมักจะอาศัยสนามแรงหรือศักยภาพที่ได้มาจากประสบการณ์หรือจากการจำลอง^{[ 1 ]}ดังนั้นแบบจำลองเหล่านี้จึงยังคงจำกัดอยู่เฉพาะในแวดวงวิชาการ

เครือข่ายประสาทเทียมสมัยใหม่สร้างศักยภาพที่มีความแม่นยำสูงและใช้การคำนวณน้อย เนื่องจากความเข้าใจเชิงทฤษฎีของวิทยาศาสตร์วัสดุได้รับการบูรณาการเข้ากับสถาปัตยกรรมและการประมวลผลล่วงหน้ามากขึ้นเรื่อยๆ เกือบทั้งหมดเป็นแบบโลคอล ซึ่งคำนึงถึงปฏิสัมพันธ์ทั้งหมดระหว่างอะตอมกับอะตอมข้างเคียงจนถึงรัศมีตัดขอบที่กำหนดไว้ มีแบบจำลองที่ไม่ใช่แบบโลคอลอยู่บ้าง แต่แบบจำลองเหล่านี้อยู่ในขั้นตอนการทดลองมาเกือบสิบปีแล้ว สำหรับระบบส่วนใหญ่ รัศมีตัดขอบที่เหมาะสมจะช่วยให้ได้ผลลัพธ์ที่มีความแม่นยำสูง^{[ 1 ]}^{[ 3 ]}

เครือข่ายประสาทเกือบทั้งหมดรับพิกัดอะตอมและส่งออกพลังงานศักยภาพ สำหรับบางเครือข่าย พิกัดอะตอมเหล่านี้จะถูกแปลงเป็นฟังก์ชันสมมาตรที่อยู่ตรงกลางอะตอม จากข้อมูลนี้ เครือข่ายประสาทอะตอมแยกต่างหากจะถูกฝึกฝนสำหรับแต่ละธาตุ เครือข่ายอะตอมแต่ละเครือข่ายจะถูกประเมินทุกครั้งที่ธาตุนั้นปรากฏในโครงสร้างที่กำหนด จากนั้นผลลัพธ์จะถูกรวมเข้าด้วยกันในตอนท้าย กระบวนการนี้ โดยเฉพาะอย่างยิ่งฟังก์ชันสมมาตรที่อยู่ตรงกลางอะตอมซึ่งสื่อถึงความไม่แปรเปลี่ยนของการเลื่อน การหมุน และการเรียงสับเปลี่ยน ได้ปรับปรุงศักยภาพการเรียนรู้ของเครื่องอย่างมากโดยการจำกัดพื้นที่การค้นหาของเครือข่ายประสาทอย่างมีนัยสำคัญ โมเดลอื่นๆ ใช้กระบวนการที่คล้ายกัน แต่เน้นพันธะมากกว่าอะตอม โดยใช้ฟังก์ชันสมมาตรคู่และฝึกฝนเครือข่ายหนึ่งเครือข่ายต่อคู่ของอะตอม^{[ 1 ]}^{[ 4 ]}

โมเดลอื่นๆ เรียนรู้ตัวบ่งชี้ของตัวเองแทนที่จะใช้ฟังก์ชันกำหนดสมมาตรที่กำหนดไว้ล่วงหน้า โมเดลเหล่านี้เรียกว่าโครงข่ายประสาทแบบส่งข้อความ (MPNN) ซึ่งเป็นโครงข่ายประสาทแบบกราฟ โดยมองโมเลกุลเป็น กราฟสามมิติ(โดยที่อะตอมเป็นโหนดและพันธะเป็นขอบ) โมเดลจะรับเวกเตอร์คุณลักษณะที่อธิบายอะตอมเป็นอินพุต และอัปเดตเวกเตอร์เหล่านี้ซ้ำๆ เมื่อข้อมูลเกี่ยวกับอะตอมข้างเคียงได้รับการประมวลผลผ่านฟังก์ชันข้อความและการแปลงแบบคอนโวลูชันจากนั้นเวกเตอร์คุณลักษณะเหล่านี้จะถูกนำมาใช้เพื่อทำนายศักยภาพสุดท้าย ความยืดหยุ่นของวิธีนี้มักส่งผลให้ได้โมเดลที่แข็งแกร่งและสามารถนำไปใช้ได้ทั่วไปมากขึ้น ในปี 2017 โมเดล MPNN ตัวแรก (โครงข่ายประสาทเทนเซอร์เชิงลึก) ถูกนำมาใช้ในการคำนวณคุณสมบัติของโมเลกุลอินทรีย์ขนาดเล็ก

ศักยภาพการประมาณค่าแบบเกาส์เซียน (GAP)

หนึ่งในคลาสยอดนิยมของศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักรคือศักยภาพการประมาณค่าแบบเกาส์เซียน (GAP) ^{[ 5 ]}^{[ 6 ]}^{[ 7 ]}ซึ่งรวมตัวอธิบายขนาดกะทัดรัดของสภาพแวดล้อมอะตอมในท้องถิ่น^{[ 8 ]}เข้ากับการถดถอยกระบวนการเกาส์เซียน^{[ 9 ]}เพื่อเรียนรู้พื้นผิวพลังงานศักยภาพของระบบที่กำหนดด้วยเครื่องจักร จนถึงปัจจุบัน กรอบงาน GAP ได้ถูกนำมาใช้เพื่อพัฒนา MLIP จำนวนมากสำหรับระบบต่างๆ ได้สำเร็จ รวมถึงระบบธาตุ เช่นคาร์บอน [ ¹⁰^]^[¹¹^]ซิลิคอน [ ¹²^]ฟอสฟอรัส [ ¹³^]และทังสเตน^[¹⁴^]ตลอดจนระบบหลายองค์ประกอบ เช่น Ge ²_Sb 2 _Te 5 _[¹⁵^]^และเหล็กกล้าไร้^{สนิม ออ}^ส^เทนิติก Fe ⁷ Cr ₂_Ni [ 16 ^]

โครงข่ายประสาทกราฟแบบสมมาตร

ข้อจำกัดที่สำคัญของ MPNN ในยุคแรกคือ พวกมันไม่ได้มีความสมมาตรต่อการหมุนและการสะท้อนของโครงสร้างอะตอมโดยเนื้อแท้ ซึ่งหมายความว่าการคาดการณ์อาจเปลี่ยนแปลงไปขึ้นอยู่กับทิศทางของโมเลกุลในอวกาศ ตั้งแต่ประมาณปี 2021 โมเดลประเภทใหม่ได้แก้ไขปัญหานี้โดยการรวมความสมมาตรเข้าไว้ในเลเยอร์การส่งข้อความโดยตรงโดยใช้ฮาร์มอนิกทรงกลมและการแสดงแทนที่ไม่สามารถลดทอนได้ ตัวอย่างที่โดดเด่น ได้แก่ NequIP ^{[ 17 ]} (2021), MACE ^{[ 18 ]} (2022) และ GemNet-OC ^{[ 19 ]} (2022) สถาปัตยกรรมที่มีความสมมาตรเหล่านี้พิสูจน์แล้วว่ามีประสิทธิภาพด้านข้อมูลและความแม่นยำมากกว่ารุ่นก่อนหน้าอย่างมาก และกลายเป็นกระบวนทัศน์ที่โดดเด่นสำหรับ MLIP ที่มีความแม่นยำสูง

MLIP สากลและชุดข้อมูลขนาดใหญ่

แบบจำลอง MLIP ในยุคแรกนั้นจำเพาะเจาะจงกับระบบ โดยฝึกฝนจากโครงสร้างเพียงไม่กี่พันโครงสร้างของวัสดุชนิดเดียว การเปลี่ยนแปลงครั้งสำคัญเกิดขึ้นเมื่อมีการสร้างชุดข้อมูลขนาดใหญ่ที่มีความหลากหลายทางเคมี ทำให้สามารถสร้างแบบจำลองที่สามารถใช้งานได้ทั่วไปกับธาตุหลายชนิด สภาพแวดล้อมการเชื่อมต่อ และโดเมนการใช้งานต่างๆ ซึ่งเรียกว่าแบบจำลอง MLIP สากล

ปัจจัยสำคัญคือโครงการ Open Catalyst Project ^{[ 20 ]} (OC20 ^{[ 21 ]} , OC22 ^{[ 22 ]} ) ซึ่งเป็นการร่วมมือกันระหว่างMeta AI (FAIR) และมหาวิทยาลัย Carnegie Mellonที่เปิดตัวในปี 2020 OC20 ประกอบด้วยการผ่อนคลาย DFT ประมาณ 1.3 ล้านครั้งใน 82 ธาตุ ออกแบบมาเพื่อเร่งการค้นพบตัวเร่งปฏิกิริยาสำหรับการใช้งานพลังงานหมุนเวียน เป็นหนึ่งในชุดข้อมูลแรกๆ ที่มีขนาดใหญ่พอที่จะฝึก GNN ที่สามารถสรุปผลได้ในระบบเคมีที่หลากหลาย และได้สร้างมาตรฐานที่ใช้กันอย่างแพร่หลายในสาขานี้ ชุดข้อมูลต่อมาคือOpen Direct Air Capture (OpenDAC 2023 ^{[ 23 ]}และ OpenDAC 2025 ^{[ 24 ]} ) ได้นำแนวทางเดียวกันนี้มาใช้กับการดักจับคาร์บอน โดยจัดเตรียมฐานข้อมูลการคำนวณขนาดใหญ่ของโครงสร้างโลหะอินทรีย์และสารดูดซับที่ได้รับการประเมินสำหรับการดักจับ CO₂ ซึ่งสร้างขึ้นโดยใช้เวลาการคำนวณทางเคมีควอนตัมเกือบ 400 ล้านชั่วโมง CPU ร่วมกับGeorgia Tech

ชุดข้อมูลเหล่านี้เผยให้เห็นความท้าทายใหม่: สถาปัตยกรรม GNN ที่มีประสิทธิภาพมากที่สุดสำหรับการจำลองอะตอมนั้นใช้หน่วยความจำมาก เนื่องจากแบบจำลองเหล่านี้จำลองปฏิสัมพันธ์ลำดับสูงระหว่างอะตอมสามหรือสี่ตัว ทำให้ยากต่อการขยายขนาดแบบจำลองGraph Parallelismซึ่งแนะนำโดย Sriram et al. (ICLR 2022) ^{[ 25 ]}ได้แก้ไขปัญหานี้โดยการกระจายกราฟอินพุตเดียวไปยัง GPU หลายตัว ซึ่งเป็นกลยุทธ์ที่แตกต่างจาก Data Parallelism (ซึ่งกระจายตัวอย่างการฝึกอบรม) หรือ Model Parallelism (ซึ่งกระจายเลเยอร์) วิธีนี้ทำให้สามารถฝึกอบรม GNN ที่มีพารามิเตอร์หลายร้อยล้านถึงหลายพันล้านตัวได้เป็นครั้งแรก

จากพื้นฐานเหล่านี้ Meta FAIR ได้เปิดตัวUniversal Model for Atoms (UMA) ^{[ 26 ]}ในปี 2025 ซึ่งได้รับการฝึกฝนบนโครงสร้างอะตอม 3 มิติที่ไม่ซ้ำกันประมาณ 500 ล้านโครงสร้าง ครอบคลุมโมเลกุล วัสดุ และตัวเร่งปฏิกิริยา ซึ่งเป็นการฝึกฝนที่ใหญ่ที่สุดเท่าที่เคยมีมาสำหรับ MLIP UMA ได้นำเสนอสถาปัตยกรรม Mixture of Linear Experts (MoLE) ซึ่งช่วยให้โมเดลเดียวสามารถเรียนรู้จากชุดข้อมูลที่สร้างขึ้นโดยโค้ด DFT และการตั้งค่าที่แตกต่างกันโดยไม่ต้องมีค่าใช้จ่ายในการอนุมานมากนัก โมเดลนี้เทียบเท่าหรือเหนือกว่าโมเดลเฉพาะทางในด้านตัวเร่งปฏิกิริยา วัสดุ และเกณฑ์มาตรฐานโมเลกุลโดยไม่ต้องปรับแต่งเฉพาะงาน และได้รับการอธิบายว่าเป็นเครื่องหมายของการแบ่ง "ก่อน/หลัง UMA" ในสาขานี้

แอปพลิเคชัน

การค้นพบตัวเร่งปฏิกิริยา: MLIPs ได้เร่งความเร็วในการคัดกรองตัวเร่งปฏิกิริยาแบบไม่เป็นเนื้อเดียวกันด้วยวิธีการคำนวณอย่างมีนัยสำคัญ โดยแทนที่การผ่อนคลาย DFT ที่มีราคาแพงด้วยตัวแทนเครือข่ายประสาทเทียมที่รวดเร็ว โครงการ Open Catalyst Project มุ่งเป้าไปที่การประยุกต์ใช้ในด้านนี้โดยเฉพาะ โดยมีเป้าหมายเพื่อระบุตัวเร่งปฏิกิริยาใหม่สำหรับการผลิตไฮโดรเจนสีเขียวและปฏิกิริยาพลังงานหมุนเวียนอื่นๆ

การดักจับคาร์บอน:โครงการ OpenDAC ใช้ MLIPs สากลในการคัดกรองวัสดุดูดซับสำหรับการดักจับ CO₂ จากอากาศโดยตรง ซึ่งเป็นเทคโนโลยีสำคัญในการบรรเทาผลกระทบจากการเปลี่ยนแปลงสภาพภูมิอากาศ การคัดกรองที่เร่งความเร็วด้วย AI ช่วยให้สามารถประเมินวัสดุที่เหมาะสมได้มากกว่ากระบวนการ DFT แบบดั้งเดิมหลายเท่า

การค้นพบยาและการออกแบบโมเลกุล: MLIPs ถูกนำมาใช้มากขึ้นในการวิจัยทางเภสัชกรรมเพื่อสร้างแบบจำลองโครงสร้างโมเลกุลและพลังงานการจับตัว ชุดข้อมูล Open Molecules 2025 (OMol25) ^{[ 27 ]}ซึ่งเผยแพร่โดย Meta FAIR ในปี 2025 ให้การคำนวณที่มีความแม่นยำสูงสำหรับระบบโมเลกุลจำนวนมากเพื่อสนับสนุนกรณีการใช้งานนี้

การค้นพบวัสดุ: MLIPs สากลช่วยให้สามารถคัดกรองวัสดุอนินทรีย์ใหม่ๆ ได้อย่างรวดเร็ว รวมถึงอิเล็กโทรไลต์แบตเตอรี่ สารกึ่งตัวนำ และตัวนำยิ่งยวด โดยการประเมินความเสถียรและคุณสมบัติในพื้นที่ทางเคมีขนาดใหญ่ได้อย่างรวดเร็ว

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

10

11

12

]

]

2

15

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร

ศักยภาพการประมาณค่าแบบเกาส์เซียน (GAP)

โครงข่ายประสาทกราฟแบบสมมาตร

MLIP สากลและชุดข้อมูลขนาดใหญ่

แอปพลิเคชัน

ข้อมูลสำคัญจากบทความ