กลับไปหน้าบทความ

อ่าน 7 นาที

ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร

ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร ( MLIPs ) หรือเรียกสั้น ๆ ว่าศักยภาพการเรียนรู้ด้วยเครื่องจักร ( MLPs )...

ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร

ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร ( MLIPs ) หรือเรียกสั้น ๆ ว่าศักยภาพการเรียนรู้ด้วยเครื่องจักร ( MLPs ) คือศักยภาพระหว่างอะตอมที่สร้างขึ้นโดยใช้การเรียนรู้ของเครื่องจักร ตั้งแต่ทศวรรษ 1990 เป็นต้น มา นักวิจัยได้ใช้โปรแกรมดังกล่าวในการสร้างศักยภาพระหว่างอะตอมโดยการจับคู่โครงสร้างอะตอมกับพลังงานศักยภาพของพวกมัน ศักยภาพเหล่านี้เรียกว่าMLIPsหรือMLPs

ศักยภาพการเรียนรู้ของเครื่องจักรดังกล่าวสัญญาว่าจะเติมเต็มช่องว่างระหว่างทฤษฎีฟังก์ชันความหนาแน่นซึ่งเป็นวิธีการสร้างแบบจำลองที่มีความแม่นยำสูงแต่ต้องใช้การคำนวณอย่างมาก และศักยภาพที่ได้มาจากประสบการณ์หรือประมาณการโดยสัญชาตญาณ ซึ่งใช้การคำนวณน้อยกว่ามากแต่มีความแม่นยำน้อยกว่าอย่างมาก การพัฒนา เทคโนโลยี ปัญญาประดิษฐ์ทำให้ความแม่นยำของ MLP เพิ่มสูงขึ้นในขณะที่ลดต้นทุนการคำนวณ ทำให้บทบาทของการเรียนรู้ของเครื่องจักรในการปรับศักยภาพเพิ่มมากขึ้น[ 1 ] [ 2 ]

ศักยภาพของการเรียนรู้ของเครื่องเริ่มต้นจากการใช้เครือข่ายประสาทเทียมเพื่อจัดการกับระบบมิติที่ต่ำ แม้ว่าจะมีแนวโน้มที่ดี แต่แบบจำลองเหล่านี้ไม่สามารถอธิบายปฏิสัมพันธ์ของพลังงานระหว่างอะตอมได้อย่างเป็นระบบ สามารถนำไปใช้กับโมเลกุลขนาดเล็กในสุญญากาศ หรือโมเลกุลที่โต้ตอบกับพื้นผิวแช่แข็งได้ แต่ไม่สามารถนำไปใช้กับสิ่งอื่นได้มากนัก และแม้แต่ในการใช้งานเหล่านี้ แบบจำลองมักจะอาศัยสนามแรงหรือศักยภาพที่ได้มาจากประสบการณ์หรือจากการจำลอง[ 1 ]ดังนั้นแบบจำลองเหล่านี้จึงยังคงจำกัดอยู่เฉพาะในแวดวงวิชาการ

เครือข่ายประสาทเทียมสมัยใหม่สร้างศักยภาพที่มีความแม่นยำสูงและใช้การคำนวณน้อย เนื่องจากความเข้าใจเชิงทฤษฎีของวิทยาศาสตร์วัสดุได้รับการบูรณาการเข้ากับสถาปัตยกรรมและการประมวลผลล่วงหน้ามากขึ้นเรื่อยๆ เกือบทั้งหมดเป็นแบบโลคอล ซึ่งคำนึงถึงปฏิสัมพันธ์ทั้งหมดระหว่างอะตอมกับอะตอมข้างเคียงจนถึงรัศมีตัดขอบที่กำหนดไว้ มีแบบจำลองที่ไม่ใช่แบบโลคอลอยู่บ้าง แต่แบบจำลองเหล่านี้อยู่ในขั้นตอนการทดลองมาเกือบสิบปีแล้ว สำหรับระบบส่วนใหญ่ รัศมีตัดขอบที่เหมาะสมจะช่วยให้ได้ผลลัพธ์ที่มีความแม่นยำสูง[ 1 ] [ 3 ]

เครือข่ายประสาทเกือบทั้งหมดรับพิกัดอะตอมและส่งออกพลังงานศักยภาพ สำหรับบางเครือข่าย พิกัดอะตอมเหล่านี้จะถูกแปลงเป็นฟังก์ชันสมมาตรที่อยู่ตรงกลางอะตอม จากข้อมูลนี้ เครือข่ายประสาทอะตอมแยกต่างหากจะถูกฝึกฝนสำหรับแต่ละธาตุ เครือข่ายอะตอมแต่ละเครือข่ายจะถูกประเมินทุกครั้งที่ธาตุนั้นปรากฏในโครงสร้างที่กำหนด จากนั้นผลลัพธ์จะถูกรวมเข้าด้วยกันในตอนท้าย กระบวนการนี้ โดยเฉพาะอย่างยิ่งฟังก์ชันสมมาตรที่อยู่ตรงกลางอะตอมซึ่งสื่อถึงความไม่แปรเปลี่ยนของการเลื่อน การหมุน และการเรียงสับเปลี่ยน ได้ปรับปรุงศักยภาพการเรียนรู้ของเครื่องอย่างมากโดยการจำกัดพื้นที่การค้นหาของเครือข่ายประสาทอย่างมีนัยสำคัญ โมเดลอื่นๆ ใช้กระบวนการที่คล้ายกัน แต่เน้นพันธะมากกว่าอะตอม โดยใช้ฟังก์ชันสมมาตรคู่และฝึกฝนเครือข่ายหนึ่งเครือข่ายต่อคู่ของอะตอม[ 1 ] [ 4 ]

โมเดลอื่นๆ เรียนรู้ตัวบ่งชี้ของตัวเองแทนที่จะใช้ฟังก์ชันกำหนดสมมาตรที่กำหนดไว้ล่วงหน้า โมเดลเหล่านี้เรียกว่าโครงข่ายประสาทแบบส่งข้อความ (MPNN) ซึ่งเป็นโครงข่ายประสาทแบบกราฟ โดยมองโมเลกุลเป็น กราฟสามมิติ(โดยที่อะตอมเป็นโหนดและพันธะเป็นขอบ) โมเดลจะรับเวกเตอร์คุณลักษณะที่อธิบายอะตอมเป็นอินพุต และอัปเดตเวกเตอร์เหล่านี้ซ้ำๆ เมื่อข้อมูลเกี่ยวกับอะตอมข้างเคียงได้รับการประมวลผลผ่านฟังก์ชันข้อความและการแปลงแบบคอนโวลูชันจากนั้นเวกเตอร์คุณลักษณะเหล่านี้จะถูกนำมาใช้เพื่อทำนายศักยภาพสุดท้าย ความยืดหยุ่นของวิธีนี้มักส่งผลให้ได้โมเดลที่แข็งแกร่งและสามารถนำไปใช้ได้ทั่วไปมากขึ้น ในปี 2017 โมเดล MPNN ตัวแรก (โครงข่ายประสาทเทนเซอร์เชิงลึก) ถูกนำมาใช้ในการคำนวณคุณสมบัติของโมเลกุลอินทรีย์ขนาดเล็ก

ศักยภาพการประมาณค่าแบบเกาส์เซียน (GAP)

หนึ่งในคลาสยอดนิยมของศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักรคือศักยภาพการประมาณค่าแบบเกาส์เซียน (GAP) [ 5 ] [ 6 ] [ 7 ]ซึ่งรวมตัวอธิบายขนาดกะทัดรัดของสภาพแวดล้อมอะตอมในท้องถิ่น[ 8 ]เข้ากับการถดถอยกระบวนการเกาส์เซียน[ 9 ]เพื่อเรียนรู้พื้นผิวพลังงานศักยภาพของระบบที่กำหนดด้วยเครื่องจักร จนถึงปัจจุบัน กรอบงาน GAP ได้ถูกนำมาใช้เพื่อพัฒนา MLIP จำนวนมากสำหรับระบบต่างๆ ได้สำเร็จ รวมถึงระบบธาตุ เช่นคาร์บอน [ 10 ] [ 11 ]ซิลิคอน [ 12 ]ฟอสฟอรัส [ 13 ]และทังสเตน[ 14 ]ตลอดจนระบบหลายองค์ประกอบ เช่น Ge 2 Sb 2 Te 5 [ 15 ]และเหล็กกล้าไร้สนิม ออ เทนิติก Fe 7 Cr 2 Ni [ 16 ]

โครงข่ายประสาทกราฟแบบสมมาตร

ข้อจำกัดที่สำคัญของ MPNN ในยุคแรกคือ พวกมันไม่ได้มีความสมมาตรต่อการหมุนและการสะท้อนของโครงสร้างอะตอมโดยเนื้อแท้ ซึ่งหมายความว่าการคาดการณ์อาจเปลี่ยนแปลงไปขึ้นอยู่กับทิศทางของโมเลกุลในอวกาศ ตั้งแต่ประมาณปี 2021 โมเดลประเภทใหม่ได้แก้ไขปัญหานี้โดยการรวมความสมมาตรเข้าไว้ในเลเยอร์การส่งข้อความโดยตรงโดยใช้ฮาร์มอนิกทรงกลมและการแสดงแทนที่ไม่สามารถลดทอนได้ ตัวอย่างที่โดดเด่น ได้แก่ NequIP [ 17 ] (2021), MACE [ 18 ] (2022) และ GemNet-OC [ 19 ] (2022) สถาปัตยกรรมที่มีความสมมาตรเหล่านี้พิสูจน์แล้วว่ามีประสิทธิภาพด้านข้อมูลและความแม่นยำมากกว่ารุ่นก่อนหน้าอย่างมาก และกลายเป็นกระบวนทัศน์ที่โดดเด่นสำหรับ MLIP ที่มีความแม่นยำสูง

MLIP สากลและชุดข้อมูลขนาดใหญ่

แบบจำลอง MLIP ในยุคแรกนั้นจำเพาะเจาะจงกับระบบ โดยฝึกฝนจากโครงสร้างเพียงไม่กี่พันโครงสร้างของวัสดุชนิดเดียว การเปลี่ยนแปลงครั้งสำคัญเกิดขึ้นเมื่อมีการสร้างชุดข้อมูลขนาดใหญ่ที่มีความหลากหลายทางเคมี ทำให้สามารถสร้างแบบจำลองที่สามารถใช้งานได้ทั่วไปกับธาตุหลายชนิด สภาพแวดล้อมการเชื่อมต่อ และโดเมนการใช้งานต่างๆ ซึ่งเรียกว่าแบบจำลอง MLIP สากล

ปัจจัยสำคัญคือโครงการ Open Catalyst Project [ 20 ] (OC20 [ 21 ] , OC22 [ 22 ] ) ซึ่งเป็นการร่วมมือกันระหว่างMeta AI (FAIR) และมหาวิทยาลัย Carnegie Mellonที่เปิดตัวในปี 2020 OC20 ประกอบด้วยการผ่อนคลาย DFT ประมาณ 1.3 ล้านครั้งใน 82 ธาตุ ออกแบบมาเพื่อเร่งการค้นพบตัวเร่งปฏิกิริยาสำหรับการใช้งานพลังงานหมุนเวียน เป็นหนึ่งในชุดข้อมูลแรกๆ ที่มีขนาดใหญ่พอที่จะฝึก GNN ที่สามารถสรุปผลได้ในระบบเคมีที่หลากหลาย และได้สร้างมาตรฐานที่ใช้กันอย่างแพร่หลายในสาขานี้ ชุดข้อมูลต่อมาคือOpen Direct Air Capture (OpenDAC 2023 [ 23 ]และ OpenDAC 2025 [ 24 ] ) ได้นำแนวทางเดียวกันนี้มาใช้กับการดักจับคาร์บอน โดยจัดเตรียมฐานข้อมูลการคำนวณขนาดใหญ่ของโครงสร้างโลหะอินทรีย์และสารดูดซับที่ได้รับการประเมินสำหรับการดักจับ CO₂ ซึ่งสร้างขึ้นโดยใช้เวลาการคำนวณทางเคมีควอนตัมเกือบ 400 ล้านชั่วโมง CPU ร่วมกับGeorgia Tech

ชุดข้อมูลเหล่านี้เผยให้เห็นความท้าทายใหม่: สถาปัตยกรรม GNN ที่มีประสิทธิภาพมากที่สุดสำหรับการจำลองอะตอมนั้นใช้หน่วยความจำมาก เนื่องจากแบบจำลองเหล่านี้จำลองปฏิสัมพันธ์ลำดับสูงระหว่างอะตอมสามหรือสี่ตัว ทำให้ยากต่อการขยายขนาดแบบจำลองGraph Parallelismซึ่งแนะนำโดย Sriram et al. (ICLR 2022) [ 25 ]ได้แก้ไขปัญหานี้โดยการกระจายกราฟอินพุตเดียวไปยัง GPU หลายตัว ซึ่งเป็นกลยุทธ์ที่แตกต่างจาก Data Parallelism (ซึ่งกระจายตัวอย่างการฝึกอบรม) หรือ Model Parallelism (ซึ่งกระจายเลเยอร์) วิธีนี้ทำให้สามารถฝึกอบรม GNN ที่มีพารามิเตอร์หลายร้อยล้านถึงหลายพันล้านตัวได้เป็นครั้งแรก

จากพื้นฐานเหล่านี้ Meta FAIR ได้เปิดตัวUniversal Model for Atoms (UMA) [ 26 ]ในปี 2025 ซึ่งได้รับการฝึกฝนบนโครงสร้างอะตอม 3 มิติที่ไม่ซ้ำกันประมาณ 500 ล้านโครงสร้าง ครอบคลุมโมเลกุล วัสดุ และตัวเร่งปฏิกิริยา ซึ่งเป็นการฝึกฝนที่ใหญ่ที่สุดเท่าที่เคยมีมาสำหรับ MLIP UMA ได้นำเสนอสถาปัตยกรรม Mixture of Linear Experts (MoLE) ซึ่งช่วยให้โมเดลเดียวสามารถเรียนรู้จากชุดข้อมูลที่สร้างขึ้นโดยโค้ด DFT และการตั้งค่าที่แตกต่างกันโดยไม่ต้องมีค่าใช้จ่ายในการอนุมานมากนัก โมเดลนี้เทียบเท่าหรือเหนือกว่าโมเดลเฉพาะทางในด้านตัวเร่งปฏิกิริยา วัสดุ และเกณฑ์มาตรฐานโมเลกุลโดยไม่ต้องปรับแต่งเฉพาะงาน และได้รับการอธิบายว่าเป็นเครื่องหมายของการแบ่ง "ก่อน/หลัง UMA" ในสาขานี้

แอปพลิเคชัน

การค้นพบตัวเร่งปฏิกิริยา: MLIPs ได้เร่งความเร็วในการคัดกรองตัวเร่งปฏิกิริยาแบบไม่เป็นเนื้อเดียวกันด้วยวิธีการคำนวณอย่างมีนัยสำคัญ โดยแทนที่การผ่อนคลาย DFT ที่มีราคาแพงด้วยตัวแทนเครือข่ายประสาทเทียมที่รวดเร็ว โครงการ Open Catalyst Project มุ่งเป้าไปที่การประยุกต์ใช้ในด้านนี้โดยเฉพาะ โดยมีเป้าหมายเพื่อระบุตัวเร่งปฏิกิริยาใหม่สำหรับการผลิตไฮโดรเจนสีเขียวและปฏิกิริยาพลังงานหมุนเวียนอื่นๆ

การดักจับคาร์บอน:โครงการ OpenDAC ใช้ MLIPs สากลในการคัดกรองวัสดุดูดซับสำหรับการดักจับ CO₂ จากอากาศโดยตรง ซึ่งเป็นเทคโนโลยีสำคัญในการบรรเทาผลกระทบจากการเปลี่ยนแปลงสภาพภูมิอากาศ การคัดกรองที่เร่งความเร็วด้วย AI ช่วยให้สามารถประเมินวัสดุที่เหมาะสมได้มากกว่ากระบวนการ DFT แบบดั้งเดิมหลายเท่า

การค้นพบยาและการออกแบบโมเลกุล: MLIPs ถูกนำมาใช้มากขึ้นในการวิจัยทางเภสัชกรรมเพื่อสร้างแบบจำลองโครงสร้างโมเลกุลและพลังงานการจับตัว ชุดข้อมูล Open Molecules 2025 (OMol25) [ 27 ]ซึ่งเผยแพร่โดย Meta FAIR ในปี 2025 ให้การคำนวณที่มีความแม่นยำสูงสำหรับระบบโมเลกุลจำนวนมากเพื่อสนับสนุนกรณีการใช้งานนี้

การค้นพบวัสดุ: MLIPs สากลช่วยให้สามารถคัดกรองวัสดุอนินทรีย์ใหม่ๆ ได้อย่างรวดเร็ว รวมถึงอิเล็กโทรไลต์แบตเตอรี่ สารกึ่งตัวนำ และตัวนำยิ่งยวด โดยการประเมินความเสถียรและคุณสมบัติในพื้นที่ทางเคมีขนาดใหญ่ได้อย่างรวดเร็ว

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Machine-learned_interatomic_potential&oldid=1360158968 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร

ศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักร ( MLIPs ) หรือเรียกสั้น ๆ ว่าศักยภาพการเรียนรู้ด้วยเครื่องจักร ( MLPs )...

ศักยภาพการประมาณค่าแบบเกาส์เซียน (GAP)

หนึ่งในคลาสยอดนิยมของศักยภาพระหว่างอะตอมที่เรียนรู้ด้วยเครื่องจักรคือศักยภาพการประมาณค่าแบบเกาส์เซียน (GAP) [ 5 ] [ 6 ] [ 7 ] ซึ่งรวมตัวอธิบายขนาดกะทัดรัดของสภาพแวดล้อมอะตอมในท้องถิ่น [ 8 ] เข้ากับการถดถอย กระบวนการเกาส์เซียน [ 9 ] เพื่อเรียนรู้...

โครงข่ายประสาทกราฟแบบสมมาตร

ข้อจำกัดที่สำคัญของ MPNN ในยุคแรกคือ พวกมันไม่ได้ มีความสมมาตร ต่อการหมุนและการสะท้อนของโครงสร้างอะตอมโดยเนื้อแท้ ซึ่งหมายความว่าการคาดการณ์อาจเปลี่ยนแปลงไปขึ้นอยู่กับทิศทางของโมเลกุลในอวกาศ ตั้งแต่ประมาณปี 2021...

MLIP สากลและชุดข้อมูลขนาดใหญ่

แบบจำลอง MLIP ในยุคแรกนั้นจำเพาะเจาะจงกับระบบ โดยฝึกฝนจากโครงสร้างเพียงไม่กี่พันโครงสร้างของวัสดุชนิดเดียว การเปลี่ยนแปลงครั้งสำคัญเกิดขึ้นเมื่อมีการสร้างชุดข้อมูลขนาดใหญ่ที่มีความหลากหลายทางเคมี ทำให้สามารถสร้างแบบจำลองที่สามารถใช้งานได้ทั่วไปกับธาตุหลายชนิด...