Open Materials 2024 (OMat24) Dataset en Modellen voor Anorganische Materialen
Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models
October 16, 2024
Auteurs: Luis Barroso-Luque, Muhammed Shuaibi, Xiang Fu, Brandon M. Wood, Misko Dzamba, Meng Gao, Ammar Rizvi, C. Lawrence Zitnick, Zachary W. Ulissi
cs.AI
Samenvatting
Het vermogen om nieuwe materialen met wenselijke eigenschappen te ontdekken is cruciaal voor tal van toepassingen, van het helpen bij het tegengaan van klimaatverandering tot vooruitgang in hardware voor de volgende generatie computers. AI heeft het potentieel om de ontdekking en het ontwerp van materialen te versnellen door effectiever het chemische ruimte te verkennen in vergelijking met andere computationele methoden of door middel van trial-and-error. Hoewel er aanzienlijke vooruitgang is geboekt op het gebied van AI voor materialendata, benchmarks en modellen, is er een barrière ontstaan door het gebrek aan publiekelijk beschikbare trainingsdata en open voorgeleerde modellen. Om dit aan te pakken, presenteren we een Meta FAIR-release van de Open Materials 2024 (OMat24) grootschalige open dataset en een bijbehorende set voorgeleerde modellen. OMat24 bevat meer dan 110 miljoen berekeningen met dichtheidsfunctionaaltheorie (DFT) gericht op structurele en compositorische diversiteit. Onze EquiformerV2-modellen behalen state-of-the-art prestaties op de Matbench Discovery leaderboard en zijn in staat om de grondtoestabiliteit en vormingsenergieën te voorspellen met een F1-score boven 0.9 en een nauwkeurigheid van 20 meV/atoom, respectievelijk. We onderzoeken de impact van modelgrootte, hulpobjectieven voor denoising en fijnafstemming op prestaties over een reeks datasets, waaronder OMat24, MPtraj en Alexandria. De open release van de OMat24 dataset en modellen stelt de onderzoeksgemeenschap in staat voort te bouwen op onze inspanningen en verdere vooruitgang te boeken in door AI ondersteunde materiaalwetenschap.
English
The ability to discover new materials with desirable properties is critical
for numerous applications from helping mitigate climate change to advances in
next generation computing hardware. AI has the potential to accelerate
materials discovery and design by more effectively exploring the chemical space
compared to other computational methods or by trial-and-error. While
substantial progress has been made on AI for materials data, benchmarks, and
models, a barrier that has emerged is the lack of publicly available training
data and open pre-trained models. To address this, we present a Meta FAIR
release of the Open Materials 2024 (OMat24) large-scale open dataset and an
accompanying set of pre-trained models. OMat24 contains over 110 million
density functional theory (DFT) calculations focused on structural and
compositional diversity. Our EquiformerV2 models achieve state-of-the-art
performance on the Matbench Discovery leaderboard and are capable of predicting
ground-state stability and formation energies to an F1 score above 0.9 and an
accuracy of 20 meV/atom, respectively. We explore the impact of model size,
auxiliary denoising objectives, and fine-tuning on performance across a range
of datasets including OMat24, MPtraj, and Alexandria. The open release of the
OMat24 dataset and models enables the research community to build upon our
efforts and drive further advancements in AI-assisted materials science.Summary
AI-Generated Summary