웰: 기계 학습을 위한 다양한 물리 시뮬레이션의 대규모 컬렉션
The Well: a Large-Scale Collection of Diverse Physics Simulations for Machine Learning
November 30, 2024
저자: Ruben Ohana, Michael McCabe, Lucas Meyer, Rudy Morel, Fruzsina J. Agocs, Miguel Beneitez, Marsha Berger, Blakesley Burkhart, Stuart B. Dalziel, Drummond B. Fielding, Daniel Fortunato, Jared A. Goldberg, Keiya Hirashima, Yan-Fei Jiang, Rich R. Kerswell, Suryanarayana Maddu, Jonah Miller, Payel Mukhopadhyay, Stefan S. Nixon, Jeff Shen, Romain Watteaux, Bruno Régaldo-Saint Blancard, François Rozet, Liam H. Parker, Miles Cranmer, Shirley Ho
cs.AI
초록
기계 학습 기반의 대리 모델은 시뮬레이션 기반 워크플로우를 가속화하는 데 연구자들에게 강력한 도구를 제공합니다. 그러나 이 공간의 표준 데이터셋이 주로 물리적 행동의 소규모 클래스를 다루기 때문에 새로운 접근 방식의 효과를 평가하는 것이 어려울 수 있습니다. 이 갭을 해결하기 위해 우리는 Well을 소개합니다. Well은 다양한 시공간 물리 시스템의 수치 시뮬레이션을 포함하는 대규모 데이터셋 컬렉션으로, 해당 분야 전문가 및 수치 소프트웨어 개발자들의 지식을 활용하여 생물학적 시스템, 유체 역학, 음향 산란, 그리고 외은 은하 체액 또는 초신성 폭발의 자석 유체 역학 시뮬레이션과 같은 다양한 도메인을 다룹니다. 이러한 데이터셋은 개별적으로 또는 보다 포괄적인 벤치마크 스위트의 일부로 활용될 수 있습니다. Well의 사용을 용이하게 하기 위해, 훈련 및 평가를 위한 통합된 PyTorch 인터페이스를 제공합니다. 이 라이브러리의 기능을 보여주기 위해 Well의 복잡한 역학이 제기하는 새로운 도전을 강조하는 예제 베이스라인을 소개합니다. 코드 및 데이터는 https://github.com/PolymathicAI/the_well에서 제공됩니다.
English
Machine learning based surrogate models offer researchers powerful tools for
accelerating simulation-based workflows. However, as standard datasets in this
space often cover small classes of physical behavior, it can be difficult to
evaluate the efficacy of new approaches. To address this gap, we introduce the
Well: a large-scale collection of datasets containing numerical simulations of
a wide variety of spatiotemporal physical systems. The Well draws from domain
experts and numerical software developers to provide 15TB of data across 16
datasets covering diverse domains such as biological systems, fluid dynamics,
acoustic scattering, as well as magneto-hydrodynamic simulations of
extra-galactic fluids or supernova explosions. These datasets can be used
individually or as part of a broader benchmark suite. To facilitate usage of
the Well, we provide a unified PyTorch interface for training and evaluating
models. We demonstrate the function of this library by introducing example
baselines that highlight the new challenges posed by the complex dynamics of
the Well. The code and data is available at
https://github.com/PolymathicAI/the_well.Summary
AI-Generated Summary