分类
麻省理工学院新闻

该技术可以有效地求解偏微分方程,适用于多种应用

Thousands of tiny lights hang from the ceiling of an at least 15-story hotel-style atrium. They are seen from the ground looking up.Headshots of the five authors of the paperA black-and-white diagram of the PEDS workflow

在物理学和工程学等领域,偏微分方程 (PDE) 用于模拟复杂的物理过程,以深入了解世界上一些最复杂的物理和自然系统是如何运作的。

为了求解这些困难的方程,研究人员使用高保真数值求解器,这可能非常耗时且计算成本高昂。当前简化的替代方法,即数据驱动的代理模型,计算偏微分方程解的目标属性,而不是整个解。这些是在高保真求解器生成的一组数据上训练的,用于预测新输入的偏微分方程的输出。这是数据密集型且成本高昂的,因为复杂的物理系统需要大量的模拟才能生成足够的数据。

在去年12月发表在《自然机器智能》(Nature Machine Intelligence)上的一篇新论文“偏微分方程的物理增强深度代理”中,提出了一种新方法,用于为力学、光学、热传递、流体动力学、物理化学和气候模型等领域的复杂物理系统开发数据驱动的代理模型。

该论文由麻省理工学院应用数学教授 Steven G. Johnson 以及麻省理工学院-IBM Watson AI 实验室和 IBM 研究院的 Payel Das 和 Youssef Mroueh 共同撰写;Julia Lab 的 Chris Rackauckas;以及前麻省理工学院博士后拉斐尔·佩斯托里(Raphaël Pestourie),现就职于佐治亚理工学院。作者将他们的方法称为“物理增强深度代理”(PEDS),它将低保真度、可解释的物理模拟器与神经网络生成器相结合。神经网络生成器经过端到端训练,以匹配高保真数值求解器的输出。

“我的愿望是用系统的计算机辅助模拟和优化来取代低效的试错过程,”Pestourie 说。“人工智能的最新突破,如ChatGPT的大型语言模型,依赖于数千亿个参数,需要大量的资源来训练和评估。相比之下,PEDS对所有人都是负担得起的,因为它在计算资源方面非常高效,并且在使用它所需的基础设施方面具有非常低的门槛。

在文章中,他们表明,PEDS代理的准确度可以比数据有限(大约1,000个训练点)的前馈神经网络集合高出三倍,并将所需的训练数据减少至少100倍,以实现5%的目标误差。使用麻省理工学院设计的 Julia 编程语言开发,这种科学的机器学习方法在计算和数据方面都非常有效。

作者还报告说,PEDS提供了一种通用的、数据驱动的策略,以弥合大量简化物理模型与模拟复杂系统的相应蛮力数值求解器之间的差距。该技术提供了准确性、速度、数据效率和对过程的物理洞察力。

Pestourie说:“自2000年代以来,随着计算能力的提高,科学模型的趋势是增加参数数量以更好地拟合数据,有时以降低预测准确性为代价。PEDS通过巧妙地选择其参数来做相反的事情。它利用自动微分技术来训练神经网络,使参数很少的模型准确无误。

Pestourie说:“阻止代理模型在工程中更广泛使用的主要挑战是维度的诅咒 – 训练模型所需的数据随着模型变量的数量呈指数级增长。“PEDS通过以低保真度模型求解器的形式整合来自数据和现场知识的信息来减少这种诅咒。”

研究人员表示,PEDS有可能恢复2000年之前专门针对最小模型的整个文献 – PEDS可以使这些直观的模型更加准确,同时还可以预测替代模型的应用。

“PEDS框架的应用超出了我们在这项研究中展示的范围,”Das说。“由偏微分方程控制的复杂物理系统无处不在,从气候建模到地震建模等等。我们受物理学启发的快速且可解释的替代模型将在这些应用中发挥重要作用,并与其他新兴技术(如基础模型)发挥互补作用。

该研究得到了麻省理工学院-IBM Watson AI实验室和美国陆军研究办公室通过士兵纳米技术研究所的支持。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2024/peds-technique-could-efficiently-solve-partial-differential-equations-0108