通常认为,高等数学是由微积分学,较深入的代数学、几何学以及它们之间的交叉内容所形成的一门基础学科。

VIP内容

题目

Facebook-利用神经网络求解高等数学方程, Using neural networks to solve advanced mathematics equations

关键字

深度学习,方程求解,神经网络,Facebook AI

简介

Facebook AI建立了第一个可以使用符号推理解决高级数学方程的AI系统。通过开发一种将复杂的数学表达式表示为一种语言的新方法,然后将解决方案视为序列到序列神经网络的翻译问题,我们构建了一个在解决集成问题以及首次和首次求解方面都优于传统计算系统的系统,二阶微分方程。

以前,这类问题被认为是深度学习模型无法实现的,因为求解复杂的方程式需要精度而不是近似值。神经网络擅长近似学习,例如认识到像素的特定模式很可能是狗的图像,或者一种语言的句子特征与另一种语言的句子特征匹配。解决复杂的方程式还需要具有处理符号数据的能力,例如公式b-4ac = 7中的字母。此类变量不能直接相加,相乘或相除,仅使用传统的模式匹配或统计分析,神经网络仅限于极其简单的数学问题。

我们的解决方案是一种全新的方法,可将复杂的方程式视为语言中的句子。这使我们能够在神经机器翻译(NMT),训练模型中充分利用成熟的技术,从而将问题从本质上转化为解决方案。要实施此方法,需要开发一种将现有数学表达式分解为类似于语言的语法的方法,并生成包含超过100M个配对方程式和解的大规模训练数据集。

当出现数千个看不见的表达式时(方程式不是其训练数据的一部分),我们的模型比传统的基于代数的方程式求解软件(例如Maple,Mathematica和Matlab)以更快的速度和更高的准确度运行。这项工作不仅证明了深度学习可以用于符号推理,而且还表明神经网络有潜力解决各种各样的任务,包括通常与模式识别不相关的任务。我们正在分享有关我们的方法的详细信息,以及可以帮助其他人生成相似训练集的方法。

出处

Facebook AI

成为VIP会员查看完整内容
0
26

最新论文

Two novel parallel Newton-Krylov Balancing Domain Decomposition by Constraints (BDDC) and Dual-Primal Finite Element Tearing and Interconnecting (FETI-DP) solvers are here constructed, analyzed and tested numerically for implicit time discretizations of the three-dimensional Bidomain system of equations. This model represents the most advanced mathematical description of the cardiac bioelectrical activity and it consists of a degenerate system of two non-linear reaction-diffusion partial differential equations (PDEs), coupled with a stiff system of ordinary differential equations (ODEs). A finite element discretization in space and a segregated implicit discretization in time, based on decoupling the PDEs from the ODEs, yields at each time step the solution of a non-linear algebraic system. The Jacobian linear system at each Newton iteration is solved by a Krylov method, accelerated by BDDC or FETI-DP preconditioners, both augmented with the recently introduced {\em deluxe} scaling of the dual variables. A polylogarithmic convergence rate bound is proven for the resulting parallel Bidomain solvers. Extensive numerical experiments on linux clusters up to two thousands processors confirm the theoretical estimates, showing that the proposed parallel solvers are scalable and quasi-optimal.

0
0
下载
预览
父主题
子主题
Top