麻省理工Nature子刊:AI加速量子化学计算,精度媲美「金标准」,计算效率提升百万倍! | 机器之心

Image 30: 机器之心

报道

人工智能数字化转型汽车科技Image 31: beta交叉前沿Image 32: beta

专栏心思Image 33: new学堂

年度榜单2023

年度榜单

年度榜单 2023年度榜单 2022年度榜单 2021年度榜单 2020年度榜单 2019年度榜单 2018年度榜单 2017

A100 系列

A100 数智中国A100 Data Intelligence

A100 Original

活动SOTA模型

数据库Image 34: iconPRO会员通讯

登录EN

Image 35Auto Byte

专注未来出行及智能汽车科技

Image 36微信扫一扫获取更多资讯

Image 37Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

Image 38微信扫一扫获取更多资讯

Image 39: ScienceAI

ScienceAI原创

2025/01/10 14:15

麻省理工Nature子刊:AI加速量子化学计算,精度媲美「金标准」,计算效率提升百万倍!

Image 40: 图片

编辑 | 2049

在量子化学计算中,精确预测分子电子结构一直是一个重要而富有挑战性的课题。

传统的密度泛函理论(DFT)方法虽然计算速度快,但精度有限;而高精度的耦合簇(CCSD(T))方法虽然被视为「金标准」,但其计算成本随分子大小呈指数级增长,难以应用于复杂体系。

最近,麻省理工学院的研究团队开发出一种创新的多任务学习方法,成功将机器学习与量子化学计算相结合,实现了接近CCSD(T)精度的分子电子结构预测。

该研究以「Approaching coupled-cluster accuracy for molecular electronic structures with multi-task learning」为题,于 2024 年 12 月 27 日发布在《Nature Computational Science》。

Image 41: 图片

研究背景

在现代计算化学领域,预测分子电子结构的主流方法是密度泛函理论。作为一种平均场理论,DFT 的系统误差通常是化学精度(1 kcal/mol)的数倍。

近年来,机器学习方法被广泛应用于提高 DFT 计算的精度,但由于这些模型都是基于 DFT 数据训练的,其精度始终无法超越 DFT 本身的理论极限。

另一方面,基于耦合簇理论的 CCSD(T)方法虽然能提供极高的计算精度,但其计算复杂度随电子数的增长呈现 N⁷ 级别的标度,这导致它只能处理包含数百个电子的小分子体系。

研究团队敏锐地发现,如果能将机器学习与 CCSD(T)方法有机结合,可能突破这一技术瓶颈。

MEHnet:融合物理洞察的深度学习框架

研究团队开发的多任务电子哈密顿网络(Multi-task Electronic Hamiltonian Network, MEHnet)采用了独特的物理启发式设计。

该方法首先使用 DFT 获得初始的平均场哈密顿量,作为快速但精度较低的起点。然后通过神经网络预测非局域交换关联修正项,这一修正项能捕捉到电子间的量子关联效应,最终得到接近 CCSD(T)精度的有效单体哈密顿量。

MEHnet 的核心创新在于其多任务学习策略。不同于传统方法仅关注分子能量的预测,MEHnet 同时预测多个物理量,包括偶极矩、四极矩、原子电荷和键级等。这些物理量都源于同一个电子结构表示,通过多任务学习可以相互促进,提高模型的泛化能力。

在技术实现上,MEHnet 采用了 E3-等变神经网络框架(E3-equivariant Neural Network),确保预测结果满足物理系统的旋转不变性。

如图 1 所示,整个计算流程包括输入层、卷积层和输出层三个主要部分。输入层将原子构型编码为图结构;卷积层通过 E3-等变神经网络提取特征;输出层则产生多个量子化学性质的预测值。

Image 42: 图片

图 1:MEHnet 的计算流程示意图。(来源:论文)

性能评估与实验验证

研究团队在碳氢化合物数据集上对 MEHnet 进行了全面评估。实验设计包括两个维度:

一是通过改变训练集大小(从 10 到 7,440 个原子构型)评估模型的学习效率和泛化能力;

二是与主流的 DFT 方法和机器学习模型进行性能对比。评估指标包括能量预测误差、偶极矩、四极矩、原子电荷等多个物理量的均方根误差。

实验结果表明,MEHnet 在计算效率和预测精度两个方面都实现了突破性进展。

如图 2 所示,MEHnet 的计算成本随分子大小呈近似线性增长(~N¹),而 CCSD(T)方法在理论上渐近标度为 N⁷,计算效率提升约百万倍。

在预测精度方面,对于能量预测,MEHnet 实现了约 0.1 kcal/mol 每原子的误差水平,接近化学精度;对于其他物理量的预测,也普遍优于 B3LYP  等广泛使用的混合泛函方法。

Image 43: 图片

图 2:测试数据集上的模型性能基准。(来源:论文)

结语

MEHnet 的创新在于其能够以 CCSD(T)级别的精度预测分子电子结构,同时保持 DFT 级别的计算效率。通过多任务学习和 E3-等变神经网络的结合,MEHnet 展示了机器学习在复杂系统电子结构预测中的巨大潜力。

这一研究不仅解决了当前量子化学计算中的关键瓶颈,还为未来的跨学科研究提供了新的思路和方法。

论文链接:https://www.nature.com/articles/s43588-024-00747-9

产业

推荐文章

Image 44: 比量子化学方法快六个数量级,一种基于绝热状态的绝热人工神经网络方法,可加速对偶氮苯衍生物及此类分子的模拟比量子化学方法快六个数量级,一种基于绝热状态的绝热人工神经网络方法,可加速对偶氮苯衍生物及此类分子的模拟

Image 45: ScienceAIScienceAI

Image 46: 可对药物分子进行表征的几何深度学习可对药物分子进行表征的几何深度学习

Image 47: ScienceAIScienceAI

Image 48: 训练数据减少多达三个数量级,等变图神经网络在长时间尺度上进行高保真分子动力学模拟训练数据减少多达三个数量级,等变图神经网络在长时间尺度上进行高保真分子动力学模拟

Image 49: ScienceAIScienceAI1

登录后评论

Image 50: 暂无评论

暂无评论~

返回顶部

Image 51

关于我们服务条款

全球人工智能信息服务

友情链接:Synced Global机器之心 Medium 博客PaperWeekly动脉网艾耕科技

Image 52: 机器之心微信公众平台

©2025 机器之心(北京)科技有限公司     京ICP备2021005318号-1

Image 53

Image 54识别二维码,立即订阅智能战疫日报

众智成城,共克时艰

加入「智能战疫联合行动」

您/贵司在疫情中面临哪些困难与诉求

您/贵司在疫情中可为其他企业提供哪类帮助

您/贵司有哪些抗疫动作或故事希望与大家分享

您/贵司希望如何参与抗疫行动

前往填写