世间物质皆由微观粒子构成,如果能将这些微观粒子性质以及粒子间的相互作用真正掌握,那么当需要组合这些不同元素粒子时,我们就可以提前预测出它可能出现的形态和性质。通过调配这些组合和组合条件,就有可能让其成为我们想要的物质。
受到AI的推动,人类在原子层面的进步正在加速。基于量子力学数据训练的AI模型已经可以将人类微观模拟的时空尺度提升数个量级。在利用计算机模拟设计新材料或新药物时,精确描述这些微观粒子间相互作用的模型,即所谓的“势能函数”,起到了极为关键的作用。目前基于机器学习训练的势能函数已经可以很好地描述许多材料和分子的相互作用,极大地提高了计算模拟的效率,使之成为材料设计、药物设计及化学化工等领域不可缺少的利器。近年来大语言模型(LLM) 的蓬勃让大家看到了人工智能与开源的力量,随着量子力学数据逐渐覆盖整个元素周期表,类比LLM的进展,我们正处在通用大原子模型出现的前夜,也愈发凸显开源开放对于推动其发展的重要作用。
近日,深度势能核心开发者团队面向DeepModeling社区正式发布“大原子模型计划(OpenLAM)”。北京科学智能研究院作为共建单位参与到该计划中。这是一项开放式的 AI for Science 领域科学计划,旨在建立开源开放的围绕微尺度大模型的生态,为微观科学研究提供新的基础设施。期待通过业内的共同推进,共同攻克复杂体系原子尺度研究的关键难题,征服整个元素周期表,从而带动材料、能源、生物制药等领域工业微尺度设计的变革。
OpenLAM计划希望未来研究人员可以一键获取任意元素组合体系的势能函数,极大地简化获取精确模型的过程,不再需要生成大量新的第一性原理计算数据,同时进一步拥有结构搜索、结构生成,以及跨尺度、跨模态等能力。作为一项开放式的协作计划,面向社区该计划将定期进行模型更新与评估报告发布、定期更新领域应用与评估工作流,同时开展比赛、培训交流,与领域开发者协作推动建立供预训练与评估的数据集等。
作为OpenLAM计划的前期探索,覆盖元素周期表70种元素的DPA-1深度势能原子间势函数预训练模型,证明了微观模拟实现“预训练+少量数据微调”的可行性。目前的DPA-2模型已覆盖元素超过90种,迁移能力大幅提高,使模型能用更少的数据达到更高的精度,并且在更多来源的大量数据上同时进行了预训练,可以帮助科研人员在众多下游任务中节省90%以上的数据计算成本。“大原子模型计划(OpenLAM)”为进一步打破数据壁垒,拓宽原子层面各方面的应用,促进开源开放的科学计算生态打开了新的思路。
“OpenLAM 大原子模型计划”是一项具有划时代意义的计划。它将打开一个全新的科学研究范式,不仅让更多科研人员可以用更低成本、更低门槛来模拟任意多种原子组合在一起后发生的效应,创造出新材料,发现新规律。同时也推动了一种新的研究模式,让全球科研人员互动,打破“课题组孤岛”,每个人都可以参与到这个宏伟的计划中,形成智慧聚力。目前“科学智能广场”已经作为“大原子模型计划”的一个重要共创和交流阵地,作为数据、模型、工作流的集散地,推动共建微观世界的基础设施。科研人员可以上传自己的数据加入OpenLAM计划模型训练中来,也可以下载平台上的预训练模型针对自己的体系进行微调优化部署、使用具体场景中的自动化工作流,加速解决科研场景中的具体问题。同时可共享数据、模型,进行成果展示,通过首页看板直观感受到自己的贡献价值,也可看到目前共建的成果。科研人员通过参与平台上的项目或竞赛,与其他优秀的科研人员合作或竞争,提升个人影响力,甚至可以牵头发起共创项目。
科学研究是人类探索自然规律的重要途径,虽然在不同学科领域之间有极大的差异,但在科研过程中仍然存在很多共性。构筑AI for Science 时代的科研基础设施,向“平台科研”模式转变,为解决这些共性问题提供了土壤,可以在很大程度上减少重复建设、降低研究成本,提高效率,全面赋能整个科学研究。预期“大原子模型计划”将实现面向研究目标的原子尺度通用生成与规划能力,未来结合实验表征和知识库等基础设施,以期实现原子尺度智能化合成设计,推动走向科学发现的“大原子具身智能”。同时该计划的实施,预计将带动一批AI for Science模型与算法的基础设施建设,加快一批工业软件与应用的落地,促进一批跨学科的协同创新。
在征服元素周期表的路上,期待与你携手共创,共同走向AI for Science的新未来!
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。