将 ScienceAI 设为星标
第一时间掌握
新鲜的 AI for Science 资讯


编辑丨%
在 AI4S 的热潮之中,大语言模型(LLMs)已经展示出了令人惊叹的文本理解与逻辑推理能力。然而,当面对科学界最核心的战场之一——材料科学与原子尺度模拟时,传统的 LLM 往往会陷入集体失语。
原因显而易见:人类的语言是线性的、一维的符号流;而原子的世界是三维空间中复杂的几何拓扑、电子云密度以及量子力学波函数的交织。来自劳伦斯伯克利实验室(Berkeley Lab)等机构的团队在《Nature Machine Intelligence》发表的 MatterChat,正试图补上这个缺口。
在文章「A multimodal large language model for materials science」中,MatterChat 把预训练的语言模型和预训练的材料模型用一个桥接模块连起来,让模型既能看懂原子结构,也能用自然语言回答材料问题。

论文链接:https://www.nature.com/articles/s42256-026-01214-y
读懂三维原子世界
论文开篇点出,传统材料 AI 要么依赖 DFT 这类高保真但昂贵的方法,要么依赖只处理文本的 LLM;问题在于,文本表示很难显式保留原子结构的三维空间关系与局域环境,因此在性质预测上往往不如图模型。
MatterChat 的思路是把材料结构转成图表示,再借助一个桥接模块把原子嵌入对齐到语言模型可接受的表示空间,从而把「材料结构—文本提问—文本回答」放进一个统一系统里。

图 1:MatterChat 概述:一款基于材料的多模态问答模块化大型语言模型。
材料加工分支
该分支将材料结构编码为捕捉原子局部环境的图表。其中的编码器在涵盖多种对称性、组成和键合类型的材料数据集上进行预训练,使其能够有效模拟复杂的原子相互作用和结构细节。
语言处理分支
该分支用于处理用户基于文本的提示,如性质预测、化学式、空间组信息或其他物质特性的请求。
桥梁模型
该模型受 BLIP2 架构启发,目的是为了促进原子嵌入与语言处理分支之间的集成。它包含 32 个可训练的查询向量,通过交替注意力机制与原子嵌入交互,可将原子嵌入细化为与文本最相关的查询嵌入。
预测、推理
用于训练桥梁模型的数据集涵盖 142,899 个物质结构,对于其中的每一个结构,都有对应的 12 项任务:3 项描述性任务(化学式、空间群和晶系)和 9 项性质预测任务。训练阶段在 8 个节点、每节点 4 张 A100 上并行进行,整体训练大约耗时 48 小时。

图 2:MatterChat 准确预测材料属性,并优于最先进的大型语言模型。
测试中,MatterChat 能有效应对从基本材料属性(例如化学式、空间群和晶体系统)到复杂材料属性(如热稳定性、带隙、地层能量和船体上方能量)等广泛需求,它能够无缝整合结构和文本数据,应用于各种材料性质任务。
推理能力方面,通过多模态查询系统,MatterChat 可以有效地将材料结构数据与文本推理结合起来。在材料分类任务上,其表现可超越 GPT-4。实验表明,多个不同规模的 LLM(包括Mistral 7B)都能与桥接模块成功融合,且桥接模块可从较小模型迁移至更大模型,降低了大型模型的应用门槛。

图 3:MatterChat 能够解决继承自预训练大语言模型的更复杂任务。
在包括金属丰度、稳定性和磁性的分类测试之中,MatterChat 始终优于所有基线。相较于 CHGNet 等专业物理模型,MatterChat 表现出更为优异的的准确性。这表明基于图的数据与自然语言推理的整合可以更全面地呈现材料化学。

图 4:MatterChat、开源大型语言模型和物理预训练模型在九个材料属性任务中的性能比较。
从属性预测到AI材料科学家
MatterChat 验证了「结构+文本」协同的巨大潜力。未来,基于多模态对话框架,它有望发展为真正的 AI 材料科学家——读取原子结构、解析物理特性、推理设计逻辑,并以自然语言与人类研究者交流。
得益于其向前兼容的桥梁模型,MatterChat 非常适合利用平行创新赛道中的那些硬核科学。相关团队正与费米实验室合作,谋求下一代高速辐射电路的开发。其通用性亦可扩展至更广泛的科学领域,如分子生物学或地球科学中需要处理三维空间结构的场景。
相关报道:https://phys.org/news/2026-05-matterchat-ai-language-atom-scale.html
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。