lch
发布于 2026-05-27 / 0 阅读
0

AI离爱因斯坦还有多远?诺奖得主Demis Hassabis谈AI时代的科学终极追问


将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯


编辑丨coisini

在科学智能(AI for Science)领域,提到技术领军人物,你会想起谁?Google DeepMind 创始人兼首席执行官、诺贝尔化学奖得主 Demis Hassabis 无疑是首选之一。

近期,在国际知名学术期刊《Dædalus》上,谷歌母公司 Alphabet 的高级副总裁 James M. Manyika 采访了数十位人工智能科学家,深入探讨了一个问题:「在人工智能的新时代,科学发现的未来是什么? 」Demis Hassabis 就是其中之一。

在采访中,Hassabis 围绕现实的本质、AI 的边界以及科学的奥秘展开了一场极具前瞻性的观点分享,包括提出大胆猜想:「信息可能是物理学中最基本的单位,比物质和能量更为根本,是理解宇宙真实本质的最佳途径」。他还针对「真正的通用人工智能还需跨越哪些关键障碍」给出了独到而具体的见解。

ScienceAI 对《Dædalus》上 Manyika 采访 Hassabis 的内容进行了不改变原意的编译、整理,内容如下。

Manyika科学对你而言为何重要?

Hassabis:我始终被深入理解周遭世界的强烈渴望所驱动。科学方法堪称人类为推进知识进步所创造的最重要思想。对我而言,置身知识的最前沿,拓展边界,首次发现全新事物 —— 再无更令人振奋之事,这正是科学的极致魅力。

Manyika你为何视自己为科学家?你是如何踏上科学家之路的?

Hassabis:如今我认为自己首先是一名科学家。但最初在剑桥大学攻读计算机科学本科、为游戏编写 AI 程序时,我曾自视为工程师。后来,随着我追随对大脑研究的长期兴趣,开始研究认知神经科学,并在博士阶段专注于记忆与想象力的研究,我意识到自己最擅长以科学家的方式工作:提出关于世界的假说,并设计实验加以验证或证伪。

但我也非常务实,关注现实世界的影响力 —— 这正是我脑中工程师的那一半仍在发挥作用。我不会沉溺于理论争论,而是倾向于务实的一面 —— 思考如何构建工具或设计实验来验证假设。AlphaGo 和 AlphaFold 就是很好的例子。

Manyika哪些科学成就最令你受启发?

Hassabis:我非常钦佩文艺复兴和古希腊时期的博学家,比如亚里士多德、达・芬奇这样的巨匠,因为他们不认为学科之间存在界限。我热爱这一点,因为它让人能够发现看似迥异领域之间的联系。我相信,未来十年到二十年里,最重大的进展将来自这些交叉地带,而人工智能将通过发现不同领域之间的共性或交汇点来助一臂之力。

同样启发我的,还有那些巨大的想象力和直觉飞跃 —— 借由时间的棱镜回望,它们仿佛是凭空而来。爱因斯坦、牛顿、玻尔、拉马努金、费曼是我最钟爱的几位 —— 这些科学家和数学家的头脑中融合了各种思想、专长和兴趣,然后对世界的运作方式做出直觉性的跨越。

Manyika在你看来,我们尚未解决的最重要的科学问题有哪些?

Hassabis:我之所以进入科学和人工智能领域,是因为从小我就痴迷于 —— 甚至可以说被那些关于现实本质和意识的终极问题所困扰,这些问题支撑着我们对世界的理解。什么是时间?什么是引力?它如何与量子世界相协调?令人惊讶的是,过去五十多年里,其中一些根本性问题进展甚微,部分原因在于它们过于复杂。

我一直认为,人工智能有潜力成为推动知识前沿的终极工具。无论是通过处理数据,还是协助我们提出新的猜想,我相信 AI 能帮助我们攻克这些根本性问题。

Manyika你如何将这些关于现实本质的问题,与计算方法的理解方式联系起来?

Hassabis:我一直对这个问题深感兴趣:什么是经典计算机或图灵机可以建模的,什么是无法建模的,而答案又能告诉我们关于现实本质的什么信息。自然界中的大多数事物都具有稳定的结构,这些结构随时间演化并存续下来 —— 细胞的行为、山脉的形状,甚至行星的轨道。这意味着应该存在某种模式或过程,是神经网络可能学习得到的。像 AlphaFold 这样的人工智能系统已经向我们展示,我们能用经典计算机建模远比过去想象的更复杂的系统。

也许在极限情况下,大多数自然系统都可以被经典系统模拟或学习 —— 某种程度上是逆向工程。这将支持我的一个猜想:信息是物理学中最基本的单位,比物质和能量更为根本,是理解宇宙真实本质的最佳途径。

Manyika你认为信息为何可能是理解现实的最基础层面?如果是这样,计算性的信息理解方法如何帮助我们回答那些根本性问题?

Hassabis:传统上,物理学中能量和物质被视为第一性。我们可以观察和测量它们。随后克劳德・香农、艾伦・图灵、约翰・冯・诺依曼 —— 计算机科学的奠基者们 —— 引入了信息熵、信息的度量、互信息以及其他重要的相关概念。但他们的工作晚于物理学家,因此他们试图将信息论纳入物理学的现有框架。也许顺序应该反过来,物理学应该以信息为框架来构建。

这个概念当然也与图灵机相关,即什么样的问题可以在经典系统上可计算。物理学家假设宇宙是一个量子系统,而经典系统由于量子系统的巨大复杂性而无法对其建模。但如果事实证明,自然界中更多的物理过程实际上能够被经典系统精确建模,那对我们理解物理学可能会产生重要的启示。

归根结底,我对现实的本质最感兴趣,并且质疑我们目前对量子系统的理解是否就是全部。我怀疑我们最终可能会为所见的现象找到一个更简单的底层描述,而该描述更易于被经典系统建模。如果我们把世界看作一个可计算的宇宙,就更有可能发现这一点。

Manyika再进一步说。如果采用信息或可计算性的视角看世界,我们是否会遇到一些难题,比如柯尔莫哥洛夫复杂性、P 是否等于 NP(即问题是否能在可行时间内求解)、或者图灵机中的停机问题?这些是否会潜在上限制我们在计算方法上能走多远?

Hassabis:确实会,而我认为这些正是值得检验和理解的有趣边界。P 是否等于 NP—— 它试图通过求解和验证一个解分别需要多少计算量来对问题的难度进行分类 —— 是科学中最重要的问题之一。我猜测 P 不等于 NP,有些问题如果不借助比如量子计算机的帮助,实际上无法在可行的时间内求解。但我们需要更深入地理解这一点,因为它可能比我们过去意识到的更加微妙。在 AlphaGo 和 AlphaFold 的工作中,我们证明了如果进行大量的预计算,你似乎可以在多项式时间内以近似最优的方式回答一些极其复杂的问题。神经网络实质上是在利用海量的预计算,将知识压缩成某种高效的工件。这个计算得出的工件在测试时可用,对于许多自然系统而言,你可以用它来缩小搜索空间,从而不必考虑所有可能的构型,而只需关注那些实际可行的远小子集。

以蛋白质为例,一个普通蛋白质大约有 10^300 种可能的构象。如果穷举所有可能来找出它实际折叠成的特定形状,所需时间比宇宙的年龄还要长。因此你必须采取更巧妙的方法 —— 你需要学习氨基酸序列存在哪些模式,然后只搜索极小一部分可能性,以找到近似正确的解。这似乎正是我们在 AlphaFold 中所做到的。也许并非完美,但至少达到了足以用于实际目的的近似精度。

类似地,围棋棋局中大约有 10^170 种可能的局面;仅凭简单的启发式搜索和纯粹的蛮力计算,根本无法找到某一局面的最优落子。而 AlphaGo 的做法是:学习一个关于合理围棋落子的优秀模型,从而只需考虑最有价值的那几条行棋路径,然后从这个大大缩减的选项集合中,找出最可能导向胜局的最佳落子。

在成功驾驭这些巨大搜索空间的过程中,有一些非常有趣的现象正在发生。我的直觉是,其意义相当深远。由于我们在人工智能领域所看到的进展,我们得以近距离观察这些根本性问题 —— 不仅来自 AlphaGo、AlphaFold 以及我们的科学项目,也来自像 Veo 3 这样的视频模型。它们仅仅通过观看几十亿个视频,就能对现实的某些方面进行建模。它们能够逆向推导出某种直觉物理学的规律:液体如何流动、玻璃中的反射、物体投射的阴影 —— 这看起来相当惊人。

所有这些都在告诉我们关于物理学底层本质的某些信息,包括图灵机的极限在哪里,在哪些情况下又需要借助量子系统,进而也告诉我们关于现实本质本身的一些东西。人工智能对所有这些问题的研究都具有深远意义。

ManyikaAlphaFold 似乎很好地印证了你所说的 —— 自然界具有能够被神经网络建模或学习的结构。请谈谈在 AlphaFold 这个案例中你们是如何做到的。

Hassabis:AlphaFold 是我们针对蛋白质折叠(即蛋白质结构预测)问题提出的解决方案。从一个氨基酸序列出发 —— 可以粗略地将其理解为蛋白质的基因序列,也就是一维的字母串。在体内或自然界中,这串字母会折叠成一个三维结构,而该结构在很大程度上决定了该蛋白质的功能,这对于药物研发和疾病理解至关重要。

预测这些结构是生物学领域一个长达五十年的重大挑战。我们最终用 AlphaFold 解决了它 —— 至少达到了原子级别的精度,这也是实验人员认为有用的精度水平。

我们的做法是:过去三十到四十年间,结构生物学家们利用电子显微镜等非常昂贵的设备,辛勤地解析出了大约 15 万个已知结构。这些数据恰好足以为我们的人工智能系统提供关于蛋白质拓扑结构的线索。当然,蛋白质并非随机折叠,而是存在某些约束条件,AI 系统学习到了这些规律。最终它能够在几秒钟内,针对一个从未见过的蛋白质给出一个合理的预测结构。随后,在一年时间里,我们折叠了科学界已知的所有两亿个蛋白质,并与我们在欧洲生物信息学研究所的同事合作,将它们免费开放在一个庞大的数据库中,供全球研究人员使用。

Manyika当然,你们已经将其扩展到了 AlphaFold 3,并涉及实际的蛋白质相互作用。下一个目标会是细胞吗?

Hassabis:AlphaFold 2 本质上预测的是蛋白质的静态快照结构。但我们知道生物学是一个动态系统,我们需要理解蛋白质之间的相互作用,以及它们如何改变自身的形态和行为。

AlphaFold 3 是我们迈出的下一步。我们现在可以预测蛋白质与蛋白质、蛋白质与配体、蛋白质与 RNA、蛋白质与 DNA 之间的所有成对相互作用。基本上,所有生命分子及其成对相互作用都可以用 AlphaFold 3 来建模。

但要扩展到整个细胞,我们还需要做得更好。因为存在级联的相互作用,涉及不止两个生物分子,显然极其复杂。下一阶段可能是对一个通路进行建模,然后可能是一个简单的细胞,比如酵母细胞 —— 它本身就是一个完整的生物体。如果成功了,也许我们可以模拟来自更复杂生物体的某个细胞器,最终模拟整个生物体。

这个梦想我已经怀揣了二十多年。其构想是:建立一个足够真实的细胞模拟系统,使得在计算机上进行的实验(in silico)可能比湿实验室快若干个数量级。这样,实验室就留给验证步骤和结果的确证,而不是用于探索阶段。一个虚拟细胞不仅对基础生物学,对药物研发也是难以置信的巨大福音。

Manyika你也涉足了科学中的其他领域 —— 物理、化学、天气、气候系统等。这些领域的共同特征是否在于它们都是自然系统,因此天然适合被学习?

Hassabis:在判断一个问题是否适合用我们当前的人工智能技术来解决时,我们会考察三个方面。第一,该问题能否被描述或转化为一个巨大的组合空间的描述?可能这个空间大得难以处理,常规的蛮力方法行不通。第二,如果确实如此,你是否有足够的数据来学习该空间拓扑结构的某种模型?或者是否存在或可学习一个模拟器,能够生成一些额外的合成数据?理想情况下,两者兼备。第三,你需要一个明确的目标 —— 最小化或最大化某个量。在游戏中,那就是赢棋或最大化得分。在自然系统中,可能是最小化该系统的自由能。如果你能量化这个目标,就可以利用模型在目标函数的引导下搜索最优解。事实证明,很多问题都符合这一描述。

除此之外,我们还会寻找那些一旦解决就能产生巨大影响的问题。如果把整个知识体系想象成一棵树,那么存在一些根节点式的问题 —— 一旦解决了它们,就会解锁全新的研究分支。蛋白质折叠无疑是其中之一,它为药物研发和疾病理解开启了新的机遇。无论是聚变能源、天气系统、材料设计,还是基础数学 —— 我们尝试解决的所有问题都具备这些特征。

Manyika再多谈谈数学。并非直观上就能认为所有数学都具有结构 —— 至少不是我们能理解的那种结构。素数的分布或许是一个很好的例子。

Hassabis:关于数字中到底存在多少结构,这仍然是一个悬而未决的问题。我猜结构相当丰富,因为数学正是为了描述现实世界而发展起来的,而现实世界确实具有结构,数学似乎也能非常好地完成这一任务。

有些卓越的数学家,比如斯里尼瓦瑟・拉马努金(Srinivasa Ramanujan),他极具直觉,常常不经过所有中间步骤就直接得出惊人的结论,以至于他觉得这些想象力的飞跃是受到了神启。我们称之为隐性知识或直觉,因为我们无法有意识地获取它,也无法用结构化的方式明确解释它。

但直觉并非魔法 —— 它只是我们用来描述大脑通过经验获得的隐性知识的词语。在某些领域非常擅长的人,比如音乐家,拥有极其高效且高度抽象的隐性知识版本。即便如此,背后依然存在一个过程,我认为在极限情况下,这个过程是可以被人工智能系统建模的。

我们正在将人工智能应用于数学,并且已经初步看到了可被建模的迹象。我们最新的 Gemini 模型 Deep Think 在国际数学奥林匹克竞赛中达到了金牌级别的水平 —— 这是面向全球顶尖高中生的一项极具难度的数学挑战。该模型接收一个自然语言描述的问题,将其转换为形式化的数学语言,然后通过迭代方式求解:执行一系列数学运算,直到得出一个可验证的正确证明。

但这与理解数字中是否存在模式或数学中是否存在结构是截然不同的。后者需要另一种类型的系统。我认为两者都很有趣 —— 人工智能既能解决数学猜想,也能发现数学中更深层的模式 —— 而且两者可能都是可行的。

Manyika在你看来,当前的人工智能系统在从事科学研究方面存在哪些空白和局限?你认为需要哪些新的突破?

Hassabis:缺失的一点 —— 也是我认为当今系统尚未接近通用人工智能的原因之一 —— 是它们不具备真正的创造力。我所说的创造力是指:一个人工智能系统不仅能解决一个难题,而且能真正提出一个优美且有意义的猜想,比如千禧年大奖难题或黎曼猜想。我认为这要困难得多。提出正确的问题是科学中最难的部分。哪个假设值得探索、值得为此做科学研究?我们尚未完全理解这种层次的创造力在人类专家中是如何运作的,而我们的人工智能系统当然也还不具备这种能力。

当前人工智能系统缺失的另一个特征是一致性。一方面,这些系统能解决非常复杂的奥数难题;另一方面,如果你把问题的表述方式稍作改变,系统就可能在初等数学上犯错。人类数学家不会这样 —— 他们会在整个领域内保持能力的一致性。

Manyika通用人工智能这个概念对你来说意味着什么?

Hassabis:我一直将通用人工智能定义为一个能够展现人类心智所具备的所有认知能力的系统。这是一个关键的参照点,因为人脑是目前已知唯一一个证明通用智能确实存在的实例。人脑具有极强的通用性和适应性 —— 令人惊叹的是,我们的大脑是为狩猎采集而进化出来的,但我们却能发明科学方法,建造出从望远镜、喷气机到计算机的现代文明奇迹。历史上伟大的艺术家、科学家和哲学家的才智,都源于这个同样非凡的大脑结构。在我看来,直到我们能够完全匹配大脑结构所能做到的一切,我们才能真正确信自己构建了一个完全的通用系统。

从理论角度看,这个定义与图灵机的概念密切相关。艾伦・图灵曾提出著名猜想:给定无限的时间和内存,图灵机可以计算任何算法。人脑可以被视为图灵机的一种生物学近似,这意味着从理论上讲,它可以学习任何可计算的东西。然而,与任何有限系统一样,由于时间、内存和信息总是有限的,必然存在一定程度的专门化。没有哪个实用系统能同时针对所有可能的任务进行优化 —— 我们无法规避「没有免费午餐」定理。但关键在于,人脑具有学习几乎任何事物的潜能,尤其是当我们能够设计和建造工具与机器来帮助我们获取知识时。

任何候选的通用人工智能系统都应该具备全面的一致性,能够覆盖人类能力的惊人广度 —— 包括能够实现真正直觉性的发现飞跃,提出有价值的新颖假说或猜想。这可以通过以下方式测试:训练一个知识截止于 1910 年的人工智能系统,看看它是否能像爱因斯坦在 1915 年那样提出广义相对论。就目前而言,答案显然是不能。

基础模型如今能做到的事情已经极其令人印象深刻,而且在我看来,毫无疑问它们最终将成为任何未来通用人工智能系统的骨干。仅靠进一步扩展现有模型是否就足以达到通用人工智能,这是一个有待实证检验的开放性问题。如果我们仍然需要少量类似于 Transformer 或深度强化学习级别的突破,我也不会感到惊讶。因此,在 Google DeepMind,我们继续不懈地同时推进规模扩展与创新前沿。

Manyika在评估我们是否实现了通用人工智能时,一方面可以使用一系列测试,另一方面也许会出现某种直觉性的飞跃或火花 —— 就像第 37 手那样(AlphaGo 那次走出了超越人类策略和直觉、极不可能的一手,最终战胜了世界围棋冠军李世石)—— 然后我们会说:「啊,我觉得我们做到了!」是需要两者兼备,还是其中之一即可?

Hassabis:我认为两者都需要。这是人类历史上极其重要的时刻,我们应该以真正科学和审慎的态度来确认。应该出现相当多显而易见的发明或创造实例 —— 比如有新的物理学被发明出来,或者提出了被数学家们认为极具意义的猜想。不仅仅是像 AlphaGo 那样在围棋中想出一个出色的新策略,而是能否发明出像围棋一样精妙的游戏?我希望至少看到多个这样的实例,才能让它成为一个候选者。

然后,我认为我们应该采用穷尽式的科学方法,确保系统不存在任何缺陷或漏洞。当今的大语言模型就是一个例子。普通人很容易就能找出它们做不到的事情。例如,它们甚至无法达到业余水平的国际象棋对弈,也无法学习新游戏,而且它们不具备持续学习的能力。在推理、记忆和一致性方面也都有问题。要能通过我刚才提议的那种测试,所有这些都需要被解决。

Manyika在科学发现方面,科学家应该如何看待人工智能?人工智能是一种工具、一个合作者,还是完全不同的某种存在?当未来我们拥有这些能力更强的系统时,你如何想象科学家的角色?

Hassabis:在未来十年左右的时间里,我们应该将人工智能视为一种帮助科学家的神奇工具 —— 无论是数值计算、模式匹配,还是某种低层次的编码或工程工作。以这些方式使用,我认为它将成为推动科学和医学进步的终极工具,并将引领一个新的科学发现黄金时代。猜想和假设将来自人类专家,然后专家使用这些工具,使工作效率大大提高 —— 可能提高十倍甚至一百倍。在那之后的时间框架内,也许这些系统会变得更像合作者。

Manyika对你而言,负责任地在科学中使用人工智能意味着什么?

Hassabis:意味着遵循科学方法,对测试和系统相关的主张极其严谨和审慎。这也意味着对你部署和使用系统的目的深思熟虑,并努力思考其二阶效应。你永远无法做到完美,因为这是一项如此新的技术,前沿发展如此之快,但应该尽一切可能的努力。

与此相关的是,这意味着利用科学方法本身来帮助理解人工智能:它的局限性、它的能力以及它的风险。然后应该利用这种理解来为人工智能设置恰当的护栏,并对这些护栏本身进行监测和研究。

我认为,随着人工智能变得日益普及和强大,科学方法是应对其挑战的最佳途径,而不是那种先构建、后提问的黑客心态。当然,后者也有其用武之地,并且对推动进步非常有益。但对于像人工智能这样具有变革性和重大影响的事物,我们需要使用我们拥有的最佳工具 —— 在我看来就是科学方法 —— 来尽可能多地获得对这些技术的远见和理解。

Manyika你最希望看到自己的工作为人类带来哪些益处?

Hassabis:首要的是改善人类健康、治愈疾病,尤其是那些对世界较贫困地区影响尤为严重的疾病。我认为我们能做得比现在好得多。

其次是助力能源、气候和环境 —— 通过更快地开发新材料和新技术,优化现有基础设施和电网,对全球正在发生的变化以及我们对生态系统的影响进行建模。在我看来,这些是我们近期内利用人工智能所能做的最重要的事情。

Manyika如果我们这场对话发生在 2050 年,那时我们会谈论什么?

Hassabis:考虑到事物发展的速度 —— 几乎每周都在推进 —— 我们唯一能确定的是,到 2050 年,情况很可能会与现在截然不同。希望到那时,领域已经以安全的方式将通用人工智能带入世界,造福全人类,而我们正在讨论如何驾驭一个极度丰裕的后通用人工智能世界,并生活在一个充满科学发现与奇迹的新黄金时代!

原文链接:

https://www.amacad.org/daedalus/ai-science-what-is-the-future-of-discovery

https://www.amacad.org/sites/default/files/publication/downloads/daedalus_wi-sp26_ai-science-what-is-future-of-discovery_0.pdf

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。