Z Potentials｜LiberAI刘松铭，在世界模型的百家争鸣时刻，他要定义最陡峭的Scaling曲线

01 导语

LiberAI 创始人刘松铭的身上，有一组几乎天然会打动投资人的标签：00 后、竞赛金牌、清华特奖、师从清华朱军老师、在做世界模型。公司成立仅三个月，便已完成三轮、总额数亿元的融资，真格基金、红杉中国、美团龙珠、顺为资本等一众头部基金悉数在列。

但他真正与众不同的部分，是那些标签之外的特质：对自然科学有融会贯通的理解，热爱化学和物理；几乎每天都会留出时间冥想，这个习惯已经持续了十余年。

也正是这种特质，让他在PhD阶段就能两次做出领先硅谷的技术判断：第一次是在2024年10月发布RDT-1B，领先π的PI-0模型一个月，是首个使用大规模预训练+Diffusion Transformer范式的基模；第二次是在2025年9月推出RDT-2，领先Generalist的 Gen-0模型一个月，是首个使用大规模UMI人类数据预训练的基模。

但他并没有止步于此，而是于2025年12月投身创业，成立了LiberAI，并于次年4月发布全球首个高自由度灵巧操作具身基础模型。

在他看来，LiberAI 选择走在一条让 Scaling Law 最陡峭的路线上，建立一个充分对齐物理模态的世界模型——用更少的物理数据、更短的时间，获得真正具有商业价值的泛化能力。

要让这条曲线足够陡峭，LiberAI的三个秘籍是：模态对齐（让海量视频数据反哺稀缺的物理数据）、归纳偏置（把物理规律作为人类先验注入模型）、软硬件协同（数据采集、本体设计与模型架构同步迭代）。

在刘松铭看来，LiberAI 所做的并不仅仅是模型本身，而更接近于一种产品定义——像苹果一样，去定义世界模型的数采范式、本体及系统。

“怎么选路线，怎么定义产品很重要。”刘松铭说，“尤其是选错了路线，后面再改成本很高。” 他形容这有点像结婚：“得先想清楚面前的人是否值得托付终身才能领证。”

这种路线判断的能力和底气，究竟从哪里来？

为回答这个问题，Z Potentials 对话了 LiberAI 创始人刘松铭，他与我们分享了自己的多个关键选择背后的思考以及他对世界模型的理解。Enjoy!

具身领域的技术路线是一整个系统，硬件、数采和模型彼此像血肉一般紧密相连，一旦要变，一切的一切都要推倒重来，切换代价是极其巨大的。
LiberAI 的世界模型，是要以物理智能为纵轴，做 Scaling 边际成本最低、速度最快的世界模型。我们从模型、数据、硬件等多个方面去做，一切都是为了让 Scaling 曲线更陡峭。
我们模型上的核心差异点是模态对齐和归纳偏置。好的对齐能起到四两拨千斤的效果，最著名的例子是LLaVA-1.5，它仅使用大约1M的图文对就达到了当时的开源SOTA，不到预训练文本的千分之一。
（数采范式）最关键的指标是scaling的边际成本，以及边际成本会随着scaling多快地下降。我们认为最好的数采方式是直接采集人手的交互数据（paired with ego-centric videos）。
我们公司是模型“小天才”与资深硬件/Infra团队的组合，兼具算法迭代与工程化组织能力。软硬协同起来是壁垒，也是难点，但组织文化上也是可以很simple、很极简的。
保持清醒是很难的，坚持做长期正确的事也是很难的。我的办法是经常冥想，也是一种“每逢大事有静气”吧。

02 化竞金牌+AI For Physics出身，一个00后清华特奖为何All In世界模型

ZP：先从你的成长经历聊起吧，你为什么会对创业产生兴趣？

刘松铭：高中我喜欢化学，凭化竞金牌进了清华。我很喜欢清华的本科培养体系——课程很难很扎实，而且各个院系之间有大量的协同效应和人才红利。我本科参与了很多创业活动，但一直没有定下方向，直到 GPT-3.5 出来。

ZP：当 GPT 时刻出现，你是怎么从几个可能方向里最终收敛到具身智能的？

刘松铭：我大三时在做 AI For Physics，人生第一篇 Paper 研究的是如何用 AI 求解 PDE 方程。这本质上是在用 AI 替代计算物理仿真，和做世界模型的 Philosophy 有点异曲同工。

GPT时刻出现后，我做过一些探索和尝试。当时的判断是：AI For Physics 的数据稀缺，GPT 时刻太远；而图像和视频领域数据极大丰富，GPT 时刻来得会太快，所以这些可能不是属于我的赛道。

而对于具身，数据比较少但存在快速扩增的潜力。此外，我有物理和机械基础，入门具身读Paper时灵感就很多，这是个非常重要的Signal。而且扪心而论，具身智能更像是属于我的Calling。

回头看，人生选择往往是在禀赋、热爱与行业前景之间求交集。

ZP：真正出来创业之前，你给自己设定了哪些条件？

刘松铭：第一是下苦功夫，扎在实验室里，选有代表性的技术路线亲自跑一遍。第二是积累行业认可度，把 citation 和朋友搞得多多的（笑）。

我认为要成为这个领域的CEO，一定要真的感受到内心澎湃的技术信仰，知道公司到底在bet什么，胜率在哪里。因为做物理世界模型不可避免要和物理实体打交道，一旦选错路线，后面改起来成本极高。这个领域的技术路线是一整个系统，硬件、数采和模型彼此像血肉一般紧密相连，一旦要变，一切的一切，设计、生产、供应链、运营都要推倒重来，切换代价是极其巨大的。正因为改不起，所以我必须选得准，有点像是婚姻，你得先花时间看清楚哪个人才是值得你托付终身的才能去领证。

03 LiberAI，一个很Simple的世界模型公司，一个诞生于夏威夷海岸的品牌

ZP：在具体讨论技术路线之前，请介绍一下LiberAI

刘松铭：LiberAI是一家世界模型公司。世界模型的终局是让人类进入地球Online的Easy模式。一个不能做早餐，不能做家务，不能和人长期共处的物理AI不属于未来。我们认为自由是人非常本质的需求，公司“LiberAI”命名就取自“Liberty”——让每个人都能“生活在此处”。

ZP：LiberAI的logo很独特，设计灵感是什么？

刘松铭：我认为公司调性是创始人审美的外化，LiberAI的Logo一个L型的海滩躺椅，设计灵感源自于夏威夷的黄金海岸。2023年，我来到夏威夷参加ICML（学术会议）。我惊叹，世界上怎会有如此美丽的地方！我每天躺在沙滩椅上，看着翡翠一般的海浪直到日落，反而获得了很多科研灵感。所以我就把沙滩椅当成了自由、愉悦以及创造力的象征。本来我还想加一个太阳伞的，但是那样有点像一家旅游公司，所以最后也没加（笑）。

ZP：LiberAI的文化和氛围是什么样的？

刘松铭：首先我们公司是模型“小天才”与资深硬件/Infra团队的组合，兼具算法迭代与工程化组织能力。软硬协同起来是壁垒，也是难点，但组织文化上也是可以很simple、很极简的。例如我们没有打卡，团队花了很多力气去推倒部门墙，让大家一起定义Scaling的范式，擦出火花。讨论有时候会很激烈，但我们每个人都知道今天聚在这里是为了同一项伟大的事业，同事关系上会很simple，拿事实说话。

我最开心的时刻就是看到大家工作时能进入心流状态，骄傲地跟彼此分享自己的成长，然后开开心心下班。

ZP：LiberAI想要招聘什么样的人？希望具备哪些特质？

刘松铭：除了解决工程问题这个标准外，我们对人才的来源蛮Open，也招过其他专业或行业背景的工程师，这些人到公司后的成长很快。在信仰层面，我们非常欢迎认同我们的路线，实事求是的人。当然，有创造力，或非常有 talent、有taste就更好了。

我们解决的是产品、甚至是系统级的问题，事实胜于一切cheap talk。我们团队会有一点物理学家的气质在，因为世界模型需要一致、鲁棒和高确定性。

ZP：如果到 2035 年，你希望LiberAI处在什么状态？

刘松铭：当前是工程化攻坚期，我们需要跑通数据、硬件、模型训练的闭环（见后文具体分析），迅速Scale Up起来，而且还要建立有实际意义的 Evaluation Metric——例如，目前行业没人知道该如何评价数据集的好坏。

我们对Scale Up后涌现出的智能程度很有信心，无论是泛化性、成功率或其他的Metric。如果我们是这个领域GPT时刻的推动者，我们也会是最先实现大规模商业化的公司之一。我很期待我们在3年5年后成为一家真正有系统级护城河的公司。

04 引领世界模型新路线：押注模态对齐与归纳偏置

ZP：现在大家都在谈世界模型，你怎么定义它？

刘松铭：狭义来说，世界模型是建模在动作的影响下，世界的状态如何发生转移的模型。但在我们看来，世界模型不止于此。它是一套系统方法论：包含大规模数采、模型架构、训练策略，甚至包括硬件本体设计。每部分紧密相连，影响着最终的模型效果。

翻译成结果指标：LiberAI 的世界模型，是要以物理智能为纵轴，做 Scaling 边际成本最低、速度最快的世界模型。我们从模型、数据、硬件等多个方面去做，一切都是为了让 Scaling 曲线更陡峭。

ZP：首先从模型架构介绍，LiberAI的世界模型如何让Scaling更陡峭？有哪些差异化优势？

刘松铭：与模型设计相关的是预训练scaling，它告诉我们随着预训练数据和算力的增加，模型的性能可以多快地提升。

我们的模型是一个统一了文本、视频和动作生成的多模态大模型。它能够利用海量纯视频数据来学习先验，缓解了当前物理数据稀缺的不利条件。

此外，还有两个比较核心的差异点。

第一，我们将物理这个新的模态与视频模态进行对齐，可以利用视频模态的泛化性去增强物理模态的泛化性。从而利用更少的物理数据就能达到更强的泛化性。

第二，我们会引入以物理规律为代表的归纳偏置。这相当于注入了人类先验，减小了模型训练要搜索的空间，进而加速收敛。同时还可以尽量避免生成不符合物理规律的结果。

ZP：请先讲一下第一个模型差异点，为什么要强调模态对齐？你们打算怎么对齐物理和视频空间？

刘松铭：本质上，对齐是让不同模态的表示指向隐空间的同一个概念。例如，人在看到“Cat”这个单词和猫的图片会想到同一个概念。如果没有对齐，模型就会把图像和文本当成两个空间去学，很容易不收敛。

好的对齐能起到四两拨千斤的效果，最著名的例子是LLaVA-1.5，它仅使用大约1M的图文对就达到了当时的开源SOTA，不到预训练文本的千分之一。

物理模态的对齐至关重要，视频蕴含了物体的运动状态，而物理数据正好表达了力和接触。二者之间天然存在因果关系——力是物体运动状态改变的原因——我们利用这一点在因果的意义上对齐二者。

对齐的收益是显著的。如果将视频与物理的空间对齐起来，模型就能借助视频的泛化性去缓解物理数据的稀缺性——就像处理图文对一样，得到更陡峭的Scaling Law。通俗地讲：遇到没见过的情况，模型首先联想对应的视频，再借助视频和物理的对应关系去补全物理。

ZP：再讲一下第二个模型的差异点，你们为什么要引入归纳偏置？

刘松铭：类比来说，模型训练的过程相当于在一个巨大的集合里寻找正确答案。假设数据和算力无限多，算法一定可以找到最好的答案。但是当数据稀缺的时候，算法的搜索能力会大幅下降，我们就需要人为帮他圈定一个可能是正确答案的范围，让它在那个小范围里面找，从而大大提升搜索的效率。这个过程就是在引入人类先验（归纳偏置）。

类似的例子在数据稀缺的领域很常见。比如强化学习（数据需要通过policy与环境交互得到），我们要引入advantage、GAE和各种梯度更新的tricks，而不是直接暴力用蒙特卡洛。

05 在最陡峭的Scaling曲线上，定义物理数据采集范式

ZP：回到Scaling的问题，你怎么思考现在的物理数据范式？

刘松铭：最关键的指标是scaling的边际成本，以及边际成本会随着scaling多快地下降。Scaling Law的横轴是经济成本和时间成本，纵轴是有效数据量。数据scaling的曲线会分为两条，前面一条是冷启动曲线，后面一条是飞轮转起来之后的量产曲线。

对于冷启动曲线，我们认为最好的数采方式是直接采集人手的交互数据（paired with ego-centric videos）。它无感，轻量，不影响人正常干活，所以价格更便宜。更重要的是，由于人手是与生俱来的，所以管理、培训和监督的成本接近于零。

量产曲线实际上说的是当智能产品开始产生商业价值，智能产品和环境交互的数据就可以回流。

ZP：为什么一定要采集物理数据？或者说，为什么要直接采集人手的交互数据？

刘松铭：两个原因。第一，视频并不具备轨迹和力的数据，而这是模型与真实物理世界交互所必须的。第二，纯视频无法进行因果建模。视频表示运动其实是“果”，缺少以力模态为代表的“因”。视频模型实际上建模的是基于统计概率似然的帧间相关性，而非因果关系。这样的相关性很容易过拟合，“知其然而不知其所以然”。

ZP：LiberAI对机器人本体的思考是什么？如何服务于你所强调的Scaling效率？

刘松铭：我们在设计本体的时候，非常注重拟人性。所有人类的动作都尽量要能在本体上replay。这和后训练scaling相关。预训练阶段我们主要使用人类数据。因此还需要用机器人本体数据进行后训练。机器人本体与人类越接近，embodiment gap越小，所需要的后训练数据越少，scaling就越快。

06 冥想与降噪：在行业的激流中坚定前行

ZP：创业之外，你平时最喜欢做的事情是什么？

刘松铭：冥想，很多年养成的习惯。

ZP：冥想具体怎么帮你沉淀信息？

刘松铭：The unexamined life is not worth living. 就像有时候实验效果不好很难知道是硬件、模型还是数据的问题，人犯了错也很难知道到底是认知、状态还是情绪的问题。当公司要极致地提高Scaling斜率，我首先要尽可能地给自己降噪，先把“CEO路线判断错误”这个因素排除出去（笑）。

ZP：你是 00 后创始人，做这么宏大的一件事，投资人怎么看？

刘松铭：投资人更看重的是团队整体实力和赛道的匹配度，并不只有我一个人。类似量化市场的因子挖掘，年龄只是其中的一个indicator。客观来说，00 后经验尚浅，但更Open，也更有冲劲——创业一定是go big or go home的。我们并不是一个OPC，有很多产业经验丰富的人在陆续加入，每个岗位的人都对公司有贡献，这不是我一个人的功劳。

ZP：现在市场很热，作为 CEO ，你将怎么带领团队向着同一个目标快速Scale Up？

刘松铭：市场热度就像激流，会带来势能与动量，我们会顺势而行，但也会有自己的目标和路径——LiberAI是一个有Character的公司。当然，我们也要尊重产品周期、硬件周期、迭代节奏这些偏客观的因素。

保持清醒是很难的，坚持做长期正确的事也是很难的。我的办法是经常冥想，也是一种“每逢大事有静气”吧。

请注意，此次访谈内容已经过精心编辑，并得到了刘松铭的认可。欲了解更多关于LiberAI的信息，敬请访问LiberAI公众号与视频号。目前，正在招募更多热爱技术的年轻人加入，感兴趣的可以联系https://ucn81zkkano6.jobs.feishu.cn/LiberAI。我们也欢迎读者通过留言互动，分享您对本访谈或 LiberAI 的看法。

ZPotentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群，与我们共同分享、学习、成长。

菜单

分享

Z Potentials｜LiberAI刘松铭，在世界模型的百家争鸣时刻，他要定义最陡峭的Scaling曲线

中国智能驾驶技术行业发展现状及前景研究报告

盐城市大丰区招商局朱金瑜局长一行来访五度易链，聚焦大数据精准招商

中国智能座舱行业市场现状及发展趋势研究报告

2021厦门投洽会 | “五度易链”创始人金永顺博士：数据驱动产业高质量发展！

2026年中国汽车芯片行业市场现状与发展前景研究报告

Y12T110 广州港科大：偏振无关角度无关的垂直耦合光栅

心梗猝死来临前的6个求救信号别忽视！记住这些关键时刻能救命

中国新能源汽车行业市场现状与未来发展趋势研究报告

“笃威尔数字技术”受邀出席2024 H-Tech Data创新情报论坛！

喜报 | “北京笃威尔数字技术有限公司”获评2024年国家高新技术企业