Gemini 3.5深夜登场，谷歌CEO劈柴亲自算账：速度快4倍、一年还省超10亿美元，曝内部已被颠覆

作者 | 华卫

北京时间5月20日凌晨1点，谷歌一年一度的I/O开发者大会准时开幕。

在发布新品前，谷歌 CEO Sundar Pichai 展示了一个惊人的数据：每月处理3.2千万亿个token。“两年前，我们在各个平台每月处理约 9.7 万亿个token。去年的 I/O 大会上，这一数字增长到了大约 480 万亿个token。快进到今天，这个数字又跳升了 7 倍，每月超过 3.2 千万亿个token。”

短短一年增幅达7倍。而这些token，代表着谷歌用户、开发者与客户正在解决的各类问题。据透露，去年I/O大会时拥有4亿月活跃用户的Gemini应用，如今已突破9亿，一年内翻了一番多。截至目前，Nano Banana 图像生成模型已生成超过500亿张图像。

“还有大量潜在的生产力等待被释放。“Pichai 称。而这次的I/O发布，“智能体”可谓是重头戏。几乎所有的重磅新品，都是围绕智能体去迭代和更新的。

Gemini 3.5登场，

彻底改变谷歌内部工作方式

Gemini 3.5 Flash 是此次 I/O 最值得开发者关注的发布，被称为谷歌“迄今为止最强大的智能体和编码模型”。在多项智能体和编码基准测试中得分均高于Gemini 3.1 Pro，运行速度比其他前沿型号快 4 倍。

对于这款模型，Pichai特意强调了两点。

第一，与 3.1 Pro相比，3.5 Flash 在几乎所有基准测试中表现更佳。它在编码能力上取得了巨大进步，尤其是 GDPVal 的飞跃非常显著，反映了许多现实世界中具有经济价值的任务。在Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和MCP Atlas（83.6%）等具有挑战性编码和代理基准测试上的表现优于Gemini 3.1 Pro，并在多模态理解方面领先（CharXiv Reasoning为84.2%）。

第二，Gemini 3.5 Flash 在多个维度上提供可媲美大型旗舰机型的智能性能，但速度仍然非常快。以每秒输出token数计算，它比其他前沿模型快4倍。

此外，Gemini 3.5 Flash的另一个惊人之处在于，它以不到可比前沿模型一半的成本提供前沿级能力。“我们听说许多公司在五月就已经超出了年度token预算。如果公司能够将 Flash 与其他前沿模型混合使用，就可以节省大量成本。举个例子，顶尖公司每天处理约 1 万亿个token。如果他们将 80% 的工作负载从其他前沿模型切换到 3.5 Flash，每年可节省超过 10 亿美元。这是真实的节省，可以再投入到公司的发展中。”Pichai表示。

过去一年，AI编程工具的市场是Cursor、Claude Code、GitHub Copilot三家在争。Google在这个赛道几乎缺席。有消息说，Gemini团队在编程方面挣扎了一段时间。这次的Gemini 3.5 系列，就像是谷歌最新的正面回应。

今天起，Gemini 3.5 Flash 在谷歌的所有产品和 API 上向所有人开放。

“新模型在谷歌内部彻底改变了我们的工作方式。”Pichai 表示，他们一直在将 3.5 Flash 与重新构想的以智能体为核心的开发平台 Antigravity 一起使用，显著加快了开发速度。“3月，我们在内部 AI 开发工具中每天处理约 5000 亿个token，之后每隔几周就翻一倍。现在，我们每天处理的token数量已经超过 3 万亿。如此规模创造了强大的反馈循环，帮助我们不断改进 3.5。”

下个月，谷歌预计推出Gemini 3.5 Pro。据悉，谷歌在内部已经在使用它，其显示出很大的改进。

Gemini Omni：

将你的想法转化成电影视频

大会上，谷歌隆重推出新模型Gemini Omni，能够从任意输入生成任意输出模态的样本。这一新模型将 Gemini 的智能与生成式媒体模型结合在一起，在现实世界理解上实现了巨大的飞跃。通过Omni，用户可以将图片、音频、视频和文本作为输入结合，生成基于Gemini真实世界知识的高质量视频，也可以通过对话轻松编辑视频。

“借助世界模型，人工智能正从预测文本转向模拟现实。我们一直在努力突破这些模型的边界。”Pichai 表示，Gemini Omni将从视频输出开始，随后会支持图像和文本。

今日起，谷歌将正式上线Omni系列的Flash版本，可以在Gemini应用、Google Flow和YouTube Shorts上试用，未来几周通过API向开发者和企业客户推广。

据介绍，Gemini Omni 的特别之处是让视频编辑变得更简单，只需自然语言，可以修改特定事物或者改动整个场景，还可以修改环境、角度、风格，甚至具体细节，同时始终保持原始场景的连贯性。并且，每条指令都可以在前一条的基础上继续操作，角色保持一致，物理规律得以维持，场景也记得之前发生的事情。

除了构建逼真的场景，Gemini Omni 还能推理接下来应该发生什么。它可以将对物理规律的直觉理解与 Gemini 对历史、科学和文化背景的知识结合起来，实现从照片级真实到有意义故事讲述的跨越。Omni 还能利用 Gemini 的知识，将语言、图像和意义联系起来，其能力远超简单的模式匹配。

不过，所有用Omni制作的视频都包含肉眼几乎察觉不到的SynthID数字水印，用户可以通过Gemini应用、Chrome中的Gemini和Google搜索轻松验证视频是否是用Gemini Omni生成的。

两款智能体加持

Gemini应用更“实用”了

对于Gemini应用来说，这一年是丰收的一年。去年在谷歌I/O大会上，Gemini服务了4亿用户。如今，每月有超过9亿人在230个国家、70多种语言中向Gemini寻求帮助。

据介绍，Gemini应用来新增了两个智能体功能。首先是晨间摘要智能体Daily Brief ，它基于近期 Google Labs 实验 CC 的成功经验，让用户可以无缝、直观地进入 AI 智能体的世界。一旦你选择加入，Gemini 会在后台跨你已连接的应用运行。它会从 Gmail 收件箱收集紧急更新，从日历跟踪即将发生的事件，并将相关的后续信息整理成一份易于浏览的简报。

而且，Daily Brief 的功能远超简单的摘要。它会根据你的具体目标主动组织和优先排序内容，甚至会建议你立即可采取的下一步行动。你还可以通过简单的“点赞”或“点踩”反馈来引导它的行为，使其越用越懂你。今天起，Daily Brief 开始向美国的 Google AI Plus、Pro 和 Ultra 用户推出。

谷歌还推出了 Gemini Spark，这是一款全天候 24/7 个人 AI 智能体，标志着 Gemini 的一次重大转变：从一个可以回答问题的助手，升级为一个可以在用户的指示下实际完成工作、成为主动合作伙伴的智能体。

“我对 Gemini Spark 特别兴奋。它是 Gemini 应用中的个人 AI 智能体，可以帮助你管理数字生活，根据你的指令代你执行操作。”Pichai 表示。

据介绍，Gemini Spark 基于 Gemini 3.5 并使用 Antigravity 框架，与你日常依赖的 Workspace 工具（如 Gmail、Docs、Slides 等）深度集成。更棒的是，因为它是基于云的智能体，即便你关闭笔记本或锁屏手机，Spark 也会在后台持续工作。这意味着 Spark 可以承担复杂任务，让你腾出时间专注于最重要的事情。

使用 Gemini Spark，你可以设置重复任务或触发器，自动解析每月信用卡账单，标记新增或隐藏的订阅费用；教它新技能，让它定期检查孩子学校的邮件更新，提取关键截止日期，并将每日汇总简报发送给你和你的伴侣。创建完整工作流，让它整合邮件和聊天中的会议原始记录，生成整理好的 Google Docs 文档，甚至起草启动项目的配套邮件。

这仅仅是开始， Gemini Spark有丰富的功能路线图。今天，谷歌扩展了 Gemini 连接应用列表，通过 MCP 新增了 Canva、OpenTable 和 Instacart 的连接。未来几周，Spark 将可以利用这些 MCP 连接完成更多任务。之后，谷歌还将增加新能力，包括通过短信和邮件与 Spark 互动、创建自定义子智能体以及操作本地浏览器。

据悉，Spark 会完全在用户的指挥下运行。用户可以选择是否启用它，以及连接哪些应用；在执行高风险操作（如花费资金或发送邮件）前，它会先征求确认。Gemini Spark 本周将向受信任测试者推出，计划下周向美国 Google AI Ultra 用户推出 Beta 版本。

25年来搜索最大升级

AI带来新纪元

同时，谷歌带来了 25 年来 Search 框的最大升级：全面 AI 化。

“随着我们进入这个智能体时代，搜索将比以往任何时候都更有帮助和强大。”Pichai 说道。据介绍，谷歌在 Search 中引入了信息智能体。这些是用户可以设置的个性化 AI 智能体，它们可以在后台全天候工作，在你最需要的时候找到信息，并帮助你执行操作。据介绍，信息智能体将在今年夏天逐步推出，首先面向 Google AI Pro 和 Ultra 用户。

“我们构建真正智能体化 Search 的另一种方式是赋予其智能体编程能力。”现在，Gemini 3.5 Flash已经成为全球用户在 Google 搜索 AI 模式下的全新默认模型。“凭借 Gemini 3.5 Flash 和 Google Antigravity 的强大能力，Search 可以为用户的每个问题创建个性化体验，例如动态布局和交互式可视化。这些生成式 UI 功能将在今年夏天向所有用户免费开放。”

对于需要长期持续处理的任务，Search 还能更进一步创建持久化、定制化的仪表盘或追踪器，用户可以随时返回并继续操作，可以把它们看作是为特定任务定制的迷你应用。未来几个月，用户将能够在 Search 中使用 Antigravity 构建个性化体验，首批面向美国的 Google AI Pro 和 Ultra 用户。

另外，谷歌还致力于让用户与 Search 的对话更简单顺畅。用户可以直接在 AI 概览界面提出后续问题，并通过 AI 模式进行连续的对话交流。上下文信息会随你保留，随着深入探索，相关链接和参考文章也会变得更加精准，这个无缝体验已在全球桌面和移动端上线。

从今天起，新的智能 Search 框开始在所有支持 AI 模式的国家和语言中逐步推出。

声明：本文为 AI 前线整理，不代表平台观点，未经许可禁止转载。

会议推荐

Agent 从 Demo 到工程化还差什么？安全与可信这道坎怎么过？研发体系不重构，还能撑多久？

AICon 上海站 2026，13 大重磅专题已上线，诚挚邀请你登台分享实战经验。AICon 2026，期待与你同行。快来扫码锁定 8 折专属席位或提交演讲议题👇

今日荐文

10 天 3000 元，一人造出全球 AI 爆款！好莱坞导演抢人、游戏版引爆期待，合作细节首次披露

曝Kimi 后训练团队研究员离职，曾为K2.5贡献者；MiniMax最新招聘，兼职也拿期权；传蜜雪CEO隔空回复黄仁勋，“大佬同款”卖爆｜AI周报

H200还没到中国，Anthropic先急了：千亿美元抢芯片，转头涨价让开发者买单

Hermes团队改写预训练：算力成本降六成，DeepSeek之后提效新路径

智谱创始人唐杰透露：原生多模态模型将在数月内上线

你也「在看」吗？👇

菜单

分享

Gemini 3.5深夜登场，谷歌CEO劈柴亲自算账：速度快4倍、一年还省超10亿美元，曝内部已被颠覆

今日荐文

中国智能驾驶技术行业发展现状及前景研究报告

盐城市大丰区招商局朱金瑜局长一行来访五度易链，聚焦大数据精准招商

中国智能座舱行业市场现状及发展趋势研究报告

2021厦门投洽会 | “五度易链”创始人金永顺博士：数据驱动产业高质量发展！

2026年中国汽车芯片行业市场现状与发展前景研究报告

Y12T110 广州港科大：偏振无关角度无关的垂直耦合光栅

心梗猝死来临前的6个求救信号别忽视！记住这些关键时刻能救命

中国新能源汽车行业市场现状与未来发展趋势研究报告

“笃威尔数字技术”受邀出席2024 H-Tech Data创新情报论坛！

喜报 | “北京笃威尔数字技术有限公司”获评2024年国家高新技术企业