lch
发布于 2026-05-20 / 0 阅读
0

Gemini 3.5深夜登场,谷歌CEO劈柴亲自算账:速度快4倍、一年还省超10亿美元,曝内部已被颠覆

作者 | 华卫

北京时间5月20日凌晨1点,谷歌一年一度的I/O开发者大会准时开幕。

在发布新品前,谷歌 CEO Sundar Pichai 展示了一个惊人的数据:每月处理3.2千万亿个token。“两年前,我们在各个平台每月处理约 9.7 万亿个token。去年的 I/O 大会上,这一数字增长到了大约 480 万亿个token。快进到今天,这个数字又跳升了 7 倍,每月超过 3.2 千万亿个token。”

短短一年增幅达7倍。而这些token,代表着谷歌用户、开发者与客户正在解决的各类问题。据透露,去年I/O大会时拥有4亿月活跃用户的Gemini应用,如今已突破9亿,一年内翻了一番多。截至目前,Nano Banana 图像生成模型已生成超过500亿张图像

“还有大量潜在的生产力等待被释放。“Pichai 称。而这次的I/O发布,“智能体”可谓是重头戏。几乎所有的重磅新品,都是围绕智能体去迭代和更新的。

Gemini 3.5登场,
彻底改变谷歌内部工作方式

Gemini 3.5 Flash 是此次 I/O 最值得开发者关注的发布,被称为谷歌“迄今为止最强大的智能体和编码模型”。在多项智能体和编码基准测试中得分均高于Gemini 3.1 Pro,运行速度比其他前沿型号快 4 倍。

对于这款模型,Pichai特意强调了两点。

第一,与 3.1 Pro相比,3.5 Flash 在几乎所有基准测试中表现更佳。它在编码能力上取得了巨大进步,尤其是 GDPVal 的飞跃非常显著,反映了许多现实世界中具有经济价值的任务。在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%)等具有挑战性编码和代理基准测试上的表现优于Gemini 3.1 Pro,并在多模态理解方面领先(CharXiv Reasoning为84.2%)。

第二,Gemini 3.5 Flash 在多个维度上提供可媲美大型旗舰机型的智能性能,但速度仍然非常快。以每秒输出token数计算,它比其他前沿模型快4倍。

此外,Gemini 3.5 Flash的另一个惊人之处在于,它以不到可比前沿模型一半的成本提供前沿级能力。“我们听说许多公司在五月就已经超出了年度token预算。如果公司能够将 Flash 与其他前沿模型混合使用,就可以节省大量成本。举个例子,顶尖公司每天处理约 1 万亿个token。如果他们将 80% 的工作负载从其他前沿模型切换到 3.5 Flash,每年可节省超过 10 亿美元。这是真实的节省,可以再投入到公司的发展中。”Pichai表示。

过去一年,AI编程工具的市场是Cursor、Claude Code、GitHub Copilot三家在争。Google在这个赛道几乎缺席。有消息说,Gemini团队在编程方面挣扎了一段时间。这次的Gemini 3.5 系列,就像是谷歌最新的正面回应。

今天起,Gemini 3.5 Flash 在谷歌的所有产品和 API 上向所有人开放。

“新模型在谷歌内部彻底改变了我们的工作方式。”Pichai 表示,他们一直在将 3.5 Flash 与重新构想的以智能体为核心的开发平台 Antigravity 一起使用,显著加快了开发速度。“3月,我们在内部 AI 开发工具中每天处理约 5000 亿个token,之后每隔几周就翻一倍。现在,我们每天处理的token数量已经超过 3 万亿。如此规模创造了强大的反馈循环,帮助我们不断改进 3.5。”

下个月,谷歌预计推出Gemini 3.5 Pro。据悉,谷歌在内部已经在使用它,其显示出很大的改进。

Gemini Omni:
将你的想法转化成电影视频

大会上,谷歌隆重推出新模型Gemini Omni,能够从任意输入生成任意输出模态的样本。这一新模型将 Gemini 的智能与生成式媒体模型结合在一起,在现实世界理解上实现了巨大的飞跃。通过Omni,用户可以将图片、音频、视频和文本作为输入结合,生成基于Gemini真实世界知识的高质量视频,也可以通过对话轻松编辑视频。

“借助世界模型,人工智能正从预测文本转向模拟现实。我们一直在努力突破这些模型的边界。”Pichai 表示,Gemini Omni将从视频输出开始,随后会支持图像和文本。

今日起,谷歌将正式上线Omni系列的Flash版本,可以在Gemini应用、Google Flow和YouTube Shorts上试用,未来几周通过API向开发者和企业客户推广。

据介绍,Gemini Omni 的特别之处是让视频编辑变得更简单,只需自然语言,可以修改特定事物或者改动整个场景,还可以修改环境、角度、风格,甚至具体细节,同时始终保持原始场景的连贯性。并且,每条指令都可以在前一条的基础上继续操作,角色保持一致,物理规律得以维持,场景也记得之前发生的事情。

除了构建逼真的场景,Gemini Omni 还能推理接下来应该发生什么。它可以将对物理规律的直觉理解与 Gemini 对历史、科学和文化背景的知识结合起来,实现从照片级真实到有意义故事讲述的跨越。Omni 还能利用 Gemini 的知识,将语言、图像和意义联系起来,其能力远超简单的模式匹配。

不过,所有用Omni制作的视频都包含肉眼几乎察觉不到的SynthID数字水印,用户可以通过Gemini应用、Chrome中的Gemini和Google搜索轻松验证视频是否是用Gemini Omni生成的。

两款智能体加持
Gemini应用更“实用”了

对于Gemini应用来说,这一年是丰收的一年。去年在谷歌I/O大会上,Gemini服务了4亿用户。如今,每月有超过9亿人在230个国家、70多种语言中向Gemini寻求帮助。

据介绍,Gemini应用来新增了两个智能体功能。首先是晨间摘要智能体Daily Brief ,它基于近期 Google Labs 实验 CC 的成功经验,让用户可以无缝、直观地进入 AI 智能体的世界。一旦你选择加入,Gemini 会在后台跨你已连接的应用运行。它会从 Gmail 收件箱收集紧急更新,从日历跟踪即将发生的事件,并将相关的后续信息整理成一份易于浏览的简报。

而且,Daily Brief 的功能远超简单的摘要。它会根据你的具体目标主动组织和优先排序内容,甚至会建议你立即可采取的下一步行动。你还可以通过简单的“点赞”或“点踩”反馈来引导它的行为,使其越用越懂你。今天起,Daily Brief 开始向美国的 Google AI Plus、Pro 和 Ultra 用户推出。

谷歌还推出了 Gemini Spark,这是一款全天候 24/7 个人 AI 智能体,标志着 Gemini 的一次重大转变:从一个可以回答问题的助手,升级为一个可以在用户的指示下实际完成工作、成为主动合作伙伴的智能体。

“我对 Gemini Spark 特别兴奋。它是 Gemini 应用中的个人 AI 智能体,可以帮助你管理数字生活,根据你的指令代你执行操作。”Pichai 表示。

据介绍,Gemini Spark 基于 Gemini 3.5 并使用 Antigravity 框架,与你日常依赖的 Workspace 工具(如 Gmail、Docs、Slides 等)深度集成。更棒的是,因为它是基于云的智能体,即便你关闭笔记本或锁屏手机,Spark 也会在后台持续工作。这意味着 Spark 可以承担复杂任务,让你腾出时间专注于最重要的事情。

使用 Gemini Spark,你可以设置重复任务或触发器,自动解析每月信用卡账单,标记新增或隐藏的订阅费用;教它新技能,让它定期检查孩子学校的邮件更新,提取关键截止日期,并将每日汇总简报发送给你和你的伴侣。创建完整工作流,让它整合邮件和聊天中的会议原始记录,生成整理好的 Google Docs 文档,甚至起草启动项目的配套邮件。

这仅仅是开始, Gemini Spark有丰富的功能路线图。今天,谷歌扩展了 Gemini 连接应用列表,通过 MCP 新增了 Canva、OpenTable 和 Instacart 的连接。未来几周,Spark 将可以利用这些 MCP 连接完成更多任务。之后,谷歌还将增加新能力,包括通过短信和邮件与 Spark 互动、创建自定义子智能体以及操作本地浏览器。

据悉,Spark 会完全在用户的指挥下运行。用户可以选择是否启用它,以及连接哪些应用;在执行高风险操作(如花费资金或发送邮件)前,它会先征求确认。Gemini Spark 本周将向受信任测试者推出,计划下周向美国 Google AI Ultra 用户推出 Beta 版本。

25年来搜索最大升级
AI带来新纪元

同时, 谷歌带来了 25 年来 Search 框的最大升级:全面 AI 化。

“随着我们进入这个智能体时代,搜索将比以往任何时候都更有帮助和强大。”Pichai 说道。据介绍,谷歌在 Search 中引入了信息智能体。这些是用户可以设置的个性化 AI 智能体,它们可以在后台全天候工作,在你最需要的时候找到信息,并帮助你执行操作。据介绍,信息智能体将在今年夏天逐步推出,首先面向 Google AI Pro 和 Ultra 用户。

“我们构建真正智能体化 Search 的另一种方式是赋予其智能体编程能力。”现在,Gemini 3.5 Flash已经成为全球用户在 Google 搜索 AI 模式下的全新默认模型。“凭借 Gemini 3.5 Flash 和 Google Antigravity 的强大能力,Search 可以为用户的每个问题创建个性化体验,例如动态布局和交互式可视化。这些生成式 UI 功能将在今年夏天向所有用户免费开放。”

对于需要长期持续处理的任务,Search 还能更进一步创建持久化、定制化的仪表盘或追踪器,用户可以随时返回并继续操作,可以把它们看作是为特定任务定制的迷你应用。未来几个月,用户将能够在 Search 中使用 Antigravity 构建个性化体验,首批面向美国的 Google AI Pro 和 Ultra 用户。

另外,谷歌还致力于让用户与 Search 的对话更简单顺畅。用户可以直接在 AI 概览界面提出后续问题,并通过 AI 模式进行连续的对话交流。上下文信息会随你保留,随着深入探索,相关链接和参考文章也会变得更加精准,这个无缝体验已在全球桌面和移动端上线。

从今天起,新的智能 Search 框开始在所有支持 AI 模式的国家和语言中逐步推出。

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

会议推荐

Agent 从 Demo 到工程化还差什么?安全与可信这道坎怎么过?研发体系不重构,还能撑多久?

AICon 上海站 2026,13 大重磅专题已上线,诚挚邀请你登台分享实战经验。AICon 2026,期待与你同行。快来扫码锁定 8 折专属席位或提交演讲议题👇

图片
今日荐文

10 天 3000 元,一人造出全球 AI 爆款!好莱坞导演抢人、游戏版引爆期待,合作细节首次披露

曝Kimi 后训练团队研究员离职,曾为K2.5贡献者;MiniMax最新招聘,兼职也拿期权;传蜜雪CEO隔空回复黄仁勋,“大佬同款”卖爆|AI周报

H200还没到中国,Anthropic先急了:千亿美元抢芯片,转头涨价让开发者买单

Hermes团队改写预训练:算力成本降六成,DeepSeek之后提效新路径

智谱创始人唐杰透露:原生多模态模型将在数月内上线

你也「在看」吗?👇