Gemini也叛变了，付费用户变小丑

上周，谷歌悄悄上线了一套新的Gemini限额机制，引起了众怒。

一大批订阅用户发现和Gemini聊了没几轮，就提示“您已达到当前用量限额，请等待刷新”。Linux和reddit还有知乎上网友的讨论炸了锅。

之前Gemini的限额是按条数算，按天刷新。免费用户一天5条，Pro用户一天100条，不管你怎么问，“今天的天气怎么样”还是“开发一个网页游戏”，都按一条算，反正是你多花钱就多用。

但现在不是了。

改成了算力消耗制。

我是Pro用户，也收到了同样的通知邮件。

从5月20号开始，Gemini改成了基于算力消耗的计费方式。

你发一句“帮我翻译这段话”和你说一句“帮我用Python写一个爬虫”，消耗的额度完全不同。系统会综合计算你的 prompt 复杂不复杂、对话有多长、用了什么功能，然后扣除对应的额度。文字对话扣得少，写代码、生成视频扣的多。

但是，消耗了多少？不能告诉你。

谷歌官方原话是限制触发速度取决于模型类型及功能负载。也就是我到底用了多少 Token？这代码耗了多少算力？用之前都不知道🤷/。Gemini也开始玩另外两家不给明确数字的玩法。

然后是限额的刷新机制也改了。

双重限额上线，5小时滚动窗口限额 + 周用量limit限额。

第一层是5小时的滚动窗口，用完额度就等5小时后刷新，第二层是是每周总量上限，一旦你这周的总消耗到顶了，只能等下周重置。

这套限额不是只卡免费用户的，还有付费的订阅用户，一大批用户上线第一天就撞上了限额。

知乎上话题《如何评价 Gemini 于 2026 年 5 月 17 日实行的新限额形式？》一天内暴涨了几十万热度，底下一位网友吐槽说自己是Pro用户，5h limit 也就是=3个低质量视频 + 2个低质量图片 + 5个简单问题的pro extend，用完之后就降级到低配的Flash-lite模型。

有网友说5小时limit大概是支撑20-30个非复杂问题，如果有图片则会消耗的更快，降到20个问题。

限额这还不是让用户最破防的操作。

打开Gemini官网套餐页，就能看到8美金/月的Plus用户，用量是免费用户2倍，20美金/月的Pro用户是免费用户的4倍用量。

蛤？之前我买个会员，Pro用户是免费版的33倍，Ultra是免费版的166倍，最起码能畅通稳定使用，现在花8美元也就是免费版的2x倍量，付费用户直接变小丑了，还不如注册两个账号。

这波操作上线之后，舆论失控了。

不止是Gemini，谷歌家的AI编程工具Antigravity那边同样被网友骂疯了。新的算力消耗制上线后，Pro用户发现5条对话就能烧掉50%的5小时额度，连续聊上10分钟也会撞上限额。大批用户纷纷吵着要退订。因为同样的话费，服务明显降级变少。

而且因为Flash和Pro模型额度被合并进同一个池子，限额感知更强。

很多人可能不太了解Antigravity，它是谷歌家的AI编程产品，IDE和CLI两种形式都有。一个很大的卖点是你订阅谷歌的Pro或Ultra套餐，不光能用Gemini，还能直接切换到Claude Sonnet、Claude Opus、GPT-OSS这些第三方模型，不用额外付费，不用API ，直接能用到claude家的模型，好多人也是冲着20美金用上Claude Opus来的。但是，所有模型共享同一个额度池。

其实，Antigravity的限额收紧比Gemini早得多，从去年12月就开始了，26年3月份已经有用户发现高级模型的刷新周期从5小时悄悄变成了按周，之前还能5小时一刷，现在就得等一周。

紧接着为了平息怒火，谷歌两天内连着加了两轮3倍额度。

网友对Gemini到底降了多少额度做了一个简单总结。总之就是大家的结论一致，还是比以前少。

如果你以为只有谷歌一家在抠，那就大错特错了。

往旁边看一眼，OpenAI和Anthropic也在干类似的事。今年4月，Codex从按消息收费改成了按token计费加积分制，Pro也拆成了100美金和200美金两档。用完了可以买积分包继续用，逻辑和谷歌几乎一模一样。

Claude那边，也把Agent SDK、GitHubActions这些产品从订阅额度里拆出来了，单独走月度积分。

三家几乎一致，都从“交月费随便用”到“交月费只是起步价，用多少算多少”的路走。超过一半以上的头部大模型公司都已经在用按量计费或混合定价了，AI订阅早就变成了云账单的逻辑。

为什么？因为算力是真的不够用。

谷歌自己造TPU，按说应该不缺，也是竞争对手的算力供应商，比如跟Anthropic签了400亿美元的TPU供应合同，但是谷歌自己的DeepMind研究团队还是要排队等算力，导致核心研究员出走。

这波限额叛变的不是谷歌，是整个AI订阅模式的蜜月期，结束了。

参考文献
[1] Google Antigravity Plans: https://antigravity.google/docs/plans
[2] OpenAI Help, using Codex with your ChatGPT plan: https://help.openai.com/en/articles/20001106
[3] Anthropic, Higher limits for Claude Code with SpaceX Colossus: https://www.anthropic.com/news/higher-limits-spacex
[4] Claude Support, use the Claude Agent SDK with your Claude plan: https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
[6] linux.do, Ultra 3 小时后 5h 额度剩 20%: https://linux.do/t/topic/1760337
[7] linux.do, 3x 补丁被质疑“先缩水再补”: https://linux.do/t/topic/2219076/11
[8] linux.do, 周限触发后刷新变 4 天: https://linux.do/t/topic/1538942/5
[9] linux.do, rate limits / quota / token 池换算讨论: https://linux.do/t/topic/2219076

菜单

分享

Gemini也叛变了，付费用户变小丑

中国智能驾驶技术行业发展现状及前景研究报告

盐城市大丰区招商局朱金瑜局长一行来访五度易链，聚焦大数据精准招商

中国智能座舱行业市场现状及发展趋势研究报告

2021厦门投洽会 | “五度易链”创始人金永顺博士：数据驱动产业高质量发展！

2026年中国汽车芯片行业市场现状与发展前景研究报告

Y12T110 广州港科大：偏振无关角度无关的垂直耦合光栅

心梗猝死来临前的6个求救信号别忽视！记住这些关键时刻能救命

中国新能源汽车行业市场现状与未来发展趋势研究报告

“笃威尔数字技术”受邀出席2024 H-Tech Data创新情报论坛！

喜报 | “北京笃威尔数字技术有限公司”获评2024年国家高新技术企业