lch
发布于 2026-05-11 / 0 阅读
0

日均百万亿Token,如何提升性价比?

Token 是什么?

在今年 3 月国新办举行的新闻发布会上, Token 被正式命名为“词元”,即 AI 大模型处理信息的最小单元。 AI 理解问题,再返回答案,都需要拆解成词元来进行。举个例子,你问豆包“红伞白杆杆的蘑菇能吃吗?”或是让 DeepSeek 帮你写一段短文案,都会消耗词元。据行业通用估算, AI 完成一次普通对话约消耗 750 词元,长文档分析约 1.15 万词元。

截至 3 月,我国日均 Token 调用量已突破 140 万亿,相比 2024 年初的 1000 亿,两年内增长超千倍,背后 海量的算力成本。这也是为什么,近日来多个 AI 大模型进入了“是否收费”的拐点。

AI 影响日常生活和百行百业的当下,有人给出了自己的时代答案—— 5 8 日, 新华三集团 主办的 NAVIGATE 2026 领航者峰会上,紫光股份董事长、新华三集团总裁兼首席执行官于英涛提出,“让每一个 Token 都具备极致性价比”。

图片

于英涛在 NAVIGATE 2026领航者峰会上演讲

从算力堆砌到系统协同

Token 不是一阵风的热词。”于英涛在峰会主旨演讲中指出,“它确定性地正在重塑一切。”在他看来, Token AI 基础设施的核心产出,是百行百业迈向智能化的动力引擎与协作语言。

那么问题来了,新华三如何做到 “让每一个 Token 都具备极致性价比”?

于英涛抛出了一个行业共有的焦虑:全球 AI 基础设施投入已超万亿美元,部分数据中心 GPU 利用率却不足六成 万卡集群中,网络拥塞导致的算力损耗高达 30% 以上,数据 IO 瓶颈让 GPU 空等时间占比超过 40% 。简单堆砌算力,并不能自动转化为高价值的 Token 产出。

新华三的判断是, Token 性价比不由某一张 GPU 卡决定,而是由计算、网络、存储、云、安全、运维六个维度的深度协同决定。于英涛用一个比喻解释:如果 AI 是一辆超级赛车,只盯住发动机(算力)而忽略变速箱、轮胎、底盘,这辆车跑不远。

为此,新华三提出 算力 × 联接 的系统级战略。区别于简单的加法, × 意味着整体适配调优。在 AI 训练和推理中,跑不同模型、不同版本,对存储配置和网络拓扑的要求都不一样。新华三要做的,是让算力和联接不再是各自为政的产品线,而是融合为一个 六位一体 的同花顺。

这一思路直接体现在峰会重磅发布的 UniPoD S80000 全系列超节点上。该产品覆盖从 32 卡到 1024 卡的弹性规格,最高可扩展至 16384 卡。通过软硬协同优化,训练性能提升 70% ,推理性能提升 3 倍。将高密液冷计算、无损网络、 AI 原生存储、智能云调度、 AI 防火墙和运维智能体融为一体 ,成为 系统级算力平台。

图片

新华三在 NAVIGATE 2026领航者峰会现场展示UniPoD S80000超节点产品

新华三集团高级副总裁、首席技术官张弢在技术解读中指出,超节点解决了行业普遍面临的集群规模扩容难、资源利用率低、安全防护弱、运维复杂等现实挑战。尤其针对推理场景, 256 卡超节点的整体效能比传统 8 卡多机堆叠方式高出 4 倍。这对于运营商、金融等需要向内部或公众提供稳定推理服务的客户来说,意味着可量产的 Token 成本优势。

全栈产品 托举产业生态

超节点的价值在于,它将原本分散的技术能力整合为一个有机整体。

“它是一个集大成的产品。”新华三集团高级副总裁张力表示。

超节点需要企业在算力、联接、存储、软件调度 全栈能力上都有深厚积累。其背后,是新华三在六大技术方向上的长期积累和同步突破。本届峰会发布的系列新品,恰好构成了超节点的能力基石。现场,新华三特地铺设数千平米展区,深度诠释其 “算 - - - - - 维”全栈协同能力和行业实践。

在计算侧,高密液冷整机系统 S90000 实现了 1U 空间 6 CPU 的业界最高密度,整机全液冷无风扇设计, PUE 低至 1.04 ,从能耗端摊薄每个 Token 的成本。在网络侧,单芯片 102.4T 智算交换机通过算网协同调优,带宽速率提升 100% ,时延降低 15% ,让网络成为算力的倍增器而非瓶颈。在存储侧, AI 原生存储 X20000 系列单节点带宽达 200GB 每秒、 IOPS 300 万,解决了数据喂不饱 GPU 的痛点。在云侧,新一代 AI 智能云支持 100 多种 GPU/NPU 统一纳管,模型浮点运算利用率达 82% ,避免算力闲置。在安全侧,业界最高性能 AI 防火墙 M9000-X 将防护从流量层面升级到 AI 指令级。在运维侧, 灵犀运维智能体 凝聚了新华三 23 年运维经验和 1.2 亿台在网设备的积累,将运维从经验驱动转向智能驱动。

产品之外,新华三同步推进 产业生态的 “地基”工程。近年来,新华三敏锐地察觉到, AI 产业发展中“有算力无应用、有企业无集群”的核心矛盾

为此,新华三创新性地推出了 图灵小镇 ”与“芯模社区”双引擎模式。图灵小镇定位为城市级 AI 产业发展引擎,提供算力服务、技术研发、场景应用和产业孵化,把算力和模型变成像电力一样随取随用的公共设施。芯模社区则是国产芯片与大模型的“试金石”和“中试场”,将芯片和模型放到真实的工业、医疗、政务场景中去跑,筛选最优组合,缩短技术从实验室到市场的周期。

图片

这一模式正在全国复制。 贵州 贵阳 “图灵小镇” 将建设成为大规模、绿色低碳的国产算力训练集群,不仅承载贵州智算中心,更是 “东数西算”国家算力枢纽的关键节点,承接东部算力需求 项目启动一年即取得显著成果,创造了 “贵安速度” 。在广西贺州,凭借毗邻珠三角区位和绿电优势,未来将面向广西和东盟提供智能算力服务。在内蒙古呼和浩特,中央实验室不仅是研发中枢平台,还承担着人才培养和本地产业赋能的角色。张力透露,依托中央实验室已与内蒙古大学等高校深度合作,打造校企合作基地。

“由内而外”的AI变革

一家提供 AI 基础设施的企业,自己如何用 AI 张力表示,新华三内部很早就开始了 AI 驱动的运营变革。

一方面,持续投入公司全局的 AI 数字大脑”建设,每年信息化投入巨大。随着 AI 智能体的爆发,新华三开始将 AI 深度嵌入到最高频、最影响效率的核心业务流程中。例如,智能订单处理系统如何实现从接收到工厂指令的自动流转与校验?应用后可将核心流程耗时压缩 50% ,并将员工从重复性劳动中解放出来,聚焦于业务创新和异常处理。

张力提到,新华三内部已广泛部署 AI 销售助手、 AI 开发助手、服务工程师智能助手等,鼓励员工利用 AI 提升生产力,旨在培养既懂行业又深谙 AI 应用的“新质人才”。

这种 “由内而外”的 AI 变革,让新华三在服务百行百业的客户数智化转型时更 说服力。

图片

张力在 NAVIGATE 2026领航者峰会上演讲

2025 年财报显示,新华三营收 759.81 亿元,同比增长 37.96% ,其中全年国内政企业务营业收入达到 658.46 亿元,同比增长 48.84%

这不得不归功于智算产业快速发展的时代浪潮。 2025 年我国人工智能核心产业规模突破 1.2 万亿元,据沙利文预测, 2029 国数字基础设施市场规模将达到 1.4 万亿元。

但值得注意的是,新华三的增长不仅依赖于 “时代的东风”,还有提前落子的功劳。 正如张力所说 ,新华 三很早就敏锐察觉到人工智能的动向,“早早地就定出基调”。 20 20 年,新华三就已提出 AI in ALL 战略,到 2023 年发布私域大模型百业灵犀,再到 2026 年以“算力×联接, AI ×未来”系统方案回应 Token 经济,始终是行业的“领航者”。

这种前瞻性,一方面源于与国内外头部互联网公司在 AI 领域的长期沟通与 合作 ,另一方面则来自从网络、服务器到云计算的完整技术栈积累。

如今,东风仍在加速 —— 2025 8 月,国务院印发《关于深入实施“人工智能 + ”行动的意见》; 2026 1 月,工业和信息化部等八部门联合印发《 “人工智能 + 制造”专项行动实施意见 》,明确提出到 2027 年推出 1000 个高水平工业智能体的核心目标; 3 月的全国两会上,政府工作报告首次提出“打造智能经济新形态”,明确提出“促进新一代智能终端和智能体加快推广”。一系列政策紧密衔接、层层递进,为技术创新、算力建设与场景落地提供了清晰且持续的制度保障。

但新华三不是要抢风口,而是在 “等风来”的过程中,已经把产品、生态、内部效率的地基打好,做好长期主义的准备。

Token 经济的帷幕刚刚拉开,新华三清楚,要让每一词元物有所值,既需要系统级的协同能力,也需要产业级的底座支撑,更需要一家企业“自己先下水”的务实态度。这或许正是 AI 产业从“炫技”走向“务实”的一个缩影。

(来源:中国新闻周刊)