
AI 算力产业高速迭代的当下,高性能、低成本、高适配的推理算力,已成为大模型规模化落地的核心刚需。近日,稀疏计算赛道龙头企业墨芯人工智能传来重磅利好:公司正式完成近十亿元人民币 C 轮融资。本轮融资汇聚深创投、岩山科技、大湾区共同家园、力鼎资本、蕴盛资本等头部国资创投与产业资本,凯旋创投、创享投资、盛景嘉成等老股东持续加码,形成 “产业巨头 + 国资背书 + 财务资本” 的多元股东结构,既保障技术协同深度,也为全国算力网络布局筑牢资源底座,充分彰显资本市场对墨芯技术路径与发展潜力的高度认可,标志着稀疏计算正从技术验证期加速迈入规模化产业爆发新阶段。

据官方披露,本次近十亿融资资金将精准聚焦两大核心战略方向:一是全力推进全新一代计算卡 SparsePrime® 的规模化量产与商业化落地;二是持续扩张全国算力网络版图,完善全域算力服务布局,进一步夯实墨芯在 AI 推理算力领域的市场地位,加速稀疏计算技术的产业化普及。
伴随融资落地,墨芯全新一代高性能 AI 通用推理计算卡 SparsePrime® 将于2026 年内正式推出,为智算中心、数据中心的大模型复杂推理场景带来颠覆性算力解决方案。作为墨芯迭代升级的核心产品,SparsePrime® 搭载自研Antoum2.0 芯片架构,针对性适配大模型训练推理、复杂场景运算需求,打破传统算力产品的适配局限与性能瓶颈。

在产品设计与适配能力上,SparsePrime® 采用自顶向下的一体化设计理念,深度兼容主流 Transformer 模型,具备极强的通用适配性,可全面覆盖各类大模型推理场景。为降低企业与开发者的落地门槛,产品配套完善的全链路工具链,实现客户零学习成本、零改造成本快速部署。开发者现有基于 PyTorch、TensorFlow 搭建的模型代码,以及 vLLM 等主流高效推理框架,均可实现近乎零代码修改迁移、一键部署运行;同时支持 Triton 语言自定义算子开发,给予开发者极致的开发灵活性,最大化降低 AI 算力落地的技术门槛与时间成本。
性能层面,SparsePrime® 依托墨芯在全国多地千卡算力中心集群部署积累的真实海量负载数据,完成算法与架构的深度优化,在稀疏计算效率上实现突破性升级。产品成功落地精度无损、算力翻倍的核心技术路径,在保障大模型推理精度稳定的前提下,大幅提升推理算力输出,彻底破解传统推理算力 “精度与性能难以兼顾、高算力伴随高功耗” 的行业痛点,构建起墨芯独有的差异化算力竞争优势。
SparsePrime® 的硬核实力,源于墨芯多年深耕稀疏计算赛道的技术积淀。此前,墨芯旗下 S30、S40 系列计算卡已在国际权威 AI 基准测试 MLPerf™ Inference 中连续三届斩获冠军,在视觉、自然语言处理、大模型等主流任务中,展现出领先行业的能效比与单位算力推理吞吐量,以显著低于行业旗舰产品的功耗达成更优推理性能,充分验证了稀疏计算在真实数据中心负载下的工程可行性与商业价值。

当前,AI 产业正从模型研发全面转向规模化落地,万亿级参数大模型普及推动算力需求爆发式增长,而摩尔定律迭代放缓,算力需求与硬件迭代的矛盾日益凸显。在此背景下,稀疏计算成为破局关键与确定性趋势,其核心逻辑是 “只算有效值、跳过零值”,通过软件压缩存储、硬件跳过无效计算的双向优化,打破传统密集型计算桎梏。
传统 AI 密集型计算面临两大核心瓶颈:一是算力墙,通用芯片无差别计算零值与非零值,而大模型超半数参数为无效零值,造成巨大算力浪费;二是内存墙,海量参数存储、长文本推理下的 KV Cache 占用,对显存带宽提出极致要求,大幅推高部署成本。稀疏计算可实现数倍至数十倍能效比提升,有效降低数据中心整体 TCO,成为 AI 算力高效低碳发展的必由之路。
经过多年发展,稀疏计算已形成硬件芯片、模型算法、基础软件三位一体的完整产业链,技术路线分为结构化稀疏与动态稀疏两大方向:结构化稀疏规则固定、硬件适配性强,多用于芯片固定剪枝优化;动态稀疏可根据输入数据自适应调整,精度表现更优,适配 MoE 混合专家模型、稀疏注意力等主流大模型技术。目前,英伟达、谷歌等国际巨头均已布局稀疏硬件架构,国内涌现出以墨芯为代表的领军企业,叠加华为、DeepSeek 等在算法层的迭代优化,赛道已进入技术爆发与大规模商业落地的双重窗口期。
如今,稀疏计算已告别实验室阶段,全面走向产业化落地。在核心算力场景,墨芯已完成西北、西南、华东、华北四大片区千卡算力集群战略性布局,紧扣 “东数西算” 与 “算电协同” 国家战略,成为区域智算中心的核心推理底座:西北集群支撑传统产业智能化转型,西南集群依托绿电资源打造低功耗算力池,华东集群赋能生信分析等高端服务业,华北集群助力城市治理升级。同时,墨芯与头部电信运营商、商旅酒店集团、车企达成合作,覆盖智能制造、智慧医疗、智能出行等多元场景,以低 TCO、高能效的算力供给,满足互联网 CSP 厂商第三方推理算力需求,为 SparsePrime® 规模化应用打开新空间。

墨芯人工智能商业化副总裁尚勇表示:“我们的千卡集群布局并非单纯的算力建设,而是通过贴近产业集聚区部署高性能、低 TCO 的推理算力节点,将稀疏计算的技术优势真正注入到千行百业 —— 无论是生信分析的基因测序加速,还是城市治理的实时视频分析,抑或智能制造的视觉检测,每一个集群落子,都是为了就近、高效、低成本支撑大规模推理需求,让 AI 算力像水电一样触手可及。”
长远来看,全球数据中心能耗压力持续攀升,单纯依靠制程升级已无法适配 AI 发展需求,全链路稀疏、软硬深度协同将成为行业核心趋势,稀疏计算也将从算力优化的 “可选方案”,升级为 AI 基础设施迭代的 “刚需路径”。墨芯持续深耕产学研合作,与卡内基梅隆大学、复旦大学、清华大学等高校联合攻关稀疏计算前沿技术,构建产学研一体的人才生态,筑牢下一代技术护城河。
墨芯董秘兼企业发展与资本市场部总经理王率宇强调:“推理成本是 AI 普及的关键瓶颈,稀疏计算正在给出根本性解答。从投资视角看,评判 AI 芯片公司的价值,不应只看单卡理论算力,更要看其在真实集群环境中完成同等 AI 任务的有效算力和能效比。墨芯的多地部署与客户扩容,正是产品力和商业价值的硬核验证。我们希望通过自研芯片与算力网络的组合,成为 AI 基础设施层不可或缺的绿色算力底座。”
此次近十亿 C 轮融资的落地,为墨芯技术迭代与商业化提速注入强劲动能。未来,随着 SparsePrime® 计算卡量产上市,叠加全国算力网络持续扩张,墨芯将进一步打通 “技术研发 — 产品迭代 — 算力部署 — 商业落地” 的完整闭环,持续深化稀疏计算在智算中心、数据中心的规模化应用,为大模型产业化、AI 产业全域落地提供高效、低碳、普惠的核心算力支撑,引领 AI 推理算力行业迈入精细化、高效化发展新阶段。

是说芯语原创,欢迎关注分享
合作洽谈,进入公众号:服务—>商务合作
