lch
发布于 2026-05-28 / 0 阅读
0

墨芯10亿C轮融资背后:揭秘这家公司的AI芯片技术有何独特?

近日,墨芯人工智能完成近10亿元人民币的C轮融资——本轮融资汇聚了深创投、岩山科技、大湾区共同家园、力鼎资本、蕴盛资本等头部国资创投、重磅产业资本及市场化机构,凯旋创投、创享投资、盛景嘉成等多家老股东共同参与。

对于长期关注电子工程专辑AI芯片报道的读者而言,墨芯这个名字并不陌生。这家屡次入选China Fabless 100与Silicon 100的企业,始终凭借其专注的“稀疏计算”技术路径,吸引着产业与资本的双重目光。多轮融资的完成,正是行业对这一技术方向持续肯定的缩影。从技术层面来看,Aspencore集团及旗下EE Times等媒体对墨芯的关注皆源于其创业以来专注的“稀疏计算”。

藉由墨芯宣布完成C轮融资的机会,本文尝试系统性解读墨芯所专注的的稀疏计算,探究其产品与技术在AI演进浪潮中,扮演何种角色。

从Token经济到世界模型:AI 3.0时代,稀疏计算何以成为算力基座?

破解AI算力困局,是理解稀疏计算价值的关键。随着AI迈入以智能体、长上下文、多模态大模型为特征的3.0时代,传统“暴力出奇迹”的稠密计算范式正面临根本性挑战。大模型参数规模远超摩尔定律的增速,而当下主流的Token计价模式下,推理成本已成为制约AI规模化商业落地的核心瓶颈。这不仅是成本问题,更是巨大的能源挑战——据SemiAnalysis预测,到2030年全球数据中心的电力消耗将超过4.2万亿千瓦时,寻找高能效比的算力解决方案已是产业可持续发展的必然要求。

稀疏计算,正是破解这一困局的根本性技术路径之一。其本质在于“只计算有效信息,不计算无效冗余”,通过剔除矩阵运算中的零元素或无效元素,成倍提升有效算力与能效比。


这一理念正从学术探索加速演变为全球产业共识:

NVIDIA自A100首次支持2:4结构化稀疏以来,其后几代架构均在强化对稀疏计算的投入。谷歌在稀疏化领域的布局同样深远:2021年,谷歌提出名为Pathways的通用AI架构,核心思想是以一个模型处理多项任务与多模态数据,明确稀疏化是下一代AI技术的关键词;此后,其团队又提出多模态稀疏化模型LIMoE,再次强调稀疏模型将成为AI最具前景的方法之一。在工程实践层面,谷歌TPU从第四代开始正式加入专用稀疏核心SparseCore,并在后续几代中持续演进。今年4月发布的第八代TPU中,SparseCore已成为关键组成部分,专注于处理稀疏、非规则、数据依赖型的访问模式,从硬件层面规避了传统架构在处理稀疏访问时的大量无效计算瓶颈。

与此同时,Meta、微软等巨头也在大模型推理体系中大规模应用MoE与动态稀疏激活等技术以降低推理开销。据Gartner预测,到2029年推理将占据65%以上的AI算力支出。即便在稀疏的实现层级上各有差异,这些布局共同表明稀疏工作负载正在成为AI推理的主流形态。无论是硬件架构、模型结构还是编译器体系,全球产业链都在围绕“只计算必要部分”这一核心思想加速演进。宏观趋势上,随着AI数据中心电力消耗预计到2030年将占全球发电量的4.5%,在面对世界模型这类需要处理海量、多模态、低价值密度数据的终极目标时,稀疏计算“按需激活”的特性更被视为通向通用人工智能的算力基石。稀疏计算正从研究热点走向产业共识,成为未来AI基础设施提升能效、降低TCO的关键路径。

墨芯人工智能董秘兼企业发展与资本市场部总经理王率宇对此总结道:“在AI算力推理需求激增的时代背景下,稀疏计算根本性地降低了推理成本,实现了结构性的能效突破。稀疏计算正从‘可选路径’变为‘必选答案’”。

MLPerf佳绩印证TCO优势,全新一代SparsePrime年内登场

稀疏计算为墨芯产品带来的直接价值,就是显著更低的TCO(总拥有成本)。

在国际权威AI基准测试MLPerf™ Inference中,墨芯的S30计算卡曾连续三届斩获冠军,覆盖视觉与自然语言处理等主流模型任务,以远低于行业旗舰产品的功耗实现了更优的推理性能。这充分验证了稀疏计算路线在真实数据中心负载下的商业竞争力,证明其在确保精度的基础上,真正实现了系统级的降本增效。



乘势而上,墨芯在本次融资发布中正式宣布,全新一代计算卡SparsePrime®将于年内推出。该产品基于自研的Antoum 2.0芯片架构,专为大模型与复杂推理场景优化,将在通用性与易用性上实现质的飞跃:

· 通用性方面,SparsePrime®定位为高性能AI通用计算推理卡,采用自顶向下的设计理念,广泛适配主流Transformer模型,大幅强化了通用适配能力。

· 易用性方面,它配备了更完善的工具链,可实现客户零成本快速迁移。开发者现有的基于PyTorch、TensorFlow的代码及vLLM等框架,能够近乎零代码修改地完成部署;同时支持Triton语言自定义算子开发,将使用门槛降至最低。

· 系统架构方面,该卡基于墨芯自研的高速互联协议,可高效协同构建超节点、超融合AI集群,支持更大参数规模的大模型推理,从系统层面进一步降低AI基础设施的TCO。

总的来说,今年要推向市场、基于新架构的SparsePrime®在单位有效稀疏算力上实现进一步提升,强化通用性和易用性的基础上,从系统层面持续降低AI基础设施的TCO;可能会成就稀疏计算真正意义上的规模化部署及墨芯人工智能企业自身的大跨步,也为未来Token经济时代打下了盈利可能性的铺垫

千卡集群落子全国,响应“十五五”规划

仅有技术前景的预判和芯片、加速卡产品的产出还不够,更重要的是技术与产品有没有在实际应用中落地。在谈墨芯稀疏计算的市场优势时,王率宇谈到了一个关键要素:“真实场景磨出来的数据飞轮”——已经落地的算力中心千卡集群在真实生产环境中“积累了海量稀疏负载数据,反哺下一代芯片架构,构成了‘落地越多、数据越多、算法越强’的飞轮效应”。

墨芯稀疏计算产品的商业化落地进展也全面提速。墨芯人工智能商业化副总裁尚勇在采访中说,公司已从单点项目验证迈入“全国多区域千卡集群部署”阶段,基于自研技术构建的推理集群正成为多个重点区域智算中心的核心算力底座。

这一布局与国家“十五五”规划、“东数西算”工程及“算电协同”战略高度共振。墨芯的计算卡已战略性部署于西北、西南、华东、华北四大片区,并在多个行业实现规模化应用:

比如“生命科学、基因检测领域已有明确项目交付”——稀疏计算推理集群用于加速基因测序数据分析流程;与头部生信企业合作,为高通量测序、蛋白质结构预测等计算密集型任务提供高性能、低功耗的AI算力支持;

在智慧城市方向上,则与华北高校合作落地智慧社区项目,支持人脸、姿态识别等视觉多模态应用;

电子制造和工业视觉领域,有“多个工厂安防项目”落地,用以促进安全生产监控、产线异常识别等;

与头部商旅酒店集团合作,旨在探索稀疏计算在酒店智慧化管理和服务提质中的应用场景;还有和头部电信运营商建立合作关系,将稀疏计算解决方案纳入运营商算力服务体系......不仅表明稀疏计算正切实地在各行各业发挥作用,而且也为SparsePrime®的问世积累了真实负载数据。


这一覆盖全国的算力网络可服务于互联网CSP云服务供应商,用于其基础大模型训练与推理需求。

强调稀疏计算的AI计算卡在各行各业及覆盖全国多片区的应用,全面响应了“十五五”规划中“绿色电力”与“算电协同”布局,对深入推进“东数西算”工程,构建多层次算力设施体系和全国一体化算力网具备非凡价值;为全面深化拓展“人工智能+”行动,令AI跨越升级为全社会的“新基建”,以及助力产业数智化转型、中国“智”造奠定了相当的基础。

生态建设构筑长期护城河,目标不止于推理

就C轮融资本身——与商业价值形成呼应,C轮融资“标志着稀疏计算正从技术验证期加速迈入规模化产业爆发的新阶段”。参投资本构成恰恰反映了围绕稀疏计算技术路线的产业共识凝聚。

除了部分老股东持续跟投,包括国资创投加码,都表明稀疏计算赛道获得政策与资本的进一步认可;本轮融资的领投方是深度布局AI基础设施的头部大厂,本身在稀疏模型架构上就有探索,故而在对稀疏计算技术路线进行长时间技术尽调以后选择了战略投资,就是对稀疏计算作为AI技术路线正统的肯定。

从行业观察的角度来看,C轮融资的价值至少体现在两个方向上:

(1)墨芯作为国内最早、最系统化深耕稀疏计算的AI算力企业,其技术积累、产品节奏与落地速度正在获得更广泛的认可;而融资不仅将为墨芯提供持续发展的资源,更重要的是它所释放出的技术路线信号。

(2)资本与产业方对稀疏计算的集中押注,意味着这一方向正在从“技术可能性”走向“产业必然性”,稀疏化正在成为未来算力体系中不可忽视的底层能力。换句话说,C轮融资不仅强化了墨芯自身的成长确定性,也在一定程度上推动了稀疏计算在国内产业链中的战略地位加速提升。

最后值得一提的是,墨芯也在积极推进稀疏计算生态圏建设,持续投入稀疏化软件工具链完善、开发者社区建设和产学研合作,构建更强大的生态壁垒。毕竟无论是投资者还是产业视角,提升开发易用与友好度、加强生态粘性、扩展落地场景,都需要持续不断地投入生态建设,更不用说稀疏计算的“生态成长性”也是所有人关注的焦点,更是墨芯长期商业价值的核心构成。

比如在产学研的合作方面,墨芯近年来也在持续加强与国内外顶级高校和科研机构的合作,从源头推动下一代稀疏计算技术的突破。例如,与卡内基梅隆大学围绕推理加速、稀疏化训练等前沿领域进行深度研究;与复旦大学可信具身智能研究院围绕“半结构化稀疏”展开联合课题,通过智能化稀疏模式搜索提升模型稀疏率与硬件友好性;与清华大学CCNI Lab、SparseMind的合作则聚焦稀疏计算理论在专业场景中的应用探索;与杭州电子科技大学共建稀疏计算联合实验室,研究“云—边—端”协同的推理算力体系。

这些合作将进一步推动稀疏计算从学术前沿走向产业实践,形成算法、架构与应用的闭环,也为行业培养稀疏计算人才生态,构筑长期技术护城河。

从更长周期来看,随着世界模型、智能体Agent对算力与能效提出极致要求,稀疏计算的价值将持续凸显。墨芯的愿景也远不止于推理端,其官方资料已明确表示,未来将探索将稀疏化技术带入训练端,寻求更广泛的AI性能突破。这家公司在稀疏计算道路上的探索,在Antoum 2.0与SparsePrime®的催化下,正进入一个新的发展阶段。

无论是谷歌在TPU架构中不断强化的SparseCore,还是国际大厂在MoE、动态稀疏激活、稀疏编译器上的持续投入,都表明稀疏计算正从单点优化走向体系化演进。随着硬件、算法与软件栈的协同成熟,稀疏计算有望成为未来AI基础设施提升能效、降低TCO的关键支柱,并在大模型规模继续扩张的背景下,承担起推动算力可持续发展的长期角色。

墨芯基于稀疏计算架构的AI算力卡,“正探索一条‘不减算力、只减成本’的技术芯路径”;墨芯的稀疏计算之路在Antoum 2.0之上才刚刚开始…