华为云首发适配DeepSeek-V4模型

4月24日，DeepSeek-V4模型正式发布并开源，华为云首发适配。DeepSeek-V4拥有百万Token超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。其中，DeepSeek-V4-Flash模型参数下降至284B，推理成本进一步降低，模型参数和激活更小，V4-Flash能够提供更加快捷、经济的A PI 服务，实现百万上下文普惠。当前，华为云MaaS模型即服务平台已为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。

在此次新模型适配过程中，华为云在系统层、算子层和集群层的关键能力上协同，分别从调度效率、计算效率和数据流转效率三个维度保障新模型快速适配与高性能落地。

针对DeepSeek-V4，华为云首发适配模型分层注意力压缩机制，实现V4注意力机制下 KVCache的高效分配管理，提供TopK、SWA、CFA等10+昇腾高性能融合算子，搭配框架异步调度、MTP多步投机等框架优化，支持原生1M长上下文的高性能推理。

华为云以高效的 AI 基础设施为核心打造“硅基黑土地”，开放接纳自研和第三方主流大模型和众多智能体，为企业解难题，提升生产效率！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3826

浏览量
52276
华为云

华为云

+关注

关注
3

文章
2837

浏览量
19373
DeepSeek

DeepSeek

+关注

关注
2

文章
847

浏览量
3406

原文标题：DeepSeek-V4发布，华为云首发适配

文章出处：【微信号：huaweicorp，微信公众号：华为】欢迎添加关注！文章转载请注明出处。

菜单

分享

华为云首发适配DeepSeek-V4模型

中国智能驾驶技术行业发展现状及前景研究报告

盐城市大丰区招商局朱金瑜局长一行来访五度易链，聚焦大数据精准招商

中国智能座舱行业市场现状及发展趋势研究报告

2021厦门投洽会 | “五度易链”创始人金永顺博士：数据驱动产业高质量发展！

2026年中国汽车芯片行业市场现状与发展前景研究报告

Y12T110 广州港科大：偏振无关角度无关的垂直耦合光栅

心梗猝死来临前的6个求救信号别忽视！记住这些关键时刻能救命

中国新能源汽车行业市场现状与未来发展趋势研究报告

“笃威尔数字技术”受邀出席2024 H-Tech Data创新情报论坛！

喜报 | “北京笃威尔数字技术有限公司”获评2024年国家高新技术企业