原生FP64突破200 TFLOPs！AMD MI430X性能曝光，领先NVIDIA Rubin达6倍？

电子发烧友网综合报道近日， AMD 对其下一代Instinct MI400系列中的MI430X GPU 进行预览介绍。其原生FP64（双精度浮点）算力预计将超过200 TF LOPs，是NVIDIA Rubin架构GPU的6倍以上。

FP64是遵循IEEE 754标准的“标准”浮点数，以其极高的计算精度著称。这种精度对于气候学、核科学、材料科学、流体力学等传统高性能计算（HPC）领域至关重要，是进行高保真科学模拟、捕获底层物理结构的基础。

从AMD自身产品线来看，MI430X的FP64性能实现了历史性飞跃。此前三代旗舰MI300X、MI325X和MI355X的FP64性能长期在80 TFLOPs左右徘徊，而MI430X一举将其提升至200 TFLOPs以上，增幅超过150%。

这一巨大提升，使其成为有史以来FP64性能最强的GPU，并已赢得美国橡树岭国家实验室的Discovery超算和法国Alice Recoque超算的订单。

不过，将MI430X与NVIDIA Rubin进行FP64性能对比，似乎存在明显的“不对等性”。因为NVIDIA Rubin是一款纯粹的 AI 加速器，其架构设计的核心是优化FP4、FP6等低精度计算格式，以满足大规模AI训练与推理的需求。对于Rubin而言，FP64并非其设计重点。

其实，AMD真正用来对标NVIDIA Rubin平台的，是Instinct MI450系列。该系列基于CDNA 5架构，在AI核心算力上与Rubin展开正面竞争。其FP4算力高达40 PFLOP，FP8算力达到20 PFLOP，与Rubin平台持平。同时，MI450在内存容量（432GB HBM4）和横向扩展带宽上甚至达到了竞品的1.5倍。

近日有消息称，苏姿丰表示AMD已开始向核心客户送样Instinct MI450 GPU加速卡，并计划下半年逐步提高出货Helios AI机架。

为了更好的理解各产品的性能，我们有必要厘清不同精度格式的定位：
FP64 (双精度浮点)：精度高，是科学计算的基石，但在AI训练中因计算开销大而较少作为主要格式。
FP8 (8位浮点)：AI领域的明星格式，在精度损失极小的情况下，能带来巨大的性能提升，已成为AI训练的主流选择。
FP4 (4位浮点)：最前沿的超低精度格式，专为大规模AI推理设计，能以最小的资源消耗实现高效的模型部署。
FP6 (6位浮点)：主要为AI推理而生，旨在解决FP4和INT8在推理中的痛点，在NVIDIA Bl ac kwell架构中被大力推广。

可以看到，AMDMI430X和MI450系列的市场策略有所不同：MI430X主攻HPC等对精度要求高的领域，服务于对计算保真度有刚性需求的科学探索；MI450系列聚焦AI算力时代的大模型训练和推理，与NVIDIA Rubin正面交锋。这并非简单的性能碾压，而是一场关于不同计算范式与应用场景的精准布局。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

amd

amd

+关注

关注
25

文章
5713

浏览量
140495
NVIDIA

NVIDIA

+关注

关注
14

文章
5707

浏览量
110155

菜单

分享

原生FP64突破200 TFLOPs！AMD MI430X性能曝光，领先NVIDIA Rubin达6倍？

中国智能驾驶技术行业发展现状及前景研究报告

盐城市大丰区招商局朱金瑜局长一行来访五度易链，聚焦大数据精准招商

中国智能座舱行业市场现状及发展趋势研究报告

2021厦门投洽会 | “五度易链”创始人金永顺博士：数据驱动产业高质量发展！

2026年中国汽车芯片行业市场现状与发展前景研究报告

Y12T110 广州港科大：偏振无关角度无关的垂直耦合光栅

心梗猝死来临前的6个求救信号别忽视！记住这些关键时刻能救命

中国新能源汽车行业市场现状与未来发展趋势研究报告

“笃威尔数字技术”受邀出席2024 H-Tech Data创新情报论坛！

喜报 | “北京笃威尔数字技术有限公司”获评2024年国家高新技术企业