lch
发布于 2026-05-09 / 0 阅读
0

原生FP64突破200 TFLOPs!AMD MI430X性能曝光,领先NVIDIA Rubin达6倍?

电子发烧友网综合报道 近日, AMD 对其下一代Instinct MI400系列中的MI430X GPU 进行预览介绍。其原生FP64(双精度浮点)算力预计将超过200 TF LOPs,是NVIDIA Rubin架构GPU的6倍以上。

FP64是遵循IEEE 754标准的“标准”浮点数,以其极高的计算精度著称。这种精度对于气候学、核科学、材料科学、流体力学等传统高性能计算(HPC)领域至关重要,是进行高保真科学 模拟 、捕获底层物理结构的基础。

从AMD自身产品线来看,MI430X的FP64性能实现了历史性飞跃。此前三代旗舰MI300X、MI325X和MI355X的FP64性能长期在80 TFLOPs左右徘徊,而MI430X一举将其提升至200 TFLOPs以上,增幅超过150%。

这一巨大提升,使其成为有史以来FP64性能最强的GPU,并已赢得美国橡树岭国家实验室的Discovery超算和法国Alice Recoque超算的订单。

不过,将MI430X与NVIDIA Rubin进行FP64性能对比,似乎存在明显的“不对等性”。因为NVIDIA Rubin是一款纯粹的 AI 加速器,其架构设计的核心是优化FP4、FP6等低精度计算格式,以满足大规模AI训练与推理的需求。对于Rubin而言,FP64并非其设计重点。

其实,AMD真正用来对标NVIDIA Rubin平台的,是Instinct MI450系列。该系列基于CDNA 5架构,在AI核心算力上与Rubin展开正面竞争。其FP4算力高达40 PFLOP,FP8算力达到20 PFLOP,与Rubin平台持平。同时,MI450在内存容量(432GB HBM4)和横向扩展带宽上甚至达到了竞品的1.5倍。

近日有消息称,苏姿丰表示AMD已开始向核心客户送样Instinct MI450 GPU加速卡,并计划下半年逐步提高出货Helios AI机架。

为了更好的理解各产品的性能,我们有必要厘清不同精度格式的定位:
FP64 (双精度浮点):精度高,是科学计算的基石,但在AI训练中因计算开销大而较少作为主要格式。
FP8 (8位浮点):AI领域的明星格式,在精度损失极小的情况下,能带来巨大的性能提升,已成为AI训练的主流选择。
FP4 (4位浮点):最前沿的超低精度格式,专为大规模AI推理设计,能以最小的资源消耗实现高效的模型部署。
FP6 (6位浮点):主要为AI推理而生,旨在解决FP4和INT8在推理中的痛点,在NVIDIA Bl ac kwell架构中被大力推广。

可以看到,AMDMI430X和MI450系列的市场策略有所不同:MI430X主攻HPC等对精度要求高的领域,服务于对计算保真度有刚性需求的科学探索;MI450系列聚焦AI算力时代的大模型训练和推理,与NVIDIA Rubin正面交锋。这并非简单的性能碾压,而是一场关于不同计算范式与应用场景的精准布局。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5713

    浏览量

    140495
  • NVIDIA
    NVIDIA
    +关注

    关注

    14

    文章

    5707

    浏览量

    110155