电子发烧友网综合报道 近日,
AMD
对其下一代Instinct MI400系列中的MI430X
GPU
进行预览介绍。其原生FP64(双精度浮点)算力预计将超过200
TF
LOPs,是NVIDIA Rubin架构GPU的6倍以上。
FP64是遵循IEEE 754标准的“标准”浮点数,以其极高的计算精度著称。这种精度对于气候学、核科学、材料科学、流体力学等传统高性能计算(HPC)领域至关重要,是进行高保真科学
模拟
、捕获底层物理结构的基础。
从AMD自身产品线来看,MI430X的FP64性能实现了历史性飞跃。此前三代旗舰MI300X、MI325X和MI355X的FP64性能长期在80 TFLOPs左右徘徊,而MI430X一举将其提升至200 TFLOPs以上,增幅超过150%。
这一巨大提升,使其成为有史以来FP64性能最强的GPU,并已赢得美国橡树岭国家实验室的Discovery超算和法国Alice Recoque超算的订单。
不过,将MI430X与NVIDIA Rubin进行FP64性能对比,似乎存在明显的“不对等性”。因为NVIDIA Rubin是一款纯粹的
AI
加速器,其架构设计的核心是优化FP4、FP6等低精度计算格式,以满足大规模AI训练与推理的需求。对于Rubin而言,FP64并非其设计重点。
其实,AMD真正用来对标NVIDIA Rubin平台的,是Instinct MI450系列。该系列基于CDNA 5架构,在AI核心算力上与Rubin展开正面竞争。其FP4算力高达40 PFLOP,FP8算力达到20 PFLOP,与Rubin平台持平。同时,MI450在内存容量(432GB HBM4)和横向扩展带宽上甚至达到了竞品的1.5倍。
近日有消息称,苏姿丰表示AMD已开始向核心客户送样Instinct MI450 GPU加速卡,并计划下半年逐步提高出货Helios AI机架。
为了更好的理解各产品的性能,我们有必要厘清不同精度格式的定位:
FP64 (双精度浮点):精度高,是科学计算的基石,但在AI训练中因计算开销大而较少作为主要格式。
FP8 (8位浮点):AI领域的明星格式,在精度损失极小的情况下,能带来巨大的性能提升,已成为AI训练的主流选择。
FP4 (4位浮点):最前沿的超低精度格式,专为大规模AI推理设计,能以最小的资源消耗实现高效的模型部署。
FP6 (6位浮点):主要为AI推理而生,旨在解决FP4和INT8在推理中的痛点,在NVIDIA Bl
ac
kwell架构中被大力推广。
可以看到,AMDMI430X和MI450系列的市场策略有所不同:MI430X主攻HPC等对精度要求高的领域,服务于对计算保真度有刚性需求的科学探索;MI450系列聚焦AI算力时代的大模型训练和推理,与NVIDIA Rubin正面交锋。这并非简单的性能碾压,而是一场关于不同计算范式与应用场景的精准布局。
-
amd
amd+关注
关注
25文章
5713浏览量
140495 -
NVIDIA
NVIDIA+关注
关注
14文章
5707浏览量
110155