AMD新品号称性能强于英伟达 ssd新闻存储新闻

2024-10-11

阅读量 1827

AMD的256GB Instinct MI325X GPU在AI推理工作负载方面的表现可以超越Nvidia的141GB H200处理器，并承诺下一代MI350加速器芯片将使性能大幅提升。

在训练AI模型方面，AMD表示MI325X与H200相当或略胜一筹。

MI325X是Instinct MI300X的后续产品，具有更大的内存容量和带宽。

Instinct MI300X去年12月推出，AMD凭借提供强大的AI加速器芯片方面的实力，成为Nvidia的竞争对手。

这是AMD新战略的一部分，即每年发布一次Instinct芯片，而不是每两年发布一次，这显然是为了跟上Nvidia加快的芯片发布节奏。

AMD表示，MI325X明年第一季度开始应用于戴尔科技、联想、超微、惠普企业、技嘉、Eviden 和其他几家服务器供应商的系统。

Instinct MI325X规格和性能指标

Instinct MI300X配备192GB HBM3和5.3TB/s的内存带宽，而基于与MI300X相同的CDNA 3 GPU 架构的MI325X配备256GB HBM3E，由于内存格式的更新，内存带宽可达到6TB/s。

在吞吐量方面，MI325X具有与MI300X相同的功能：8位浮点（FP8）性能为2.6千万亿次浮点运算，16位浮点（FP16）性能为1.3千万亿次浮点运算。

在芯片级别将AI推理性能与H200进行比较时，AMD表示，MI325X采用8组、70亿参数的Mixtral 模型，吞吐量提高40%；采用70亿参数的Mixtral模型，延迟降低30%；采用700亿参数的Llama 3.1模型，延迟降低20%。

MI325X将适用于八芯片Instinct MI325X平台，该平台将作为明年初推出的服务器的基础。

该平台通过带宽为896GB/z的AMD Infinity Fabric连接八个MI325X GPU，将具有2TB的HBM3e 内存、48TB/s的内存带宽、20.8 petaflops的FP8性能和10.4 petaflops的FP16性能。

这意味着MI325X平台的内存容量比Nvidia的H200 HGX平台高出80%，内存带宽高出30%，FP8和FP16吞吐量快30%，该平台配备8个H200 GPU，今年早些时候开始出货，作为基于H200的服务器的基础。

AMD将推理性能与H200 HGX平台进行比较，MI325X平台通过4050亿个参数的Llama 3.1模型提供了更快40%的吞吐量，通过700亿个参数的Llama 3.1模型提供了更低20%的延迟。

在单个GPU上训练70亿参数的Llama 2模型时，MI325X比H200快10%。

另一方面，在八个GPU上训练700亿参数的Llama 2模型时，MI325X平台与H200 HGX平台不相上下。

MI350芯片推理能力提升35倍

下一代 Instinct MI350加速器芯片系列有望明年下半年推出，并透露与MI300X相比，推理性能将提高35倍。

这是基于运行1.8万亿参数专家混合模型的八GPU MI350平台的工程估算做出的预测。

MI350系列基于AMD下一代CDNA 4架构，采用3纳米制造工艺，将包括MI355X GPU，配备288GB HBM3e内存和8TB/s内存带宽。

MI350系列支持新的4位和6位浮点格式 (FP4、FP6)，MI355X能够实现9.2千万亿次浮点运算。

对于FP8和FP16，MI355X预计分别达到4.6千万亿次浮点运算和2.3千万亿次浮点运算。

这意味着下一代Instinct芯片有望比MI325X或MI300X提供快77%的FP8和FP16格式的性能。

Instinct MI355X平台配备八个MI355X GPU，预计将具有2.3TB HBM3e内存、64TB/s内存带宽、18.5 petaflops的FP16性能、37 petaflops的FP8性能以及74 petaflops的FP6和FP4性能。

MI355X平台拥有74petaflops的FP6和FP4性能，预计比MI300X平台的FP16功能快7.4倍。

MI355X平台的内存容量增加了50%，这意味着它可以在单个系统上支持多达4.2万亿个参数模型，是MI300X平台的六倍。

AMD明年下半年推出MI355X后，公司计划在2026年推出采用下一代CDNA架构的Instinct MI400 系列。

点击此处关注，获取最新资讯！

1.本文整理自网络，如有侵权，请联系删除。

2.所刊内容仅代表作者观点，非闪德资讯立场。

请登录后评论