Cerebras Systems宣布推出第三代晶圆级AI加速芯片“WSE-3”(Wafer Scale Engine 3)。
这款产品的规格和参数都很疯狂,在功耗和价格方面也有稳定优势,性能更是比英伟达的芯片更胜一筹。
峰值AI算力高达125PFlops,相当于每秒能够完成12.5亿亿次的浮点计算。WSE-3一天内就能完成Llama 700亿参数的训练任务,为人工智能领域提供超强算力。
WSE-3采用台积电5nm,拥有超过4万亿个晶体管和46225平方毫米的硅片。板载900,000个内核和 44GB内存。当Cerebras提到内存时,这更多的是SRAM,而不是片外HBM3E或DDR5。
在搭配内存方面,还可以灵活选择1.5TB、12TB、甚至高达1200TB的容量,以满足不同规模的应用需求。
内存与内核一起分布,目的是使数据和计算尽可能接近。
Cerebras成功的原因之一是它与NVIDIA的做法不同。使用的是片上内存,而不是NVIDIA的封装内存。
NVIDIA、AMD、英特尔等公司采用晶圆切成小块来制造芯片,而Cerebras将晶圆连在一起。
在当今的集群中,可能有成千上万个GPU或AI加速器在处理一个问题,将芯片数量减少50倍以上可以降低互连和网络成本以及功耗。
在具有Infiniband、以太网、PCIe和NVLink交换机的NVIDIA GPU集群中,重新连接芯片需要花费大量的电力和成本。Cerebras通过将整个芯片连在一起来减少这一成本。
点击此处关注,获取最新资讯!
我的评论
最新评论