低功耗处理器设计已经应用于超过1800亿颗芯片的ARM,两年前就开始探索边缘、云端及5G市场,并发布了Neoverse E系列处理器,ARM当时称到2021年这一系列处理器每年要实现30%的性能提升。2019年,第一代Neoverse N1推出,性能提升60%,是2018年提出的目标的两倍。
本周,ARM再次更新Neoverse产品线,发布第二代N系列Neoverse N2以及全新的Neoverse V1平台。相比Neoverse N1,Neoverse N2在保持相同水平的功率和面积效率之余,单线程性能提升了40%。同样与Neoverse N1相比,Neoverse V1的单线程性能可提升超过50%。
ARM在高性能计算市场是要靠单核与x86的多核竞争吗?
Neoverse CPU为何强调单核性能?
Neoverse系列发布两年之后,已经拥有了E系列、N系列、V系列三大系列。Neoverse N系列同时考虑了性能、功率、面积(PPA),擅长可扩展;V系列旨在提供最佳性能,相对而言会消耗更多面积和功耗;E系列主要关注效率,在功耗和面积的缩减上进行优化。
作为最新发布的产品系列,V系列更加追求性能,因此Neoverse V1是面向7nm和5nm设计,并且率先支持可伸缩矢量扩展(SVE ,Scalable Vector Extensions)。SVE可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。
同时,V1还支持PCIe 5.0连接、DDR5、HBM2e和CCIX 1.0,可实现插槽之间的芯片与封装内小芯片之间的双向一致性通信。
ARM基础设施事业部高级副总裁兼总经理 Chris Bergey接受采访时表示:“SVE在加速HPC高性能计算领域或者是机器学习工作方面表现高效,同时它对软件开发者非常友好,不需要管矢量的位宽是多少。未来我们会把SVE技术运用到除N2和V1之外的一系列核上面。”
以ARM架构为基础的日本富岳(Fugaku)超级计算机就使用了512位的SVE的技术,它不仅是全球最快的超算,也是最新Green500榜单排名第四的超算。
ARM本周发布的另一款新产品Neoverse N2面向5nm工艺设计,支持PCIe 5.0和DDR5,通过支持用于高带宽存储器的HBM3以及用于结构的CCIX 2.0和CXL 2.0来进一步扩展。可支持从8核心,20W到192核心350W的设计,横跨云、智能网卡(SmartNICs)、企业网络到功耗受限的边缘设备的高可扩展性平台。
Chris Bergey表示,关于新发布的V1和N2的更多细节会在之后公布。现在我们只知道V1和N2相比上一代N1的单核性能提升了超50%和40%。
为什么Neoverse CPU如此强调单核性能?Chris Bergey解释:“我们认为云服务厂商会更倾向选择单线程处理器核,因为接近度、安全性、多租户等特性可以为他们带来更好的经济性,这也是我们的产品聚焦单线程技术的原因。当然,Neoverse E1也支持同步多线程(SMT)技术。”
他还给出了一张图表,X轴代表芯片级性能,Y轴代表每线程性能,从图表中可以看到,相比传统的英特尔和AMD服务器CPU,Neoverse的单核及芯片级性能都超过了市场上的产品。
Neoverse每年30%的性能提升持续到2021年之后
ARM承诺,Neoverse系列CPU的性能每年会提升30%,这种提升会持续到2021年。Chris Bergey说:“这当然与ARM工程团队的努力和投入是分不开的,我认为与软件生态的逐渐成熟有更大的关系,例如很多云原生的软件现在可以比较无缝地运行在ARM架构上面。”
ARM在手机CPU市场持续更新的架构与Neoverse性能的持续提升显然有着密不可分的关系。Chris Bergey表示,“我们在Cortex的基础上,针对基础设施领域所要求的功能做了进一步的增添或提升,并且打造最合适超多核设备的功耗与性能,包括核之间的互联等优化工作。”
也就是说,同一时期的Cortex和Neoverse产品之间存在相似之处。比如,Neoverse N1是和Cortex-A76是同期开发,这两个微体系结构有很多相似之处。
Neoverse V1可以看作是Cortex-X1的同级设计,两款旗舰CPU可能共享许多超大型内核结构。Cortex-X1是今年5月份发布的新品,同样追求最大性能。
Neoverse N2有些特殊,因为它代表下一代Cortex-A的设计,也就是与Cortex-X1同期发布的A78的后续产品,这或许也是Neoverse N2的技术细节现在还不能公布的关键原因。为了更直观的说明Cortex与Neoverse产品线之间的关系,外媒AnandTech制作的一张图能够帮助大家更好地理解。
图片来源:AnandTech
软件生态方面,ARM关键的任务在于ARM的芯片级接口,这提供了设计系统层级解决方案的机会。ARM在CCIX与CXL投资,提供更好的互联技术,可以提供可扩展性的交换网,支持大量的处理器核。
另外,ARM Project Cassini是希望通过标准、平台安全性与参考实施,对软件开发者友好,让行业合作伙伴能够在基于ARM的平台上部署装机即用。
在对基础设施的基础软件包括操作系统、虚拟机管理程序支持方面,Xen、KVM、Docker容器以及越来越多的Kubernetes已经陆续宣布支持ARM架构。许多初期由ARM推动的开源项目正在变得自主运转,商用ISV应用程序也齐步演进。
ARM服务器CPU“抢食”x86蛋糕最缺的是时间
但想要真正撼动x86在云端CPU市场的地位,ARM还有很长的路要走。Chris Bergey对记者表示:“ARM在云端市场最大的挑战还是时间。我们看到很多数据中心的客户对转向ARM有巨大的兴趣。但从ARM的IP到芯片设计,到最后能够在数据中心部署,再到软件生态系统的支持,仍需要一定的时间以及很多产业链合作伙伴一起努力。”
当然,Neoverse是面向从个云端到边缘的市场。Chris Bergey也指出,ARM的机遇其实包括了云原生软件的支持,以及协助客户通过定制化的形式克服摩尔定律减速带来的挑战等。
此前报道,亚马逊、Marvell都已经将ARM架构应用于云端,亚马逊推出了ARM架构的服务器处理器Graviton2,Marvell也推出了基于ARM架构定制的ThunderX3处理器,华为海思也推出了基于Neoverse N1设计的鲲鹏系列服务器。
业内有观点认为,ARM在云端市场要成功的一个关键就是满足大型互联网公司和云服务提供商的定制化需求。
“在异构计算里,ARM有一个很大的机遇,就是我们如何提供紧耦合或是定制化的能力,甚至是通过多核封装或多芯片组装技术,将来自生态系统、IP技术与云厂商的需求与技术整合在一起。” Chris Bergey说,对于没有很强设计经验的客户而言,他们更倾向于选择Neoverse核。
ARM架构芯片能未来能否覆盖从终端到边缘再到云端?现在看来,这种成功除了ARM的努力外,最终是否会被英伟达收购也成为了关键因素。
点击此处关注,获取最新资讯!
我的评论
最新评论