炼数成金 门户 商业智能 芯片 查看内容

Arm连发两大服务器CPU新品!单核性能猛增50%

2020-9-23 16:03| 发布者: 炼数成金_小数| 查看: 41244| 评论: 0|原作者: 心缘|来自: 芯东西

摘要: 今天,Arm公布下一代Neoverse服务器CPU设计,不仅公布N系列的第二代产品N2,还首次推出了全新产品类别Neoverse V系列平台,剑指最高单线程性能。Neoverse V1内核(代号Zeus)支持可伸缩扩展(SVE),具备更高的单线 ...
今天,Arm公布下一代Neoverse服务器CPU设计,不仅公布N系列的第二代产品N2,还首次推出了全新产品类别Neoverse V系列平台,剑指较高单线程性能。

Neoverse服务器CPU路线图

Neoverse V1内核(代号Zeus)支持可伸缩扩展(SVE),具备更高的单线程性能和机器学习性能,适用于对CPU性能和带宽要求更高的应用。相较N1内核,V1单线程性能提高了50%以上。

N2内核(代号Perseus)提供更多的内核数和优化的性能/功率比,具有更好的横向扩展性能。相较N1内核,N2单线程性能提高了40%以上。

Neoverse N系列的PPA特征定义是性能、功率、面积得到了同等考量,擅长可扩展;E系列主要关注效率,对于网络流量和数据应用程序非常有效,在功耗和面积的缩减上进行优化;V系列旨在提供较佳性能,需要添加更大的缓存、窗口和队列,相对来说会消耗更多面积和功耗。

Arm基础设施事业部高级副总裁兼总经理Chris Bergey说,Arm承诺每年30%的性能提升,将持续到2022年及以后。

01、Neoverse V1:主打高单线程性能,支持可伸缩矢量扩展
Neoverse V1面向7nm和5nm工艺技术而设计,是Arm的第一个支持可伸缩矢量扩展(Scalable Vector Extensions,SVE)的设计核心,将支持256位宽度的向量,适合高性能计算、高性能云和机器学习处理任务。

SVE可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。SVE可确保软件编码的可移植性与使用寿命,同时兼顾高效的执行。


“我们的芯片伙伴可以完全控制SVE电压和频率转换,富士通A64FX CPU就是一个很好的例子,在执行SVE代码时,它可以全天全频率运行。”
Chris Bergey介绍说,对于开发者而言,主要好处是SVE的架构使其可以在寄存器宽度之间无缝转换,因此,他们可以合并新的宽向量SVE指令,同时可以重新使用为较小的寄存器编写的辅助函数。

V1还支持PCIe 5.0连接、DDR5、HBM2e和CCIX 1.0,以实现插槽之间的芯片与封装内小芯片之间的双向一致性通信。
与Neoverse N1相比,Neoverse V1的单线程性能可提升超过50%。

02、Neoverse N2:主打高度可扩展性,单线程性能较N1提升40%
Neoverse N2被设计为一个超级可扩展平台,用来满足横向扩展的性能需求。

N2面向5nm工艺技术而设计,支持PCIe 5.0和DDR5,通过支持用于高带宽存储器的HBM3以及用于结构的CCIX 2.0和CXL 2.0来进一步扩展。

此外,相较Neoverse N1,Neoverse N2在保持相同水平的功率和面积效率之余,单线程性能提升了40%。

它不会像V1在每线程性能具有突出表现,但它将在恒定的TDP中支持更多内核。它可以支持从20W、8个内核到350W、192个内核,用例可横跨云、智能网卡(SmartNICs)、企业网络到功耗受限的边缘设备。

N2在边缘计算要求的性能下,甚至非常有限的TDP条件下,同样能展现出良好的性能表现。“对于企业网络和SmartNIC应用,没有比N2更好的解决方案。”Chris Bergey说。

Arm的一位性能工程负责人做了一张有趣的图表,X轴是芯片级性能,Y轴是每线程性能,Arm认为客户和运营商将需要更多的单线程性能。


Chris Bergey认为,N1 CPU在芯片级吞吐量和单线程性能方面,都将超过市场上的任何产品。V1和N2在图的右上方,Arm也展示了这两款新品预期的性能提升。

“我们知道其他竞争架构不会停滞不前,但我们非常有信心N2将继续代表较高的单芯片性能,而V1将在未来提供较高的单线程性能。”Chris Bergey谈到。

Arm的移动设备和服务器CPU IP之间的世代同级产品(图源:AnandTech)

值得注意的是,同一时期串联开发的Arm移动IP系列Cortex和Neoverse产品之间存在相似之处,例如Neoverse N1是与Cortex-A76一起开发的,因此这两个微体系结构可以看作是兄弟设计,具有很多相似之处。

Neoverse V1可以看作是Cortex-X1的同级设计,可能共享许多为这两个旗舰CPU开发的超大型内核结构。Neoverse N2较为特殊,代表了下一代Cortex-A内核的兄弟设计,是A78的后续产品。

03、“装机即用”的软件与创新的组件 
除了提供更高性能的处理器核外,Arm还为合作伙伴提供可扩展性的交换网,用以支持大量的处理器核。
Arm在CCIX与CXL进行投资,确保其生态系统得以快速且高效地推出相关的技术。

迄今为止,日本富士通超算的A64FX芯片和定制核心微架构是一款宣布和提供SVE的CPU, Neoverse V1和N2将是Arm第一批实现SVE的自主设计处理器核。


在软件生态系统方面,Arm Project Cassini旨在为软件开发者提供流畅的体验,通过标准、平台安全性与参考实施,使得行业伙伴可基于Arm平台上部署“装机即用”的软件。

同时,Arm也持续推动基础软件支持。例如,Xen、KVM、Docker容器以及越来越多的Kubernetes等操作系统、虚拟机管理程序,都已经陆续宣布支持Arm架构。许多初期由Arm推动的开源项目正在变得自主运转,同时,商用ISV应用程序也齐步演进。

Chris Bergey谈到,Arm希望每一代有30%以上的性能提升,除了与技术团队的努力分不开外,与整个软件生态的逐渐成熟也有很大关系,许多原生软件现已能够无缝运行在软件架构上。

04、7大互联网公司已有4家公开宣布采用Arm技术
Arm自十年前就开始部署数据中心领域的高效计算技术。

2018年,Arm首次公布在基础设施市场的初步产品——Neoverse服务器CPU路线图,这个“量尺”用来衡量Arm在接下来的18个月的进程,并承诺以每年增长30%的平台性能为指标,持续优化到2021年。

过去两年间,Arm在服务器市场取得一系列落地进展。

在互联网领域,前7大互联网公司中有4家公开宣布采用Arm技术进行部署。

在高性能计算(HPC)领域,搭载Arm服务器CPU的日本富士通超算是今年全球排名第一的超级计算机。

在整个5G生态系统厂商中,从L1到传输的整个堆栈,以及新兴的OpenRAN和VRAN计划,Arm都获得一系列重大设计项目。

在基础架构和边缘,Arm已推出uCPE转Arm以及Project Cassini计划,并将在两周后的Arm DevSummit大会上更新Project Cassini第一年的进展。

05、结语:Arm在服务器市场的竞争力显著增长
如今第一代Neoverse N1基础架构CPU IP产品已经以商业和公开可用的形式进入市场,下一代Neoverse平台也即将面世。

无论是近年推出的基于Arm平台的服务器处理器产品,还是今天所公布的新一代处理器核的性能,都足见Arm已成为数据中心服务器市场的竞争力正显著提升。

今天的发布只是预告片,据Chris Bergey透露,Arm将在明年深入分享关于V1和N2产品的更多细节。

声明:文章收集于网络,版权归原作者所有,为传播信息而发,如有侵权,请联系小编删除,谢谢!

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括:各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人
1

路过

鸡蛋

刚表态过的朋友 (1 人)

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

 

GMT+8, 2020-12-2 11:36 , Processed in 0.134395 second(s), 27 queries .