再创纪录!Ampere推出192自研核云原生服务器CPU

访客2年前AI生活232

经过多年生态建设,Arm服务器CPU市场已经越来越繁荣,前有亚马逊、Marvell基于Arm架构应用于云端,后有华为海思、平头哥基于Arm推出数据中心服务器,近一两年,更是有不少顺应芯片创业潮而生的Arm服务器CPU初创公司,遇贤微、鸿钧微电子都包括在内……

近日,专注Arm云原生服务器CPU的Ampere Computing在2023年度战略和产品路线图更新分享中表示,Ampere推出了全新的AmpereOne系列处理器,基于5nm工艺节点制造,拥有多达192个单线程Ampere核,再一次创造业内最高核心记录。

再创纪录!Ampere推出192自研核云原生服务器CPU

这一核心数量远远超过英特尔和AMD服务器CPU的核心数,如果放在一个具体的场景中,在云环境中运行虚拟机(VM),将192核的AmpereOne、96核的AMD Genoa、60核的英特尔Sapphire Rapids进行对比,AmpereOne每机架运行的虚拟机数量是AMD Genoa的2.9倍,是英特尔Sapphire Rapids的4.3倍。

“AmpereOne现已投产并交付给客户,AmpereOne能够为云工作负载提供更高的性能、更高的可扩展性以及更高的密度,这是第一款基于Ampere新自研核的产品。”Ampere Computing首席产品官Jeff Wittich说到。

192自研核再创纪录,针对更大规模数据中心

Ampere发展至今已经有将近6年历史,此前的两年,已经推出了几款不同的产品,核数从32核到128核不等,今年又将核数进一步提升,最高可达192核,对比隔壁X86阵营的英特尔至强开始强调“多放10 个核数,不如多放一个加速器”,Ampere的产品升级似乎执着于核心数的提升。

这对数据中心市场而言意味着什么?

”全新推出的AmpereOne系列处理器并不是要取代Ampere Altra系列,而是在它原本的基础之上进行持续扩张。我们的出发点是希望能够满足不同客户的不同需求。”Jeff Wittich说到。

AmpereOne系列处理器因为拥有更高的核数,不仅在计算性能上有所扩展,还扩展了内存容量、带宽和IO带宽,采用了PCIe 5.0 和 DDR5。这些新增的功能主要是为对算力有更高需求的用户提供服务,主要针对大规模的数据中心,而对于边缘计算场景,只需要部署32核、功耗40瓦的Ampere Altra处理器就能满足需求。

另外,考虑到生成式AI算力需求爆发,提升对AI工作负载需求是此次AmpereOne升级的重点。

三年前,Ampere收购了专注于创建AI软件的OnSpecta公司,通过创建AI软件助力硬件在AI负载之下运行更快,过去几年,Ampere的AI团队也已经建立了形成标准框架的Libraries,能够更高性地运行Ampere Altra。

而Ampere提供的产品,非常适合AI推理,特别是大规模的云推理,目前已经有不少客户在使用Ampere提供的处理器进行AI推理工作负载,比如Matoha,其鉴别特定材料的应用程序模型就在Ampere上运行,用以鉴别玻璃、金属或织物以实现便捷回收。

再创纪录!Ampere推出192自研核云原生服务器CPU

Ampere提供的测试数据显示,相比AMD Genoa,AmpereOne可每秒多提供2.3倍的帧数(图像),在运行稳定的扩散模型中胜出。此外在运行DLRM模型的推荐系统中,通过AmpereOne响应的查询数量是AMD Genoa的每秒查询数量的两倍多。

值得注意的是,通过Ampere云原生处理器进行AI推理,不仅能打破效率瓶颈,也可以解决云服务提供商(CSPs)的行业痛点——使用GPU实现AI推理所产生的高能耗,以及容量扩展和可部署的服务器数量都会受到制约。

采用Chiplet设计,解决内存不均衡问题

为避免内存墙问题更加严重,除了拥有高达192个内核,AmpereOne还拥有128通道的PCIe  Gen5和8通道的DDR5,以此提升内存带宽,获得更高的内存速度。

值得注意的是,AmpereOne还大量采用了Chiplet设计,以解决内存不均衡的问题。

再创纪录!Ampere推出192自研核云原生服务器CPU

”我们在Chiplet设计中实现了特定的拓扑结构以及单一的计算裸片,同时还有单一大网格结构,这样可以助力我们为客户提供平衡的高性能。反之,其他设计则要求从一个计算的小芯片传输到另一个小芯片,这种设计则会带来延迟问题。”Jeff Wittich解释道。

也就是说,AmpereOne采用的是一个大的计算Chiplet被数个控制Chiplet包围的设计方式,且64MB的System Level Cache(系统级缓存)被放在计算芯片上,这样能够轻易实现内存到内存的访问,同时避免造成访问时间和系统级缓存之间的不平衡,不需要为处理器引入额外的HOPs。

那么,采用了Chiplet设计和自研核心的AmpereOne是否会出现与过去Neoverse核心的Ampere Altra处理器不兼容的问题?

Jeff Wittich表示,因为AmpereOne系列处理器和Ampere Altra系列处理器都是基于ARM ISA的,所以所有能够在Ampere Altra系列处理器上运行的代码,在全新的AmpereOne系列处理器上也能运行,不需要做任何改动。

Ampere针对云原生研发的Arm服务器CPU,已经再次证明了Arm ISA在数据中心的潜力。不过面对X86在数据中心建立起的生态,为云原生而生的Ampere还有很长的路要走。

Ampere也表示,Ampere有许多目标,用某个单独的目标并不足以概括,其中的一个目标是希望继续扩展生态合作,让Ampere的产品面向更多的用户,触手可及。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

百里挑一“萃取”数据精华,上海AI实验室开源发布高质量语料“万卷CC”

百里挑一“萃取”数据精华,上海AI实验室开源发布高质量语料“万卷CC”

近日,上海人工智能实验室(上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”(WanJuan-CC),首批开源的语料覆盖过去十...

汕头移动发布GPT虚拟数字人客服“潮智兴” 助推纺织服装产业高质量发展

汕头移动发布GPT虚拟数字人客服“潮智兴” 助推纺织服装产业高质量发展

近日,广东移动汕头分公司在第二届中国·潮汕国际纺织服装博览会(以下简称“服博会”)上发布GPT虚拟数字人客服“潮智兴”。 本届服博会共设置...

新能源汽车赛道激战正酣,年度电子生产设备大展揭示四大造车突围新风向

新能源汽车赛道激战正酣,年度电子生产设备大展揭示四大造车突围新风向

汽车行业正在加速探索转向新的方向,一边是传统燃油车在价格市场中的惨烈厮杀,另一边则是新能源汽车产业链的持续扩容。与传统燃油车类似,核心产品制...

探班2023年爱奇艺Hack Day,AIGC如何照见未来娱乐世界

探班2023年爱奇艺Hack Day,AIGC如何照见未来娱乐世界

经常追剧追综艺的观众应该已经发现,爱奇艺的搜索改版了。 以《田耕纪》为例,搜索角色名“连蔓儿”,更新后的搜索建议栏会给出角色所属剧集《田耕纪》...

全球首科4nm芯片发布!支持蓝牙5.3的芯片,支持3CC多载波聚合!

全球首科4nm芯片发布!支持蓝牙5.3的芯片,支持3CC多载波聚合!

时隔多年,联发科再次杀回旗舰芯片领域。 联发科今日发布了智能手机旗舰芯片天玑9000。联发科方面给出的数据相当亮眼,这颗芯片是全球目前...

从视音角度看多模态学习的过去与未来

从视音角度看多模态学习的过去与未来

视觉和听觉在人类的沟通和场景理解中至关重要。为了模仿人类的感知能力,旨在探索视音模态的视音学习在近些年来已成为一个蓬勃发展的领域。本文是对由中...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。