通过内置NVIDIA AI、HPC和图形SDK等功能,NVIDIA 为Arm在高性能计算、云、边缘和PC平台在内的生态系统带来GPU和DPU加速
从手机、自动驾驶汽车、边缘系统到全球速度最快的超级计算机——日本的Fugaku,Arm已成为数十亿台设备的核心。
这种广泛的系统得到了约1300万开发者的支持。NVIDIA为这个充满活力的社区带来了自主开发的扩展工具集。
该工具集包括:
NVIDIA AI– 加速AI训练和推理的行业标准
NVIDIA RAPIDS– 一套可在GPU上运行数据科学和分析的软件库
NVIDIA HPC SDK– 用于高性能计算的编译器、库和软件工具
NVIDIA RTX– 提供光线追踪和AI功能的图形驱动器
多年来,NVIDIA一直将JetsonSoC中的Arm核心用于边缘计算和自主机器。最近,又将该核心用在BlueField DPU等网络产品中。
在合作伙伴和独立软件供应商的支持下,BlueFieldDPU可加速并保护云、嵌入式和企业级应用的网络与存储工作。
Arm是高能效计算领域的领导者,NVIDIA通过为其提供这些资源,从而增加客户的选择,并为Arm和NVIDIA合作伙伴在四个主要领域的发展提供更多机会。
NVIDIA对Arm的支持范围:从超级计算机到个人和嵌入式系统
高性能计算的新方向
Arm正在通过可伸缩向量扩展指令(SVE)扩展其处理器技术,从而满足这一全球******、性能最强的系统的需求。NVIDIA工程师已开始为富士通A64FX(Fugaku内置的处理器)中的SVE提供支持。
SVE是Arm Neoverse平台用于数据中心计算和网络的最新产品。其强大的模拟功能推动了Fugaku的科学研究,并在TOP500全球性能最强大的计算机榜单上************。
NVIDIA将帮助Arm合作伙伴和客户为同时使用Neoverse CPU和NVIDIA GPU的系统生成经过优化的软件。2019年6月,NVIDIA宣布了HPC计划的最新举措,该计划旨在为NVIDIA用于Arm加速计算和 AI的CUDA软件提供支持。
除了NVIDIA HPC SDK之外,用于HPC网络主干NVIDIA Mellanox InfiniBand的软件现已得到完整支持并部署在Arm服务器上。工程师们正在NVIDIA Magnum IO中扩展对Arm的支持。 NVIDIA Magnum IO软件用于实现多节点系统存储和网络性能的******化。
云端游戏创造良机
在云计算领域,NVIDIA与Arm服务器SoC和OEM合作伙伴开展了多个方面的合作。
例如,NVIDIA与Ampere Computing合作,将Mt. Jade服务器平台扩展至云游戏。基于Ampere Altra的系统包含两个80核Arm SoC、四个NVIDIA T4 GPU和一个NVIDIA Mellanox BlueField-2 DPU。它们可以同时为128名游戏用户提供服务,为Android-in-Cloud服务提供流媒体服务,这种服务受到中国越来越多的5G智能手机用户的欢迎。
在NVIDIA的帮助下,Ampere Computing的Mt. Jade平台正在开拓云游戏新兴市场
此外,NVIDIA工程师不断在向Arm移植代码,并开发新的工具来优化Arm服务器和用户之间的云游戏编码、渲染和串流传输方式。这些工具被技嘉科技、浪潮和纬颖等Arm服务器OEM合作伙伴所广泛使用。
根据运行其服务GeForce NOW所获得的经验,NVIDIA了解到云游戏的潜力。
除游戏外,云服务供应商还支持用于GPU加速的机器学习、存储和其他应用的Arm服务器。因此,NVIDIA为Arm服务器提供一系列GPU管理和监控工具,包括可以在内置Kubernetes的Arm上运行Docker容器的NVIDIA容器工具集。
为每家公司提供企业级AI
企业网络的边缘是下一个重要的计算领域。NVIDIA EGX 边缘AI平台将支持包括Arm在内的所有主要处理器架构。
由于认识到边缘对高能效计算的需求,NVIDIA将Arm作为其各垂直市场加速计算和AI平台的核心。通常,这些平台将GPU与像Jetson等嵌入式模块中的多核Arm CPU配对。
NVIDIA将这些模块的定制版本与专用于医疗(Clara)、机器人(Isaac)、自动驾驶汽车(DRIVE)等行业的开发者套件配对,为Arm软件合作伙伴和SoC供应商提供了大量实现企业AI的机会。
此外,如NVIDIA在收购公告中指出,通过Arm提供的IP,随着NVIDIA的扩展它们将会变得越来越丰富。
未来的发展趋势
多家供应商的Windows PC和Chromebook已在Arm处理器上运行,并且更多消费级平台正在加入其中,此举推动了未来个人系统的发展。
NVIDIA长期以来使用GPU(包括Arm系统)支持各种形状和尺寸的PC,包括基于Arm的系统。最近的一项调查显示,超过70%的游戏PC使用NVIDIA GPU。
未来,具有丰富图形和连接性、性能与当今PC一样强大且更加节能的AI加速的个人系统将迎来机遇。Arm生态系统可以在个人系统等各个市场中使用NVIDIA 参考设计,就像当前在医疗市场中使用的那样。
构建平台的工具
得到NVIDIA大量工具支持的Arm处理器IP产品组合等先进技术让各种新的平台成为可能。
用于Arm的CUDA工具包将NVIDIA GPU加速计算和AI功能引入Arm生态系统。通过CUDA,开发者可以访问TensorRT进行深度学习推理、访问DeepStream进行视频分析等。
NVIDIA提供一整套Nsight可视化开发者工具,利用分析器、调试器等工具为Arm SoC和服务器提供支持。用户可以通过NVIDIA的开发者网站访问所有的工具、SDK和平台。
NVIDIA已经为Arm提供了十多年的支持,而这仅仅是个开始。我们很高兴能够加入这个不断扩展的社区,该社区为从智能卡、超级计算机到未来的各项技术提供了强大支持。
我们对未来设想了许多可能性,并且希望从Arm生态系统中的1300万开发人员身上学到大量知识与经验。
···
···
···
···
···
···
···
···
···
···
···
···
···
···
···