云提供商推动定制硬件的背后是什么?

来源:TechWeb.com.cn2020-07-07 10:34:00

[TechWeb]最初,公共云是建立在通用硬件上以降低成本并大规模运行的,但现在情况正在改变。

2020060802

向高度可扩展的AI和机器学习工作负载以及IoT和分析应用程序的转变正推动云供应商考虑采用新架构。传统的芯片和硬件制造商正在尝试将这些功能推向市场。但是,主要的云供应商越来越多地将事情交到自己手中,因为这些制造商无法满足他们的需求。

在云硬件方面,亚马逊已经拥有一家小型芯片制造商,而谷歌拥有其张量处理单元(TPU)。云巨头之间的竞争有望改变基础架构的构建方式以及开发人员如何使用基础架构。

“最终用户(将)从这些专门构建的计算环境中受益,并且可以更加高效地工作,因为平台将在那里支持他们需要实现的目标,”数字转型咨询公司Brillio负责云转换服务的副总裁Fahim Khan这样说。

亚马逊在其云硬件定制方面一直是最积极的。它始于构建更高效的路由器。然后,它开始使用Nitro System重新考虑其服务器体系结构,从而为虚拟机配置的各个方面带来了效率。最近,亚马逊开发了AWS Inferentia(一种用于AI的客户推理引擎)以及基于ARM架构的Graviton系列CPU。

云供应商正在从第三方探索云硬件架构,这些架构旨在加速AI工作负载,降低成本或两者兼而有之。数十家AI芯片和量子计算初创公司也涌现出来,其产品可以在云中使用。这些初创公司也在开发用于优化云基础架构的新型芯片。

自定义云硬件的关键驱动程序

云提供商已利用对可支持大数据量的创新软件模型和平台的需求。这是转向定制云硬件和基于硬件的功能的主要推动力。

云管理平台CloudCheckr的首席技术官杰夫·瓦伦丁说:“对以更低的成本提高计算能力的需求也越来越高,这不仅推动了公共云提供商的硬件创新,还推动了新的软件服务。”

随着云使用量的增长,公共云提供商只能以两种方式之一有效运行。他们要么将商品硬件插入数据中心以尝试满足其独特需求,要么在内部进行设计和开发。 Valentine说,公共云供应商正在使用定制硬件来改善可用性,性能,安全性和成本。而更安全可靠的基础架构最终将吸引并留住更多客户。

在云计算的早期,提供商遇到的第一个问题是密度和散热。数据中心空间非常昂贵,而散热是一个大问题。供应商将主板安装在机架上,并在机架上运行专业风扇以适当冷却所有组件。

瓦伦丁说:“自那时以来,我们取得了很大进步,但是公共云提供商一直没有停止努力,竭尽所能。”

今天的焦点主要集中在如何操作基础架构上。如果Microsoft,Amazon或任何其他云提供商可以使其基础架构超高效,则理论上可以通过较低的价格将节省下来的费用转嫁给客户。

但是云数据中心的运行方式与典型的企业设施大不相同,这给供应商带来了独特的挑战。例如,商品硬件可以通过软件更新固件,但是必须对共享服务器进行专门配置以禁止这样做。相反,这些供应商必须在可以安全地将其配置到硬件BIOS时推出更新。 Valentine说,这对公共云人员来说是一个痛苦。

结果,AWS开发了Nitro安全芯片,因此可以由AWS以及仅AWS更新固件。这节省了AWS的时间和精力,但是这些类型的幕后工作在很大程度上(至少是直接)不会被客户注意到。

Valentine说:“现实是,大多数客户只会注意到成本。”

定制硬件的未来好处

在大多数云计算模型中,最终用户不会直接接触硬件。最终用户减少的开销是云如此流行的主要原因之一。

高级副总裁Jeff Wittich表示:“这种[摘要]可以跟上需求的步伐,以更高的成本提供更好的服务质量,提供针对工作负载选择正确类型的硬件的能力,而不会给最终用户带来任何额外的复杂性。”半导体公司Ampere的产品总裁,该公司为云和边缘基础架构创建CPU。

云提供商一直在寻找能够提高产品质量的数据中心效率。一个引起更多关注的领域涉及减少延迟。Pensando Systems的CTO Vipin Jain说,这在COVID-19以及家庭,在线游戏,远程学习和视频会议工作量增加之后尤其重要,该公司将定制芯片用于其软件定义的服务平台。 Jain表示,定制硬件有望帮助缓解性能过高的基础架构所面临的压力,而对于规模如此之大的快速增长,基础架构从来就没有达到过合适的规模。

裸机是数字基础架构的新兴类别,它使企业能够将工作负载部署在安全的单租户硬件上,并按地理位置分布以提高邻近性和性能。传统上,需要单租户硬件的组织必须购买主机托管和电源,订购和运送自己的硬件,然后雇用技术人员来设置,测试和激活服务器。基于云的裸机使客户可以在需要满足一系列标准服务器配置要求时跳过这些步骤并按需创建计算实例。

AWS Nitro系统的一个副作用是,它使配置裸机实例变得更加容易,这使组织能够自定义其在AWS中运行的基础架构。

在未来,云提供商可能会使用自定义硬件来重新构想诸如AI之类的传统计算架构。例如,IBM研究人员一直在研究新型的神经形态芯片,它们可以在内存中执行计算。

IBM Research神经形态与内存计算小组的研究人员Manuel Le Gallo说,这实际上消除了执行多种类型的AI计算时的内存处理器瓶颈。

但是,这种技术的类型还需要几年的时间,并且将要求开发人员学习新的编程技术。同时,诸如亚马逊的Nitro System之类的想法将启发其他方法来重新思考传统的云架构。

但是,提高效率可能会不利。下一波云硬件创新可能会创建一种新型的锁定方式,这具有讽刺意味,因为云开始时几乎完全依赖商品基础架构组件。

从理论上讲,自定义硬件(例如Amazon的Graviton CPU或Google TPU)应与其他硬件运行相同的软件。但是,企业可能会倾向于采用特定于云的辅助服务来提高性能或减少其应用程序的维护。这可能会导致更难迁移到其他云平台。[TechWeb]

责任编辑:冯玉强

标签: 云计算 硬件 提供商

相关文章

要闻

原创

最新

取消