Loading
0

数据中心增长放缓 英伟达的辉煌即将成为过去式?

 

NVIDIA 已成为科技行业最热门的公司之一。其图形处理单元(GPU)使计算效率更高,导致其库存在过去三年中飙升超过500%。

 

我一直是NVIDIA的粉丝。我在2015年访问了公司总部,多年来一直是股东,赚了不少钱。

 

但最近几个月NVIDIA遭到抨击,分析师们对其增长的来源存在分歧。该公司已经在消费者游戏领域占据主导地位,因此它现在将数据中心视为扩大收入的关键市场。看好英伟达的人士把英伟达58%的数据中心收入增长视为一个迹象,表明该公司正在稳步前进。

 

我对此仍然持怀疑态度。我不同意,数据中心真正的问题,特别是那些最大的云供应商像 Amazon.com,其亚马逊网络服务(AWS)的企业,或 谷歌 与 Google云端平台。

 

但我越来越清楚GPU 并不适合数据中心。我相信NVIDIA的未来将与过去看起来大不相同,这对投资者来说并不是一个好消息。

 

"望着云端"

 

为了设置场景,大型云计算供应商的庞大数据中心 确实是硬件供应商的圣杯。世界各地有许多地方,每个地点都在管理大量的数据。NVIDIA的胜利可能会带来巨大的未来GPU销售。

 

但云端巨头对其工作流程有着独特的需求。而这些需求往往与GPU的优势并不完全一致。

 

例如,亚马逊正在设计自己的芯片,以使其Echo设备 对声音提示更具响应性。对于此应用程序,延迟(Alexa理解和响应所需的速度)非常重要。谷歌也正在设计自己的芯片,以降低其数据中心的功耗。这里,每瓦功耗所执行的操作次数非常重要。这些应用程序都不需要图像或视频识别。

 

软件应用程序的底层代码也在不断变化,机器学习算法不断被重新训练。Alexa可能最初根据牛津英语词典教英语 ,但最终接受再培训以认识到“杀死那次采访”是一件好事而不是杀人罪。

 

现在,将每个软件的特定需求和不断变化的代码相乘,成千上万的其他客户,每个客户都从Amazon Web Services和Google Cloud Platform等云提供商那里租用存储,处理和“机器学习即服务”。事情很快变得非常复杂。

 

值得称道的是,NVIDIA已尽其所能为客户的问题找到解决方案。它采用优化器将其客户试图完成的逻辑与最能够实现这些目标的GPU硬件产品相匹配。 TensorRT  就是一个例子,它可以配置NVIDIA的GPU来运行某些数据中心应用程序。

但合身永远不会完美。

 

公司不得不接受他们的软件在某种程度上强制适应NVIDIA的可用硬件模型及其相关功能。最终用户不知道NVIDIA的优化器在幕后实际抽象了什么架构。他们只知道GPU 在处理他们的需求方面明显 优于CPU。这正是我们近年来看到GPU大幅增长的原因。

 

这就是NVIDIA的问题所在。GPU不是可以处理所有数据中心复杂性的神奇解决方案。每次将应用程序强制拟合到GPU时都会产生效率低下的问题。事情变得越来越复杂。

 

拥有雄厚资金的大公司已经在设计自己的专用集成电路来优化个别任务。但即使是那些没有数十亿美元和专门研究团队的人,也开始出现解决方案。

 

如果有可以编程然后重新编程的芯片,总能完美匹配你想要的软件做什么呢?

 

FPGA

 

这些芯片确实存在,它们被称为现场可编程门阵列(FPGA)。现场可编程芯片可以不断改变其逻辑,这意味着它们可以适应不断变化的软件需求。

 

这使得它们与其他基于指令的芯片(如CPU或GPU)区别开来,但这种区别在历史上并没有真正重要。传统上,计算只是使用CPU完成的,无论如何,每18个月的性能效率提高一倍。然后GPU发现了一种更有效的改进CPU的方法。

 

但是,这一点差异化在今天非常重要。人工智能(AI)是一种变幻无常的野兽,它对AI算法的不断训练使得CPU和GPU难以跟上。就像Alexa一样,延迟对于任何需要瞬间响应时间的应用程序变得越来越重要 。低效率正变得越来越不容忍。

 

FPGA的可编程方面可以完全消除这些低效率。通过在软件模型和硬件之间抽象层 - 技术人员的“模型优化器库” - 理论上,使用FPGA的生态系统可以完美地运行每个应用程序 。 FPGA即服务  可能就像 类固醇上的 CUDA一样 :经过微调以匹配特定算法的硬件,而不是使用NVIDIA的GPU中最接近的匹配。FPGA可以进行优化,然后随着时间的推移重新优化,这在代码和逻辑发生变化时很方便。

 

FPGA并不是每个人的答案。它们的前期成本高于CPU和GPU。他们需要花费大量时间进行编程,这需要由经验丰富的工程师完成。

 

但这些因素并不像云供应商那样令人担忧。他们可以使用IT人才,并可以承担高额的前期成本。他们获得的好处是降低了数据中心的总体电力成本,他们可以将这些成本作为更具竞争力的价格传递给租用处理和存储的客户。

 

对于FPGA来说,这是正确的市场,现在正是适当的时机。而这正是最大的云服务提供商,包括AWS,微软 , 阿里巴巴 和 百度 ,正在全球快速部署它们的原因。我相信英伟达在数据中心的增长速度将会放缓,它最辉煌的日子可能已经过去了。