英伟达：用GPU训练大语言模型成本可降低96%

5月29日消息，根据英伟达在 2023 年台北电脑展会上的演讲，该公司宣称其 GPU 可以大幅降低训练大型语言模型（LLM）的成本和耗能。

英伟达首席执行官黄仁勋在演讲中，向 CPU 行业发起了挑战，他认为生成式人工智能和加速计算是未来计算的方向。他宣布传统的摩尔定律已经过时，未来的性能提升将主要来自生成式人工智能和基于加速计算的方法。

英伟达在展会上展示了一份 LLM 的总体拥有成本（Total Cost of Ownership，TCO）分析：首先，他们计算了训练一个 LLM 所需的 960 个 CPU 组成的服务器集群的完整成本（包括网络、机箱、互连等所有设备），发现这需要花费约 1000 万美元，并消耗 11 千兆瓦时的电力。

相比之下，如果保持成本不变，购买一个价值 1000 万美元的 GPU 集群，可以在同样的成本和更少的电力消耗（3.2 千兆瓦时）下训练 44 个 LLM。如果转而保持电力消耗不变，那么可以通过 GPU 集群实现 150 倍的加速，以 11 千兆瓦时的电力消耗训练 150 个 LLM，但这需要花费 3400 万美元，此外这个集群的占地面积比 CPU 集群小得多。最后，如果只想训练一个 LLM，那么只需要一个价值 40 万美元、消耗 0.13 千兆瓦时电力的 GPU 服务器就可以了。

英伟达所要表达的意思是，相比 CPU 服务器，客户可以以 4% 的成本和 1.2% 的电力消耗来训练一个 LLM，这是一个巨大的成本节省。

英伟达：用GPU训练大语言模型成本可降低96%

清华权威报告：文心一言4.0多项指标遥遥领先

你当前使用的 PC 可迎战 AI 未来吗？戴尔详述 AI PC 要求、常见问题等

商汤科技将发布“日日新SenseNova 5.0”大模型

Meta推出最新人工智能模型Llama 3

百川智能回应数亿美元融资传闻：并未对外披露融资信息

昆仑万维：“天工3.0”及旗下音乐大模型开启公测

今日热点

网易云游戏上架统信应用商店，可玩40余款游戏

Intel Arc锐炫显卡：完整AV1硬件加速+性能提升

被马斯克解雇的三位推特前高管，获近2亿美元“遣散费”

华为F5.5G产业愿景：带宽、覆盖和体验都提升10倍以上

随客热榜

全球乘用车动力电池看中国，2023 产能占比超 2/3：宁德时代 35%、比亚迪 16%

中国工程院院士邬贺铨：5G红利不及预期网速比4G快但消费者难以感知

英特尔酷睿 Ultra 9 185H 处理器测试：多核跑分接近 AMD Ryzen 9 7845HX

售价超2500美元！英伟达计划Q4推出RTX 5090显卡

消息称三星电子在硅谷建立先进处理器实验室，专注设计AI芯片

全球首个出租车纯电动化城市车辆退役换新，山西太原超 1000 台比亚迪汽车陆续交付

苹果“超级王炸”M4芯片或年底前亮相 AI PC再迎升级？

华为Pura 70 Pro/Ultra实测：首发搭载全新麒麟9010芯片

关于我们

源自随客