算力告急：谷歌限制 Gemini 模型调用，Meta 研发进度受阻

JQR1 · 发表于昨天 16:19

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

您需要登录才可以下载或查看，没有账号？立即注册

×

随着生成式人工智能热潮的持续，算力资源已成为科技巨头们争夺的核心。近日，谷歌因 Gemini AI 平台需求激增，被迫收紧了资源供应，旨在应对日益增长的开发者及企业负载压力。

自 2025 年春季以来，Gemini API 的调用请求量翻倍，使得这一核心算力资源供不应求。为了保障生态系统的公平使用，谷歌于 2026 年 5 月 17 日正式实施了基于算力额度的使用限制，采用类似流量套餐的滚动更新机制。对于超出配额的请求，系统将触发频率限制，确保所有合作伙伴在资源吃紧的背景下均能获得基础调用支持。

在这一系列变动中，Meta 受到的冲击最为显著。据悉，由于 Meta 对该模型的需求远超其他客户，谷歌此前已明确表示无法足额满足其申请的算力配额。这一突发限制直接打乱了 Meta 多项内部 AI 项目的推进节奏。为应对算力压力，同时配合公司内部压缩人工智能研发成本的战略，Meta 已紧急要求员工优化调用流程，提升代码及令牌的使用效率。

业内人士指出，此次资源调控反映出全球 AI 算力底座面临的严峻现实：尽管大模型能力不断跃升，但支撑其高效运行的基础算力基础设施建设速度，仍难以完全追赶上爆发式的应用需求。对于像 Meta 这样深度依赖云端算力的厂商而言，如何在资源受限的前提下维持研发速度，将成为下阶段竞争的关键课题。

来源：AIbase

[人工智能] 算力告急：谷歌限制 Gemini 模型调用，Meta 研发进度受阻

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

快速入口

重要文档

关于我们

联系我们