返回列表 发布新帖
查看: 16|回复: 0

[人工智能] 算力告急:谷歌限制 Gemini 模型调用,Meta 研发进度受阻

发表于 昨天 16:19 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
202604171655124578_0.jpg

随着生成式人工智能热潮的持续,算力资源已成为科技巨头们争夺的核心。近日,谷歌因 Gemini AI 平台需求激增,被迫收紧了资源供应,旨在应对日益增长的开发者及企业负载压力。

自 2025 年春季以来,Gemini API 的调用请求量翻倍,使得这一核心算力资源供不应求。为了保障生态系统的公平使用,谷歌于 2026 年 5 月 17 日正式实施了基于算力额度的使用限制,采用类似流量套餐的滚动更新机制。对于超出配额的请求,系统将触发频率限制,确保所有合作伙伴在资源吃紧的背景下均能获得基础调用支持。

在这一系列变动中,Meta 受到的冲击最为显著。据悉,由于 Meta 对该模型的需求远超其他客户,谷歌此前已明确表示无法足额满足其申请的算力配额。这一突发限制直接打乱了 Meta 多项内部 AI 项目的推进节奏。为应对算力压力,同时配合公司内部压缩人工智能研发成本的战略,Meta 已紧急要求员工优化调用流程,提升代码及令牌的使用效率。

业内人士指出,此次资源调控反映出全球 AI 算力底座面临的严峻现实:尽管大模型能力不断跃升,但支撑其高效运行的基础算力基础设施建设速度,仍难以完全追赶上爆发式的应用需求。对于像 Meta 这样深度依赖云端算力的厂商而言,如何在资源受限的前提下维持研发速度,将成为下阶段竞争的关键课题。

来源:AIbase

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2026 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.110028 second(s), 7 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表