快科技6月28日消息,据媒体报道,谷歌正在收紧其Gemini人工智能平台的资源供应,因为开发者、企业以及科技巨头的日益增长的需求正威胁着现有容量。

这一举措背后,是2025年3月至8月期间Gemini API请求量翻倍,这一点迫使谷歌重新思考应该如何分配科技领域最抢手的资源之一——原始人工智能(AI)计算能力。

据知情人士透露,谷歌在今年3月前后告诉Meta,无法足额供应其所需的Gemini模型算力额度。由于Meta对谷歌模型的需求远高于其他客户,因此受到的影响也最为明显。

此举打乱并推迟了Meta多项内部人工智能项目的推进节奏。受该算力限制,叠加公司整体压缩人工智能成本的战略,Meta已要求员工节约调用AI令牌,提升使用效率。

除Meta之外,其他谷歌客户也受到算力不足影响,但程度相对有限。

自2026年5月17日起,谷歌对Gemini应用实施了基于算力额度的使用限制。这类似于手机流量套餐:用户不再拥有无限请求,而是需在每周滚动更新的5小时刷新窗口内使用,并且每周有使用上限。

这些限制适用于广泛范围,而不仅限于一家公司。谷歌已记录了速率限制和支出层级,旨在确保在该公司所称的快速增长阶段,所有客户都能公平使用API。