Google только что ввел новую систему измерения лимитов для своей модели Gemini, и этот переход уже вызвал волну недовольства среди пользователей. Нововведение заменило старую модель подсчета запросов на более сложный механизм, который оперирует понятием «вычислительных ресурсов» (compute-based). Проще говоря, теперь каждый ваш запрос «стоит» определенное количество вычислительной мощности, которое зависит от сложности промпта, используемых функций и даже длины вашего диалога с нейросетью. Новые лимиты обновляются каждые пять часов и суммируются с недельным ограничением.
Пользователи, особенно те, кто активно использует ИИ для разработки, быстро почувствовали на себе, что это значит на практике. В сообществах начали появляться сообщения о том, что новый недельный лимит можно исчерпать всего за час интенсивной работы в Antigravity — AI-среде разработки от Google. Особенно сильный удар пришелся по подписчикам плана AI Pro, которые внезапно обнаружили, что их «безлимитный» инструмент стал гораздо менее щедрым.
Первой ласточкой стал сам Antigravity. Google не просто повысил лимиты, а сделал это дважды, в общей сложности увеличив их в девять раз по сравнению с изначально введенными ограничениями. Сначала, еще в среду, компания утроила лимиты для этой платформы, а вскоре после этого повторила повышение, сфокусировавшись уже на еженедельной квоте. За каждым повышением следовал и полный сброс использованных квот для всех пользователей платных планов. Такой стремительный разворот произошел после того, как директор DeepMind Варун Моган публично признал, что многие пользователи действительно исчерпывали свои недельные лимиты «всего за несколько рабочих сессий».
Однако важно понимать: щедрость Google на этом пока заканчивается. Повышенные лимиты действуют исключительно в среде Antigravity. Для всех остальных пользователей Gemini в чат-боте или других сервисах, даже платных, лимиты не изменились, и они по-прежнему могут быть значительно ниже, чем до введения новой системы. Хотя Google добавил в настройки наглядный график расхода, который позволяет следить за остатком вычислительных ресурсов, это не отменяет того факта, что пользователи стали гораздо острее ощущать каждый свой запрос.
Этот инцидент ярко демонстрирует фундаментальную проблему текущего этапа развития больших языковых моделей: их эксплуатация — это крайне дорогостоящий процесс, и провайдеры вынуждены искать способы контролировать расходы. Переход на «поресурсную» модель — логичный шаг для масштабирования, но он болезненно отражается на пользовательском опыте, который привык к абстрактному «безлимиту». Действия Google показывают, что компания готова прислушиваться к отчаянным сигналам от сообщества разработчиков, но это лишь локальная корректировка курса. Главный вопрос — как и когда эти изменения затронут остальную экосистему Gemini, остается открытым.
