Google смягчил новые лимиты Gemini после волны жалоб пользователей

Gemini

Ни для кого не секрет, что генеративные нейросети — удовольствие дорогое. Но когда Google на конференции I/O 2026 анонсировала переход на новую систему «compute-based usage limits» для приложения Gemini, реакция пользователей оказалась куда более резкой, чем ожидали в Маунтин-Вью. И вот спустя всего неделю компания вынуждена оперативно корректировать правила игры.

Проблема была в простоте и одновременно жестокости подхода. Раньше лимиты измерялись в запросах. Теперь — в «вычислительных единицах». Это значит, что запрос вроде «какая погода?» почти ничего не стоит, а вот попытка загрузить двухчасовой 4K-видеофайл с просьбой найти все сцены с дождём может сжечь дневную норму за один раз. Пользователи быстро смекнули, что даже при обычной работе с документами или несложным кодом квота улетает в трубу слишком быстро.

В ответ на шквал жалоб команда Gemini во главе с Джошем Вудвордом объявила о серии исправлений, которые стоит знать каждому владельцу Android-смартфона или планшета, использующему ИИ.

Первое и главное изменение — вводится «потолок» на максимальное количество квоты, которое может быть списано за один промпт. Раньше какой-нибудь сложнейший запрос к модели Gemini 3.1 Pro с гигантским вложением мог одномоментно обнулить ваш лимит. Теперь система искусственно ограничивает аппетит сложных заданий. Буквально: Google закручивает гайку на самом верху, чтобы вы физически не могли потратить всё за пять минут.

Второй момент технически очевидный, но для обычного пользователя критически важный: сбойные запросы больше не сжирают квоту. В документации чётко прописано — «если запрос завершился ошибкой, платить не нужно. Системные ошибки Google — на совести Google». Это честный шаг, учитывая, как часто облачные сервисы грешат временными лагами.

Третье и, пожалуй, самое полезное для повседневной работы — модель Gemini 3.1 Flash-Lite теперь полностью бесплатна и не учитывается в лимитах. Это легковесная, но вполне рабочая версия, идеальная для быстрых текстовых задач, переформулирования или простых ответов. По сути, Google даёт вам «режим экономии» официально.

Кроме того, исправлен конкретный баг с «Omni»-видео: у некоторых пользователей всего один-два ролика в формате Omni сжирали весь дневной лимит. Баг локализовали и починили, а для подписчиков AI Ultra количество генераций Omni и вовсе удвоили.

Если вы работаете с тяжелыми инструментами вроде Deep Research (глубокий анализ по множеству источников), то на дешборде gemini.google.com/usage пообещали дать гораздо более детальную разбивку расходов: вы увидите, что именно и в каком объёме потребляет ресурсы.

Отдельный технический нюанс: если вы вручную выбрали конкретную модель, Gemini запомнит этот выбор для всех будущих сессий. Модель сменится только если вы сами нажмёте «сменить» или когда упрётесь в лимит — тогда произойдёт автоматический откат на более лёгкую версию. Это сделано для того, чтобы не тратить драгоценные единицы на случайные активации «тяжёлой» модели, когда она не нужна.

В перспективе Google планирует запустить систему покупки дополнительных кредитов AI по модели «pay-as-you-go» — то есть докупил 100 условных единиц, и работаешь дальше. Но пока это только обещания.

Что это значит для владельцев техники на Android? Ровно то, что Gemini становится предсказуемее. Вы по-прежнему можете запросто исчерпать лимит за один сеанс сложной работы с видео или кодом, но теперь у вас есть официальный «лёгкий» канал (Flash-Lite) и гарантия, что ошибки или один суперсложный промпт не уничтожат всю квоту моментально. Ситуация остаётся динамичной, но Google явно показывает, что слушает аудиторию. А в мире монетизации ИИ это, пожалуй, главная новость сегодня.

Все про систему Андроид
Добавить комментарий