Google тестирует революционные инструменты аннотации изображений прямо в веб-версии Gemini, позволяя пользователям рисовать на фото, обводить элементы и добавлять текстовые слои без перехода в сторонние приложения. Эта функция устраняет ключевую проблему текущих ИИ-редакторов: необходимость экспорта файлов для разметки, что замедляет workflow и приводит к ошибкам интерпретации промптов. Вместо расплывчатых текстовых описаний Gemini теперь понимает визуальные маркеры, точно фокусируясь на нужных зонах для правок вроде удаления объектов или локальной ретуши.
Разработка опирается на модель Nano Banana Pro, построенную поверх Gemini 3 Pro, которая уже демонстрирует превосходство в сложных задачах редактирования, сохраняя качество текстур и деталей даже при наложении нескольких слоев изменений. В мобильной версии Gemini подобные элементы UI уже обнаружены в коде ранее, а теперь они мигрируют в браузер — платформу для большинства профессиональных правок. Пользователи смогут, например, обвести дефект на фото и указать “удали это”, получая предсказуемый результат без итераций промптов, что особенно ценно для дизайнеров Android-приложений и фотографов на Pixel.
Интеграция аннотаций повышает точность ИИ на 20-30% в задачах с мелкими деталями, судя по тестам предшествующих обновлений Imagen 4 и Gemini 2.5 Flash, где улучшилась обработка композиций из нескольких изображений. Google подчеркивает безопасность: все отредактированные фото получат водяные знаки SynthID, видимые и невидимые, для идентификации ИИ-вмешательства. Тестирование идет полным ходом на веб и мобильных клиентах, обещая сделать Gemini конкурентом Adobe Firefly в нише интуитивного редактирования для повседневных пользователей iPhone и MacBook, привыкших к Photos.app.
Фаза экспериментов подтверждает приоритет Google на мультимодальность: от генерации по тексту до пошагового редактирования с визуальным вводом, что упрощает создание контента для маркетинга или соцсетей. Ожидаемый релиз сделает Gemini незаменимым инструментом для IT-специалистов, работающих с графикой в экосистеме Android, где сейчас доминируют базовые инструменты вроде Google Photos AI. Это не просто апдейт — это сдвиг к редакторам, где ИИ читает жесты, как Photoshop читает кисть.
