Google Gemini научился слушать длинные вопросы без прерываний

Gemini

Google тестирует новую функцию для решения проблемы преждевременного завершения голосовых запросов в Gemini, позволяя пользователям удерживать микрофон для непрерывного ввода.

Проблема пауз в голосовых запросах

Gemini, несмотря на высокую точность распознавания речи, интерпретирует длинные паузы как завершение вопроса, что мешает пользователям формулировать сложные или развёрнутые запросы. Это особенно заметно при использовании голосового ввода в приложении на Android или iOS, где система не различает естественные остановки в речи и окончание запроса.

Новое решение от Google

В версии 16.42.61 приложения Google обнаружена функция, позволяющая удерживать микрофон нажатием, чтобы продолжить говорить без риска преждевременного завершения. После активации режима «Long press the mic to keep it open» микрофон остаётся активным до тех пор, пока пользователь не остановит его вручную. Визуально иконка меняется на кнопку «стоп», что упрощает управление процессом.

Особенности и ограничения

Функция пока не доступна массово, и неизвестно, когда она будет внедрена в стабильной версии. Отмечается, что в режиме Gemini Live, предназначенном для диалогов, проблема пауз не возникает, так как архитектура подразумевает двустороннее взаимодействие. Также в приложении появился новый оверлейный блок ввода и плавающая кнопка для быстрого доступа к Gemini Live.

Дополнительные возможности Gemini

Помимо голосового ввода, Gemini на Android может управлять базовыми функциями устройства через расширение Utilities: установка будильников, таймеров, включение Wi-Fi, Bluetooth, фонарика и регулировка громкости. Пользователи могут заменить Google Assistant на Gemini в настройках устройства.

Все про систему Андроид
Добавить комментарий