AIDive

Описание

Gemini 3.5 Live Translate — модель Google для перевода речи в речь почти в реальном времени. Она автоматически определяет 70+ языков, переводит речь непрерывно и старается сохранить интонацию, темп и высоту голоса говорящего. Для обычного пользователя это обновление приходит в Google Translate, а разработчики могут пробовать модель через Gemini Live API и Google AI Studio.

Где воспользоваться

Google пишет, что Gemini 3.5 Live Translate выкатывается в Google Translate на Android и iOS. В приложении нужно открыть Live translate и подключить наушники; на Android также начинает появляться режим прослушивания через динамик телефона, если наушников нет.

Приложение доступно в Google Play и App Store.

Что умеет

  • переводит живую речь с задержкой в несколько секунд
  • автоматически распознает 70+ языков
  • сохраняет более естественную интонацию, ритм и темп речи
  • подходит для поездок, встреч, уроков, трансляций и многоязычных звонков
  • доступна разработчикам в публичном превью через Gemini Live API

Что с Google Meet

В Google Meet эта технология должна расширить перевод речи: Google обещает 70+ языков, больше 2000 языковых пар и не только перевод из английского или на английский. На старте это private preview для отдельных клиентов Google Workspace, шире — позже в 2026 году. Подробнее можно посмотреть в карточке Google Meet AI Translate.

Что учитывать

Функция выкатывается постепенно, поэтому доступность зависит от страны, приложения, устройства и аккаунта. Для приватных разговоров стоит заранее предупреждать участников, что используется перевод речи. Google также указывает, что аудио, созданное моделями, помечается SynthID.

0

0 комментариев

Пока нет комментариев

Начните обсуждение первым — оно появится здесь сразу после отправки.

Может быть интересно

0

Рассылка

Расскажем о выходе новых нейросетей

Присоединяйтесь к сообществу.