
Революция синхронного перевода
Google представила принципиально новую технологию Gemini 3.5 Live Translate, которая способна не просто переводить речь, но и сохранять уникальную эмоциональную окраску говорящего. Ключевое преимущество — потоковая обработка звука в реальном времени с минимальной задержкой.
Как это работает?
Новая система анализирует аудиопоток «на лету», распознавая более 70 языков и копируя тембр, высоту и темп голоса. Это принципиально отличает Gemini 3.5 от традиционных переводческих инструментов, которые работали с задержкой.
Области применения
Технология уже интегрирована в ключевые продукты Google:
- Google Translate для Android и iOS
- Потенциальная интеграция в Google Meet для синхронного перевода встреч
- API для сторонних разработчиков
Безопасность и инновации
Для противодействия рискам создания дипфейков Google использует технологию SynthID — цифровой водяной знак в аудиопотоке, который незаметен человеческому уху, но позволяет идентифицировать синтетическую речь.
