OpenAI раскрыла новые возможности ChatGPT: голосовой режим с мультимедийными ответами

0
3

ChatGPT представляет свою последнюю инновацию: голосовое взаимодействие Режим голосового взаимодействия ChatGPT. Источник: OpenAI

Революция голосового интерфейса

OpenAI существенно расширила функциональность голосового режима ChatGPT, превращая взаимодействие с искусственным интеллектом в более естественный и многогранный процесс. Ключевое нововведение — полная интеграция голосового общения в основной чат-интерфейс.

Как работает новый режим

Активация голосового диалога теперь предельно проста: достаточно нажать значок звуковой волны рядом с полем ввода. Пользователи получают моментальную транскрипцию голоса и визуальные материалы, которые контекстно дополняют разговор.

Мультимодальный прорыв

В демонстрационном видео OpenAI показала впечатляющий пример: ИИ может одновременно визуализировать карты и фотографии, например, популярных пекарен с изображениями пирожных. Такой подход значительно обогащает коммуникацию с ChatGPT.

Технические детали

Обновление уже доступно для всех пользователей в веб-версии и мобильном приложении. Для активации необходимо обновить приложение. Для консервативных пользователей сохранена опция возврата к раздельному интерфейсу.

Это очередной шаг OpenAI в развитии мультимодальных технологий, который демонстрирует стремление компании конкурировать с такими гигантами, как Google с их экспериментальным форматом Gemini Live.

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ