ОпенАИ
OpenAI объявила о крупном обновлении своего чат-бота ChatGPT, который включает в себя поиск изображений, распознавание речи и чтение текста.
Что известно
Распознавание речи позволяет задать чат-боту вопрос с помощью голоса. Для этого ChatGPT использует Whisper, модель с открытым исходным кодом, разработанную OpenAI.
Преобразование текста в речь осуществляется с помощью новой модели, которая, по словам компании, может генерировать «человеческий голос» всего за несколько секунд образцов речи. В настоящее время на выбор предлагается пять вариантов голоса.
Поиск изображений позволяет сфотографировать интересующий объект и отправить его в ChatGPT. Чат-бот попытается понять запрос и ответить соответствующим образом.
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
Sound on 🔊 pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) September 25, 2023
Вы также можете использовать инструмент рисования внутри приложения, чтобы указать на определенную часть изображения.
OpenAI осознает потенциальные риски новых функций. Компания не разрешает ChatGPT обрабатывать изображения людей или отвечать на вопросы о них.
Новые функции будут доступны подписчикам ChatGPT Plus Enterprise в течение двух недель. Позже компания откроет к ним доступ для всех желающих.