Смартфоны

Meta разработала генеративную модель искусственного интеллекта для преобразования текста в речь

От

17.06.2023

211

Meta представила генеративную модель преобразования текста в речь Voicebox. По словам разработчиков, алгоритм сделает для разговорной речи то же, что ChatGPT и DALL-E сделали для текста и изображений.

Что известно

Подобно генеративным системам для текста и изображений, Voicebox может создавать выходные данные с нуля, преобразовывать стили и изменять предоставленный шаблон. Система была обучена на 50 000 часов записанной речи и транскрипций аудиокниг в открытом доступе на английском, французском, испанском, немецком, польском и португальском языках.

В результате Voicebox может редактировать клипы, устранять шум и заменять неправильно произносимые слова.

«Человек может определить, какой необработанный сегмент речи поврежден шумом (например, лаем собаки), вырезать его и дать указание модели восстановить этот сегмент», — говорят исследователи.

Voicebox также может воспроизводить речь в течение двух секунд, передавать межъязыковой стиль и создавать различные образцы для синтетических наборов данных.

Когда ждать

Meta не опубликовала исходный код модели. Разработчики сослались на «потенциальные риски неправильного использования», несмотря на «множество интересных вариантов использования моделей генеративной речи».

Meta разработала генеративную модель искусственного интеллекта для преобразования текста в речь

Что известно

Когда ждать

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ

Свежие материалы

Популярное

Последние новости

Cronos: The New Dawn захватывает Mac — хоррор Bloober Team расширяет границы геймерского мира

WhatsApp открыл доступ к юзернеймам: как найти друзей без номера телефона

Huawei раскрыла первые секреты: Умные AI-очки, которые могут заменить смартфон

Samsung случайно слил дизайн iPhone 18 Pro Max в рекламе Galaxy S26 Ultra