OpenAI объявила о новой технологии клонирования голоса из 15-секундного аудио

0
64

OpenAI объявляет о новой технологии для воспроизведения звука из 15 секунд звука

OpenAI представила новый инновационный инструмент под названием Voice Engine, который может воспроизводить голос любого человека из 15-секундного аудиосэмпла.

Что известно

Речевой движок анализирует короткие аудиосигналы и создает естественно звучащие голоса с «эмоциональными и реалистичными голосами». Эта инновационная технология основана на существующем API преобразования текста в речь OpenAI и может быть полезна для различных целей, включая аудиокниги, языковой перевод и помощь людям с нарушениями речи.

OpenAI осознает значительные риски, связанные с использованием этой технологии, особенно возможность ее неправильного использования злоумышленниками. Поэтому компания активно обеспечивает конфиденциальность и безопасность и ввела ряд мер, таких как установка водяных знаков и упреждающий мониторинг использования системы.

Как было объявлено, Voice Engine все еще находится в предварительной версии, но компания уже успешно провела пилотную программу, демонстрирующую потенциал Voice Engine. Предварительная версия была проведена в Университете Брауна, где эта функция использовалась для помощи пациентам с языковыми расстройствами.

OpenAI заявляет, что ее голосовой движок будет реализован при сборе отзывов от партнеров и соблюдении политики, запрещающей использование клонированных голосов без согласия человека. Кроме того, для предотвращения злоупотреблений будет создан «список запрещенных голосований.

Стоимость вопроса

Ориентировочная стоимость использования Voice Engine составляет примерно 15 долларов США за миллион символов (приблизительно 162 500 слов.

Источник: Энгаджет

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ