Stability AI запустила генеративную платформу искусственного интеллекта под названием Stable Audio, которая создает звук на основе текстовых сообщений.
Что известно
Stable Audio использует модель диффузии, обученную на 800 000 аудиофайлах с музыкой, звуковыми эффектами и пением в унисон. Также использовались текстовые метаданные из AudioSparx.
Stability AI заявляет, что у нее есть разрешение на использование материалов, защищенных авторским правом.
Отличительной особенностью Stable Audio является возможность генерировать треки разной длины. Для этого была проанализирована информация о времени в обучающих данных.
Платформа имеет бесплатную версию с лимитом 20 треков длительностью до 45 секунд в месяц. Профессиональный платный план за 11,99 долларов США позволяет создавать до 500 треков за 90 секунд.
Пользователи бесплатной версии не могут использовать сгенерированный звук в коммерческих целях.