Майкрософт
На конференции Ignite компания Microsoft анонсировала сервис по созданию фотореалистичных аватаров людей с анимацией губ в соответствии с заданным текстом. Также был показан инструмент для клонирования голоса из аудиообразца.
Что известно
Новая служба преобразования текста в речь Azure AI Speech позволяет загрузить изображение человека и создать сценарий. Затем на основе этого генерируется видеоролик с говорящим аватаром.
Цифровые двойники могут говорить на нескольких языках. В сценариях они могут использовать модели искусственного интеллекта, такие как GPT-3.5 от OpenAI, чтобы отвечать на вопросы клиентов вне сценариев.
Другая функция, Personal Voice, может воссоздать голос пользователя за считанные секунды. Для этого требуется одна минута аудиозаписи.
Компания предлагает персональный голос для создания персональных голосовых помощников, дублирования контента на разные языки и создания индивидуальной озвучки для рассказов, аудиокниг и подкастов.
По словам Microsoft, оба инструмента будут доступны ограниченному числу пользователей и только для определенных сценариев. Кроме того, клиенты должны дать явное согласие на использование своего голоса и изображения.
Это призвано ограничить потенциальное неправильное использование технологий для создания глубоких фейков без ведома людей. Microsoft заявляет, что придерживается ответственного подхода к этике ИИ.