Открытый ИИ
OpenAI анонсировала новую модель генерации видео под названием Sora, которая может создавать реалистичные и фэнтезийные видеоролики продолжительностью до одной минуты на основе текстовых описаний.
Что известно
По данным OpenAI, Сора создает сложные сцены с участием нескольких человек и точно позиционирует объекты и персонажей в кадре. Эта модель также может генерировать различные типы движений.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Разработчики сосредоточились на способности ИИ детально отображать окружающую среду, отдельные объекты и персонажей. Более того, вы можете создавать яркие лица персонажей с различными эмоциями.
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
OpenAI утверждает, что ее модели обладают определенным «пониманием» реальной физики. Однако иногда бывает сложно создать сложные сцены или причинно-следственные связи.
Помимо создания видео с нуля, Сора также может изменять и улучшать существующие видео. Он может заполнить недостающие кадры в последовательности изображений.
В настоящее время Sora доступна только «красным командам», которые оценивают модели на предмет потенциального вреда и рисков. OpenAI также открыл доступ некоторым художникам, дизайнерам и кинематографистам для обратной связи.