Apple представила модель ИИ для редактирования изображений на основе текстовых команд

0
46

Apple запускает модель искусственного интеллекта для редактирования изображений на основе текста

Лоренц Хейман/Unsplash

Apple в сотрудничестве с исследователями из Калифорнийского университета разработала и опубликовала модель искусственного интеллекта MLLM Guided Image Editing (MGIE). Вы можете изменять изображения на основе текстовых инструкций на естественном языке.

Что известно

MGIE использует технологию мультимодальной крупномасштабной языковой модели. Это позволяет ему интерпретировать короткие и неоднозначные команды пользователя при последующем редактировании фотографии. Например, подсказка «сделать полезнее» на фотографии пиццы может быть интерпретирована ИИ как означающая добавление растительного ингредиента.

Apple запускает модель искусственного интеллекта для редактирования изображений на основе текста

Помимо внесения серьезных изменений в контент, модель может выполнять базовые операции, такие как обрезка, поворот, изменение размера и цветокоррекция изображений. ИИ также может обрабатывать определенные области и преобразовывать определенные объекты.

MGIE доступен на GitHub. Кроме того, Apple разместила демо-версию сервиса на своем ресурсе Hugging Face. 

Пока неясно, планирует ли компания использовать эту технологию в своих продуктах.

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ