Лоренц Хейман/Unsplash
Apple в сотрудничестве с исследователями из Калифорнийского университета разработала и опубликовала модель искусственного интеллекта MLLM Guided Image Editing (MGIE). Вы можете изменять изображения на основе текстовых инструкций на естественном языке.
Что известно
MGIE использует технологию мультимодальной крупномасштабной языковой модели. Это позволяет ему интерпретировать короткие и неоднозначные команды пользователя при последующем редактировании фотографии. Например, подсказка «сделать полезнее» на фотографии пиццы может быть интерпретирована ИИ как означающая добавление растительного ингредиента.
Помимо внесения серьезных изменений в контент, модель может выполнять базовые операции, такие как обрезка, поворот, изменение размера и цветокоррекция изображений. ИИ также может обрабатывать определенные области и преобразовывать определенные объекты.
MGIE доступен на GitHub. Кроме того, Apple разместила демо-версию сервиса на своем ресурсе Hugging Face.
Пока неясно, планирует ли компания использовать эту технологию в своих продуктах.