Искусственный интеллект Google DeepMind научился щадяще редактировать фотографии без потери узнаваемости

0
41

Gemini представляет: образцовый коллаж исследований в сфере AI Коллаж с результатами работы Gemini. Источник: Google

Технологический гигант объявил о принципиальном обновлении инструментов трансформации визуального контента в приложении Gemini. Инновационная разработка команды DeepMind уже прошла успешную валидацию в предварительных тестированиях и теперь доступна широкому кругу пользователей. Технология позволяет корректировать фотографии с сохранением абсолютной аутентичности персонажей и объектов.

Место Модель Балл 95% ДИ (±) Голосов Организация Лицензия
1 gemini-2.5-flash-image-preview (nano-banana) 1362 ±2 2 521 035 Google Проприетарная
2 flux-1-kontext-max 1191 ±3 357 196 Black Forest Labs Проприетарная
3 flux-1-kontext-pro 1174 ±2 2 015 530 Black Forest Labs Проприетарная
3 gpt-image-1 1170 ±3 1 026 399 OpenAI Проприетарная
5 flux-1-kontext-dev 1152 ±3 1 584 400 Black Forest Labs Проприетарная
6 qwen-image-edit 1145 ±2 1 585 904 Алибаба Apache 2.0
6 seededit-3.0 1142 ±4 1 285 080 Bytedance Проприетарная
8 gemini-2.0-flash-preview-image-generation 1093 ±3 1 700 785 Google Проприетарная
9 бублик 1044 ±5 12 774 Байтданс Апач 2.0
10 шаг1х-редактирование 1017 ±4 138 399 StepFun Apache 2.0

Источник: lmarena.ai

Что изменилось

Актуальная версия Gemini фокусируется на максимальной достоверности визуальных трансформаций. Если раньше алгоритм мог кардинально изменять внешность, то теперь система минимизирует значительные отклонения. Это гарантирует, что персонажи на снимках сохранят свою изначальную индивидуальность.

Gemini научился

  • перемещать персонажей или объекты в альтернативные локации без потери индентичности;
  • добавлять или заменять предметы интерьера, не нарушая общей композиции;
  • переносить стилистику отдельных элементов на другие части изображения;
  • создавать комплексные визуальные композиции из разных фотографий.

Gemini получил мощное обновление с генеративным редактированием изображений

Пример изменения ролей персонажа. Иллюстрация: Google

Примеры использования

  • Семейная фотография: корректировка мимических нюансов без искажения личности;
  • Домашние животные: сохранение оригинальных характеристик питомца при минимальных изменениях;
  • Модные эксперименты: виртуальная примерка одежды;
  • Дизайнерские решения: визуализация интерьерных трансформаций;
  • Креативные сценарии: перемещение знакомых людей в фантастические локации с сохранением их узнаваемости.

Gemini получил мощное обновление с генеративным редактированием изображений

Пример смешивания двух изображений. Иллюстрация: Google

Почему это важно

Компания позиционирует обновленный инструментарий как революционный подход к персональной визуальной коммуникации. Технология открывает невероятные горизонты для креативных экспериментов в области визуального контента.

Gemini получил мощное обновление с генеративным редактированием изображений

Пример сочетания дизайна. Иллюстрация: Google

Разработчики уверяют, что все вычислительные процессы гарантируют максимальную конфиденциальность пользователей, а текущее обновление — лишь начальный этап развития функционала.

Источник: Google

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ