Коллаж с результатами работы Gemini. Источник: Google
Технологический гигант объявил о принципиальном обновлении инструментов трансформации визуального контента в приложении Gemini. Инновационная разработка команды DeepMind уже прошла успешную валидацию в предварительных тестированиях и теперь доступна широкому кругу пользователей. Технология позволяет корректировать фотографии с сохранением абсолютной аутентичности персонажей и объектов.
Место | Модель | Балл | 95% ДИ (±) | Голосов | Организация | Лицензия |
---|---|---|---|---|---|---|
1 | gemini-2.5-flash-image-preview (nano-banana) | 1362 | ±2 | 2 521 035 | Проприетарная | |
2 | flux-1-kontext-max | 1191 | ±3 | 357 196 | Black Forest Labs | Проприетарная |
3 | flux-1-kontext-pro | 1174 | ±2 | 2 015 530 | Black Forest Labs | Проприетарная |
3 | gpt-image-1 | 1170 | ±3 | 1 026 399 | OpenAI | Проприетарная |
5 | flux-1-kontext-dev | 1152 | ±3 | 1 584 400 | Black Forest Labs | Проприетарная |
6 | qwen-image-edit | 1145 | ±2 | 1 585 904 | Алибаба | Apache 2.0 |
6 | seededit-3.0 | 1142 | ±4 | 1 285 080 | Bytedance | Проприетарная |
8 | gemini-2.0-flash-preview-image-generation | 1093 | ±3 | 1 700 785 | Проприетарная | |
9 | бублик | 1044 | ±5 | 12 774 | Байтданс | Апач 2.0 |
10 | шаг1х-редактирование | 1017 | ±4 | 138 399 | StepFun | Apache 2.0 |
Источник: lmarena.ai
Что изменилось
Актуальная версия Gemini фокусируется на максимальной достоверности визуальных трансформаций. Если раньше алгоритм мог кардинально изменять внешность, то теперь система минимизирует значительные отклонения. Это гарантирует, что персонажи на снимках сохранят свою изначальную индивидуальность.
Gemini научился
- перемещать персонажей или объекты в альтернативные локации без потери индентичности;
- добавлять или заменять предметы интерьера, не нарушая общей композиции;
- переносить стилистику отдельных элементов на другие части изображения;
- создавать комплексные визуальные композиции из разных фотографий.
Пример изменения ролей персонажа. Иллюстрация: Google
Примеры использования
- Семейная фотография: корректировка мимических нюансов без искажения личности;
- Домашние животные: сохранение оригинальных характеристик питомца при минимальных изменениях;
- Модные эксперименты: виртуальная примерка одежды;
- Дизайнерские решения: визуализация интерьерных трансформаций;
- Креативные сценарии: перемещение знакомых людей в фантастические локации с сохранением их узнаваемости.
Пример смешивания двух изображений. Иллюстрация: Google
Почему это важно
Компания позиционирует обновленный инструментарий как революционный подход к персональной визуальной коммуникации. Технология открывает невероятные горизонты для креативных экспериментов в области визуального контента.
Пример сочетания дизайна. Иллюстрация: Google
Разработчики уверяют, что все вычислительные процессы гарантируют максимальную конфиденциальность пользователей, а текущее обновление — лишь начальный этап развития функционала.
Источник: Google