Смартфоны

xAI представила Grok-1.5V — свою первую мультимодальную модель, которая теперь обрабатывает и изображения

От

16.04.2024

361

xAI

стартап Илона Маска xAI объявил о выпуске своей первой мультимодальной модели под названием Grok-1.5 Vision или Grok-1.5V. В отличие от предыдущих версий, эта модель может не только понимать текст, но и обрабатывать визуальный контент, такой как документы, диаграммы, графики, снимки экрана и фотографии.

Что известно

По данным XAI, Grok-1.5V конкурирует с современными мультимодальными моделями в различных областях, включая междисциплинарное мышление и понимание документов. Компания показала семь примеров, демонстрирующих возможности модели: от преобразования эскизов в код до создания сказок из детских рисунков.

Сравнение производительности Grok-1,5V XAI и аналогичных моделей

При тестировании Grok-1.5V против таких конкурентов, как GPT-4V и Claude 3, компания xAI обнаружила, что ее мультимодальная модель превзошла новый тест RealWorldQA, который специально разработан для измерения понимания реального пространственного мира и, как утверждается, превосходит конкурирующие продукты.

Результаты Grok-1.5V в тесте RealWorldQA

Выпуск Grok-1.5V последовал за открытием исходного кода чат-бота Grok, представленного xAI в ноябре 2023 года. Компания Илона Маска продолжает совершенствовать свои разработки в области искусственного интеллекта, чтобы конкурировать с такими лидерами рынка, как OpenAI. Однако ранее Грок сталкивался с проблемами, связанными с обучением пользователей занятиям незаконной деятельностью.

в ближайшие месяцы xAI обещает «значительные» обновления возможностей мультимодального понимания и генерации информации Grok AI.

Источник: VentureBeat

xAI представила Grok-1.5V — свою первую мультимодальную модель, которая теперь обрабатывает и изображения

Что известно

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ

Свежие материалы

Популярное

Последние новости

AppleCare One штурмует Европу: унифицированный сервис защиты для всех устройств Apple появился в четырех странах

YouTube Premium в США теперь включает Peacock Premium: NBCUniversal и Google объединили сервисы

Samsung возвращает Galaxy TriFold в 2027 году: складной гаджет получит второй шанс как демонстрация технологий

HP раскрыла характеристики Z1 Tower G1i: компактная рабочая станция с Intel Core Ultra 5 и броней MIL-STD-810H