Google ДипМайнд
Google представила новую модель искусственного интеллекта Gemini 1.5 Pro. По мнению технических экспертов, он показал превосходные результаты во многих тестах производительности по сравнению с конкурирующими разработками.
Что известно
Gemini 1.5 Pro принадлежит к классу мультимодальных моделей, которые могут манипулировать текстом, изображениями, аудио и видео. Согласно данным, опубликованным Google, новая модель показывает практически идеальные результаты при выполнении задач по поиску длинной текстовой информации объемом до 10 миллионов токенов.
Для сравнения, существующие модели, такие как Claude 2.1 и GPT-4 Turbo, могут обрабатывать только 200 000 и 128 000 контекстов токенов соответственно.
Кроме того, Gemini 1.5 Pro продемонстрировал превосходные возможности в таких областях, как анализ длинного текста, долговременная обработка видео и распознавание речи. Например, модель может проанализировать 45-минутный фильм и ответить на конкретные вопросы о его содержании.
Gemini 1.5 Pro в настоящее время доступен разработчикам в тестовом режиме через Google Cloud Services. Компания обещает вскоре представить широко используемую модель с ограничением контекстного окна в 128 000 токенов.