Обновленная модель Gemini 2.0 Flash Thinking от Google доступна для тестирования . Источник: 9to5Google В декабре Google анонсировала модель Gemini 2.0 Flash Thinking как первую для логических размышлений, и теперь доступна ее обновленная экспериментальная версия для тестирования. Эта модель базируется на версии 2.0 Flash, которая была представлена ранее в том же месяце, и позволяет «четко показывать свои рассуждения» (как в AI Studio). Это улучшает производительность при решении более сложных задач. Она дополняет другие модели, такие как gemini-2.0-flash-exp и gemini-exp-1206. Что известно
Основные новинки Gemini 2.0 Flash Thinking Experimental (январь 2025)
- Контекстное окно в 1 миллион токенов (из 32к): это удобно для тех, кто хочет «подключить кодовую базу или запрашивать набор статей с более сложными рассуждениями».
- Поддержка выполнения кода на месте: для улучшенного использования инструментов.
- Большая генерация исходных токенов.
- Меньшая частота расхождений в моделях («уменьшена вероятность противоречия между мнением и ответом»).
- По сравнению с Exp 1219, новая версия демонстрирует «лучшую производительность по математическим, научным и мультимодальным тестам», в частности 73,3% на тесте AIME2024 (Математика) и 74,2% на тесте GPQA Diamond (Наука).
Генеральный директор DeepMind Демис Хасабис отметил, что это «представляет очень быстрый прогресс с момента нашего первого выпуска в декабре». Отмечалось, что они занимаются разработкой таких систем планирования более десяти лет, начиная с программ, таких как AlphaGo, и им приятно видеть мощное сочетание этих идей с самыми мощными фундаментальными моделями.
Gemini 2.0 Flash Thinking Experimental доступна для бесплатного тестирования в Google AI Studio и через API. Сундар Пичаи отметил, что прогресс в масштабировании мышления впечатляющий и будет продолжаться, а также пообещал больше новостей в будущем.
Источник: 9to5Google