Основные новинки Gemini 2.0 Flash Thinking Experimental (январь 2025)
- Контекстное окно в 1 миллион токенов (из 32к): это удобно для тех, кто хочет «подключить кодовую базу или запрашивать набор статей с более сложными рассуждениями».
- Поддержка выполнения кода на месте: для улучшенного использования инструментов.
- Большая генерация исходных токенов.
- Меньшая частота расхождений в моделях («уменьшена вероятность противоречия между мнением и ответом»).
- По сравнению с Exp 1219, новая версия демонстрирует «лучшую производительность по математическим, научным и мультимодальным тестам», в частности 73,3% на тесте AIME2024 (Математика) и 74,2% на тесте GPQA Diamond (Наука).
Генеральный директор DeepMind Демис Хасабис отметил, что это «представляет очень быстрый прогресс с момента нашего первого выпуска в декабре». Отмечалось, что они занимаются разработкой таких систем планирования более десяти лет, начиная с программ, таких как AlphaGo, и им приятно видеть мощное сочетание этих идей с самыми мощными фундаментальными моделями.
Gemini 2.0 Flash Thinking Experimental доступна для бесплатного тестирования в Google AI Studio и через API. Сундар Пичаи отметил, что прогресс в масштабировании мышления впечатляющий и будет продолжаться, а также пообещал больше новостей в будущем.
Источник: 9to5Google