Логотип OpenAI. Источник: NurPhoto Генеральный директор OpenAI Сэм Альтман (Sam Altman) в последний день мероприятия «12 дней OpenAI» анонсировал новые модели искусственного интеллекта o3 и o3-mini, которые основаны на предыдущих моделях o1. Эти модели используют метод «частной цепочки мыслей», позволяющий им планировать свои ответы заранее, что называется симулированным рассуждением (SR). Модель o3 достигла рекордных результатов в бенчмарке ARC-AGI, набрав 75,7% в условиях низких вычислительных ресурсов и 87,5% в условиях высоких вычислительных ресурсов, что сопоставимо с человеческой производительностью. Также модель o3 набрала 96,7% на Американском пригласительном экзамене по математике 2024 года и 87,7% на тесте GPQA Diamond, включающем вопросы по биологии, физике и химии на уровне магистратуры. В бенчмарке Frontier Math от EpochAI o3 решила 25,2 процента задач, в то время как ни одна другая модель не превысила 2%. Модель o3-mini включает функцию адаптивного времени мышления, предлагая низкую, среднюю и высокую скорость обработки. OpenAI заявляет, что более высокие настройки вычислений дают лучшие результаты. Эти модели будут доступны для тестирования исследователями безопасности. Запуск o3-mini планируется на конец января, а o3 — вскоре после этого. Источник: OpenAIЧто известно