Китайская компания DeepSeek анонсировала новую модель искусственного интеллекта DeepseekMath-V2, демонстрирующую выдающиеся способности в области сложной математики. Система успешно решила множество задач из Международной и Китайской математических олимпиад (IMO 2025 и CMO 2024), показав результат, соответствующий золотой медали.
Источник изображений: the-decoder.com
Согласно заявлению, DeepseekMath-V2 набрала 118 баллов из 120 возможных в тесте Putnam, что значительно превышает лучший человеческий результат в 90 баллов. Разработчики отмечают, что предыдущие ИИ-модели часто давали верный ответ, но не предоставляли корректного пошагового решения. Для преодоления этого ограничения новая модель использует многоступенчатый процесс с отдельным модулем верификации, который оценивает правильность каждого шага и определяет необходимость его повторной проверки. Такой подход позволяет алгоритму анализировать и улучшать свои решения в реальном времени.
Технически DeepseekMath-V2 создана на базе модели Deepseek-V3.2-Exp-Base. В описании DeepSeek не упоминается применение внешних инструментов вроде калькуляторов или интерпретаторов кода. В ходе ключевых экспериментов одна и та же модель использовалась как для генерации доказательств, так и для их проверки. Высокая эффективность алгоритма объясняется его способностью критически оценивать и совершенствовать собственные рассуждения, а не полагаться на внешнее программное обеспечение. Для решения особо сложных задач модель увеличивает вычислительные ресурсы на этапе тестирования, параллельно создавая и проверяя множество вариантов доказательств, чтобы повысить уверенность в окончательном ответе.
Презентация DeepSeek состоялась после анонсов пока не выпущенных ИИ-моделей от OpenAI и Google Deepmind, которые также показали схожие успехи в решении сложных математических задач. Важно, что эти алгоритмы достигли подобных результатов благодаря развитым способностям к логическим рассуждениям, а не узкой оптимизации под олимпиадные задачи. Если заявленные достижения подтвердятся на практике, это будет означать, что языковые модели вплотную приблизились к решению сложных абстрактных проблем, что долгое время считалось исключительной прерогативой человеческого интеллекта.
Стоит подчеркнуть, что подход DeepSeek к публикации технических особенностей модели DeepseekMath-V2 кардинально отличается от политики конфиденциальности, которой придерживаются Google и OpenAI. Зарубежные корпорации предпочитают не разглашать детали архитектуры своих систем искусственного интеллекта, в то время как китайский разработчик, напротив, действует с полной открытостью, наглядно демонстрируя, что по уровню разработок он находится на одной ступени с признанными лидерами отрасли.