Новости Software

Copilot получит GPT-5.2: новый режим Smart Plus для сложных задач

Компания Microsoft внедрила в веб-версию Copilot, а также в версии для Windows и мобильных платформ новейшую и наиболее совершенную на данный момент модель GPT-5.2 от OpenAI. Эта модель ускоряет решение практических задач, таких как подготовка таблиц и презентаций, написание и анализ кода, изучение объёмных документов, применение различных инструментов и обработка изображений. После обновления GPT-5.2 будет работать параллельно с моделью GPT-5.1.

 Источник изображения: Microsoft

Источник изображения: Microsoft

В прошлом месяце Copilot получил обновление до GPT-5.1 для интеллектуального режима. Теперь Microsoft представляет GPT-5.2 в Copilot как новый режим Smart Plus. По всей видимости, эта версия GPT-5.2 ориентирована на логические рассуждения, поскольку компания особо отмечает её повышенную эффективность в решении сложных задач.

По критерию OpenAI GDPval, который оценивает производительность модели в экономически важных реальных задачах для 44 профессий, GPT-5.2 Thinking превосходит или соответствует уровню отраслевых специалистов в 70,9% случаев, тогда как GPT-5 достигает этого лишь в 38,8% случаев. Такой существенный прогресс позволил OpenAI присвоить GPT-5.2 статус «экспертного уровня» для многих конкретных офисных задач, включая работу с презентациями, графиками и другими подобными элементами.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

В тестах, оценивающих работу ИИ-агентов в сложных сценариях разработки программного обеспечения, GPT-5.2 Thinking демонстрирует 55,6% на SWE-Bench Pro и 80% на SWE-Bench Verified, что выше результатов GPT-5.1 Thinking. В специализированных испытаниях модель показала следующие результаты: 92,4% в GPQA Diamond, 100% в AIME 2025 и 88,7% в CharXiv Reasoning (с использованием Python).

Новая версия GPT также значительно улучшила показатели в тестах ARC-AGI (Корпус абстракций и рассуждений для искусственного общего интеллекта) и ARC-AGI-2, которые предназначены для оценки способности модели к абстрактному мышлению и логическим умозаключениям.

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории