Alibaba Cloud представила публике свою передовую модель для логических рассуждений Qwen3-Max-Thinking. По данным 19 оценочных тестов, её возможности соответствуют уровню таких флагманов, как GPT-5.2-Thinking, Claude-Opus-4.5 и Gemini 3 Pro.
Источник изображения: AI
Как отмечается в корпоративном блоге, модель Qwen3-Max-Thinking демонстрирует прогресс в точности фактов, решении сложных логических задач, выполнении инструкций, учёте предпочтений пользователя и агентских функциях. Эти улучшения стали результатом масштабирования архитектуры модели и применения значительных вычислительных мощностей для обучения с подкреплением (Reinforcement Learning, RL).
Основными новшествами выступили адаптивные инструменты и стратегия масштабирования при тестировании. Вместо прежнего ручного выбора инструментов пользователем, Qwen3-Max-Thinking теперь самостоятельно активирует встроенные модули поиска, памяти и интерпретатора кода прямо в процессе диалога. По словам создателей, инструменты поиска и памяти помогают минимизировать «галлюцинации», предоставляют доступ к свежей информации и позволяют давать ответы с учётом контекста, а интерпретатор кода исполняет программные фрагменты для решения нетривиальных задач. Данный метод позволил улучшить результаты в ряде специализированных тестов (GPQA, HLE, LiveCodeBench v6, IMO-AnswerBench), не увеличивая при этом вычислительные затраты.
Источник изображения: Alibaba
Как сообщает компания, версия модели с адаптивными инструментами уже интегрирована в Qwen Chat. Также открыт доступ через API в сервисе Alibaba Cloud Model Studio: для этого требуется зарегистрировать учётную запись в Alibaba Cloud, перейти в Model Studio и сгенерировать API-ключ в консоли разработчика. API Qwen поддерживает протокол OpenAI API, что упрощает стандартную интеграцию, а также реализована совместимость с протоколом Anthropic API для плавного взаимодействия с инструментом Claude Code.