Нова модель Qwen-3-Max від Alibaba перевершила GPT-5

Дмитро Сімагін

Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.

Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.

Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.

У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4. 

Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026