Рубріки: Новини

Китайська компанія MiniMax стверджує, що її нова модель краща за DeepSeek R1-0528

Дмитро Сімагін

Компанія MiniMax з Шанхаю випустила нову LLM-модель під назвою MiniMax-M1. Вона має відкритий код і, як стверджується, більш ефективна, ніж всі конкуренти, створені в Китаї. Компанія-розробник запевняє, що MiniMax-M1 перевершує останню модель DeepSeek R1-0528 у кількох бенчмарках. Про це повідомляє Bloomberg.

Для навчання M1 використали 512 графічних процесорів Nvidia H800, оренда яких обійшлась у $534 тис.

Модель M1 підтримує довжину контексту в 1 мільйон токенів, що у вісім разів більше, ніж у DeepSeek R1, і вимагає лише близько 30% ресурсів, яких потребує DeepSeek. Журналісти та експерти поки не провели незалежної перевірки заяв MiniMax.

Компанія MiniMax, яка підтримується двома китайськими IT-гігантами Tencent Holdings та Alibaba Group, є частиною елітної групи місцевих стартапів у сфері штучного інтелекту, відомих як Little Dragons. За останній рік вони залучили мільярди доларів венчурного фінансування, хоча зростання DeepSeek змусило більшість групи скоротити або припинити фундаментальні дослідження та зосередитися більше на додатках.

MiniMax заявила, що поділиться додатковими оновленнями протягом наступних кількох днів. Серед інших продуктів компанії — інструмент для створення відео та віртуальний помічник.

 

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026