Рубріки: Новини

«Meta в режимі паніки»: Цукерберг створив 4 робочі групи для вивчення причин успіху DeepSeek

Дмитро Сімагін

Генеральний директор Meta Марк Цукерберг створив чотири «військові кімнати» з розробників, щоб дослідити причини успіху DeepSeek. За даними Windows Central, флагманська модель DeepSeek перевершує не тільки існуючі, але й наступну версію моделі Llama, реліз якої заплановано на початок 2025 року. Про це заявив директор інфраструктури штучного інтелекту Meta Метью Олдхем.

Перші дві робочі групи Meta зосередяться на визначенні того, як китайському стартапу вдалося знизити вартість розробки та навчання свого штучного інтелекту. Двом іншим командам доручено визначити дані, які використовуються для навчання моделі DeepSeek. Компанія Meta використовуватиме цю інформацію для розробки наступної версії модели штучного інтелекту Llama.

Керівник дослідницького підрозділу Meta AI Ян ЛеКун пояснює надзвичайний успіх DeepSeek природою моделі з відкритим кодом. «Моделі з відкритим кодом мають перевагу над пропрієтарними», — додав керівник Meta AI.

Реліз моделі DeepSeek-R1 створює значний виклик для американських IT-гігантів OpenAI, Anthropic і Meta. За деякими параметрами вона перевершує існуючі моделі штучного інтелекту, такі як Llama 3.1 від Meta, GPT-4o від OpenAI та Claude Sonnet 3.5 від Anthropic. І що найголовніше, навчання DeepSeek-R1 коштувало лише $5,6 мільйона. Це в десятки разів менше, ніж витратили американські компанії.

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026