Рубріки: Новини

«Вони дешевші і їх можна запускати на власному обладнанні»: американські розробники все частіше обирають китайські LLM-моделі

Дмитро Сімагін

Хоча американські стартапи продовжують лідирувати в галузі штучного інтелекту, багато з них розробляють свої продукти на основі китайських LLM-моделей. Причина цього проста — вони відкриті та дешевші у доступі, і підтримують безліч сценаріїв застосування, пише NBC News. 

Зростання популярності китайських LLM-моделей загрожує всій галузі штучного інтелекту США: інвестори вкладають десятки мільярдів доларів в OpenAI, Anthropic та інші компанії з розрахунку, що вони домінуватимуть на світовому ринку. Однак на практиці розробники все частіше звертаються до китайських проектів — це порушує питання, наскільки американські LLM-моделі насправді виняткові, і чи не є помилкою стратегія з випуску закритих продуктів.

Майкл Файн, керівник відділу в Exa, пошуковій компанії, яка спеціалізується на штучному інтелекті, розповів, що запуск китайських моделей на власному обладнанні в багатьох випадках виявився значно швидшим і дешевшим, ніж використання GPT-5 від OpenAI або Gemini від Google.

«Часто трапляється так, що ми отримуємо функцію, яка працює із закритою моделлю, і розуміємо, що вона занадто дорога або занадто повільна, і ми себе запитуємо, як це зробити швидшим і дешевшим. Зазвичай це означає заміну закритої моделі на користь відкритої моделі, а потім її запуск на власній інфраструктурі», — сказав Файн.

Китайські моделі, такі як R1 від DeepSeek та Qwen від Alibaba, можна використовувати безкоштовно і вони вважаються «відкритими», оскільки кожен може їх завантажити, копіювати, змінювати та використовувати на власному обладнанні. Вони відрізняються від провідних американських систем, таких як Claude від Anthropic або GPT від OpenAI, які є «закритими» або пропрієтарними, і доступ до яких здійснюється через API та дата-центри, які контролюються великими технологічними гігантами.

Роками американські моделі із закритим кодом від OpenAI та Anthropic значно перевершували як американські, так і китайські відкриті альтернативи. Але за останній рік китайські компанії, такі як DeepSeek та Alibaba, досягли величезного технологічного прогресу. Їхні продукти з відкритим кодом тепер майже наближаються або навіть відповідають показникам провідних закритих американських моделей у багатьох сферах, згідно з показниками, що відстежуються Artificial Analysis, незалежною компанією з бенчмаркінгу штучного інтелекту.

«Розрив справді скорочується», — сказав Лінь Цяо, генеральний директор Fireworks AI та співзасновник PyTorch, домінуючого фреймворку для навчання моделей штучного інтелекту.

Джеррі Лю, засновник Dayflow — застосунку для продуктивності — оцінює, що приблизно 40% користувачів Dayflow зараз обирають моделі з відкритим кодом: «Qwen така ж хороша, як GPT-5 для мого випадку використання». І на відміну від GPT-5 або Gemini, полегшена версія Qwen може працювати за відносно низькою ціною або безкоштовно. 

Моделі Dayflow з відкритим кодом можуть виконувати обробку даних на комп’ютері користувача, що, за словами Лю, приваблює тих, хто не хоче надсилати свої дані в хмару з міркувань конфіденційності. Особисто Лю віддає перевагу зберігати дані на своєму пристрої, використовуючи моделі з відкритим кодом: «Чи використовував би я продукт, де весь мій екран транслювався б у хмару якогось випадкового хлопця? Ні, чорт забирай».

Чарльз Зедлевскі, головний директор з продуктів компанії Together AI, яка займається інфраструктурою штучного інтелекту, сказав, що розробникам тепер простіше та ефективніше починати з відкритих моделей та адаптувати їх до власних даних, додаючи «навички чи знання, які недоступні в жодній із існуючих сьогодні моделей». 

Для розробників, які бажають самостійно налаштувати модель, китайські варіанти є відправною точкою за замовчуванням. У Kilo Code, популярному додатку для кодування, де користувачі можуть обирати потрібну їм модель, з 20 найпопулярніших LLM-моделей сім є китайськими, причому шість із семи мають відкритий вихідний код.

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026