Рубріки: Новини

OpenAI випустила GPT-OSS — першу LLM-модель з відкритим кодом з часів GPT-2

Дмитро Сімагін

Компанія OpenAI вперше за шість років випустила модель з відкритим кодом. На ринок представили gpt-oss-120b та gpt-oss-20b — обидві LLM можуть працювати локально на пристроях користувачів і налаштовуватися для конкретних цілей, повідомляє The Verge.

Старша модель має 120 мільярдів параметрів, gpt-oss-20b — 20 мільярдів. Версія gpt-oss-120b може працювати на одному графічному процесорі Nvidia, та аналогічна існуючій моделі OpenAI o4-mini, тоді як менша версія працює приблизно на такому ж рівні, як o3-mini, але використовує на пристрої лише 16 ГБ пам’яті. 

Обидві версії моделі вже доступні на платформах Hugging Face, Databricks, Azure та AWS за ліцензією Apache 2.0, що дозволяє їх широко модифікувати для комерційних цілей. Останньою моделлю з відкритим кодом, яку випустили в OpenAI, була GPT-2 ще у 2019 році.

Оскільки нові LLM-моделі є загальнодоступними, це означає, що будь-хто може переглянути внутрішні параметри gpt-oss, щоб отримати уявлення про те, як вони обробляють інформацію. На відміну від ChatGPT, їх можна запускати без підключення до інтернету та через брандмауер.

Для OpenAI реліз моделі з відкритим кодом є відмовою від стратегії, яка зосереджується виключно на комерційних релізах, оскільки компанія останніми місяцями все більше стикається з конкуренцією з боку DeepSeek, Meta, Alibaba та інших розробників.

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026