Нова агентна модель GPT 5.1-Codex-Max може автономно писати код протягом 24 годин
OpenAI розпочала розгортання в інструменті Codex нової агентної моделі GPT 5.1-Codex-Max. У пості в X компанія заявила, що новинка може автономно працювати з кодом протягом кількох годин. Про це повідомляє Bleeping Computer.
На відміну від моделі GPT-5.1, яка оптимізована для досліджень та звичайної взаємодії на кшталт створення зображень, GPT‑5.1-Codex-Max призначена суто для кодування. Вона навчена працювати в кількох контекстних вікнах за допомогою методу стискання.
Завдяки стисканню GPT‑5.1-Codex-Max автоматично ущільнює сеанс роботи, коли він наближається до ліміту контекстного вікна, дозволяючи моделі працювати незалежно протягом довгого часу. Під час внутрішнього тестування виявилось, що GPT‑5.1-Codex-Max змогла працювати над завданнями більше 24 годин.
За даними компанії-розробника, GPT‑5.1-Codex-Max може працювати з мільйонами токенів в одному завданні. Крім того, нова модель швидша та ефективніша при використанні токенів, ніж базова модель GPT-5.1.
«GPT‑5.1-Codex-Max було навчено виконувати завдання з розробки програмного забезпечення в реальному світі, такі як створення PR, перевірка коду, фронтенд-кодування та система запитань і відповідей, і перевершує наші попередні моделі в багатьох оцінках передового кодування», — заявляють в OpenAI.
У бенчмарках нова модель GPT-5.1-Codex-Max досягла 77,9% на SWE-Bench Verified, 79,9% — на SWE-Lancer IC SWE та 58,1% — на TerminalBench 2.0.
Інструмент Codex, для якого призначена GPT‑5.1-Codex-Max, працює всередині терміналу, але розробники також можуть використовувати його у веб-версії після підключення до GitHub.
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…