OpenAI випустила модель GPT‑5.2, яка перевершує людей у 70,9% завдань
OpenAI випустила нову LLM-модель GPT-5.2 у версіях Instant, Thinking та Pro, розгорнувши їх для платних планів, таких як Plus, Pro, Business та Enterprise. Новинка вже доступна для всіх розробників через API. Разом з цим Microsoft негайно додає GPT-5.2 до Microsoft 365 Copilot та Microsoft Copilot Studio, повідомляє блог компанії.
В OpenAI стверджують, що в бенчмарках модель GPT-5.2 Thinking перевершує або працює на рівні провідних фахівців галузі у 70,9% завдань інтелектуальної роботи (GDPval), виконуючи її більш ніж в 11 разів швидше. При цьому вартість роботи моделі коштує менше ніж 1% від вартості роботи людей-експертів.
«Версія 5.2 найкраще підходить для створення електронних таблиць, презентацій, написання коду, генерації зображень, розуміння довгого контексту, використання інструментів, а потім пов’язування складних, багатоетапних проектів», — заявив Фіджі Сімо, головний директор з продуктів OpenAI.
Три рівні моделей виконують різні функції: Instant обробляє швидкі завдання, такі як письмо та переклад; Thinking може впоратися з більш складною роботою, такою як кодування та математика; а Pro забезпечує найвищу точність для багатоетапних задач.
GPT-5.2 має контекстне вікно на 400 000 токенів, що дозволяє їй обробляти сотні документів одночасно. Ціна доступу до моделі через API становить $1,75 за мільйон вхідних токенів для стандартної моделі, що на 40% дорожче, ніж GPT-5.1.
У кодуванні GPT-5.2 Thinking набирає 55,6% у бенчмарку SWE-Bench Pro та 80% у SWE-Bench Verified, що вище, ніж у GPT-5.1-Codex-Max.
OpenAI запевняє, що попередня версія GPT-5.1 залишатиметься доступною в ChatGPT для платних користувачів протягом трьох місяців у випадаючому списку застарілих моделей.
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…