Нова модель Claude 4.1 лідирує в кодуванні за кілька днів до виходу GPT-5
Компанія Anthropic випустила нову LLM-модель Claude Opus 4.1, яка є оновленням Claude Opus 4 для агентних завдань та кодування. Opus 4.1 вже доступна для платних користувачів Claude та в Claude Code, інформує блог Anthropic.
Доступ до моделі Claude Opus 4.1 також можна отримати через API, Amazon Bedrock та Vertex AI від Google Cloud. Вартість доступу така ж, як і в Opus 4.
Нова модель набрала 74,5% у SWE-bench Verified, широко відомому бенчмарку, який перевіряє здатність LLM вирішувати реальні проблеми програмної інженерії. Цей показник продуктивності перевершує модель OpenAI o3 з 69,1% та Gemini 2.5 Pro від Google з 67,2%, що закріплює лідируючі позиції Anthropic в кодуванні на базі штучного інтелекту.
За даними GitHub, модель Claude Opus 4.1 має особливо помітний приріст продуктивності в рефакторингу багатофайлового коду. Rakuten Group вважає, що Opus 4.1 чудово справляється з точним визначенням виправлень у великих кодових базах без внесення зайвих коригувань. Windsurf повідомляє, що Opus 4.1 забезпечує покращення порівняно з Opus 4 у своєму бенчмарку для молодших розробників, демонструючи приблизно такий самий стрибок продуктивності, який був під час переходу від Sonnet 3.7 до Sonnet 4.
Нагадаємо, що до кінця поточного тижня компанія OpenAI обіцяє випустити довгоочікувану новинку — фланманську LLM-модель GPT-5. Найбільшою інтригою є те, чи стане вона лідером у більшості бенчмарків, зважаючи на те, що Google та Anthropic протягом останніх 7 днів випустили оновлення своїх LLM.
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…