Модель Gemini 2.5 Deep Think виграла чемпіонат з програмування, розв'язавши 10 з 12 завдань
Компанія Google заявила, що її LLM-модель виграла світовий фінал Міжнародного конкурсу коледжів з програмування (ICPC), отримавши золоту медаль. За словами Google, це знаменує собою «значний крок на нашому шляху до загального штучного інтелекту». Про це пише Ars Technica.
Щороку тисячі програмістів з різних коледжів беруть участь у ICPC, намагаючись протягом п’яти годин вирішити складні завдання, пов’язані з кодуванням та алгоритмами. Це найбільші та найдовші змагання такого типу. Для участі в ICPC Google підключила Gemini 2.5 Deep Think до віддаленого онлайн-середовища, схваленого ICPC. Учасникам змагань було надано фору в 10 хвилин, перш ніж Gemini почне «думати».
На відміну від аналогічної Міжнародної математичної олімпіади (IMO), яка пройшла на початку цього року, компанія Google не створила спеціально навчену модель для ICPC. Gemini 2.5, яка брала участь у змаганні, — це та сама серійна модель, якою всі користуються в інших додатках Gemini.
Після закінчення ліміту часу команді Gemini вдалося отримати правильні відповіді на 10 з 12 завдань, що принесло їй золоту медаль. Лише чотири з 139 «людських» команд змогли досягти такого ж результату.
На ICPC бали нараховуються лише за правильне розв’язання завдання з урахуванням витраченого часу. Команда Gemini швидко досягла вищих позицій у рейтингу, правильно виконавши 8 завдань лише за 45 хвилин. Після 677 хвилин змагання команда Gemini 2.5 Deep Think мала 10 правильних відповідей.
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…