Рубріки: Новини

Модель Gemini 2.5 Deep Think виграла чемпіонат з програмування, розв’язавши 10 з 12 завдань

Дмитро Сімагін

18.09.2025 09:41

Модель Gemini 2.5 Deep Think виграла чемпіонат з програмування, розв'язавши 10 з 12 завдань

Компанія Google заявила, що її LLM-модель виграла світовий фінал Міжнародного конкурсу коледжів з програмування (ICPC), отримавши золоту медаль. За словами Google, це знаменує собою «значний крок на нашому шляху до загального штучного інтелекту». Про це пише Ars Technica.

Щороку тисячі програмістів з різних коледжів беруть участь у ICPC, намагаючись протягом п’яти годин вирішити складні завдання, пов’язані з кодуванням та алгоритмами. Це найбільші та найдовші змагання такого типу. Для участі в ICPC Google підключила Gemini 2.5 Deep Think до віддаленого онлайн-середовища, схваленого ICPC. Учасникам змагань було надано фору в 10 хвилин, перш ніж Gemini почне «думати».

На відміну від аналогічної Міжнародної математичної олімпіади (IMO), яка пройшла на початку цього року, компанія Google не створила спеціально навчену модель для ICPC. Gemini 2.5, яка брала участь у змаганні, — це та сама серійна модель, якою всі користуються в інших додатках Gemini.

Після закінчення ліміту часу команді Gemini вдалося отримати правильні відповіді на 10 з 12 завдань, що принесло їй золоту медаль. Лише чотири з 139 «людських» команд змогли досягти такого ж результату.

На ICPC бали нараховуються лише за правильне розв’язання завдання з урахуванням витраченого часу. Команда Gemini швидко досягла вищих позицій у рейтингу, правильно виконавши 8 завдань лише за 45 хвилин. Після 677 хвилин змагання команда Gemini 2.5 Deep Think мала 10 правильних відповідей.

Наступна стаття Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4 »

попередня стаття « ChatGPT вдвічі балакучіший, ніж Stack Overflow. Це може бути проблемою

Дмитро Сімагін

Теги: Gemini 2.5 Deep ThinkgoogleLLM-модель

18.09.2025 09:41

Останні статті

Новини

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Новини

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Новини

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Новини

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Новини

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Новини

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026

Модель Gemini 2.5 Deep Think виграла чемпіонат з програмування, розв’язавши 10 з 12 завдань

Схожі статті

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Meta купує Moltbook: соціальну мережу для агентів та ботів

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review