Експериментальна LLM-модель OpenAI досягла рівня переможця Міжнародної математичної олімпіади
Експериментальна модель OpenAI досягла рівня золотої медалі на Міжнародній математичній олімпіаді (IMO), вирішивши п’ять із шести завдань і набравши 35 балів із 42 можливих, повідомляє Engadget. Ця подія вже названа «важливою віхою в розвитку штучного інтелекту», особливо в галузі логічного та творчого мислення.
За словами наукового співробітника OpenAI Александра Вея, який спеціалізується на великих мовних моделях і логічних завданнях, нова розробка компанії впоралася з одним із ключових завдань — вирішенням математичних задач, які вимагають не лише обчислень, а й нестандартного підходу.
IMO є одним із найпрестижніших змагань для школярів з усього світу. Учасники конкурсу вирішують складні завдання з алгебри та математичного аналізу. Цього року золоті медалі здобули лише 67 із 630 учасників, тобто близько 10%.
До цього часу штучний інтелект показував хороші результати в обробці великих даних і виконанні рутинних операцій, однак у завданнях, де вимагається творчий підхід або складні логічні міркування, він не досягав вершин. Нова модель OpenAI нарешті змогла наблизитися до рівня мислення людини, побудувавши суворі і логічно вивірені докази.
Вей підкреслив, що модель здатна створювати «складні та безпомилкові логічні аргументи на рівні професійних математиків». При цьому OpenAI не планує виводити продукт з таким рівнем математичної підготовки на ринок у найближчі кілька місяців. Нова версія GPT-5, хоча й покращиться в порівнянні з попередніми версіями, але вона не включатиме можливості, продемонстровані на олімпіаді.
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…