Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4
Дослідницька команда Tongyi Lab, яка входить в структуру Alibaba, представила нову агентну LLM-модель Tongyi DeepResearch. Вона має відкритий код і призначена для проведення «глибоких досліджень» в інтернеті та складання точних звітів для окремих осіб та організацій. Про це повідомляє Venture Beat.
Як запевняють у Tongyi Lab, це «перший повністю відкритий веб-агент, який досягає продуктивності, нарівні з Deep Research від OpenAI, маючи лише 30 мільярдів параметрів (з них активовано 3 мільярди)».
Бенчмарки, опубліковані Tongyi Lab, демонструють, що Tongyi DeepResearch Agent працює на рівні або перевершує більшість альтернатив. Наприклад, він досяг показника 32.9 на Останньому іспиті людства (HLE) — це найвище досягнення серед усіх протестованих моделей, навіть перевершує o3 від OpenAI.
Ці результати ставлять Tongyi DeepResearch вище за інші моделі з відкритим кодом, такі як DeepSeek V3.1, Kimi K2 та Claude Sonnet 4, за кількістю завдань, незважаючи на його відносно скромний розмір.
Як і LLM Qwen3-30B-A3B, від якої він походить, агент Tongyi DeepResearch доступний безкоштовно для розробників та організацій для завантаження, налаштування та розгортання — навіть для комерційних програм, продуктів та робочих процесів — через платформи HuggingFace, GitHub та ModelScope — за ліцензією Apache 2.0.
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…