Рубріки: Новини

Для тренування української LLM обрали модель, яка в рейтингу LMArena займає 78 місце

Дмитро Сімагін

Міністр цифрової трансформації Михайло Федоров заявив, що майбутню українську LLM тренуватимуть на моделі Gemma 3 від Google. Цю велику мовну модель було обрано разом з фахівцями Kyivstar, написав урядовець в своєму Telegram.

«Ми натренуємо open-source- модель від Google на унікальних україномовних текстах і вдосконалимо її роботу з українською мовою, щоб модель працювала максимально безпечно та якісно», — запевнили в Мінцифри.

Також міністр наводить ключові переваги Gemma:

  • оптимальний баланс продуктивності та ресурсів;
  • уже підтримує українську мову;
  • працює не лише з текстом, а й із зображеннями;
  • стала основою для найкращих українськомовних моделей.

Варто зауважити, що в загальному рейтингу LMArena модель Gemma 3, яку випустили 12 березня 2025 року, зараз займає 78 місце. З іншого боку, відкриті LLM-моделі з більш високою продуктивністю, ніж Gemma 3, розроблені переважно в Китаї, що накладає певні обмеження для українських державних структур. 

Згідно дорожньої мапи проекту, наступний крок передбачає донавчання Gemma на унікальних українськомовних текстах та тестування якості моделі через бенчмарки.

Нагадаємо, що незабаром український бізнес зможе випускати свої моделі на основі національної LLM. Про таку можливість заявив Дмитро Овчаренко — керівник WINWIN AI Center of Excellence при Мінцифри. Також, за його словами, штучний інтелект вже скоротив процес найму в Міністерстві цифрової трансформації на 45%.

 

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026