Рубріки: Новини

Для тренування української LLM обрали модель, яка в рейтингу LMArena займає 78 місце

Дмитро Сімагін

01.12.2025 12:30

Міністр цифрової трансформації Михайло Федоров заявив, що майбутню українську LLM тренуватимуть на моделі Gemma 3 від Google. Цю велику мовну модель було обрано разом з фахівцями Kyivstar, написав урядовець в своєму Telegram.

«Ми натренуємо open-source- модель від Google на унікальних україномовних текстах і вдосконалимо її роботу з українською мовою, щоб модель працювала максимально безпечно та якісно», — запевнили в Мінцифри.

Також міністр наводить ключові переваги Gemma:

оптимальний баланс продуктивності та ресурсів;
уже підтримує українську мову;
працює не лише з текстом, а й із зображеннями;
стала основою для найкращих українськомовних моделей.

Варто зауважити, що в загальному рейтингу LMArena модель Gemma 3, яку випустили 12 березня 2025 року, зараз займає 78 місце. З іншого боку, відкриті LLM-моделі з більш високою продуктивністю, ніж Gemma 3, розроблені переважно в Китаї, що накладає певні обмеження для українських державних структур.

Згідно дорожньої мапи проекту, наступний крок передбачає донавчання Gemma на унікальних українськомовних текстах та тестування якості моделі через бенчмарки.

Нагадаємо, що незабаром український бізнес зможе випускати свої моделі на основі національної LLM. Про таку можливість заявив Дмитро Овчаренко — керівник WINWIN AI Center of Excellence при Мінцифри. Також, за його словами, штучний інтелект вже скоротив процес найму в Міністерстві цифрової трансформації на 45%.

Наступна стаття Обмеження безпеки LLM можна обійти, якщо написати промпт у віршах »

попередня стаття « Німецький науковець винайшов формулу, як підвищити продуктивність робочого дня

Дмитро Сімагін

Теги: Gemma 3LLM-модельминцыфрыМихайло Федоров

01.12.2025 12:30

Останні статті

Новини

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Новини

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Новини

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Новини

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Новини

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Новини

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026

Для тренування української LLM обрали модель, яка в рейтингу LMArena займає 78 місце

Схожі статті

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Meta купує Moltbook: соціальну мережу для агентів та ботів

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review