Рубріки: Новини

Google випустила Magika 1.0 — систему, яка визначає вміст файлів включно з мовами програмування

Дмитро Сімагін

Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та вміст файлів включно з мовами програмування, які використовувались при розробці, методами стиснення, інсталяційними пакетами, кодом, видами розмітки, форматами звуку, відео, документів та зображень. Про це інформує блог Google.

Magika 1.0 має відкритий код і поширюються під ліцензією Apache 2.0. Система вміє ідентифікувати понад 200 типів контенту, що вдвічі більше, ніж під час виходу початкової версії.

Однією з основних змін Magika 1.0 є те, що код системи переписано з Python на Rust. На MacBook Pro (M4) продуктивність нового рушія Magika дозволяє обробляти близько 1000 файлів за секунду.

Серед інших нововведень Magika 1.0 варто виділити:

  • Нативний клієнт командного рядка Rust, який максимально прискорює роботу.
  • Підвищена точність для складних текстових форматів, таких як код та файли конфігурації.
  • Оновлений модуль Magika для Python та TypeScript для ще легшої інтеграції.

Від схожих проектів, що визначають MIME-тип за вмістом, Magika відрізняється застосуванням методів машинного навчання, високою продуктивністю та точністю визначення. Модель навчена з використанням фреймворку Keras на 100 млн. прикладів файлів (розмір набору даних більше 3 терабайт) і підтримує розпізнавання 200 типів даних з точністю не менше 99%. Модель скомпонована у форматі ONNX і має розмір лише кілька мегабайт. 

 

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026