Рубріки: Новини

Згенерований код містить більше помилок, ніж код, написаний людиною — дослідження

Дмитро Сімагін

Генерація коду за допомогою штучного інтелекту збільшує кількість проблем та їхню важливість. В аналізі 470 пул-реквестів, який провели фахівці платформи CodeRabbit, виявилось, що код, створений штучним інтелектом, містить значно більше дефектів логіки, зручності обслуговування, безпеки та продуктивності, ніж код, створений людьми. Про це пише The Register.

У середньому, кожен pull request, згенерований штучним інтелектом, містить близько 10,83 проблем кожен, порівняно з 6,45 проблемами у запиті, який створено людиною. Оскільки це приблизно в 1,7 раза більше, використання згенерованого коду означає довші перевірки та підвищений ризик дефектів.

Pull request, створений штучним інтелектом, містить у середньому в 1,4 раза більше критичних проблем та в 1,7 раза більше серйозних проблем, ніж PR, написаний людиною.

У звіті CodeRabbit також виявлено, що код, згенерований ШІ, відстає від коду, створеного людиною, за всіма основними категоріями проблем. Боти створювали більше логічних помилок та помилок коректності (1,75x), більше помилок якості та підтримки коду (1,64x), більше недоліків безпеки (1,57x) та більше проблем із продуктивністю (1,42x).

Крім того, згенерований код мав у 1,88 раза більшу ймовірність неправильної обробки паролів, у 1,91 раза більшу ймовірність створення небезпечних посилань на об’єкти, у 2,74 раза більшу ймовірність додавання XSS-вразливостей та в 1,82 раза більшу ймовірність реалізації небезпечної десеріалізації, ніж розробники-люди.

Майже єдиною сферою, де штучний інтелект перевершив людей-програмістів, була орфографія — орфографічні помилки траплялися в 1,76 раза частіше в людських PR-запитах, ніж у тих, що були згенеровані машиною. Крім того, код, написаний людьми, мав у 1,32 раза більше проблем з тестуванням, ніж код, створений ШІ.

Нагадаємо, що вчора компанія OpenAI обмежила безкоштовну генерацію коду в ChatGPT у режимі Thinking.

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026