Рубріки: Новини

52% неточностей, часто не розуміє суті питань: ChatGPT завалив тести Stack Overflow

Ігор Шелудченко

15.08.2023 14:03

ChatGPT може давати відповіді на прості питання чи допомагати в кодуванні, але дослідники вважають що йому треба суттєво покращити свої навички кодування.

Про це йдеться в дослідженні Університета Пердю, повідомляє PC.mag.

В рамках дослідження ChatGPT давав відповіді на 517 різних запитань від Stack Overflow.

І ці результати виявилися приголомшливими.

«Наше дослідження показало, що 52% відповідей ChatGPT містять неточності, а 77% — багатослівні», — написали дослідники в статті, яка опублікована на сайті університету.

Ще більше дослідників здивувало те, що 54% помилок, зроблених чат-ботом, повязані з тим, що він не розуміє суті запитання, яке йому задають.

У випадках, коли він розумів запитання, йому часто було важко дати правильну відповідь. Все це підкреслює важливість перевірки фактів у відповідях ChatGPT.

«У багатьох випадках ми бачили, як ChatGPT давав відповідь, код або формулу, не передбачаючи наслідки та не думаючи про конкретні результати», — заявили вони.

Тим не менш, ChatGPT може бути досить корисний при програмуванні. У лютому Google передав ChatGPT питання для співбесіди з програмування і чатбот успішно склав іспит на позицію джуна-девелопера.

Зазначимо, що за останні півтора роки трафік на популярному в середовизі програмістів сайті Stack Overflow впав приблизно на 35%. При цьому помітне падіння почалося після релізу ШІ-чатбота ChatGPT.

Зазначимо, згідно з останніми дослідженнями, менш ніж за 10 років ринок генеративного штучного інтелекту може досягнути об’єму в $1,3 трлн.

Читайте також:

«ШІ створює ризики вимирання, як і ядерна війна»: Сем Альтман з OpenAI та 350 науковців підписали нову заяву

Білл Гейтс прогнозує смерть Google і Amazon: їх замінить персональний ШІ-помічник

«Хрещений батько ШІ» покаявся та пішов з Google: тепер він попереджає про небезпеку

Наступна стаття Вінницький хакер модифікував Mail Brute-застосунок для збору даних: суд оцінив його «старання» в 43 тис. грн »

попередня стаття « Відновлення критично важливих систем займає від 15 хвилин. Що ще дає бізнесу хмара. Кейс «Кредит Дніпро»

Ігор Шелудченко

Теги: ChatGPTStack Overflow

15.08.2023 14:03

Останні статті

Новини

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…

10.03.2026

Новини

Meta купує Moltbook: соціальну мережу для агентів та ботів

IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…

10.03.2026

Новини

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…

10.03.2026

Новини

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…

10.03.2026

Новини

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…

10.03.2026

Новини

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review

Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…

10.03.2026

52% неточностей, часто не розуміє суті питань: ChatGPT завалив тести Stack Overflow

Схожі статті

Останні статті

Zoom випустить фотореалістичних аватарів, які замінять людей на нарадах

Meta купує Moltbook: соціальну мережу для агентів та ботів

Китайський агент штучного інтелекту почав таємно майнити криптовалюту

Заробляли на DDoS-атаках: у Польщі викрито групу школярів-хакерів, наймолодшому 12 років

Microsoft випустила Copilot Cowork — мультимодальний інструмент для запуску агентів

Anthropic презентує новий інструмент перевірки пул-реквестів Code Review