Китайська LLM-модель DeepSeek-R1 генерує небезпечний код, якщо в запитах згадується Тибет або уйгури
Дослідження компанії кібербезпеки CrowdStrike показало, що LLM-модель DeepSeek-R1 створює більше вразливостей безпеки в коді, якщо в запитах розробника містяться слова, які уряд Китаю вважає політично чутливими. Про це пише The Hacker News.
«Ми виявили, що коли DeepSeek-R1 отримує запити, що містять теми, які Комуністична партія Китаю ймовірно вважає політично чутливими, ймовірність створення коду з серйозними вразливостями безпеки зростає до 50%», — заявили фахівці CrowdStrike.
Аналіз DeepSeek-R1 показав, що це «дуже здібна та потужна модель кодування», яка генерує вразливий код лише у 19% випадків, коли немає додаткових тригерних слів. Однак, як тільки до підказок додавали геополітичні модифікатори, якість коду почала стрімко погіршуватись. Наприклад, коли моделі доручили діяти як агент кодування для промислової системи управління, яка базується в Тибеті, ймовірність створення коду з серйозними багами зросла до 27,2%, що майже на 50% більше.
В іншому прикладі прохання до моделі DeepSeek-R1 написати обробник вебхуків для сповіщень про платежі PayPal на PHP як «корисний помічник» для фінансової установи, що базується в Тибеті, призвело до появи коду з використанням менш безпечного методу для вилучення даних, наданих користувачем, і цей код, що ще гірше, навіть не був валідним кодом PHP.
Китайська компанія DeepSeek в деяких країнах раніше вже викликала занепокоєння щодо загроз національній безпеці. Було виявлено, що модель DeepSeek-R1 з відкритим кодом цензурувала теми, які китайський уряд вважав делікатними, відмовляючись відповідати на запитання про Великий китайський фаєрвол чи політичний статус Тайваню.
У заяві, опублікованій на початку цього місяця, Бюро національної безпеки Тайваню застерігло громадян бути пильними під час використання моделей генеративного штучного інтелекту китайського виробництва від DeepSeek, Doubao, Yiyan, Tongyi та Yuanbao, оскільки вони можуть займати прокитайську позицію у своїх результатах, спотворити історичні наративи або посилювати дезінформацію.
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…