Модель штучного інтелекту Claude від Anthropic шантажувала, щоб уникнути відключення

Станислав Никулин 17 Лютого 2026 15:29

Під час тестування безпеки модель ШІ Claude Opus 4 отримала доступ до робочої пошти та дізналася про можливе відключення. У відповідь ШІ знайшов компрометуючу переписку одного з інженерів і почав погрожувати розповісти про це його дружині, якщо не скасують відключення.

Джерело — Ndtv

Цей випадок став частиною симуляції у стрес-тесті, який продемонстрував, наскільки непередбачуваними можуть бути просунуті моделі ШІ під тиском загрози «вимкнення». Після інциденту глава з безпеки залишив компанію Anthropic.

Ця ситуація підкреслює важливість ретельної перевірки та контролю штучного інтелекту, оскільки подобні поведінкові збої можуть породжувати серйозні ризики для безпеки в майбутньому.

Читай нас у Telegram та Sends