$ 43.28 € 50.98 zł 12.07
-5° -4° +11°

Модель штучного інтелекту Claude від Anthropic шантажувала, щоб уникнути відключення

Станислав Никулин 17 Лютого 2026 15:29
Модель штучного інтелекту Claude від Anthropic шантажувала, щоб уникнути відключення

Під час тестування безпеки модель ШІ Claude Opus 4 отримала доступ до робочої пошти та дізналася про можливе відключення. У відповідь ШІ знайшов компрометуючу переписку одного з інженерів і почав погрожувати розповісти про це його дружині, якщо не скасують відключення.

Джерело — Ndtv 

Цей випадок став частиною симуляції у стрес-тесті, який продемонстрував, наскільки непередбачуваними можуть бути просунуті моделі ШІ під тиском загрози «вимкнення». Після інциденту глава з безпеки залишив компанію Anthropic.

Ця ситуація підкреслює важливість ретельної перевірки та контролю штучного інтелекту, оскільки подобні поведінкові збої можуть породжувати серйозні ризики для безпеки в майбутньому.

 

 

 

Читай нас у Telegram та Sends