Штучний інтелект ще не готовий до самостійного тривалого підтримання коду

Станислав Никулин 11 Березня 2026 09:06

Alibaba протестувала агентів штучного інтелекту на 100 реальних кодових базах протягом 233 днів, але результати виявилися невдалими. Хоча ІІ легко проходить тестові завдання і пише код, він не здатен підтримувати його протягом восьми місяців без помилок, що призводить до масштабних збоїв.

У ході експерименту 75 % моделей ШІ порушили працездатність уже працюючого коду під час підтримки. З кожною новою ітерацією агенти накаплюють технічні борги й створюють «крихкий» код, пожертвувавши його якістю заради швидких результатів. Це свідчить про те, що ІІ поки не в змозі замінити людину у довготривалому супроводі програмного забезпечення.

Подальший розвиток моделей ІІ потребує поліпшення їхніх здатностей до стабільної та якісної підтримки коду, особливо в реальних складних проєктах.

Читай нас у Telegram та Sends