Штучний інтелект ще не готовий до самостійного тривалого підтримання коду
Alibaba протестувала агентів штучного інтелекту на 100 реальних кодових базах протягом 233 днів, але результати виявилися невдалими. Хоча ІІ легко проходить тестові завдання і пише код, він не здатен підтримувати його протягом восьми місяців без помилок, що призводить до масштабних збоїв.
У ході експерименту 75 % моделей ШІ порушили працездатність уже працюючого коду під час підтримки. З кожною новою ітерацією агенти накаплюють технічні борги й створюють «крихкий» код, пожертвувавши його якістю заради швидких результатів. Це свідчить про те, що ІІ поки не в змозі замінити людину у довготривалому супроводі програмного забезпечення.
Подальший розвиток моделей ІІ потребує поліпшення їхніх здатностей до стабільної та якісної підтримки коду, особливо в реальних складних проєктах.