Штучний інтелект не готовий до досліджень: що не так з ШІ в науці

Минулого місяця Google анонсував "AI co-scientist", штучний інтелект, який, за словами компанії, призначений для допомоги вченим у створенні гіпотез та планів досліджень. Google представив його як спосіб відкриття нових знань, але експерти вважають, що та подібні інструменти поки що не працюють.
"Цей попередній інструмент, хоч і цікавий, навряд чи буде серйозно використовуватися", — заявила TechCrunch Сара Бірі, дослідниця комп'ютерного зору з MIT. "Я не впевнена, що існує попит на такий тип системи генерації гіпотез з боку наукової спільноти".
Google — останній технологічний гігант, який просуває ідею, що ШІ колись значно прискорить наукові дослідження, особливо в галузях, насичених літературою, таких як біомедицина. В есе на початку цього року генеральний директор OpenAI Сем Альтман заявив, що "суперінтелектуальні" інструменти ШІ можуть "масово прискорити наукові відкриття та інновації". Подібним чином, генеральний директор Anthropic Даріо Амодей сміливо прогнозував, що ШІ може допомогти сформулювати ліки від більшості видів раку.
Але багато дослідників не вважають сучасний ШІ особливо корисним для керівництва науковим процесом. За їхніми словами, такі програми, як "AI co-scientist" від Google, здаються більше хайпом, ніж чимось іншим, не підкріпленим емпіричними даними.
Наприклад, у своєму блозі, де описується "AI co-scientist", Google заявив, що інструмент вже продемонстрував потенціал у таких сферах, як перепрофілювання ліків для гострого мієлоїдного лейкозу, типу раку крові, що вражає кістковий мозок. Однак результати настільки розпливчасті, що "жоден легітимний вчений не сприйме [їх] серйозно", — сказала Фавія Дубик, патологоанатом, пов'язана з Northwest Medical Center-Tucson в Арізоні.
"Це можна використовувати як хорошу відправну точку для дослідників, але […] відсутність деталей викликає занепокоєння і не спонукає мене довіряти цьому", — сказала Дубик TechCrunch. "Відсутність наданої інформації дуже ускладнює розуміння, чи може це дійсно бути корисним".
Це не перший випадок, коли Google критикують науковці за розголошення передбачуваного прориву ШІ без надання засобів для відтворення результатів.
У 2020 році Google заявив, що одна з його систем ШІ, навчена виявляти пухлини молочної залози, досягла кращих результатів, ніж радіологи-люди. Дослідники з Гарварду та Стенфорду опублікували спростування в журналі Nature, заявивши, що відсутність детальних методів і коду в дослідженні Google "підриває його наукову цінність".
Вчені також дорікали Google за замовчування обмежень його інструментів ШІ, спрямованих на наукові дисципліни, такі як матеріалознавство. У 2023 році компанія заявила, що близько 40 "нових матеріалів" було синтезовано за допомогою однієї з її систем ШІ під назвою GNoME. Однак, зовнішній аналіз показав, що жоден з матеріалів насправді не був абсолютно новим.
"Ми не зможемо по-справжньому зрозуміти сильні та слабкі сторони таких інструментів, як "co-scientist" від Google, доки вони не пройдуть ретельну, незалежну оцінку в різних наукових дисциплінах", — заявив TechCrunch Ашик ХудаБухш, доцент кафедри розробки програмного забезпечення в Рочестерському технологічному інституті. "ШІ часто добре працює в контрольованих умовах, але може зазнати невдачі при застосуванні в масштабі".
Частиною проблеми розробки інструментів ШІ для допомоги в наукових відкриттях є передбачення незліченної кількості збиваючих з пантелику факторів. ШІ може стати в нагоді в тих сферах, де потрібне широке дослідження, наприклад, звуження величезного списку можливостей. Але менш зрозуміло, чи здатний ШІ на той тип нестандартного вирішення проблем, який призводить до наукових проривів.
"Ми бачили протягом історії, що деякі з найважливіших наукових досягнень, такі як розробка мРНК-вакцин, були зумовлені людською інтуїцією та наполегливістю перед обличчям скептицизму", — сказав ХудаБухш. "ШІ, яким він є сьогодні, може бути не дуже придатним для відтворення цього".
Лана Сінапайєн, дослідниця ШІ в Sony Computer Science Laboratories в Японії, вважає, що такі інструменти, як "AI co-scientist" від Google, зосереджуються на неправильному виді наукової роботи.
Сінапайєн бачить справжню цінність у ШІ, який міг би автоматизувати технічно складні або нудні завдання, такі як підсумовування нової академічної літератури або форматування роботи відповідно до вимог грантової заявки. Але в науковій спільноті немає великого попиту на "AI co-scientist", який генерує гіпотези, — завдання, від якого багато дослідників отримують інтелектуальне задоволення.
"Для багатьох вчених, включаючи мене, генерація гіпотез — найцікавіша частина роботи", — сказала Сінапайєн TechCrunch. "Чому я повинен хотіти передати своє задоволення комп'ютеру, а потім залишитися тільки з важкою роботою, яку потрібно виконати самому? Взагалі, багато дослідників генеративного ШІ, здається, не розуміють, чому люди роблять те, що вони роблять, і ми закінчуємо пропозиціями продуктів, які автоматизують ту саму частину, від якої ми отримуємо радість".
Бірі зазначила, що часто найскладнішим кроком у науковому процесі є розробка та впровадження досліджень та аналізів для підтвердження або спростування гіпотези, що не обов'язково досяжне для сучасних систем ШІ. ШІ, звичайно, не може використовувати фізичні інструменти для проведення експериментів, і часто гірше справляється з проблемами, для яких існує вкрай обмежена кількість даних.
Технічні недоліки та ризики ШІ — такі як його схильність до галюцинацій — також змушують вчених з осторогою ставитися до його схвалення для серйозної роботи.


