ChatGPT прошел тест Тьюринга, и его приняли за человека
Новое исследование показало, что современные модели искусственного интеллекта способны убедительно имитировать человеческое поведение в разговоре, и в отдельных случаях их трудно отличить от реальных людей. Самая мощная версия ChatGPT в тесте Тьюринга была воспринята как человек в 73% случаев, что значительно превышает ожидания, пишет Independent.
Искусственный интеллект все увереннее проходит классические эксперименты на «человечность» и уже не просто отвечает на вопросы, а строит разговор так, что люди начинают сомневаться, с кем именно они разговаривают. Новое исследование показало, что современные языковые модели иногда могут убедить собеседника в том, что перед ним живой человек, и делают это довольно успешно.
Тест Тьюринга, предложенный математиком Аланом Тьюрингом в 1950-х годах как «игра в имитацию», предполагает простой сценарий: человек общается с неизвестным собеседником и пытается определить, это другой человек или машина. В новом исследовании, опубликованном в журнале Proceedings of the National Academy of Sciences, проверяли сразу несколько крупных языковых моделей, среди которых различные версии ChatGPT и LLaMa от Meta, сравнивая их с ответами реальных людей.
Результаты оказались показательными: новейшую версию GPT-4.5 участники считали человеком в 73% случаев, и это даже выше, чем показатели взаимодействия между самими людьми в части тестов. Модель LLaMa набрала 56%, тогда как GPT-4o, выпущенный в 2024 году, был воспринят как человек лишь в 21% случаев. Для сравнения, даже древняя система ELIZA 1960-х годов получила 23%, что подчеркивает сложность современных оценок.
Автор исследования Кэмерон Джонс объяснил, что ключевую роль играют способ общения модели и правильные подсказки, которые задают ей стиль и роль. «Мы обнаружили, что при правильных подсказках передовые LLM могут демонстрировать тот же тон, прямоту, юмор и склонность к ошибкам, что и люди», — отметил он.
Ученые также подчеркивают, что без специальных инструкций и сценариев модели значительно чаще «выдают себя», и их легко распознать как искусственный интеллект. Например, без дополнительных подсказок GPT-4.5 воспринимался как человек лишь в 36% случаев, что существенно снижает показатель убедительности.
Исследователи считают, что такие результаты демонстрируют не только прогресс технологий, но и сложность самой природы человеческого общения, которое все труднее формально отличить от машинного.
Напомним, гендиректор компании Nvidia Дженсен Хуанг заявил, что развитие ИИ не приведет к массовой безработице, а наоборот будет способствовать созданию новых рабочих мест.
Ученые разработали ИИ для прогнозирования заболеваний, связанных с ожирением.