Запущена первая "гибридная" модель искусственного интеллекта с функцией "размышления"

UA UA.NEWS 24 Февраля 2025 21:33

Компания Anthropic представила новую модель искусственного интеллекта (ИИ) Claude 3.7 Sonnet, которая, по словам разработчиков, может "размышлять" над вопросами столько, сколько нужно пользователям.

Claude 3.7 Sonnet позиционируется как первая в области "гибридная модель ИИ с соображением", поскольку она может предоставлять как мгновенные ответы, так и более обдуманные, "продуманные" ответы на вопросы. Пользователи могут выбирать, активировать ли функции "размышления" модели ИИ, побуждающие Claude 3.7 Sonnet "размышлять" в течение короткого или длительного периода времени.

Эта модель является частью более широких усилий Anthropic по упрощению пользовательского опыта своих продуктов ИИ. В отличие от большинства современных чат-ботов ИИ, имеющих сложный выбор моделей, Anthropic стремится создать единую модель, выполняющую все задачи.

Claude 3.7 Sonnet доступен для всех пользователей и разработчиков с понедельника, но функции "размышления" доступны только для платных пользователей премиум-планов Claude. Бесплатные пользователи получат стандартную версию без соображений, которая, по словам Anthropic, превосходит предыдущую модель Claude 3.5 Sonnet.

Claude 3.7 Sonnet стоит 3 доллара за миллион входящих токенов (примерно 750 000 слов) и 15 долларов за миллион выходных токенов. Это дороже, чем o3-mini от OpenAI и R1 от DeepSeek, но следует учитывать, что o3-mini и R1 являются лишь моделями размышления, а не гибридами, как Claude 3.7 Sonnet.

Режимы "размышления":

Claude 3.7 Sonnet – первая модель Anthropic, которая может "размышлять", являющаяся техникой, к которой обращаются многие лаборатории ИИ для улучшения производительности. Модели рассуждения, такие как o3-mini, R1, Gemini 2.0 Flash Thinking от Google и Grok 3 (Think) от xAI, тратят больше времени и вычислительной мощности перед предоставлением ответов.

Anthropic планирует, что Claude будет самостоятельно определять, как долго "размышлять" над вопросами, без необходимости выбора пользователями элементов управления.

Особенности:

"Видимый черновик": Claude показывает свой внутренний этап планирования, демонстрируя процесс рассуждения.

Оптимизация реальных задач: Модель оптимизирована для сложных задач кодирования и агентских задач.

Улучшенная точность: На тестах SWE-Bench и TAU-Bench Claude 3.7 Sonnet показали лучшие результаты, чем модели конкурентов.

Уменьшение отказов: Модель реже отказывается отвечать на вопросы, лучше различая вредные и безопасные запросы.

Вместе с Claude 3.7 Sonnet, Anthropic выпустила инструмент для кодирования Claude Code, позволяющий разработчикам выполнять задания непосредственно из терминала.

Загружай наше приложение