Запущена первая "гибридная" модель искусственного интеллекта с функцией "размышления"

Компания Anthropic представила новую модель искусственного интеллекта (ИИ) Claude 3.7 Sonnet, которая, по словам разработчиков, может "размышлять" над вопросами столько, сколько нужно пользователям.
Claude 3.7 Sonnet позиционируется как первая в области "гибридная модель ИИ с соображением", поскольку она может предоставлять как мгновенные ответы, так и более обдуманные, "продуманные" ответы на вопросы. Пользователи могут выбирать, активировать ли функции "размышления" модели ИИ, побуждающие Claude 3.7 Sonnet "размышлять" в течение короткого или длительного периода времени.
Эта модель является частью более широких усилий Anthropic по упрощению пользовательского опыта своих продуктов ИИ. В отличие от большинства современных чат-ботов ИИ, имеющих сложный выбор моделей, Anthropic стремится создать единую модель, выполняющую все задачи.
Claude 3.7 Sonnet доступен для всех пользователей и разработчиков с понедельника, но функции "размышления" доступны только для платных пользователей премиум-планов Claude. Бесплатные пользователи получат стандартную версию без соображений, которая, по словам Anthropic, превосходит предыдущую модель Claude 3.5 Sonnet.
Claude 3.7 Sonnet стоит 3 доллара за миллион входящих токенов (примерно 750 000 слов) и 15 долларов за миллион выходных токенов. Это дороже, чем o3-mini от OpenAI и R1 от DeepSeek, но следует учитывать, что o3-mini и R1 являются лишь моделями размышления, а не гибридами, как Claude 3.7 Sonnet.
Режимы "размышления":
Claude 3.7 Sonnet – первая модель Anthropic, которая может "размышлять", являющаяся техникой, к которой обращаются многие лаборатории ИИ для улучшения производительности. Модели рассуждения, такие как o3-mini, R1, Gemini 2.0 Flash Thinking от Google и Grok 3 (Think) от xAI, тратят больше времени и вычислительной мощности перед предоставлением ответов.
Anthropic планирует, что Claude будет самостоятельно определять, как долго "размышлять" над вопросами, без необходимости выбора пользователями элементов управления.
Особенности:
- "Видимый черновик": Claude показывает свой внутренний этап планирования, демонстрируя процесс рассуждения.
- Оптимизация реальных задач: Модель оптимизирована для сложных задач кодирования и агентских задач.
- Улучшенная точность: На тестах SWE-Bench и TAU-Bench Claude 3.7 Sonnet показали лучшие результаты, чем модели конкурентов.
- Уменьшение отказов: Модель реже отказывается отвечать на вопросы, лучше различая вредные и безопасные запросы.
Вместе с Claude 3.7 Sonnet, Anthropic выпустила инструмент для кодирования Claude Code, позволяющий разработчикам выполнять задания непосредственно из терминала.
