З'явилася перша "гібридна" модель штучного інтелекту з функцією "міркування"

Компанія Anthropic представила нову модель штучного інтелекту (ШІ) Claude 3.7 Sonnet, яка, за словами розробників, може "міркувати" над питаннями стільки, скільки потрібно користувачам.
Claude 3.7 Sonnet позиціонується як перша в галузі "гібридна модель ШІ з міркуванням", оскільки вона може надавати як миттєві відповіді, так і більш обдумані, "продумані" відповіді на запитання. Користувачі можуть обирати, чи активувати функції "міркування" моделі ШІ, що спонукають Claude 3.7 Sonnet "міркувати" протягом короткого або тривалого періоду часу.
Ця модель є частиною ширших зусиль Anthropic зі спрощення користувацького досвіду своїх продуктів ШІ. На відміну від більшості сучасних чат-ботів ШІ, які мають складний вибір моделей, Anthropic прагне створити єдину модель, яка виконує всі завдання.
Claude 3.7 Sonnet доступний для всіх користувачів і розробників з понеділка, але функції "міркування" доступні лише для платних користувачів преміум-планів Claude. Безкоштовні користувачі отримають стандартну версію без міркування, яка, за словами Anthropic, перевершує попередню модель Claude 3.5 Sonnet.
Claude 3.7 Sonnet коштує 3 долари за мільйон вхідних токенів (приблизно 750 000 слів) і 15 доларів за мільйон вихідних токенів. Це дорожче, ніж o3-mini від OpenAI та R1 від DeepSeek, але варто враховувати, що o3-mini та R1 є лише моделями міркування, а не гібридами, як Claude 3.7 Sonnet.
Режими "міркування":
Claude 3.7 Sonnet – перша модель Anthropic, яка може "міркувати", що є технікою, до якої звертаються багато лабораторій ШІ для покращення продуктивності. Моделі міркування, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google та Grok 3 (Think) від xAI, витрачають більше часу та обчислювальної потужності перед наданням відповідей.
Anthropic планує, що Claude самостійно визначатиме, як довго "міркувати" над питаннями, без необхідності вибору користувачами елементів керування.
Особливості:
- "Видимий чернетка": Claude показує свій внутрішній етап планування, демонструючи процес міркування.
- Оптимізація для реальних завдань: Модель оптимізована для складних задач кодування та агентських завдань.
- Покращена точність: На тестах SWE-Bench та TAU-Bench Claude 3.7 Sonnet показав кращі результати, ніж моделі конкурентів.
- Зменшення відмов: Модель рідше відмовляється відповідати на запитання, краще розрізняючи шкідливі та безпечні запити.
Разом з Claude 3.7 Sonnet, Anthropic випустила інструмент для кодування Claude Code, який дозволяє розробникам виконувати завдання безпосередньо з терміналу.
