З'явилася перша "гібридна" модель штучного інтелекту з функцією "міркування"

UA UA.NEWS 24 Лютого 2025 21:33

Компанія Anthropic представила нову модель штучного інтелекту (ШІ) Claude 3.7 Sonnet, яка, за словами розробників, може "міркувати" над питаннями стільки, скільки потрібно користувачам.

Claude 3.7 Sonnet позиціонується як перша в галузі "гібридна модель ШІ з міркуванням", оскільки вона може надавати як миттєві відповіді, так і більш обдумані, "продумані" відповіді на запитання. Користувачі можуть обирати, чи активувати функції "міркування" моделі ШІ, що спонукають Claude 3.7 Sonnet "міркувати" протягом короткого або тривалого періоду часу.

Ця модель є частиною ширших зусиль Anthropic зі спрощення користувацького досвіду своїх продуктів ШІ. На відміну від більшості сучасних чат-ботів ШІ, які мають складний вибір моделей, Anthropic прагне створити єдину модель, яка виконує всі завдання.

Claude 3.7 Sonnet доступний для всіх користувачів і розробників з понеділка, але функції "міркування" доступні лише для платних користувачів преміум-планів Claude. Безкоштовні користувачі отримають стандартну версію без міркування, яка, за словами Anthropic, перевершує попередню модель Claude 3.5 Sonnet.

Claude 3.7 Sonnet коштує 3 долари за мільйон вхідних токенів (приблизно 750 000 слів) і 15 доларів за мільйон вихідних токенів. Це дорожче, ніж o3-mini від OpenAI та R1 від DeepSeek, але варто враховувати, що o3-mini та R1 є лише моделями міркування, а не гібридами, як Claude 3.7 Sonnet.

Режими "міркування":

Claude 3.7 Sonnet – перша модель Anthropic, яка може "міркувати", що є технікою, до якої звертаються багато лабораторій ШІ для покращення продуктивності. Моделі міркування, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google та Grok 3 (Think) від xAI, витрачають більше часу та обчислювальної потужності перед наданням відповідей.

Anthropic планує, що Claude самостійно визначатиме, як довго "міркувати" над питаннями, без необхідності вибору користувачами елементів керування.

Особливості:

"Видимий чернетка": Claude показує свій внутрішній етап планування, демонструючи процес міркування.

Оптимізація для реальних завдань: Модель оптимізована для складних задач кодування та агентських завдань.

Покращена точність: На тестах SWE-Bench та TAU-Bench Claude 3.7 Sonnet показав кращі результати, ніж моделі конкурентів.

Зменшення відмов: Модель рідше відмовляється відповідати на запитання, краще розрізняючи шкідливі та безпечні запити.

Разом з Claude 3.7 Sonnet, Anthropic випустила інструмент для кодування Claude Code, який дозволяє розробникам виконувати завдання безпосередньо з терміналу.