Розробники та дослідники не оцінили "найрозумніший ШІ у світі" Ілона Маска - Grok 3

Шелудько Микола 20 Лютого 2025 12:14

Ілон Маск представив Grok 3 — нову версію чат-бота від xAI, назвавши її "на порядок більш потужною" за попередню. Деякі дослідники штучного інтелекту та експерти протестували Grok 3, і їхні перші реакції виявилися змішаними.

Про це пише Business Insider.

Маск стверджує, що нова модель перевершує флагманський GPT-4o від OpenAI та конкуруючі ШІ-системи від Google, DeepSeek і Anthropic у ключових тестах з математики, науки та програмування.

"Ми щодня покращуємо моделі, і буквально протягом 24 годин ви побачите зміни", — заявив Маск під час трансляції у соцмережі X, де виступав разом із трьома інженерами xAI.

Андрій Карпаті, комп’ютерний науковець, співзасновник OpenAI та колишній керівник напрямку ШІ в Tesla, у своєму дописі в X зазначив, що Grok 3 успішно виконав завдання, зокрема пошук складної інформації у науковій роботі. Проте, як і OpenAI o1-pro, він мав труднощі з розв’язанням "хитрих" партій у хрестики-нулики.

"Загальне враження — це рівень приблизно o1-pro, випереджає DeepSeek-R1, хоча для точних висновків потрібні реальні оцінки", — додав Карпати, який отримав ранній доступ до Grok 3.

xAI також представила новий інструмент для Grok 3 під назвою DeepSearch. Він покликаний покращити дослідження, генерацію ідей та аналіз даних, а також пояснювати, як саме ШІ обробляє запити й формує відповіді. За даними Business Insider, стартап працював над цим інструментом ще з кінця минулого року.

Карпаті зазначив, що DeepSearch приблизно відповідає DeepResearch від Perplexity, що є непоганим результатом, але все ще поступається новій функції "Deep Research" від OpenAI, яка виглядає більш ґрунтовною та надійною.

Ітан Моллік, професор Уортонської бізнес-школи Пенсильванського університету, який досліджує ШІ, вважає, що хоча xAI швидко масштабується, Grok 3 не є беззаперечним лідером.

"Дуже міцна модель передового рівня, але не настільки, щоб відмовитися від використання ваших поточних аналогів", — написав Моллік у понеділок у LinkedIn.

Він додав, що хоча Grok 3 перевершує деякі моделі OpenAI у певних тестах, він не є явним лідером над OpenAI o3.

Гері Маркус, засновник Geometric Intelligence і давній критик ажіотажу навколо ШІ, поставився до запуску скептично.

"Ілон Маск обіцяв, що Grok 3 стане найрозумнішим штучним інтелектом в історії. Спойлер: це не так", — написав Маркус у Substack.

Раніше ми писали, що Міра Мураті, колишня технічна директорка OpenAI, представила свій новий ШІ-стартап Thinking Machines Lab. Мета компанії - зробити ШІ більш «настроюваним» і «простим» у використанні, допомагаючи людям адаптувати ШІ до їхніх «конкретних потреб».

Соцмережа X Ілона Маска підвищила ціни на підписку Premium+ одразу після анонсу нової моделі штучного інтелекту Grok-3. Тепер доступ до нової моделі ШІ доступний тільки для передплатників Premium+ і тих, хто оплачує нову окрему підписку SuperGrok.