$ 41.9 € 43.57 zł 10.37
+5° Київ +4° Варшава +7° Вашингтон
Краще користуватися кількома різними моделями штучного інтелекту: експерт з ШІ Олександр Теплюк

Краще користуватися кількома різними моделями штучного інтелекту: експерт з ШІ Олександр Теплюк

30 Січня 2025 14:34

Такі сервіси штучного інтелекту, як ChatGPT, DeepSeek та інші мають технічні відмінності. Через це вони можуть давати різні відповіді на одні й ті самі питання.

Чому різняться відповіді? Тому що дані, на яких вони вчаться, у всіх базово різні. Китайські моделі вчаться на інформації, яка знаходиться в фактично закритому інтернеті Китаю. Там інакше висвітлюють інформацію, ніж у нас, в Європі чи в США. Тому прерогативи він будує на інформації, яку аналізує в себе. Він не придумує нічого сам, а вивчає вже наявну інформацію. Ми повинні пам'ятати, що кожна компанія має свій дата-сет, на якому вчиться їхня модель. Тобто ідеології тут немає, це скоріше технічні питання.

Іноді DeepSeek відмовляється відповідати на деякі запитання. Ця модель поки що має технічні негаразди та проблеми з потужністю. Сервери DeepSeek «провисають» вже кілька днів. Їхня інфраструктура не розрахована на таку кількість користувачів. Більшість компаній приділяє велику увагу якраз інфраструктурі, щоб велика кількість користувачів могла одночасно використовувати сервіс. А от DeepSeek не такий, він трошки в іншому напрямку працював. Я сам вже кілька днів не можу нормально з ним працювати.

Цікаво також подумати стосовно майбутнього сфери штучного інтелекту та конкуренції між моделями США та КНР. Хто може перемогти в цій конкуренції — складно сказати. Може, взагалі хтось третій. Сьогодні всі використовують архітектуру «трансформер», яка з'явилася в 2017 році. Майже всі генеративні моделі сьогодні на ній працюють. Вона покращується і доопрацьовується, але фундаментально не змінюється. Через рік чи два може з'явитися нова компанія з кращою архітектурою. Вона може стати більш ефективною. А вартість користування стане навпаки, більш дешевою.

У мене взагалі питання: чи не фінансується DeepSeek урядом Китаю. По-перше, щоб зробити таку дешеву ціну, а по-друге — аби зробити такий хайп. Бо він з’явився вже кілька місяців тому. Але хайп почався тільки зараз. Коли прийшов Трамп і заявив, що виділить 500 мільярдів на ШІ. Чому ж раніше ніхто про неї не говорив? Вона була у відкритому доступі.

Під кінець дам невелику пораду. Я раджу користуватися одразу кількома моделями. Особисто я використовую GhatGPT, DeepSeek і Gemini одночасно. І часом користуюся й деякими іншими. Постійно з'являються нові моделі, їх дуже багато. Але є от ці три моделі є базовими станом на сьогодні. Я рекомендую всім не використовувати тільки одну модель. Це як спілкування з лікарем: от коли ти в трьох лікарів спитав і у трьох зійшлися діагнози, то діагноз встановлений точно. Тож не довіряйте лише одній моделі — отака моя рекомендація.

Олександр Теплюк