Національну українську мовну модель тренуватимуть на базі Gemma-3 від Google
Національну велику мовну модель (LLM) тренуватимуть на базі моделі Gemma-3 від Google. Спільне рішення було ухвалено Міністерством цифрової трансформації та «Київстар».
Про це повідомило Міністерство цифрової трансформації.
У Мінцифри зазначили, що серед ключових переваг Gemma-3 – оптимальний баланс продуктивності та ресурсів (вважається однією з найкращих серед відкритих моделей за співвідношенням розміру та якості), багатомовність (вже має українську мову у своєму діапазоні) та мультимодальність (вміння сприймати й аналізувати не лише текст, а й зображення). Крім того, модель має розширений токенайзер з довгим контекстним вікном — 128 тисяч токенів.
Щоб покращити роботу моделі з українською мовою та зменшити помилки при створенні україномовних текстів, планується вдосконалити український токенайзер, донавчити її на унікальних україномовних текстах і створити тести для більш точного налаштування для подальшого використання.
Також ми раніше повідомляли, що Міністерство освіти і науки України планує залучити штучний інтелект до експертизи шкільних підручників. Також процес контролюватимуть незалежні експерти, а ШІ стане помічником у їхній роботі.
Нагадаємо, американський мільярдер та команда технологів DOGE використовують штучний інтелект для відстеження повідомлень держслужбовців на предмет ворожості до президента Дональда Трампа і його програми.