Narodowy ukraiński model językowy będzie trenowany na bazie Gemma-3 od Google

UA NEWS 01 grudnia 2025 13:25

Narodowy duży model językowy (LLM) będzie trenowany na bazie modelu Gemma-3 od Google. Wspólna decyzja została podjęta przez Ministerstwo Transformacji Cyfrowej i „Kyivstar”.

O tym poinformowało Ministerstwo Transformacji Cyfrowej.

W Ministerstwie Transformacji Cyfrowej wskazano, że kluczowe zalety Gemma-3 to optymalna równowaga między wydajnością a zasobami (uważana za jedną z najlepszych spośród otwartych modeli pod względem relacji rozmiaru do jakości), wielojęzyczność (już obejmuje język ukraiński) oraz multimodalność (zdolność do analizowania nie tylko tekstu, ale i obrazów). Ponadto model posiada rozszerzony tokenizer z długim oknem kontekstowym – 128 tysięcy tokenów.

Aby poprawić działanie modelu w języku ukraińskim i zmniejszyć błędy przy generowaniu tekstów ukraińskojęzycznych, planuje się ulepszenie ukraińskiego tokenizera, dalsze trenowanie modelu na unikalnych ukraińskich tekstach oraz tworzenie testów do precyzyjniejszego dostosowania modelu do późniejszego użycia.

Wcześniej informowano również, że Ministerstwo Edukacji i Nauki Ukrainy planuje wykorzystać sztuczną inteligencję do ekspertyzy podręczników szkolnych. Proces ten będzie również nadzorowany przez niezależnych ekspertów, a SI stanie się ich wsparciem w pracy.

Przypomnijmy, że amerykański miliarder oraz zespół technologów DOGE używają sztucznej inteligencji do monitorowania komunikatów urzędników państwowych pod kątem wrogości wobec prezydenta Donalda Trumpa i jego programu.

Czytaj nas na Telegram i Sends