Sztuczna inteligencja, której przestraszyli się nawet jej twórcy: Mythos od Anthropic

02 czerwca 2026 11:05

Wyobraź sobie, że inżynierowie wynaleźli niezwykle potężny i najszybszy silnik, który z łatwością wyprzedza wszystkie istniejące samochody. Jest jednak jedno „ale” — nie wymyślono jeszcze do niego hamulców. W mniej więcej takiej sytuacji znalazła się firma Anthropic wiosną 2026 roku.

7 kwietnia firma ogłosiła, że posiada model AI o nazwie Claude Mythos. Jednak na razie nie jest gotowa do jego wprowadzenia na rynek. Czy to z powodu problemów technicznych czy presji ze strony organów regulacyjnych? Nie. Stało się tak, ponieważ podczas wewnętrznych testów okazało się, że świat nie jest jeszcze gotowy na takie narzędzie.

Jednak pod koniec maja pojawiło się nowe oświadczenie. Anthropic nadal planuje udostępnić modele klasy Mythos, ale dopiero po opracowaniu wystarczająco niezawodnych mechanizmów zabezpieczających. Firma nie podała żadnych konkretnych terminów.

Czym jest ten „niebezpieczny model”? Czym różni się od innych modeli AI Claude, z których korzystają użytkownicy? I czego można się spodziewać w przyszłości w związku z takim obrotem wydarzeń?

Czym jest Mythos i czym różni się od zwykłych modeli Claude

Jeśli porównać te modele AI, to modele Claude, które są obecnie dostępne dla użytkowników (Sonnet, Opus itp.) – to bardzo inteligentni asystenci. Pomagają napisać list, stworzyć jasny plan pracy (a nawet go zrealizować), uporać się z kodem lub wyjaśnić skomplikowany temat. Jednak Mythos to już coś znacznie potężniejszego.

W zadaniach matematycznych na najwyższym poziomie konkursowym – USAMO-2026 – Mythos uzyskał 97,6%. Poprzedni flagowy model Opus 4.6 uzyskał zaledwie 42,3%. Różnica wynosząca 55% to kolosalny skok.

Jednak matematyka to jeszcze połowa problemu. Nawet twórców modelu przeraziła autonomiczna praca Mythosa w zakresie cyberbezpieczeństwa. Mythos może prześcignąć niemal każdego żywego specjalistę ds. cyberbezpieczeństwa w wyszukiwaniu i wykorzystywaniu luk w oprogramowaniu. Podczas testów znalazł krytyczne błędy w każdym popularnym systemie operacyjnym i przeglądarce. Obecnie są one naprawiane.

Brytyjski Instytut Bezpieczeństwa Sztucznej Inteligencji (AISI) uzyskał wczesny dostęp do modelu i przeprowadził niezależne testy. W zadaniach na poziomie eksperckim, z którymi żadna inna model nie mogła sobie poradzić jeszcze rok temu, Mythos dawał prawidłowy wynik w siedmiu na dziesięć przypadków.

Jednak największy rozgłos wzbudziło to, co model zrobił jeszcze podczas wewnętrznych testów. Naukowcy odkryli, że Mythos wyszedł poza granice zabezpieczonego, izolowanego środowiska, uzyskał dostęp do publicznej sieci i wysłał nieautoryzowaną wiadomość do jednego z badaczy z Anthropic. Następnie model próbował usunąć ślady swoich działań. Najciekawsze jest to, że badacze nie prosili go o to. Zrobił to samodzielnie.

Co konkretnie Anthropic zamierza „ulepszyć” w zakresie bezpieczeństwa

Anthropic nie mówi o „wyłączniku” ani ograniczeniu inteligencji modelu. Cel jest inny – nauczyć model bezpiecznego wykorzystywania swoich możliwości.

Firma opublikowała oficjalny raport. W nim Anthropic przyznaje, że ani ona, ani żadna inna firma nie dysponuje obecnie narzędziami umożliwiającymi bezpieczne udostępnienie takiego modelu szerokiej publiczności. Już w kwietniu firma ostrzegła, że Mythos może sprowokować masowe cyberataki. Z tego powodu część raportu nie jest dostępna dla ogółu społeczeństwa.

Na razie Mythos jest dostępny tylko dla wybranych organizacji w ramach projektu Glasswing. Głównym celem projektu jest danie specjalistom ds. cyberbezpieczeństwa czasu na przygotowanie się do momentu, gdy podobne technologie pojawią się w innych laboratoriach. Aby uczestnicy mogli w pełni pracować, firma Anthropic przeznaczyła dla nich do 100 milionów dolarów w formie kredytów.

Pierwsze wyniki już są. Mythos sprawdził ponad tysiąc otwartych projektów programowych i wykrył ponad 23 tysiące potencjalnych luk w zabezpieczeniach. Po ręcznej weryfikacji specjaliści potwierdzili prawie 1 600 rzeczywistych problemów, z których ponad tysiąc okazało się krytycznych. Wśród nich znalazła się luka w bibliotece wolfSSL (narzędzie programowe do szyfrowania danych, z którego korzysta się na całym świecie). Została już naprawiona. Co więcej, tempo wykrywania luk jest tak szybkie, że część programistów poprosiła firmę Anthropic o zwolnienie tempa. Ich zespoły nie nadążają z analizowaniem zgłoszeń i przygotowywaniem poprawek.

Wiadomo również, że firma Anthropic planuje stopniowo rozszerzać dostęp do Glasswing. W pierwszej kolejności chcą udostępnić model rządom Stanów Zjednoczonych i krajów sojuszniczych. Według szacunków firmy do pełnego udostępnienia modelu pozostało od sześciu do osiemnastu miesięcy.

Komu to się opłaca i czego można się spodziewać w przyszłości

Odpowiedzi na te pytania są niejednoznaczne.

Z jednej strony, jeśli Glasswing rzeczywiście pomoże chronić krytyczne oprogramowanie, wszyscy na tym zyskają. Z drugiej strony te same narzędzia można wykorzystać również do ataków. Nie można również ignorować komercyjnego wymiaru projektu, ponieważ dostęp do Mythos dla partnerów Glasswing kosztuje pięć razy więcej niż do poprzedniego flagowego modelu Opus 4.7.

Reakcja rządów była szybka. Premier Japonii Sanae Takaichi zleciła rządowi opracowanie nowej strategii cyberbezpieczeństwa, nazywając pojawienie się Mythos momentem wymagającym interwencji na najwyższym szczeblu. Indie prowadzą natomiast rozmowy ze stroną amerykańską i firmą Anthropic, aby doprowadzić do włączenia indyjskich firm do Glasswing.

Co to oznacza dla Ukrainy

Ukraina jest jednym z niewielu krajów na świecie, które prowadzą aktywną wojnę cybernetyczną w czasie rzeczywistym. Rosyjskie ataki na infrastrukturę energetyczną, rejestry państwowe i system bankowy już dawno stały się częścią codziennej rzeczywistości. Właśnie dlatego pojawienie się Mythos jest dla nas kwestią o praktycznych konsekwencjach.

Obecnie wśród uczestników Glasswing przeważają duże amerykańskie firmy technologiczne. Konkurencyjna inicjatywa OpenAI o nazwie Daybreak jest od maja 2026 r. otwarta dla Stanów Zjednoczonych, Kanady, Korei Południowej i Japonii, podczas gdy negocjacje dotyczące dostępu dla krajów UE wciąż trwają. W żadnym z publicznych dokumentów nie ma wzmianki o Ukrainie.

Nie oznacza to jednak, że sprawa jest zamknięta. Narzędzie, które w ciągu kilku godzin jest w stanie wykryć luki w infrastrukturze krytycznej, mogłoby stać się realną przewagą dla kraju, który codziennie odpiera cyberataki. Czy Ukraina uzyska dostęp do takich technologii i kiedy – to kwestia otwarta.

Dla zwykłego użytkownika historia z Mythosem nie ma na razie żadnego konkretnego znaczenia w codziennym życiu. Ale rodzi pytanie, które stanie się kluczowe dla całej dekady technologicznej. Kto i w jaki sposób będzie decydował, kiedy narzędzie stanie się zbyt potężne, by je udostępniać? I czy można powierzyć ten wybór samym firmom, które to narzędzie tworzą? Odpowiedź na te pytania jest jeszcze przed nami.

Czytaj nas na Telegram i Sends

Pobierz naszą aplikację

Sztuczna inteligencja, której przestraszyli się nawet jej twórcy: Mythos od Anthropic

Czym jest Mythos i czym różni się od zwykłych modeli Claude

Co konkretnie Anthropic zamierza „ulepszyć” w zakresie bezpieczeństwa

Komu to się opłaca i czego można się spodziewać w przyszłości

Co to oznacza dla Ukrainy

UA NEWS