Ogromna awaria Cloudflare — firma podała przyczynę przerwy w działaniu X, ChatGPT i tysięcy stron internetowych
18 listopada w infrastrukturze Cloudflare nastąpiła ogromna awaria, w wyniku której częściowo lub całkowicie utracono dostęp do tysięcy stron internetowych i serwisów na całym świecie.
Informację tę podała firma na swojej stronie internetowej.
Podczas awarii ucierpiały m.in. X, ChatGPT, Spotify, PayPal, serwisy gamingowe oraz liczne media, w tym strony ukraińskie. Użytkownicy masowo widzieli strony z błędami 5xx oraz komunikaty o wewnętrznym błędzie sieci Cloudflare.
Firma podkreśliła, że incydent miał charakter techniczny i nie był wynikiem cyberataku.
Według oficjalnego wyjaśnienia Cloudflare, zatrzymanie sieci spowodowała nieprawidłowa zmiana w systemie dostępu do jednej z baz danych. W wyniku tej zmiany baza wygenerowała plik konfiguracyjny dla modułu „Bot Management”, który okazał się znacznie większy niż norma.
Serwery proxy Cloudflare nie były w stanie przetworzyć pliku tej wielkości, co wywołało reakcję łańcuchową z masowymi błędami i awariami stron. Początkowo inżynierowie podejrzewali dużą atak DDoS, ale później ustalili, że przyczyną był błąd w logice generowania konfiguracji.
Problemowy plik konfiguracyjny był aktualizowany co około pięć minut, przez co sieć częściowo wracała do działania, a następnie znowu ulegała awarii. Utrudniało to diagnostykę, gdyż system okresowo wydawał się sprawny, by potem ponownie zwracać masowe błędy 5xx.
Dopiero po zatrzymaniu dystrybucji zwiększonego pliku i przywróceniu poprzedniej wersji ruch sieciowy zaczął się stabilizować. Według firmy główne przepływy danych udało się znormalizować około 14:30, a pełna odbudowa infrastruktury zakończyła się po 17:00 UTC.
Awaria wpłynęła na działanie kluczowych elementów ekosystemu Cloudflare — od CDN i proxy po panel sterowania i API.
Przypomnijmy, że masowa awaria Cloudflare zablokowała szereg popularnych stron.
Awaria spowodowała również masowe problemy z dostępem do Google, Spotify, X i innych platform.