Масштабный сбой в работе Cloudflare, одного из ведущих поставщиков интернет-безопасности и CDN-услуг, недавно стал причиной временной недоступности около трети глобального интернета. Инцидент в очередной раз подтвердил, насколько критичной может быть роль одной компании для стабильности всемирной сети.
Об этом сообщает ProIT
Причины сбоя и ход событий
Сбой произошел из-за технической ошибки во время развертывания обновления, касающегося настроек базы данных в Cloudflare. Сначала был внесен некорректный доступ в систему, в результате чего база данных начала генерировать чрезмерное количество записей в так называемый «файл функций». Этот файл, который используется для управления системой защиты от ботов, неожиданно увеличился в размере и был распространен по всей сети Cloudflare.
“Проблема не была вызвана, прямо или косвенно, кибератакой или какой-либо злонамеренной деятельностью. Ее вызвала смена разрешений одной из наших систем баз данных, что привело к тому, что база данных выводила сразу несколько записей в “файл функций”, который использовала наша система управления ботами. Этот файл, в свою очередь, удвоился в размере. Файл функций, больший, чем ожидалось, затем был распространен на все машины, входящие в состав нашей сети”, — объясняет Принс.
Обновленный файл был развернут около 13:05 по киевскому времени. Первые признаки проблемы появились через 23 минуты — в 13:28, хотя последствия могли ощущаться даже раньше. Изначально сбой имел локализованный характер, поскольку файл только начал распространяться по сети. Однако уже после 15:00 ситуация ухудшилась, и ошибка парализовала всю инфраструктуру Cloudflare. Лишь в 16:30 специалисты идентифицировали и устранили причину сбоя, а к 19:06 все затронутые службы были перезапущены, и трафик вернулся к обычному режиму.
Влияние на глобальные сервисы и значимость события
Из-за проблемы с Cloudflare временно были недоступны такие популярные сервисы, как X (бывший Twitter), продукты OpenAI, а также некоторые подразделения McDonald’s. Ситуация продемонстрировала, насколько велика доля интернета зависит от инфраструктуры одной компании. По данным Blazing CDN, Cloudflare контролирует примерно 28% рынка CDN-услуг, поэтому подобные сбои могут влиять на работу миллионов пользователей по всему миру.
Специалисты отмечают, что существуют альтернативы Cloudflare, однако доминирование компании на рынке остается значительным. Подобные инциденты уже не в первый раз поражают интернет: в частности, в октябре прошлого года сбой Amazon Web Services привел к остановке работы многих критических узлов, а в июле обновление CrowdStrike вызвало критические ошибки на компьютерах под управлением Windows в различных странах.