Технический директор Cloudflare Дейн Кнект публично извинился перед клиентами и мировой интернет-сообществом за серьезный сбой, произошедший 18 ноября, который вывел из строя тысячи сайтов и сервисов по всему миру. Он подчеркнул, что проблема была технической и не связана с кибератакой.
Об этом сообщает ProIT
Причины и последствия инцидента
Инцидент начался около 11:48 UTC 18 ноября, когда на странице статуса Cloudflare появилась информация о «внутреннем ухудшении сервисов». Пользователи в различных странах столкнулись с недоступностью сайтов, использующих инфраструктуру Cloudflare, а также со сбоями в службах Access и WARP. Жалобы стремительно появлялись в соцсетях, а даже сервис Downdetector, отслеживающий отказы, временно перестал работать.
“Мы подвели наших клиентов и более широкий интернет. Скрытая ошибка в сервисе, лежащем в основе наших возможностей по смягчению бот-трафика, начала вызывать сбои после обычного изменения конфигурации. Это привело к масштабной деградации нашей сети и других сервисов. Это не была атака”, – написал Кнект в своем Х.
Специалисты компании выяснили, что причиной стала ошибка в модуле защиты от бот-трафика. Во время рутинного обновления конфигурации был активирован скрытый баг, который спровоцировал цепную реакцию сбоев во внутренних сетевых компонентах, CDN-шарах и маршрутах, обеспечивающих работу большого количества веб-ресурсов.
Восстановление работы и будущие шаги
Обновление, направленное на устранение проблемы, было внедрено примерно в 14:42 UTC. После этого основные сервисы постепенно начали восстанавливать работу, однако Cloudflare предупредила, что аналитические панели и некоторые вспомогательные сервисы еще некоторое время могут работать со сбоями.
Интернет-эксперты подчеркивают, что Cloudflare обслуживает значительную часть глобального трафика, поэтому даже один технический сбой может иметь масштабные последствия для частных сайтов и крупных онлайн-платформ. Этот случай вновь акцентировал внимание на рисках централизации цифровой инфраструктуры: даже мощные системы не застрахованы от неожиданных ошибок. Кроме того, подобные инциденты уже происходили ранее — год назад Cloudflare также столкнулась со взломом.
Cloudflare анонсировала подготовку детального технического отчета (post-mortem), в котором будут описаны причины сбоя и меры для предотвращения подобных ситуаций в будущем. Для компаний и конечных пользователей этот инцидент стал очередным напоминанием о необходимости иметь резервные планы на случай массовых перебоев даже в надежной инфраструктуре.
