Технічний директор Cloudflare Дейн Кнект публічно вибачився перед клієнтами та світовою інтернет-спільнотою за серйозний збій, що стався 18 листопада та вивів з ладу тисячі сайтів і сервісів по всьому світу. Він наголосив, що проблема була технічною і не пов’язана з кібератакою.
Про це розповідає ProIT
Причини та наслідки інциденту
Інцидент розпочався близько 11:48 UTC 18 листопада, коли на сторінці статусу Cloudflare з’явилася інформація про «внутрішнє погіршення сервісів». Користувачі в різних країнах зіткнулися з недоступністю сайтів, які використовують інфраструктуру Cloudflare, а також зі збоями у службах Access та WARP. Скарги стрімко з’являлися у соцмережах, а навіть сервіс Downdetector, що відслідковує відмови, тимчасово перестав працювати.
“Ми підвели наших клієнтів і ширший інтернет. Прихована помилка у сервісі, що лежить в основі наших можливостей із пом’якшення бот-трафіку, почала спричиняти збої після звичайної зміни конфігурації. Це призвело до масштабної деградації нашої мережі та інших сервісів. Це не була атака”, – написав Кнект у своєму Х.
Фахівці компанії з’ясували, що причиною стала помилка в модулі захисту від бот-трафіку. Під час рутинного оновлення конфігурації було активовано прихований баг, який спровокував ланцюгову реакцію збоїв у внутрішніх мережевих компонентах, CDN-шарах та маршрутах, що забезпечують роботу великої кількості вебресурсів.
Відновлення роботи та майбутні кроки
Оновлення, спрямоване на усунення проблеми, було впроваджено приблизно о 14:42 UTC. Після цього основні сервіси поступово почали відновлювати роботу, проте Cloudflare попередила, що аналітичні панелі та деякі допоміжні сервіси ще деякий час можуть працювати зі збоями.
Інтернет-експерти підкреслюють, що Cloudflare обслуговує значну частину глобального трафіку, тож навіть один технічний збій може мати масштабні наслідки для приватних сайтів і великих онлайн-платформ. Цей випадок знову акцентував увагу на ризиках централізації цифрової інфраструктури: навіть потужні системи не застраховані від несподіваних помилок. До того ж, схожі інциденти вже траплялися раніше — рік тому Cloudflare теж зіткнулася зі зламом.
Cloudflare анонсувала підготовку детального технічного звіту (post-mortem), де будуть описані причини збою та заходи для запобігання подібним ситуаціям у майбутньому. Для компаній і кінцевих користувачів цей інцидент став черговим нагадуванням про необхідність мати резервні плани на випадок масових перебоїв навіть у надійній інфраструктурі.
