Сбой Cloudflare оставил без интернета крупные сайты, включая X и ChatGPT
Компания Cloudflare подтвердила, что ошибка в одном из её основных сервисов вызвала масштабный сбой во вторник, в результате которого значительная часть интернета оказалась недоступной. Под удар попали такие сервисы, как X, ChatGPT и, что иронично, Downdetector. Технический директор компании Дэйн Кнект опубликовал публичные извинения вскоре после восстановления работы, назвав инцидент «неприемлемым».
Проблема началась примерно в 14:48 по московскому времени 18 ноября, когда официальный статус-сайт Cloudflare сообщил о «внутренней деградации сервисов». По мере распространения сбоя пользователи в нескольких регионах сообщали о невозможности доступа не только к сайтам, работающим через Cloudflare, но и к её сервисам Access и WARP. Позже компания идентифицировала конкретную зависимость в своём инструменте защиты от ботов как источник проблемы.
«Мы подвели наших клиентов и интернет в целом, — написал Кнект. — Скрытая ошибка в сервисе, лежащем в основе нашей системы защиты от ботов, начала вызывать сбои после планового изменения конфигурации. Это привело к каскадному отказу и широкомасштабной деградации нашей сети и других сервисов. Это не была атака».
К 17:42 по московскому времени Cloudflare развернула исправление и начала восстанавливать затронутые компоненты. Функциональность панели управления, включая аналитику и журнализацию ошибок, оставалась частично нарушенной до вечера, пока инженеры отслеживали остаточные неисправности. В рамках процесса устранения последствий также было временно приостановлено использование WARP в Лондоне.
Стек защиты от ботов Cloudflare, который включает такие механизмы, как Turnstile и уровни JavaScript-верификации, обрабатывает трафик многих известных веб-сайтов и API. Поскольку эти системы используются не только для блокировки злоумышленников, но и для контроля доступа легитимных пользователей, сбои в этом слое могут привести к массовым нарушениям работы сервисов, даже когда основная инфраструктура CDN или DNS остаётся работоспособной.
Это уже третий крупный сбой, затронувший основные сайты менее чем за месяц. В октябре большая часть региона AWS US-East-1 была недоступна более двух часов из-за того, что Amazon позже назвал сломанной конфигурацией DNS. А всего через несколько дней произошёл масштабный сбой в Azure от Microsoft.
Эти инциденты поднимают более широкие вопросы о том, как широко используемые сервисы и платформы справляются с внутренними сбоями и изолируют зависимости в больших масштабах. Около 19% интернета полагается на Cloudflare, в то время как на Azure и AWS приходится примерно 24% и 30% рынка облачных вычислений соответственно.
Источник: Tomshardware.com








0 комментариев