Fastly раскрыла причину «падения» Reddit, GitHub, Stackoverflow и огромного количества остальных ресурсов намедни — анонсы на Tproger

Поделиться

Вчера, 8 июня, в районе 13 часов по столичному времени произошёл большой сбой. В итоге этого огромное количество больших веб-сайтов стали недосягаемы.

Весьма стремительно продакт-менеджер Financial Times Мэтт Тэйлор опубликовал твит, в каком предпосылкой произошедшего именовал трагедию на стороне CDN-провайдера Fastly. Сейчас же вице-президент компании Ник Роквелл подтвердил это, рассказав что конкретно вышло намедни.

Оказалось, что на стороне провайдера и взаправду произошёл большой сбой. Связан он был с необнаруженным ранее багом, который «влез» с обновлением ПО систем Fastly. Сам апгрейд прошёл ещё посреди мая, но о ставшей роковой ошибке сделалось понятно только вчера.

Хронология событий

12:47 Начало сбоя.

12:48 Fastly нашел факт сбоя.

12:58 Размещен Status Post.

13:27 Fastly обусловила конфигурацию клиента, который и стал предпосылкой сбоя.

13:36 Сервисы, задетые в итоге ошибки, начали восстанавливаться.

14:00 Большая часть сервисов восстановились.

15:35 Инцидент смягчен.

15:44 Status Post завершился с «кодом» Resolved.

20:25 Началось развертывание исправления ошибки.

Что будет далее?

    Компания продолжит развёртывать исправление ошибки в собственной сети ещё резвее и безопаснее.
    Будет проведён разбор того, какие процессы и практики применялись во время инцидента.
    Также в Fastly пообещали узнать, почему компания не нашла ошибку во время проверки свойства и тестирования ПО.
    Провайдер попробует уменьшить время восстановления.

Источник: Блог Fastly

Источник: tproger.ru

Поделиться с друзьями:
Андройд IT
Добавить комментарий