Недавний сбой в работе облачных сервисов Amazon был вызван опечаткой сотрудника компании

Новости Отредактировано

2К открытий2К показов

Крупный сбой в работе облачных сервисов Amazon, из-за которого 28 февраля 2017 года появились проблемы в работе Slack, Trello, Coursera и многих других сайтов, произошёл из-за опечатки одного из сотрудников компании. Об этом вчера сообщила Amazon.

28 февраля 2017 года команда Amazon S3 занималась отладкой своей биллинговой системы. В ходе работ ей понадобилось перевести несколько серверов в автономный режим, но при вводе команды была допущена ошибка:

К сожалению, команда была введена неправильно и под отключение попало больше серверов, чем предполагалось. Среди них были серверы, которые поддерживали работу подсистем S3.

В частности, была отключена подсистема, управляющая метаданными и информацией о расположении всех серверов S3 в регионе. От неё зависела работа многих сервисов для поиска и хранения данных, в том числе и Amazon Elastic Compute Cloud (EC2), который используется для доступа к вычислительным мощностям.

Представители компании пояснили, что для восстановления работоспособности сервисов нужно было перезапустить некоторые системы и провести их проверку, что заняло довольно много времени. По их словам, S3 способен работать при отключении нескольких серверов, но массовая перезагрузка стала проблемой.

Сейчас Amazon уже внесла в S3 изменения, которые позволят ускорить процесс восстановления систем. Кроме того, инженеры не смогут отключать серверы, которые задействованы в системах «определённого уровня». Также компания пообещала исправить работу информационной панели AWS Service Health Dashboard, которая не показывала информацию о сбоях, так как сама зависела от упавшего сервиса S3.

2К открытий2К показов

Также рекомендуем

Cloudflare удалила ИИ-поисковик Perplexity из «белого списка» за игнорирование robots.txt и подмену IP

Cloudflare обвинила Perplexity в обходе robots.txt и подмене IP — бот исключён из белого списка и может быть заблокирован тысячами сайтов

Вредные советы по работе с базами данных, или как расстроить DBA

Сборник самых раздражающих ошибок в работе с базами данных — с примерами и советами, как делать правильно. По выпуску подкаста «Техно.Логично».

🔥 МТС, МегаФон, Билайн и Tele2 попросили правительство заблокировать звонки в WhatsApp и Telegram в России

МТС, «МегаФон», Билайн и Tele2 предложили заблокировать звонки в WhatsApp и Telegram, чтобы вернуть абонентов к обычной голосовой связи

Geeks do it better: как прошла конференция GoCloud 2025 от Cloud.ru

Недавно мы побывали на большой конференции по облакам и искусственному интеллекту GoCloud, которую ежегодно проводит Cloud.ru. Делимся итогами конференции и рассказываем, как компании удается создавать топовые облачные сервисы и драйвить коммьюнити.