🔥 Создатель Windows объяснил истоки сбоя CrowdStrike, который «уронил» 8.5 млн компьютеров по всему миру
В конце прошлой недели произошел один из крупнейших сбоев Windows за всю историю IT. Тогда пострадали миллионы компьютеров по всему миру
Новости TprogerМир все еще восстанавливается после одного из крупнейших сбоев в истории IT, который привел к выходу из строя 8.5 млн компьютеров под управлением Windows.
Дэйв Пламмер, бывший инженер-программист из Microsoft, объяснил на своем YouTube-канале, как именно произошел этот сбой.
Причины сбоя
По словам Пламмера, операционная система использует кольцевую систему для разделения кода на два типа: Ring 0 (ядро) и Ring 1 (пользовательский режим).
Ядро управляет основными функциями, такими как связь с оборудованием и управление памятью, в то время как пользовательский режим отвечает за работу приложений.
Если в пользовательском режиме происходит сбой, то приложение просто закрывается, но сбой в ядре приводит к краху всей системы.
Ошибка в драйвере CrowdStrike
Проблема возникла из-за обновления программного обеспечения Falcon от CrowdStrike, которое работает на уровне ядра.
Falcon отслеживает и идентифицирует новые атаки через мониторинг приложений, что требует привилегированного доступа.
В новом обновлении драйвера Falcon содержались файлы, которые вызывали ошибку на уровне ядра, что приводило к краху системы и появлению «Синего экрана смерти».
Недостаточная проверка и последствия
Как отметил Пламмер, проблемный драйвер CrowdStrike не был должным образом проверен на наличие возможных ошибок перед выпуском.
Более того, драйвер был помечен как «boot-start driver» — это означает, что он необходим для запуска ОС. Это и привело к тому, что сбой драйвера вызывал постоянные циклы перезагрузки системы. Для исправления ситуации требовалось физическое вмешательство.
Восстановление работы систем
Для исправления проблемы пользователи должны были загрузить систему в безопасном режиме Windows, удалить проблемные драйверы CrowdStrike и перезагрузить компьютер.
Хотя это простое решение, оно требовало значительного времени и усилий, особенно если от исправления зависели тысячи компьютеров.