Более 30 кластеров в продуктиве: как работает ДБО в Почта Банке на базе контейнерной платформы «Штурвал»
Внедрение контейнерной платформы «Штурвал» сократило время вывода нового функционала до двух часов и обеспечило нулевые простои при обновлениях.
, отредактировано
⭐ Участник Продуктовой Премии Tproger 2025 — проголосовать за кейс можно по ссылке
Почта Банк имеет широкую разветвленную сеть и работает в 83 регионах нашей страны, в том числе и в отделениях Почты России. У банка несколько миллионов клиентов, которые создают высокую нагрузку на цифровые каналы обслуживания, прежде всего на систему дистанционного банковского обслуживания (ДБО).
К 2023 году рост числа клиентов, их массовый переход в онлайн, а также запуск федеральных инициатив, включая проект «Пушкинская карта», привели к резкому увеличению нагрузки на ДБО.
В этих условиях банку потребовалась глубокая технологическая модернизация ДБО с переходом на современную микросервисную архитектуру и российский технологический стек, в частности — контейнерную платформу «Штурвал».
Сейчас система выдерживает 120 тысяч одновременных сеансов, позволяет добавлять новые сервисы не более чем за два часа и обеспечивает управление 30+ кластерами.
Задача: дать банку инструмент для управления десятками кластеров и простого масштабирования
До старта проекта банку необходимо было решить следующие задачи:
- сократить релизные циклы;
- ускорить обновления;
- автоматизировать масштабирование;
- импортозаместить инфраструктуру и ключевые компоненты ДБО;
- увеличить скорость вывода новых сервисов.
Почта Банк принял решение создать ДБО с нуля с переходом на микросервисную архитектуру, а также внедрить российскую платформу для управления контейнерной инфраструктурой на базе отечественной виртуализации и операционной системы.
В основе решения — контейнерная платформа «Штурвал», позволяющая централизованно управлять Kubernetes-кластерами, обеспечивать высокий уровень отказоустойчивости, безопасности и масштабируемости.
«Лаборатория Числитель», разработчик платформы «Штурвал», реализовала глубокую интеграцию с системой виртуализации zVirt, поддержку RedOS и встроенные механизмы безопасности. Платформа обеспечивает централизованное управление множеством кластеров из единого окна, автоматическое масштабирование и высокий уровень отказоустойчивости, что позволяет инфраструктуре расти вместе с цифровыми сервисами банка.
Параметры проекта
- Команда: 70 человек (со стороны банка и «Лаборатории Числитель»)
- Сроки: один год, проект завершился в Q3 2024 г.
- Масштаб клиента: несколько миллионов пользователей, 69% из которых используют онлайн-банкинг
- Инфраструктура: 6 продакшн-кластеров Kubernetes для ДБО, более 500 виртуальных машин, 2 ЦОДа
- Результаты: система выдерживает до 120 тысяч одновременных сеансов, на старте проекта было развернуто 3 кластера, теперь — больше 30
Почему банк выбрал «Штурвал»
Почта Банк сравнил шесть решений, включая Deckhouse Kubernetes Platform, OpenShift, Rancher, «ванильный» Kubernetes и другие. На «Штурвале» остановились из-за ряда причин:
- Архитектура для enterprise. Централизованное управление, простое масштабирование, отказоустойчивость компонентов доступных «из коробки».
- Готовые интеграции. «Штурвал» работал как с тем ПО, которое банк уже использовал, так и с тем, которое только собирался внедрить.
- Гибкие права доступа. Можно сегментировать доступы между командами разработки, инфраструктуры, DevOps и ИБ на уровне всей платформы.
- Высокий уровень безопасности. Механизмы информационной безопасности уже встроены в платформу.
- Масштабирование вместе с бизнесом. Платформа управляет десятками кластеров из одного окна. Новый кластер разворачивается за 15 минут.
Пять главных результатов для банка
- Скорость внедрения сервисов
Теперь на запуск нового сервиса требуется не более двух часов. Новый кластер можно создать за 15 минут, поэтому time-to-market сильно сократился.
- Нулевые простои
Обновления проходят без простоев, а клиенты не замечают, что в инфраструктуре что-то меняется.
- Нагрузка на команды уменьшилась в пять раз
Автоматизация рутинных задач освободила инженеров от ручной настройки. Теперь они занимаются развитием продуктов, а не поддержкой инфраструктуры.
- Система устойчива к высоким нагрузкам
Платформа выдерживает до 120 тысяч одновременных онлайн-сеансов. При этом остается запас по масштабированию в несколько раз, что очень важно для банка с миллионами клиентов.
- Полная независимость от западных вендоров
Переход на российский стек убрал зависимость от западных производителей. Банк получил контроль над развитием платформы и может быстро реагировать на требования регулятора и бизнеса.
Сложности проекта
🔴 Проблема: внешние балансировщики с постоянно меняющимися адресами
По требованиям банка внешний доступ к приложениям должен был обеспечиваться через балансировщиков нагрузки, вынесенных за пределы кластеров. Это повышало уровень контроля и соответствовало внутренним стандартам безопасности, но одновременно усложняло архитектуру.
Дополнительной трудностью стало то, что сами кластеры создавались автоматически и динамически: имена и сетевые адреса узлов постоянно менялись.
✅ Решение: автоматическая синхронизация состояния кластера
Перед командой встала нетривиальная задача — внешняя система балансировки должна была знать, куда именно направлять трафик, несмотря на постоянные изменения внутри платформы.
Специалисты реализовали механизм автоматической синхронизации, который позволил связать внешний контур доступа с реальным состоянием кластеров. Это решение обеспечило стабильность сервисов для бизнеса без необходимости ручного вмешательства и снизило операционные риски.
🔴 Проблема: недостаточная отказоустойчивость на уровне виртуализации
Банк требовал размещения управляющих компонентов кластеров на разных физических хостах, чтобы сбой одной части инфраструктуры не приводил к остановке критичных сервисов. Но в системе zVirt отсутствовали готовые механизмы для автоматического обеспечения такого распределения.
✅ Решение: разработка компонента, контролирующего размещение управляющих серверов
Команда разработала дополнительный компонент, который автоматически контролирует и корректирует размещение управляющих серверов. Это позволило добиться требуемого уровня надежности и соответствия внутренним требованиям банка, не меняя базовую платформу виртуализации.
🔴 Проблема: инсталляционная настройка десятков кластеров
После запуска платформы нужно было настроить большое количество кластеров.
✅ Решение: паттерн Apps-of-Apps
Команда использовала паттерн Apps-of-Apps для модуля непрерывной доставки приложений. Банк получил управляемую модель, где изменения вносятся быстро, предсказуемо и с контролируемыми рисками.
Не лобовая замена, а технологический апгрейд
Кейс Почта Банка показал, что переход на российский стек — это возможность построить систему надежнее и быстрее западных аналогов, снизить операционные расходы и ускорить вывод новых функций для клиентов. Для банка с широкой региональной сетью в стране это критически важное конкурентное преимущество.
Дорожная карта проекта
3Q 2023: подготовка — уточнение ТЗ, формирование команды, разработка план-графика.
4Q 2023: разработка документации, пилотное развёртывание «Штурвала», перенос 10 пилотных микросервисов на тестовый кластер.
1Q 2024: масштабирование кластера, подготовка платформы и развёртывание HA-кластера.
2Q 2024: перенос пилотных микросервисов в продакшен, старт доработки остальных 150 микросервисов.
3Q 2024: развёртывание новой платформы на RedOS, перенос пилотных сервисов.
Реклама. ООО «Лаборатория Числитель», ИНН 9731042193, erid: 2W5zFHR4LV7