Более 30 кластеров в продуктиве: как работает ДБО в Почта Банке на базе контейнерной платформы «Штурвал»

Внедрение контейнерной платформы «Штурвал» сократило время вывода нового функционала до двух часов и обеспечило нулевые простои при обновлениях.

Обложка: Более 30 кластеров в продуктиве: как работает ДБО в Почта Банке на базе контейнерной платформы «Штурвал»
⭐ Участник Продуктовой Премии Tproger 2025 — проголосовать за кейс можно по ссылке

Почта Банк имеет широкую разветвленную сеть и работает в 83 регионах нашей страны, в том числе и в отделениях Почты России. У банка несколько миллионов клиентов, которые создают высокую нагрузку на цифровые каналы обслуживания, прежде всего на систему дистанционного банковского обслуживания (ДБО).

К 2023 году рост числа клиентов, их массовый переход в онлайн, а также запуск федеральных инициатив, включая проект «Пушкинская карта», привели к резкому увеличению нагрузки на ДБО.

В этих условиях банку потребовалась глубокая технологическая модернизация ДБО с переходом на современную микросервисную архитектуру и российский технологический стек, в частности — контейнерную платформу «Штурвал».

Сейчас система выдерживает 120 тысяч одновременных сеансов, позволяет добавлять новые сервисы не более чем за два часа и обеспечивает управление 30+ кластерами.

Задача: дать банку инструмент для управления десятками кластеров и простого масштабирования

До старта проекта банку необходимо было решить следующие задачи:

  • сократить релизные циклы;
  • ускорить обновления;
  • автоматизировать масштабирование;
  • импортозаместить инфраструктуру и ключевые компоненты ДБО;
  • увеличить скорость вывода новых сервисов.

Почта Банк принял решение создать ДБО с нуля с переходом на микросервисную архитектуру, а также внедрить российскую платформу для управления контейнерной инфраструктурой на базе отечественной виртуализации и операционной системы.

В основе решения — контейнерная платформа «Штурвал», позволяющая централизованно управлять Kubernetes-кластерами, обеспечивать высокий уровень отказоустойчивости, безопасности и масштабируемости.

«Лаборатория Числитель», разработчик платформы «Штурвал», реализовала глубокую интеграцию с системой виртуализации zVirt, поддержку RedOS и встроенные механизмы безопасности. Платформа обеспечивает централизованное управление множеством кластеров из единого окна, автоматическое масштабирование и высокий уровень отказоустойчивости, что позволяет инфраструктуре расти вместе с цифровыми сервисами банка.

Параметры проекта

  • Команда: 70 человек (со стороны банка и «Лаборатории Числитель»)
  • Сроки: один год, проект завершился в Q3 2024 г. 
  • Масштаб клиента: несколько миллионов пользователей, 69% из которых используют онлайн-банкинг
  • Инфраструктура: 6 продакшн-кластеров Kubernetes для ДБО, более 500 виртуальных машин, 2 ЦОДа
  • Результаты: система выдерживает до 120 тысяч одновременных сеансов, на старте проекта было развернуто 3 кластера, теперь — больше 30

Почему банк выбрал «Штурвал»

Почта Банк сравнил шесть решений, включая Deckhouse Kubernetes Platform, OpenShift, Rancher, «ванильный» Kubernetes и другие. На «Штурвале» остановились из-за ряда причин:

  • Архитектура для enterprise. Централизованное управление, простое масштабирование, отказоустойчивость компонентов доступных «из коробки».
  • Готовые интеграции. «Штурвал» работал как с тем ПО, которое банк уже использовал, так и с тем, которое только собирался внедрить.
  • Гибкие права доступа. Можно сегментировать доступы между командами разработки, инфраструктуры, DevOps и ИБ на уровне всей платформы.
  • Высокий уровень безопасности. Механизмы информационной безопасности уже встроены в  платформу.
  • Масштабирование вместе с бизнесом. Платформа управляет десятками кластеров из одного окна. Новый кластер разворачивается за 15 минут.

Пять главных результатов для банка

  • Скорость внедрения сервисов

Теперь на запуск нового сервиса требуется не более двух часов. Новый кластер можно создать за 15 минут, поэтому time-to-market сильно сократился.

  • Нулевые простои

Обновления проходят без простоев, а клиенты не замечают, что в инфраструктуре что-то меняется.

  • Нагрузка на команды уменьшилась в пять раз

Автоматизация рутинных задач освободила инженеров от ручной настройки. Теперь они занимаются развитием продуктов, а не поддержкой инфраструктуры.

  • Система устойчива к высоким нагрузкам

Платформа выдерживает до 120 тысяч одновременных онлайн-сеансов. При этом остается запас по масштабированию в несколько раз, что очень важно для банка с миллионами клиентов.

  • Полная независимость от западных вендоров

Переход на российский стек убрал зависимость от западных производителей. Банк получил контроль над развитием платформы и может быстро реагировать на требования регулятора и бизнеса.

Сложности проекта

🔴 Проблема: внешние балансировщики с постоянно меняющимися адресами

По требованиям банка внешний доступ к приложениям должен был обеспечиваться через балансировщиков нагрузки, вынесенных за пределы кластеров. Это повышало уровень контроля и соответствовало внутренним стандартам безопасности, но одновременно усложняло архитектуру.

Дополнительной трудностью стало то, что сами кластеры создавались автоматически и динамически: имена и сетевые адреса узлов постоянно менялись.

✅ Решение: автоматическая синхронизация состояния кластера

Перед командой встала нетривиальная задача — внешняя система балансировки должна была знать, куда именно направлять трафик, несмотря на постоянные изменения внутри платформы.

Специалисты реализовали механизм автоматической синхронизации, который позволил связать внешний контур доступа с реальным состоянием кластеров. Это решение обеспечило стабильность сервисов для бизнеса без необходимости ручного вмешательства и снизило операционные риски.

🔴 Проблема: недостаточная отказоустойчивость на уровне виртуализации

Банк требовал размещения управляющих компонентов кластеров на разных физических хостах, чтобы сбой одной части инфраструктуры не приводил к остановке критичных сервисов. Но в системе zVirt отсутствовали готовые механизмы для автоматического обеспечения такого распределения.

✅ Решение: разработка компонента, контролирующего размещение управляющих серверов

Команда разработала дополнительный компонент, который автоматически контролирует и корректирует размещение управляющих серверов. Это позволило добиться требуемого уровня надежности и соответствия внутренним требованиям банка, не меняя базовую платформу виртуализации.

🔴 Проблема: инсталляционная настройка десятков кластеров

После запуска платформы нужно было настроить большое количество кластеров.

✅ Решение: паттерн Apps-of-Apps

Команда использовала паттерн Apps-of-Apps для модуля непрерывной доставки приложений. Банк получил управляемую модель, где изменения вносятся быстро, предсказуемо и с контролируемыми рисками.

Не лобовая замена, а технологический апгрейд

Кейс Почта Банка показал, что переход на российский стек — это возможность построить систему надежнее и быстрее западных аналогов, снизить операционные расходы и ускорить вывод новых функций для клиентов. Для банка с широкой региональной сетью в стране это критически важное конкурентное преимущество.

Дорожная карта проекта

3Q 2023: подготовка — уточнение ТЗ, формирование команды, разработка план-графика.

4Q 2023: разработка документации, пилотное развёртывание «Штурвала», перенос 10 пилотных микросервисов на тестовый кластер.

1Q 2024: масштабирование кластера, подготовка платформы и развёртывание HA-кластера.

2Q 2024: перенос пилотных микросервисов в продакшен, старт доработки остальных 150 микросервисов.

3Q 2024: развёртывание новой платформы на RedOS, перенос пилотных сервисов.

Реклама. ООО «Лаборатория Числитель», ИНН 9731042193, erid: 2W5zFHR4LV7