Год разработки, 25 инженеров и снижение TCO на 40%: как создали российский ПАК виртуализации с нуля
«Гравитон» разработал ПАК виртуализации «Гелиус», где аппаратная часть и программная часть созданы, производятся и сопровождаются одной компанией.
⭐ Участник Продуктовой Премии Tproger 2025
При импортозамещении российские компании сталкиваются с одной проблемой: покупают серверы у одного производителя, программы у другого, а потом мучаются со стыковкой и поддержкой. «Гравитон» за 13 месяцев разработал ПАК виртуализации «Гелиус», где и аппаратная часть, и программная часть созданы, производятся и сопровождаются одной компанией.
Команда построила гиперконвергентное решение — в разработке участвовал весь департамент инженерных решений. Это решение сокращает стоимость инфраструктуры на 35-40% в перспективе 3-5 лет по сравнению со стандартным подходом.
Задача: частное облако без зависимости от нескольких вендоров
Бизнес-задача — снизить расходы на IT-инфраструктуру для российских компаний. Гиперконвергентное решение сокращает расходы на персонал за счёт упрощения обслуживания и позволяет эффективнее использовать имеющиеся ресурсы в модели IaaS.
Техническая задача — разработать программно-аппаратный комплекс на базе серверного и коммутационного оборудования российского производства (включённого в Единый реестр российской радиоэлектронной продукции) и программного обеспечения (включённого в Реестр российского программного обеспечения).
Параметры проекта
Срок разработки: март 2021 — апрель 2022 (13 месяцев)
Команда: около 25 инженеров и разработчиков
Экономический эффект: снижение стоимости владения инфраструктурой на 35-40% в перспективе 3-5 лет по сравнению с классической схемой (выделенные серверы, отдельные системы хранения данных, лицензии на ПО от разных вендоров и расходы на обслуживание)
Статус: внесён в Реестр Минпромторга (№10445375 от 07.05.2024, действует до 06.05.2027) и Реестр российского программного обеспечения (№23667 от 29.08.2024)
Архитектура: гиперконвергенция вместо классической инфраструктуры
Программно-аппаратный комплекс «Гелиус» построен по гиперконвергентной архитектуре. В отличие от классического подхода, где вычислительные мощности и системы хранения данных разделены физически, гиперконвергентная архитектура объединяет серверы в кластер, где каждый узел одновременно выполняет функции вычислительного узла и узла хранения данных.
Компоненты системы:
→ Серверы линейки «Гравитон» (объединены в кластер)
→ Среда виртуализации (управление виртуальными машинами и контейнерами)
→ Программно-определяемая система хранения данных (блочный, файловый, объектный доступ)
→ Программно-определяемая сеть (сегментирование через VXLAN, виртуальные маршрутизаторы, коммутаторы, межсетевые экраны)
→ Единая веб-консоль управления с ролевой моделью доступа
Архитектура предусматривает простое и предсказуемое масштабирование: достаточно добавить унифицированные вычислительные узлы на базе серверов линейки «Гравитон», и система автоматически включит их в кластер, распределив нагрузку.
Семь ключевых технических возможностей «Гелиус»
1. Широкая комплектация под разные задачи
Каждый узел кластера поддерживает процессоры Intel или AMD до 5-го поколения включительно, до 3 терабайт оперативной памяти на один узел, различные варианты накопителей HDD, SSD или NVMe — до 25 штук на один узел. Это позволяет компаниям собирать конфигурации под конкретные сценарии использования: от высокопроизводительных вычислений с большим объёмом оперативной памяти до массивов с приоритетом на объём хранения данных.
2. Высокая отказоустойчивость по схеме N+1
Резервирование аппаратных компонентов обеспечивает работу кластера даже при выходе из строя отдельных узлов. Целостность и доступность данных, хранящихся в кластере, обеспечивается тройной репликацией. Благодаря этому данные остаются доступными в случае выхода из строя до 40% от общего числа накопителей в кластере. Это критично для центров обработки данных, где простой инфраструктуры измеряется в миллионах убытков.
3. Развитая среда управления виртуальными машинами
ПАК «Гелиус» поддерживает живую миграцию виртуальных машин между узлами без остановки работы приложений, создание мгновенных снимков для быстрого отката к предыдущим состояниям, резервное копирование по расписанию, перенос виртуальных машин, созданных в импортных продуктах VMware, Hyper-V, Citrix и KVM. Последнее особенно важно для компаний, которые мигрируют с западных решений — не нужно разворачивать инфраструктуру с нуля, можно перенести существующие виртуальные машины.
4. Программно-определяемая система хранения данных со встроенным ML и поддержкой AI
Встроенная система хранения поддерживает три типа доступа к данным: блочный (для баз данных и виртуальных машин), файловый (для общих ресурсов) и объектный (для неструктурированных данных и резервных копий). Реализованы технологии компрессии и дедупликации для экономии дискового пространства, зеркалирования для повышения надёжности. Возможно построение тиринговых массивов, в которых автоматическая миграция «холодных» и «горячих» данных между медленными и быстрыми накопителями обеспечивается алгоритмами искусственного интеллекта. Система анализирует частоту обращения к данным и переносит редко используемые файлы на медленные, но объёмные HDD-накопители, а часто запрашиваемые — на быстрые NVMe, оптимизируя производительность и стоимость хранения.
5. Программно-определяемая сеть с полной изоляцией
Среда виртуализации работает в окружении программно-определяемой сети с сегментированием трафика виртуальных машин посредством VXLAN. Администраторы могут создавать виртуальные маршрутизаторы, коммутаторы и межсетевые экраны с индивидуальными настройками для каждого проекта или подразделения. Поддерживается технология vNAT и создание изолированных сетей в стиле DMZ для размещения публично доступных сервисов без риска для внутренней инфраструктуры. Реализованы балансировщики нагрузки по протоколам TCP, UDP, HTTP и HTTPS для распределения трафика между несколькими серверами приложений.
6. Встроенный мониторинг инфраструктуры и оборудования
В состав ПАК «Гелиус» входят средства мониторинга как виртуальной инфраструктуры (загрузка процессоров, использование памяти и дисков виртуальных машин, сетевой трафик), так и аппаратных компонентов кластера (температура, состояние накопителей, работа блоков питания, загрузка физических серверов). Единая веб-консоль с ролевой моделью доступа позволяет управлять всеми компонентами программно-аппаратного комплекса с рабочего места администратора без необходимости переключаться между разными интерфейсами.
7. Поддержка геораспределенных кластеров
ПАК «Гелиус» поддерживает возможность создания геораспределенных кластеров, когда узлы находятся в разных физических локациях — разных городах или дата-центрах. Это обеспечивает географическую отказоустойчивость: даже если один из дата-центров станет недоступен из-за аварии или стихийного бедствия, виртуальные машины продолжат работу на узлах в других локациях. Репликация данных между географически распределёнными узлами происходит автоматически.
Главная трудность: выбор архитектуры и конфигураций
🔴 Проблема: определить оптимальную архитектуру
Требовалось выбрать архитектуру для программно-аппаратного комплекса виртуализации и создать типовые конфигурации для узлов (серверов) кластера с учётом одновременного выполнения задач высокой отказоустойчивости, производительности и простоты управления. Гиперконвергентный подход требует тщательного баланса между вычислительными ресурсами и ресурсами хранения на каждом узле, а также продуманной схемы репликации данных.
✅ Решение: анализ реальных задач и опыт команды
Провели анализ типовых задач информационно-технологических отделов заказчиков, которые хорошо знакомы с серверным оборудованием «Гравитон», для формирования требований к программно-аппаратному комплексу виртуализации. Изучили функционал существующих продуктов в области виртуализации и хранения данных — как западных, так и российских — для дополнения требований к ПАК виртуализации. Использовали многолетний опыт инженеров и разработчиков компании «Гравитон» для выбора конфигураций узлов и создания программного обеспечения. Команда из более чем 100 специалистов объединила экспертизу в аппаратной части (производство серверов) и разработке программного обеспечения, что позволило создать сбалансированное решение.
Результаты: экономика и отзывы клиентов
Снижение совокупной стоимости владения инфраструктурой до 8 миллионов рублей в год по сравнению с затратами на классическую инфраструктуру. Традиционный подход требует закупки выделенных серверов, отдельных систем хранения данных, лицензий на программное обеспечение от разных вендоров и затрат на интеграцию и обслуживание всех этих компонентов. Гиперконвергентная архитектура ПАК «Гелиус» объединяет всё в одном решении от единого производителя.
Переход на российское решение виртуализации — это важный шаг в реализации нашей информационно-технологической стратегии. Мы выбрали для модернизации своей инфраструктуры гиперконвергентные технологии. Это даёт существенную экономию по сравнению с классическим, конвергентным подходом, и быстрый результат: уже через два месяца после старта проекта мы использовали новую инфраструктуру и смогли перевести на неё свои информационно-технологические сервисы.
Быстрое развёртывание и миграция — ключевое преимущество гиперконвергентной архитектуры. Компаниям не нужны месяцы на интеграцию разнородного оборудования и программного обеспечения от разных вендоров, координацию между несколькими службами поддержки. Единый производитель обеспечивает предсказуемость процесса и оперативное решение проблем.
Планы развития: расширение платформ и автоматизация
«Гравитон» продолжает развитие ПАК «Гелиус» по трём направлениям.
Поддержка новых серверных платформ от Intel и AMD. По мере выхода новых поколений процессоров команда будет адаптировать программное обеспечение для использования их возможностей — новых инструкций, улучшенной энергоэффективности, расширенной поддержки виртуализации.
Дополнение конфигурации программно-аппаратного комплекса тонкими клиентами линейки «Гравитон» для виртуальных рабочих столов. Это позволит компаниям полностью перевести сотрудников на работу с виртуальными десктопами, централизованно управляя всей вычислительной средой из единой консоли.
Расширение функционала системы управления для автоматизации рутинных операций администраторов. Планируется добавить сценарии автоматического масштабирования ресурсов в зависимости от нагрузки, умные алерты с анализом паттернов потребления ресурсов, шаблоны для быстрого развёртывания типовых конфигураций виртуальных машин.