Год разработки, 25 инженеров и снижение TCO на 40%: как создали российский ПАК виртуализации с нуля

«Гравитон» разработал ПАК виртуализации «Гелиус», где аппаратная часть и программная часть созданы, производятся и сопровождаются одной компанией.

Обложка: Год разработки, 25 инженеров и снижение TCO на 40%: как создали российский ПАК виртуализации с нуля
⭐ Участник Продуктовой Премии Tproger 2025

При импортозамещении российские компании сталкиваются с одной проблемой: покупают серверы у одного производителя, программы у другого, а потом мучаются со стыковкой и поддержкой. «Гравитон» за 13 месяцев разработал ПАК виртуализации «Гелиус», где и аппаратная часть, и программная часть созданы, производятся и сопровождаются одной компанией.

Команда построила гиперконвергентное решение — в разработке участвовал весь департамент инженерных решений. Это решение сокращает стоимость инфраструктуры на 35-40% в перспективе 3-5 лет по сравнению со стандартным подходом.

Задача: частное облако без зависимости от нескольких вендоров

Бизнес-задача — снизить расходы на IT-инфраструктуру для российских компаний. Гиперконвергентное решение сокращает расходы на персонал за счёт упрощения обслуживания и позволяет эффективнее использовать имеющиеся ресурсы в модели IaaS.

Техническая задача — разработать программно-аппаратный комплекс на базе серверного и коммутационного оборудования российского производства (включённого в Единый реестр российской радиоэлектронной продукции) и программного обеспечения (включённого в Реестр российского программного обеспечения).

Параметры проекта

Срок разработки: март 2021 — апрель 2022 (13 месяцев)

Команда: около 25 инженеров и разработчиков

Экономический эффект: снижение стоимости владения инфраструктурой на 35-40% в перспективе 3-5 лет по сравнению с классической схемой (выделенные серверы, отдельные системы хранения данных, лицензии на ПО от разных вендоров и расходы на обслуживание)

Статус: внесён в Реестр Минпромторга (№10445375 от 07.05.2024, действует до 06.05.2027) и Реестр российского программного обеспечения (№23667 от 29.08.2024)

Архитектура: гиперконвергенция вместо классической инфраструктуры

Программно-аппаратный комплекс «Гелиус» построен по гиперконвергентной архитектуре. В отличие от классического подхода, где вычислительные мощности и системы хранения данных разделены физически, гиперконвергентная архитектура объединяет серверы в кластер, где каждый узел одновременно выполняет функции вычислительного узла и узла хранения данных.

Компоненты системы:

→ Серверы линейки «Гравитон» (объединены в кластер)

→ Среда виртуализации (управление виртуальными машинами и контейнерами)

→ Программно-определяемая система хранения данных (блочный, файловый, объектный доступ)

→ Программно-определяемая сеть (сегментирование через VXLAN, виртуальные маршрутизаторы, коммутаторы, межсетевые экраны)

→ Единая веб-консоль управления с ролевой моделью доступа

Архитектура предусматривает простое и предсказуемое масштабирование: достаточно добавить унифицированные вычислительные узлы на базе серверов линейки «Гравитон», и система автоматически включит их в кластер, распределив нагрузку.

Семь ключевых технических возможностей «Гелиус»

1. Широкая комплектация под разные задачи

Каждый узел кластера поддерживает процессоры Intel или AMD до 5-го поколения включительно, до 3 терабайт оперативной памяти на один узел, различные варианты накопителей HDD, SSD или NVMe — до 25 штук на один узел. Это позволяет компаниям собирать конфигурации под конкретные сценарии использования: от высокопроизводительных вычислений с большим объёмом оперативной памяти до массивов с приоритетом на объём хранения данных.

2. Высокая отказоустойчивость по схеме N+1

Резервирование аппаратных компонентов обеспечивает работу кластера даже при выходе из строя отдельных узлов. Целостность и доступность данных, хранящихся в кластере, обеспечивается тройной репликацией. Благодаря этому данные остаются доступными в случае выхода из строя до 40% от общего числа накопителей в кластере. Это критично для центров обработки данных, где простой инфраструктуры измеряется в миллионах убытков.

3. Развитая среда управления виртуальными машинами

ПАК «Гелиус» поддерживает живую миграцию виртуальных машин между узлами без остановки работы приложений, создание мгновенных снимков для быстрого отката к предыдущим состояниям, резервное копирование по расписанию, перенос виртуальных машин, созданных в импортных продуктах VMware, Hyper-V, Citrix и KVM. Последнее особенно важно для компаний, которые мигрируют с западных решений — не нужно разворачивать инфраструктуру с нуля, можно перенести существующие виртуальные машины.

4. Программно-определяемая система хранения данных со встроенным ML и поддержкой AI

Встроенная система хранения поддерживает три типа доступа к данным: блочный (для баз данных и виртуальных машин), файловый (для общих ресурсов) и объектный (для неструктурированных данных и резервных копий). Реализованы технологии компрессии и дедупликации для экономии дискового пространства, зеркалирования для повышения надёжности. Возможно построение тиринговых массивов, в которых автоматическая миграция «холодных» и «горячих» данных между медленными и быстрыми накопителями обеспечивается алгоритмами искусственного интеллекта. Система анализирует частоту обращения к данным и переносит редко используемые файлы на медленные, но объёмные HDD-накопители, а часто запрашиваемые — на быстрые NVMe, оптимизируя производительность и стоимость хранения.

5. Программно-определяемая сеть с полной изоляцией

Среда виртуализации работает в окружении программно-определяемой сети с сегментированием трафика виртуальных машин посредством VXLAN. Администраторы могут создавать виртуальные маршрутизаторы, коммутаторы и межсетевые экраны с индивидуальными настройками для каждого проекта или подразделения. Поддерживается технология vNAT и создание изолированных сетей в стиле DMZ для размещения публично доступных сервисов без риска для внутренней инфраструктуры. Реализованы балансировщики нагрузки по протоколам TCP, UDP, HTTP и HTTPS для распределения трафика между несколькими серверами приложений.

6. Встроенный мониторинг инфраструктуры и оборудования

В состав ПАК «Гелиус» входят средства мониторинга как виртуальной инфраструктуры (загрузка процессоров, использование памяти и дисков виртуальных машин, сетевой трафик), так и аппаратных компонентов кластера (температура, состояние накопителей, работа блоков питания, загрузка физических серверов). Единая веб-консоль с ролевой моделью доступа позволяет управлять всеми компонентами программно-аппаратного комплекса с рабочего места администратора без необходимости переключаться между разными интерфейсами.

7. Поддержка геораспределенных кластеров

ПАК «Гелиус» поддерживает возможность создания геораспределенных кластеров, когда узлы находятся в разных физических локациях — разных городах или дата-центрах. Это обеспечивает географическую отказоустойчивость: даже если один из дата-центров станет недоступен из-за аварии или стихийного бедствия, виртуальные машины продолжат работу на узлах в других локациях. Репликация данных между географически распределёнными узлами происходит автоматически.

Главная трудность: выбор архитектуры и конфигураций

🔴 Проблема: определить оптимальную архитектуру

Требовалось выбрать архитектуру для программно-аппаратного комплекса виртуализации и создать типовые конфигурации для узлов (серверов) кластера с учётом одновременного выполнения задач высокой отказоустойчивости, производительности и простоты управления. Гиперконвергентный подход требует тщательного баланса между вычислительными ресурсами и ресурсами хранения на каждом узле, а также продуманной схемы репликации данных.

✅ Решение: анализ реальных задач и опыт команды

Провели анализ типовых задач информационно-технологических отделов заказчиков, которые хорошо знакомы с серверным оборудованием «Гравитон», для формирования требований к программно-аппаратному комплексу виртуализации. Изучили функционал существующих продуктов в области виртуализации и хранения данных — как западных, так и российских — для дополнения требований к ПАК виртуализации. Использовали многолетний опыт инженеров и разработчиков компании «Гравитон» для выбора конфигураций узлов и создания программного обеспечения. Команда из более чем 100 специалистов объединила экспертизу в аппаратной части (производство серверов) и разработке программного обеспечения, что позволило создать сбалансированное решение.

Результаты: экономика и отзывы клиентов

Снижение совокупной стоимости владения инфраструктурой до 8 миллионов рублей в год по сравнению с затратами на классическую инфраструктуру. Традиционный подход требует закупки выделенных серверов, отдельных систем хранения данных, лицензий на программное обеспечение от разных вендоров и затрат на интеграцию и обслуживание всех этих компонентов. Гиперконвергентная архитектура ПАК «Гелиус» объединяет всё в одном решении от единого производителя.

Переход на российское решение виртуализации — это важный шаг в реализации нашей информационно-технологической стратегии. Мы выбрали для модернизации своей инфраструктуры гиперконвергентные технологии. Это даёт существенную экономию по сравнению с классическим, конвергентным подходом, и быстрый результат: уже через два месяца после старта проекта мы использовали новую инфраструктуру и смогли перевести на неё свои информационно-технологические сервисы.

Быстрое развёртывание и миграция — ключевое преимущество гиперконвергентной архитектуры. Компаниям не нужны месяцы на интеграцию разнородного оборудования и программного обеспечения от разных вендоров, координацию между несколькими службами поддержки. Единый производитель обеспечивает предсказуемость процесса и оперативное решение проблем.

Планы развития: расширение платформ и автоматизация

«Гравитон» продолжает развитие ПАК «Гелиус» по трём направлениям.

Поддержка новых серверных платформ от Intel и AMD. По мере выхода новых поколений процессоров команда будет адаптировать программное обеспечение для использования их возможностей — новых инструкций, улучшенной энергоэффективности, расширенной поддержки виртуализации.

Дополнение конфигурации программно-аппаратного комплекса тонкими клиентами линейки «Гравитон» для виртуальных рабочих столов. Это позволит компаниям полностью перевести сотрудников на работу с виртуальными десктопами, централизованно управляя всей вычислительной средой из единой консоли.

Расширение функционала системы управления для автоматизации рутинных операций администраторов. Планируется добавить сценарии автоматического масштабирования ресурсов в зависимости от нагрузки, умные алерты с анализом паттернов потребления ресурсов, шаблоны для быстрого развёртывания типовых конфигураций виртуальных машин.

Рекомендуем