От GPU к платформе: как Selectel строит AI-инфраструктуру для бизнеса
Selectel анонсировал AI-сервер и публичный доступ к каталогу LLM. Почему GPU без платформы — это «кирка без рудника» и как бизнесу перейти от пилотов к промышленной эксплуатации ИИ — читайте в материале.
22 апреля 2026 года в Москве прошла конференция «MLечный путь», которую Selectel проводит уже в шестой раз. В этом году организаторы собрали в одном зале бизнес и технические команды: бизнес-трек ориентирован на руководителей (CEO, CIO, CTO), аналитиков и специалистов по стратегическому внедрению ИИ, а технический трек — на инженеров, архитекторов и DevOps. Искусственный интеллект перестал быть игрушкой с потенциалом — он стал инструментом, который уже приносит деньги. Однако путь от первого пилота до промышленной эксплуатации до сих пор проходит далеко не каждая компания.
Selectel, крупнейший независимый провайдер IT-инфраструктуры в России (более 33 000 клиентов, 17 лет на рынке), на этой конференции не только анонсировал новые продукты, но и предложил системный взгляд на то, как строить AI-инфраструктуру, чтобы она работала на бизнес, а не против него.
Главные анонсы Selectel: новый AI-сервер и развитие платформы
Первый и, пожалуй, ожидаемый анонс — новый высокопроизводительный AI-сервер Selectel. Решение разработано с акцентом на сбалансированную архитектуру. Сервер представляет собой 8U-платформу с собственной материнской платой, поддержкой двух процессоров Intel Xeon 6 (до 144 ядер) и возможностью установки до 8 ТБ оперативной памяти DDR5. Ключевая особенность — до 16 графических ускорителей на ноду и продуманная топология PCI-линий, минимизирующая задержки при передаче данных между CPU, памятью и GPU.
«Новая аппаратная платформа обеспечит стабильную, быструю и предсказуемую работу AI-моделей в реальных условиях с полным контролем над данными и производительностью», — прокомментировал Дмитрий Шиченко, руководитель отдела разработки встроенных систем Selectel.
Второй важный анонс касается AI-платформы Selectel. Обновлённый Foundation Models Catalog переведён в публичный статус и теперь доступен всем клиентам. Каталог позволяет разворачивать LLM на выделенной инфраструктуре с поддержкой автомасштабирования, получать логи и метрики инференса (observability), управлять сервисами через REST API. В качестве основного движка инференса используется vLLM — высокопроизводительный open-source фреймворк, увеличивающий производительность без роста затрат.
В каталог уже добавлены модели IBM Granite, Alibaba Qwen, DeepSeek, Microsoft Phi, Mistral AI, а в ближайшее время появятся Kimi, GLM, Gemma, Whisper и другие. Оплата сейчас идёт за фактические вычислительные ресурсы, а в ближайшее время станет доступна тарификация по токенам.
«Наша задача — обеспечить компаниям быстрый переход от экспериментов с AI к экономически эффективному применению. Мы предоставляем не просто "железо", а комплексный набор решений — от серверов c GPU до платформенных продуктов, закрывающих задачи пилотных проектов и промышленной эксплуатации», — отметил Александр Тугов, директор AI-вертикали Selectel.
Единое окно для внедрения ИИ-агентов
Ещё одно важное событие конференции — начало сотрудничества Selectel с российским вендором Data Sapience и консалтинговой группой GlowByte. Партнёры объявили о создании комплексных решений для корпоративных заказчиков: от бизнес-задачи до промышленной эксплуатации ИИ-агентов и больших языковых моделей.
В рамках партнёрства Selectel подтвердил технологическую совместимость инфраструктуры с платформой Kolmogorov AI от Data Sapience, которая обеспечивает полный цикл работы с моделями — от подготовки данных до мониторинга и оркестрации в промышленном контуре. Selectel предоставляет гибкую инфраструктуру (публичное и частное облако, аренду выделенных серверов, размещение GPU на площадке клиента, в том числе в аттестованных сегментах ЦОД), а GlowByte выступает интеграционным партнёром: консалтинг, архитектура, дообучение моделей и сопровождение.
Такой подход позволяет компаниям получать end‑to‑end предложение «из одного окна», сокращая время от пилота до реального внедрения и обеспечивая соответствие регуляторным требованиям. Решения ориентированы на автоматизацию сложных процессов, поддержку принятия решений, анализ больших данных и построение приватных ИИ-сред в условиях строгой безопасности.
«В партнёрстве с Data Sapience и GlowByte мы объединяем экспертизу инфраструктурного провайдера, вендора платформенных решений и консалтинговой компании, чтобы упростить компаниям путь к эффективному внедрению ИИ», — прокомментировал Александр Тугов.
Экосистема вокруг платформы: что обсуждали на техническом треке
Кроме докладов команды Selectel, на техническом треке выступили эксперты из других компаний. Своим опытом поделились:
- Антон Алексеев, MLOps-инженер AvitoTech рассказывал о построении централизованной ML-платформы;
- Владислав Шевченко, CTO red_mad_robot рассказывал про кризис SDLC и объяснял, почему нельзя просто написать код и ждать результата;
- Максим Пантелеев, руководитель направления Core M&D. Wildberries & Russ поделился последними результатами исследования интерпретируемости LLM по мотивам участия в сообществах и опыта работы над проектами red- и blue-teaming LLM.
Программа технического трека подтвердила главный тренд: ИИ-инфраструктура и платформенный подход становятся сквозной темой для разных отраслей.
Почему AI-инфраструктура — это не просто GPU
AI-инфраструктура не исчерпывается графическими ускорителями. В реальном пайплайне инференса LLM нагрузка распределяется между сетевыми картами, оперативной памятью, CPU (пред- и постобработка, токенизация, формирование батчей), PCI-шиной и только потом — GPU. Каждый этап может стать узким горлышком.
«Просто взять графический ускоритель и запустить на нём модель — это как поехать на болиде Формулы-1 по гравию. Двигатель мощный, но быстрее не станет», — пояснил Дмитрий Шиченко.
Именно поэтому при разработке нового AI-сервера в Selectel сделали упор на баланс ресурсов: процессоры последнего поколения с высокими частотами, 4 ТБ оперативной памяти на частоте 6400 МТ/с, высокоскоростные интерконнекты (до 128 ГБ/с между CPU и GPU, до 900 ГБ/с между GPU через NVLink). И топологию материнской платы с детерминированной архитектурой PCI-линий.
«Привычный закон Мура для AI больше не работает. У нас теперь закон Хуанга: GPU морально устаревают за 2 года, а не за 5–7. Амортизировать серверное железо по старым правилам — значит гарантированно проиграть по TCO», — считает Владислав Кирпинский, директор по облачной интеграции Selectel.
Как выглядит эффективный инференс на реальных задачах
Технические результаты наглядно показывают, что даёт сбалансированная архитектура.
Сценарий 1.
- Модель на 400 млрд параметров (Qwen 3.5), длинный контекст, сотни одновременных пользователей.
- Конфигурация: 8 × H100, 112 ядер CPU, 512 ГБ RAM.
- Результат: 500 токенов в секунду.
«При 150 токенах в секунду нейросеть уже отвечает быстрее, чем человек читает. А 500 токенов — это инференс с большим запасом для реальных Enterprise-нагрузок», поясняет Дмитрий Шиченко, руководитель отдела разработки встроенных систем Selectel.
Сценарий 2.
- Модель на 1 трлн параметров (Kimi k2, Mixture of Experts), ещё более длинный контекст, до 1000 пользователей.
- Конфигурация: RTX 6000 Pro Server Edition (увеличенный объём VRAM), 2 ТБ RAM.
- Результат: 150 токенов в секунду — более чем достаточно для диалоговых систем и ассистентов.
Итоги: AI-инфраструктура как стратегический актив
Конференция «MLечный путь» наглядно показала: рынок AI в России перешёл от экспериментов к промышленному внедрению. Но бизнес сталкивается с системными барьерами — от выбора правильного железа до построения платформ, которые позволяют масштабировать успешные пилоты.
Selectel на этом фоне предлагает комплексную историю:
- Инфраструктура — собственные сбалансированные AI-серверы, широкая линейка GPU (от потребительских до enterprise), гибкие модели потребления (BareMetal, облако, аренда на площадке клиента, гибрид).
- Платформа — Foundation Models Catalog в публичном доступе, observability, API‑управление, поддержка vLLM.
- Экспертиза — собственные инженеры, разработка серверов и материнских плат, независимость от поставщиков.
- Развитие направления партнерств с ведущими российскими AI-вендорами, обладающими экспертизой для решения отраслевых и специализированных бизнес-кейсов.
Как отметил один из спикеров конференции: «GPU без платформы — это кирка без рудника». Selectel же предлагает и кирку, и рудник, и карту местности. Для Enterprise это означает снижение рисков, предсказуемое TCO и возможность сфокусироваться на бизнес‑результатах, а не на том, почему инференс тормозит или почему GPU не окупаются за 5 лет.
AI‑инфраструктура перестаёт быть историей про «купить железо». Она становится историей про управляемость, экономику и скорость изменений. Именно этот переход — от GPU к платформе — стал главным итогом «MLечного пути».