«Клаудия» с режимом SRE-агента, собственный VPN и новые цены LLM — итоги GoCloud Tech
Осенний сезон для IT-комьюнити стартовал масштабной конференцией по облакам и искусственному интеллекту — GoCloud Tech от облачного провайдера Cloud.ru.
356 открытий3К показов
Событие стало логичным продолжением апрельской встречи: команда показала новые разработки и релизы и объяснила, как они пригодятся разработчикам и платформенным командам — от ускорения повседневных процессов до более простого запуска AI-сценариев.
Главные анонсы Cloud.ru на конференции GoCloud Tech
Провайдер облачных и AI-технологий Cloud.ru остаётся лидером российского рынка по совокупной выручке IaaS+PaaS: по итогам 2024 года доля компании составила 28,9%. Отдельно в сегменте IaaS — 24,7%.
Компания развивает собственное публичное облако Cloud.ru Evolution, предоставляет инфраструктурные и платформенные сервисы, внедряет решения на базе AI/ML и выпускает инструменты для разработчиков, работает с клиентами от небольших команд до крупных предприятий.
3 сентября прошла вторая технологическая конференция для инженеров и разработчиков GoCloud Tech, которая собрала сотни участников, в том числе онлайн. На сессиях топ-менеджеры и инженеры платформы представили новые сценарии AI-помощника «Клаудии» (режимы SRE-агента и FinOps-оптимизации), объявили новые цены на открытые LLM в Cloud.ru Evolution AI Factory (вступают в силу 1 ноября 2025 года), а также сообщили о запуске грантовой программы «Код без границ» совместно со СберТех и сообществом Хабр. В числе спикеров были и приглашённые представители индустрии, в том числе 2ГИС.
На конференции работали четыре трека:
AI&ML — здесь спикеры обсуждали AI-агентов, разгружающих инженеров (SRE/DevOps), и прикладную работу с моделями (RAG, инференс) — как это ускоряет поддержку и улучшает клиентский сервис.
Cloud Infrastructure — на сессиях сделали упор на устойчивость и защищённые соединения: архитектура IaaS на Kubernetes, связность между проектами с Magic Link и облачный Evolution VPN для гибридных сценариев.
Data & Analytics — трек был посвящён запуску коммерческой Evolution Data Platform и современному взгляду на СУБД/HTAP и метрики производительности — «данные как топливо» для AI-кейсов
Dev Platform Services — демонстрировались практические решения для девов: Partner API, монтирование S3 в Container Apps, и приёмы с eBPF для улучшения cloud-native продуктов.
Рассказываем подробнее о главных тезисах и анонсах события.
«Клаудия»: от ассистента к агентным сценариям SRE и FinOps
AI-помощник «Клаудия» — это интерфейс в личном кабинете Cloud.ru Evolution, который не только советует, но и выполняет действия. Клаудию представили в конце июня, и с тех пор идёт публичное тестирование: участие приняли более 4 000 инженеров, отправлено ~36 000 сообщений, из них 67% — получили положительные оценки. Пока сервис открыт только для инженеров;корпоративные аккаунты подключат после доработки сценариев.
Из базовых задач AI-помощник уже умеет подобрать сервисы под задачу, развернуть ВМ, сгенерировать SSH-ключ, включить мониторинг и алерты, а в сложных местах — «провести за руку»: подсказать по Secret Management и Terraform, выступить «копилотом» в консоли. На демо показали сокращение онбординга инфраструктуры с 15–30 до ~2 минут; в ~96% случаев ответ приходит около 10 секунд (внутренние метрики).
Сейчас в публичном тесте — еще два режима «Клаудии»: SRE и FinOps.
- SRE. Подключается к метрикам и логам проекта, собирает дашборды, предлагает правила алертинга и план действий при инциденте. Ближайший шаг — возможность масштабироваться «по клику» из рекомендации с подтверждением инженера.
- FinOps. Ищет «зомби-ресурсы» (простаивающие ВМ, диски, IP) и предлагает безопасные варианты экономии, и никаких авто-удалений — любые изменения совершаются только после согласия пользователя.
Вместе с ручным тестированием команда использует собственного агента-тестировщика «Альберта» на базе фреймворка с открытым исходным кодом DeepEval. Он генерирует и ведёт диалоги с Клаудией в разных ролях (например, «студент делает лабораторную»), помогает проверять регрессии и качество ответов.
Команда подчёркивает ключевой принцип: никакой самодеятельности в инфраструктуре. Клаудия выполняет только проверенные и безопасные операции — и всегда с разрешения пользователя.
Клаудия умеет понимать задачу пользователя и задавать уточняющие вопросы. Дальше она подбирает подходящие облачные сервисы и решения под конкретный кейс, а из базовых IaaS-сервисов может сама развернуть виртуальные машины, помочь с их первичной настройкой, включить мониторинг инфраструктуры и приложений, разбирать алерты и логи.
На днях добавили анализ нагрузки ВМ с точки зрения фин.эффективности: ассистент рекомендует сменить конфигурацию или — если ресурс недоиспользуется — предлагает удалить его по подтверждению пользователя, чтобы не платить лишнего. Она понимает профессиональный жаргон и разговорную лексику и реагирует на это корректно и эмпатично.
И важно понимать границы: всё, что рутина и повторяемые действия, — отлично автоматизируется. А там, где начинаются инновации, лучшие практики, критическое мышление, стратегические решения и сама постановка задачи, — роль человека остаётся ключевой. Это не замена инженера, это усиление: та же команда делает кратно больше, потому что освобождается время и ресурс.
Evolution VPN и немного «магии»: другие громкие анонсы
На конференции командой был анонсирован запуск собственного облачного VPN-сервиса — Evolution VPN. Он уже доступен пользователям в Private Preview, а до конца года выйдет в общий доступ. Задача сервиса — обеспечить защищённый удалённый доступ к ресурсам в VPC и корпоративной сети, а также упростить работу в гибридной и мультиоблачной архитектуре: подключать офис/ЦОД к облаку и связывать несколько облаков без сложной ручной настройки. Сервис ориентирован и на компании любого масштаба, и на индивидуальных специалистов — сетевых администраторов, DevOps и системных инженеров.
Что это даёт на практике: шифрование трафика на линии (конфиденциальность и целостность данных), единые правила доступа для распределённых команд и возможность собрать единую гибридную архитектуру — когда часть систем остаётся в офисе/ЦОД, а часть работает в облаке. При мультиоблаке VPN помогает свести разные площадки в централизованно управляемое пространство.
Параллельно Cloud.ru показал Magic Link — дополнение к Magic Router, которое позволяет настраивать прямые частные маршруты между ресурсами разных проектов (и даже разных клиентов) внутри Cloud.ru Evolution без выхода в интернет.
Что умеет Magic Router (и что добавляет Magic Link):
- маршруты между VPC внутри Cloud.ru Evolution;
- маршруты между VPC и on-prem инфраструктурой клиента;
- маршруты между VPC и ресурсами на платформах Cloud.ru Advanced и «Облако VMware»;
- новое (Magic Link): маршрутизация между ресурсами разных проектов и клиентов в Evolution без интернета;
- self-service-настройка в кабинете (без обращения в поддержку)
Услуга доступна в Private Preview. Выход в Public Preview заявлен до конца квартала. Настройка выполняется прямо в личном кабинете в режиме self-service, что удобно для холдингов и компаний с несколькими контурами и дочерними организациями.
Теперь о деньгах: новые цены на LLM в Evolution AI Factory
Объём российского рынка LLM-продуктов для бизнеса по итогам 2024 года составил — 35 млрд ₽. До 2028 года среднегодовой рост составит около 25%. Основная часть приходится на on-premise (~33 млрд ₽), а на облачные решения — примерно 2 млрд ₽. Средняя стоимость LLM-проекта без железа сейчас оценивается примерно в 15 млн ₽.
LLM или большая языковая модель — это нейросеть с большим числом параметров, обученная на больших массивах текстов. На практике это инструмент для прикладных задач: поддержка клиентов (чат-боты и голос), поиск и анализ документов (RAG), генерация деловых текстов и отчётов, ассистенты для разработчиков и аналитиков, автоматизация внутренних процессов через API. Поэтому стоимость токенов прямо влияет на цену экспериментов (PoC) и эксплуатацию в проде.
С 1 ноября 2025 в Evolution AI Factory вводится раздельная тарификация токенов для открытых моделей (≥120B параметров): 35 ₽ за 1 млн входных и 70 ₽ за 1 млн выходных токенов. Примеры в каталоге: GLM-4.5 — 55/220 ₽, Qwen3-235B — 17/50 ₽, Qwen3-Coder — 40/80 ₽ (ввод/вывод). Подключение — через OpenAI-совместимый API.
Наша цель — сделать цены на LLM в Cloud.ru максимально доступными в России и сопоставимыми с глобальными провайдерами. Так компании смогут брать модели в работу, тестировать их и быстро решать, внедрять ли их в продакшн.
EDP запущена в прод: данные, пайплайны и аналитика в одном контуре
Весной на конференции GoCloud команда представила ядро будущей Evolution Data Platform (EDP). Осенью платформа вышла на новый этап: Evolution Data Platform перешла в коммерческую эксплуатацию. Теперь большинство сервисов доступно для промышленного применения — от базового хранения и обработки данных до построения сложной аналитики и визуализации. Ключевое изменение — все data-сервисы разворачиваются в едином кластерном окружении на общем платформенном слое. Это снижает объём ручной интеграции, ускоряет сборку сквозных пайплайнов и, по оценке компании, даёт до 40% экономии инфраструктурных затрат за счёт автомасштабирования и автоматизации рутины.
Функциональные возможности
- Единый управляемый контур для: Evolution Managed Metastore, Spark, Trino, BI, Airflow, ArenadataDB; плюс управляемые БД и Object Storage.
- Прямая интеграция с AI Factory — данные из EDP без лишних прослоек уходят в AI-сервисы.
- Масштабируемость и отказоустойчивость за счёт базы на Kubernetes.
- Оплата по потреблению (pay-as-you-go).
Безопасность для нас — главный приоритет. Мы запустились с сертификацией для хранения персональных данных и регулярно проходим аудиты — этим занимается специальная команда. Некоторым компаниям удобнее хранить данные локально, это возможно, но обходится дороже. Оптимальная модель — гибридная: критически важные данные остаются в локальной инфраструктуре, а эластичные и пиковые нагрузки размещаются в облаке. При доверительных отношениях с провайдером действует принцип коллективной защиты: уровень безопасности повышается благодаря общим стандартам и постоянному мониторингу.
До конца 2025 года Cloud.ru планирует перевести в статус General Availability (GA) — то есть в общую коммерческую доступность для продакшена — сервисы Evolution Managed Metastore, Spark, Trino и ArenadataDB, тогда как Evolution Managed BI и Evolution Managed Airflow останутся в режиме Preview — предварительном режиме (по аналогии с другими анонсами Cloud.ru, где Preview может проходить стадии от Private к Public).
Тренды в AI: быстрый инференс и «маленькие» доменные модели
По просьбе редакции мы попросили Дмитрия Юдина назвать самые интересные и важные тренды в области AI — которые уже влияют на продуктовые команды.
Я вижу два практичных тренда.
Первый — оптимизация инференса: снижение разрядности (low-bit), цепочки обработки и, как результат, заметный прирост скорости при приемлемом качестве.
Второй — уход к Small Language Models: небольшим, доменным моделям под конкретные задачи. Они дешевле в эксплуатации и дают лучший результат в своей нише.
Логика простая: вместо одной “всеобщей” модели — несколько маленьких, каждая под свой кейс. Такой подход позволяет быстрее и экономичнее доводить решения до продакшена.
Мы также поинтересовались, как меняется подход к созданию AI-решений с точки зрения их доступности для бизнеса. Особенно актуально это для компаний, не имеющих глубоких компетенций в области машинного обучения.
Сейчас большая часть наших решений — инструменты для разработчиков, но мы целенаправленно двигаемся к продуктам, понятным и бизнес-пользователю. Идея простая: зайти в платформу, собрать из готовых инструментов свой сценарийи сразу улучшить, например, поддержку. Это особенно важно для малого и среднего бизнеса, где нет глубокой AI/ML-экспертизы.
Tproger также выяснил, в каких сферах бизнеса внедрение AI даёт наибольшую отдачу.
Когда мы говорим о внедрении AI, ключевой вопрос — в какой точке цепочки создания ценности компании он принесёт наибольший эффект. Это зависит от индустрии и зрелости процессов.
• Продажи и маркетинг: в компаниях с большим объёмом клиентов AI помогает автоматизировать рутину (чат-боты, персонализированные предложения, скоринг лидов). Здесь важно, что AI ускоряет воронку и снижает нагрузку на сотрудников.
• Операции и цепочка поставок: в производстве и ритейле приоритет — оптимизация логистики, прогнозирование спроса и управление запасами. AI может снижать издержки за счёт более точного планирования и предотвращения сбоев.
• Финансовый сектор: AI внедряют для анализа рисков, борьбы с мошенничеством и персонализированного обслуживания клиентов.
• R&D и продукт: в фарме, IT и инженерии AI используется для ускорения исследований, симуляций и генерации новых решений.
То есть внедрение AI — это не универсальный рецепт, а скорее выбор наиболее «узкого места» или наибольшего источника ценности в конкретной индустрии.
И напоследок — про сообщество
На GoCloud Tech объявили грантовую программу «Код без границ» от Cloud.ru, СберТех и Хабр для open-source проектов: четыре номинации, денежные гранты, облачные ресурсы и менторская поддержка. Для участия репозиторий должен быть на GitVerse (есть импорт «в один клик»). Сбор заявок: 3 сентября — 31 октября 2025; отбор: 1–30 ноября; итоги: декабрь 2025. Победители получат не только финансирование и инфраструктуру, но и доступ к профессиональному комьюнити — шанс ускорить развитие и найти единомышленников.
Итог. В этом году Cloud.ru связал воедино три линии — данные (EDP), модели (AI Factory и новые цены на LLM) и практику агентов («Клаудия») — плюс дал «сетевые мосты» (Magic Link и Evolution VPN). Для команд это открывает возможности быстрее переходить от эксперимента к промышленной эксплуатации,
356 открытий3К показов









