Cloud.ru: Evolution ML Inference

Продукт
Разработчики: Cloud.ru (Облачные технологии) ранее SberCloud
Дата премьеры системы: 2025/04/17
Технологии: IaaS - Инфраструктура как услуга

Основная статья: Что такое IaaS

2025: Представление Evolution ML Inference

Cloud.ru 17 апреля 2025 года представил Evolution ML Inference – готовый облачный сервис для инференса (вывода) больших языковых моделей (LLM) с возможностью разделения графических процессоров (GPU) и гибким подходом к утилизации вычислительных ресурсов. Помимо уже доступных в рамках сервиса Cloud.ru моделей GigaChat бизнес может запускать и развертывать собственные AI-модели и любые ML/DL open source модели из библиотеки Hugging Face на базе облачных GPU в несколько кликов. Сервис уже доступен для пользователей в режиме General availability и войдет в состав Cloud.ru Evolution AI Factory – готового набора инструментов для работы с AI в облаке.

Evolution ML Inference подойдет для компаний и пользователей, которые разрабатывают AI- и ML-решения и хотят быстро и с минимальными затратами запустить собственную ML-модель и персональный конечный продукт для работы. Это полностью управляемый сервис – пользователь только настраивает конфигурацию, модель и тип масштабирования. При этом Cloud.ru предоставляет доступ к мощным графическим процессорам, а также выполняет полное администрирование и обслуживание инфраструктуры.

Ключевые преимущества сервиса:

  • Shared GPU – технология позволяет разделять GPU-ресурсы и потреблять то количество vRAM (видеопамяти), которое необходимо для эффективной работы самой модели без задержек, с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей клиентов. Это повышает утилизацию мощностей в AI-проектах от 15 до 45% в сравнении со сценарием, когда графические процессоры используется полностью.
  • Простота и гибкость управления сервисом дают возможность, как запускать модели без необходимости сборки образа напрямую из Hugging Face, так и запускать собственные образы со своим окружением.
  • Решение обеспечивает высокую степень адаптации и рациональное использование доступных ресурсов: на одной видеокарте можно одновременно запускать несколько моделей. Это делает технологию наиболее оптимальной для распределенных систем с разнородной вычислительной инфраструктурой и помогает эффективно масштабировать нагрузку.
  • Режим скайлирования (эффективного масштабирования) – тарификация за использование модели начинается только в момент обращения к ней.

«
По нашим оценкам около 70% пользователей загружают GPU-ресурсы, зарезервированные под инференс в процессе эксплуатации ML-моделей, менее чем на 55%. При внедрении AI в большинстве случаев базой становится именно среда исполнения модели. Поэтому для получения экономии ресурсов и оптимизации затрат в ходе использовании технологий искусственного интеллекта, особенно GenAI, необходима производительная инфраструктура с гибким масштабированием в реальном времени,
сказал Евгений Колбин, генеральный директор провайдера облачных и AI-технологий Cloud.ru.
»

Глубоко изучив потребности клиентов и наиболее популярные запросы на инфраструктуру и сервисы для AI, мы представили рынку первый управляемый облачный сервис для инференса LLM. С его помощью бизнес может эффективно управлять вычислительными ресурсами в среде с высокой интенсивностью обработки данных. Благодаря размещению Evolution ML Inference в облаке компании могут упростить доступ к AI и сделать использование AI-инструментов проще и удобнее.



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Cloud4Y (ООО Флекс) (250)
  ITglobal.com (ИТглобалком Рус) (88)
  Т1 Интеграция (ранее Техносерв) (80)
  Softline (Софтлайн) (59)
  ИТ-Град (IT-Grad) Энтерпрайз Клауд (Enterprise Cloud) (56)
  Другие (846)

  Cloud4Y (ООО Флекс) (17)
  ITglobal.com (ИТглобалком Рус) (17)
  Яндекс.Облако (Yandex Cloud) (7)
  Мобильные ТелеСистемы (МТС) (6)
  Softline (Софтлайн) (5)
  Другие (36)

  Cloud4Y (ООО Флекс) (34)
  ITglobal.com (ИТглобалком Рус) (15)
  Яндекс.Облако (Yandex Cloud) (9)
  Мобильные ТелеСистемы (МТС) (8)
  Robin (Робин) (3)
  Другие (45)

  Cloud4Y (ООО Флекс) (21)
  Яндекс.Облако (Yandex Cloud) (6)
  Reg.ru (Рег.ру Домены Хостинг РДХ) (6)
  Нубес (Nubes) (5)
  Timeweb Cloud (Таймвэб.Клауд) (5)
  Другие (45)

  Cloud4Y (ООО Флекс) (3)
  ITglobal.com (ИТглобалком Рус) (1)
  MTS Web Services, MWS (МТС Веб Сервисы, МВС) (1)
  VK Tech (ВК Технологии) (1)
  К2 Тех (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Cloud4Y (ООО Флекс) (7, 252)
  Microsoft (24, 117)
  ITglobal.com (ИТглобалком Рус) (8, 94)
  Т1 Облако (Т1Клауд) ранее T1 Cloud (2, 87)
  Т1 Интеграция (ранее Техносерв) (1, 87)
  Другие (472, 877)

  ITglobal.com (ИТглобалком Рус) (2, 18)
  Cloud4Y (ООО Флекс) (2, 17)
  Яндекс.Облако (Yandex Cloud) (2, 11)
  Мобильные ТелеСистемы (МТС) (1, 7)
  VK Tech (ВК Технологии) (1, 6)
  Другие (19, 33)

  Cloud4Y (ООО Флекс) (3, 34)
  ITglobal.com (ИТглобалком Рус) (3, 18)
  Яндекс.Облако (Yandex Cloud) (2, 14)
  Мобильные ТелеСистемы (МТС) (1, 10)
  Softline (Софтлайн) (3, 4)
  Другие (24, 46)

  Cloud4Y (ООО Флекс) (3, 20)
  Яндекс.Облако (Yandex Cloud) (2, 11)
  Softline (Софтлайн) (4, 6)
  Reg.ru (Рег.ру Домены Хостинг РДХ) (1, 6)
  Нубес (Nubes) (1, 5)
  Другие (31, 48)

  Cloud4Y (ООО Флекс) (3, 3)
  MTS Web Services, MWS (МТС Веб Сервисы, МВС) (1, 1)
  К2 Тех (1, 1)
  Мастер-интеграция (Мастер-Технология) mClouds.ru (1, 1)
  ITglobal.com (ИТглобалком Рус) (1, 1)
  Другие (4, 4)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Cloud4Y IaaS - 205
  Microsoft Azure - 93
  Т1 Облако (ранее T1 Cloud) - 87
  ITglobal.com: Публичное облако - 84
  IT-Grad Cloud IaaS - 65
  Другие 793

  ITglobal.com: Публичное облако - 17
  Cloud4Y IaaS - 15
  Yandex Cloud Услуги виртуальной вычислительной инфраструктуры - 9
  CloudMTS - 7
  VK Cloud Универсальная облачная платформа для развития цифровых сервисов (ранее VK Cloud Solutions) - 6
  Другие 29

  Cloud4Y IaaS - 24
  ITglobal.com: Публичное облако - 14
  Yandex Cloud Услуги виртуальной вычислительной инфраструктуры - 13
  CloudMTS - 10
  Cloud4Y Корпоративная облачная почта - 7
  Другие 42

  Cloud4Y IaaS - 17
  Yandex Cloud Услуги виртуальной вычислительной инфраструктуры - 10
  Рег.облако - 6
  Nubes NGcloud - 5
  Timeweb Cloud Облачная платформа - 5
  Другие 39

  МегаФон Облако - 1
  VK Cloud Универсальная облачная платформа для развития цифровых сервисов (ранее VK Cloud Solutions) - 1
  MClouds Облачная платформа для бизнеса - 1
  ITglobal.com: Публичное облако - 1
  Cloud4Y Корпоративная облачная почта - 1
  Другие 6