Baum AI

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Baum Inform (Баум-Информ)
Технологии: Big Data,  Data Mining

Основные статьи:

Как работают российские AI-решения для разных отраслей. Обзор комплекса BAUM AI

Любой информационный след, который оставляет оборудование, человек или система, можно фиксировать и сохранять. Эта информация представляет ценность, т.к. чаще всего искусственный интеллект обучается на исторических данных. Чем длиннее «хвост» данных, тем больше точность ИИ при решении задач. Компания «Баум-Информ» разработала программно-технический комплекс BAUM AI, который может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика.

Комплекс BAUM AI может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика

Что собой представляет BAUM AI

Это симбиоз систем хранения данных, вычислительных процессоров Nvidia (в планах — совместимость с процессорами «Модуль» и IVA) и софта собственной разработки. Комплекс позволяет создавать, обучать или использовать предобученные модели искусственного интеллекта без необходимости прямого кодирования по принципу drag n drop. BAUM AI оснащен интуитивно-понятным графическим интерфейсов (GUI).Как с помощью EvaProject и EvaWiki построить прозрачную бесшовную среду для успешной работы крупного холдинга

Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании Крок:

«
Особенность решения в том, что его аппаратная часть может размещаться на ИТ-оборудовании российского производства. А это значит, что программно-аппаратный комплекс будет полностью удовлетворять требованиям регуляторов в области импортозамещения электроники, и его можно использовать в ходе модернизации инфраструктуры как отечественный продукт. По кодам классификации решение полностью закрывает потребности как в аппаратной части из реестра Минпромторга, так и в программном обеспечении из реестра Минцифры.
»

Какие задачи решает BAUM AI

Многие крупные корпоративные заказчики работают с двумя источниками данных — открытыми и закрытыми. К первым относится информация из интернета, полученная с помощью краулинга и парсинга. Например, научные публикации, патентная система, корпоративные сайты компаний и т.д. Закрытые данные находятся внутри доверенного периметра (корпоративная переписка, архивные чертежи, технологические карты и т.д.).

Благодаря BAUM AI заказчик может в пару кликов обратиться к данным и собрать свою модель искусственного интеллекта, провести ее обучение, верификацию и тестирование. Контроль версионности MLops поможет в навигации по моделям или в их доработке. Сбор блок-схем моделей и процессов происходит в нотации BPMN 2.0.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Должен констатировать, что технологии искусственного интеллекта уже стали обыденностью. Они позволяют анализировать любые типы данных, помогая принимать решения даже в ситуации неопределенности. Их применяют в бизнес-процессах любой сложности и любого уровня: от проектирования и производства до логистики и продвижения. Запросы на решения различных задач поступают от моторостроителей и металлургов до патентоведов и архивистов.
»

Как BAUM AI помогает промышленным предприятиям

На предприятиях теплосетей, чтобы исключить внеплановую остановку в случае подозрения на неисправность оборудования (турбин, компрессоров, генераторов, котлов и др), нужна система мониторинга. Она предоставляет предиктивную аналитику для точной оценки фактического и прогнозируемого состояния оборудования. Это необходимо, чтобы минимизировать издержки и возможные риски. Ведь, согласно исследованиям, час простоя в промышленном производстве может стоить предприятию в среднем $100 тысяч.

Система предиктивной аналитики на базе комплекса BAUM AI позволяет выполнять интеллектуальный мониторинг, сравнивать фактические показатели оборудования с математической цифровой или эталонной моделью, находить аномалии и определять вероятность выхода из строя.

Разработка системы включает в себя общение со специалистами, создание многомерной модели базы данных (логи оборудования, информация о плановых и внеплановых работах, выходе из строя и т.д.), формирование математических и цифровых эталонных моделей работы оборудования. Затем идет разработка модуля интеллектуальной обработки данных и моделей предиктивной аналитики, настройка протоколов обмена данными между всеми единицами системы.

Все модели упаковываются в блок-схемы BPMN 2.0, для пользователей настраиваются динамические Dashboard (рабочие пространства). Профильные инженеры получают доступ к логам оборудования, они могут использовать готовые модели машинного обучения и прогнозировать внештатные ситуации, принимать взвешенные решения при внеплановых остановках.

Помощь научно-производственным компаниям

Крупные научно-производственные предприятия должны быть в курсе последних трендов, знать новые перспективные материалы. Также необходимо хранить архивные документы, чертежи, технологические карты, корпоративную переписку. В этом случае компаниям требуется база знаний, которая включает в себя структурированные и неструктурированные данные из открытых и закрытых источников.

All-in-one решение BAUM AI помогает обрабатывать большие данные. Комплекс устанавливается на территории заказчика. Решение интегрируется с корпоративной поисковой системой elasticsearch, чтобы после запроса к базе знаний пользователь сразу получал доступ к продвинутой аналитике.

Как реализуется проект: готовятся модели машинного обучения и обучаются нейронные сети для определения устойчивых научных кластеров, трендов, лидеров исследований, вероятностей получения патентов, окупаемости изобретения, анализа источников информации и авторов, сравнения текущих технологических процессов и вновь создаваемых и т.д.

Как итог: пользователи BAUM AI могут работать в трех плоскостях — интеллектуальная научная «разведка», продвинутая аналитика данных, решение узкоспециализированных задач, связанных с подбором и анализом материалов и их актуальности.

Помощь телекому

Производители систем хранения данных часто сталкиваются с поломкой дисков. Нужно решение, которое на ранней стадии спрогнозирует выход из строя или критическое состояние элементов системы.

BAUM AI способна определять сценарии, которые предшествуют выходу из строя, а также прогнозировать ключевые параметры. При этом могут быть сформированы рекомендации по профилактическим работам.

Для начала специалисты «Баум-Информ» вместе с инженерами формируют перечень анализируемых данных. Затем организуют дополнительный учет планового и внепланового обслуживания с созданием временных меток для каждого события.

Учет всех показателей системы хранения у заказчика ведется в PostgreSQL. «Баум-Информ» разрабатывает и настраивает буферную зону, получающую основной пакет анализируемых показателей.

Логика работы системы предиктивной аналитики выглядит следующим образом:

  • Данные из Zabbix (public.history_log) отправляются в модуль подкачки данных. В последнем хранится необходимое количество данных для работоспособности моделей ИИ. Данные разделяются на кластеры (Hardware, Configuration, Capacity, Performance).
  • Информация отправляется в модуль обработки входных данных. Она проходит нормализацию и стандартизацию (при необходимости).
  • Модуль содержит сохраненные натренированные модели. Все они были созданы с использованием блок-схем BPMN 2.0, по принципу drag n drop. В предиктиве участвуют обученные авторегрессионные модели, рекуррентные и свёрточные нейронные сети.
  • Нормализованные данные проходят через натренированные модели (в соответствии с кластерами).
  • В случае срабатывания какого-либо сценария создается подпись, отправляется в статистику, и запускается сценарий (замена диска, рекомендация обновления и т.д).

При работе с GUI пользователь видит основную информацию о работе предиктивной системы:

  • Статистика отображает количество отработанных часов, сработавших сценариев, новых подписей и т.д. (можно подобрать наиболее важные параметры).
  • Текущее состояние дублирует основные показатели с Zabbix в части анализируемых атрибутов.
  • Прогноз отражает необходимость замены оборудования, риск выхода из строя элементов, рекомендации по установке обновления

В результате система функционирует в штатном режиме, как отдельно приложение к общей системе мониторинга СХД. Благодаря искусственному интеллекту, инженеры могут на ранней стадии приступить к минимизации рисков ущерба или выхода из строя оборудования, а также своевременно выполнить работы, связанные с безопасностью системы в целом.

Помощь финтеху

Крупные платежные системы сталкиваются с трудностями в определении мошеннических операций в транзакциях. Решение — применение модели машинного обучения, позволяющей с высокой точностью находить мошеннические транзакции.

«Баум-Информ» использует подход, связанный с созданием новых синтетических агрегированных признаков. Они позволяют увидеть мошеннические операции в гипертрофированном виде.

Специалисты компании находят главные признаки, которые характеризуют мошеннические операции, и подбирают алгоритмы машинного обучения. При разработке учитывается как обучение с учителем, когда алгоритму показывают, какие операции являются мошенническими, так и обучение без учителя, когда алгоритм обучается, не зная, как выглядят мошеннические транзакции.

В BAUM AI размещается датасет, разворачивается кластер, настраиваются spark-сессии, позволяющие выполнять распределенные вычисления. Данные проходят нормализацию, выполняется интеллектуальное заполнение пропущенных значений в транзакциях.

Для создания моделей разрабатываются блок-схемы BPMN 2.0. Далее они drag n drop методом помещаются в конструктор ИИ, обучаются, потом снимаются метрики. Совместно с представителями заказчика проводится валидация и A/B тестирование обученных моделей.

В итоге модель обеспечивает точность до 98% при определении мошеннических операций.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Мы очень прагматично смотрим на применение искусственного интеллекта в любой области. Прежде чем приступить к реализации проекта, нужно обсудить все детали, включая ожидания заказчика, чтобы понять, действительно ли для решения бизнес-задач нужен искусственный интеллект. Далее следует выдвинуть гипотезу и договориться о том, как ее проверять, и уже потом проектировать решение. И еще важно подчеркнуть: я бы не рекомендовал планировать применение конкретных концепций на перспективу более одного-двух лет. Технологии развиваются очень быстро, и быть всегда в тренде позволяет только agile-подход.
»


Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании КРОК:

«
На внедрение полноценного решения потребуется от полугода до года, в ряде случаев чуть больше. Все, безусловно, зависит от задач, которые сильно сказываются на объемах работы. Если говорить поэтапно, то на проверку гипотезы, как правило требуется от пары недель до месяца, на разработку пилота и запуск минимально жизнеспособного продукта (MVP) - от трех месяцев до полугода.
»



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  БизнесАвтоматика НПЦ (120)
  Инфосистемы Джет (13)
  Сбербанк (10)
  Marketing Logic (Маркетинг Лоджик) (9)
  Другие (623)

  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Сапиенс солюшнс (Sapiens solutions) (2)
  Сбербанк (2)
  IPavlov (Айпавлов) (2)
  Другие (48)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Московский центр инновационных технологий в здравоохранении (2)
  Платформа больших данных (Platforma) (2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
  Другие (57)

  БизнесАвтоматика НПЦ (5)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (62)

  БизнесАвтоматика НПЦ (8)
  Синимекс (Cinimex) (2)
  Университет Иннополис (2)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Мобильные ТелеСистемы (МТС) (2)
  Другие (56)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
  БизнесАвтоматика НПЦ (2, 119)
  Полиматика (Polymatica) (4, 15)
  SL Soft (СЛ Софт) (4, 15)
  Oracle (12, 14)
  Другие (307, 171)

  БизнесАвтоматика НПЦ (1, 3)
  Dell EMC (1, 2)
  Полиматика (Polymatica) (1, 2)
  SL Soft (СЛ Софт) (1, 2)
  Informatica (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 12)
  Сбербанк (2, 2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (1, 2)
  К-Скай (K-SkAI) (1, 2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  Другие (14, 16)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (2, 2)
  Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  Полиматика (Polymatica) (1, 2)
  Другие (15, 18)

  БизнесАвтоматика НПЦ (1, 7)
  SL Soft (СЛ Софт) (3, 4)
  Полиматика (Polymatica) (3, 4)
  Rubbles (Раблз) (1, 2)
  Exodrive (Экзодрайв) (1, 1)
  Другие (8, 8)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 119
  Polymatica Analytics Аналитическая платформа - 13
  IBM SPSS Decision Management - 10
  Loginom Аналитическая платформа - 10
  Другие 160

  Visary BI Платформа бизнес-аналитики - 3
  EMC Greenplum Data Computing Appliance - 2
  Polymatica Analytics Аналитическая платформа - 2
  Loginom Аналитическая платформа - 1
  IBM SPSS Decision Management - 1
  Другие 5

  Visary BI Платформа бизнес-аналитики - 12
  Platforma и HFLabs: Технология безопасного метчинга данных - 2
  Webiomed - Платформа предиктивной аналитики и управления рисками в здравоохранении на основе машинного обучения - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  Loginom Аналитическая платформа - 2
  Другие 11

  Visary BI Платформа бизнес-аналитики - 5
  ЦРТ: Speech Analytics Lab - 2
  Polymatica Analytics Аналитическая платформа - 2
  PIX Process Management (PIX Процессы) - 2
  CM.Expert Data Mining платформа - 2
  Другие 14

  Visary BI Платформа бизнес-аналитики - 7
  Rubbles Customer Insight - 2
  Polymatica Analytics Аналитическая платформа - 2
  Систематика: Optimining (ранее СвойРМ) - 1
  МТС DataOps Platform - 1
  Другие 5

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (120)
  Большая Тройка (46)
  Умная Логистика (14)
  Сбербанк (14)
  Доверенная среда (13)
  Другие (467)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Другие (54)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Московский центр инновационных технологий в здравоохранении (2)
  Сбербанк (2)
  Другие (44)

  БизнесАвтоматика НПЦ (5)
  РИР (Росатом Инфраструктурные решения) (3)
  Инфосистемы Джет (2)
  Marketing Logic (Маркетинг Лоджик) (2)
  Яндекс.Облако (Yandex Cloud) (2)
  Другие (63)

  БизнесАвтоматика НПЦ (8)
  Синимекс (Cinimex) (2)
  Университет Иннополис (2)
  Rocket Group (Рокет Групп) (2)
  Наносемантика (Nanosemantics Lab) (2)
  Другие (63)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 119)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Доверенная среда (1, 13)
  Цифра (2, 10)
  Другие (259, 127)

  Доверенная среда (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 12)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Yabbi (Ябби) (1, 1)
  Другие (7, 7)

  БизнесАвтоматика НПЦ (1, 5)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  CM.Expert (АвтоЭксперт) (1, 2)
  Датакаталог (1, 2)
  Цифра (1, 2)
  Другие (14, 14)

  БизнесАвтоматика НПЦ (1, 7)
  Сбербанк (2, 2)
  Датакаталог (1, 2)
  СПбГУ ИТМО (Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики) (1, 2)
  Цифра (1, 2)
  Другие (14, 16)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 119
  Большая Тройка: АИС Редактор территориальных схем - 39
  Доверенная среда: Триафлай BI-платформа - 13
  ZIIoT Платформа для работы с промышленными данными - 10
  Luxms BI - 8
  Другие 128

  Доверенная среда: Триафлай BI-платформа - 5
  ZIIoT Платформа для работы с промышленными данными - 4
  Visary BI Платформа бизнес-аналитики - 3
  Большая Тройка: АИС Редактор территориальных схем - 2
  EMC Greenplum Data Computing Appliance - 2
  Другие 10

  Visary BI Платформа бизнес-аналитики - 12
  Росатом Цифровое теплоснабжение - 2
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  Yabbi Smart Panel (YSP) - 1
  N3.Аналитика - 1
  Другие 6

  Visary BI Платформа бизнес-аналитики - 5
  Arenadata Catalog - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Росатом Цифровое теплоснабжение - 2
  CM.Expert Data Mining платформа - 2
  Другие 15

  Visary BI Платформа бизнес-аналитики - 7
  Rocket Group: rTIM Платформа генеративного дизайна территорий - 2
  Luxms BI - 2
  Arenadata Catalog - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Другие 11