Как корпоративная стратегия
управления данными
помогает трансформации бизнеса?
TADетали
Необходимость цифровизации бизнеса все чаще подталкивает российские компании разрабатывать свою собственную стратегию управления данными. Впрочем, многим предприятиям тяжело решиться на новый подход к работе с корпоративной информацией из-за устаревшей ИТ-инфраструктуры. Что с этим делать, можно ли реализовать проект своими силами и как Data Governance помогает единению бизнеса и ИТ, помогли разобраться специалисты компании «Крок»: руководитель направления «Системы хранения данных» Владимир Колганов и эксперт практики Big Data Егор Осипов.
В чем суть методологии Data Governance
Data Governance («Управление данными») — это стратегия работы с корпоративными данными и соответствующий ей набор решений. Понимание необходимости такой методологии вырабатывалось десятилетиями, а потому программы на рынке существуют достаточно давно. В России идея набирает популярность особенно активно: многие компании достигли того уровня зрелости, при котором работа с данными становится одной из самых приоритетных задач.
Data Governance — система, которая позволяет бизнесу понять, какими активами данных он владеет, как эти данные связаны друг с другом, кто и как ими пользуется, позволяет управлять их качеством. И в идеальной картине мира вся эта информация работает на языке бизнес-терминов, — объясняет эксперт практики Big Data компании «Крок» Егор Осипов. |
Специалисты отмечают также, что востребованность Data Governance обусловлена популярностью больших данных и озер данных. При этом, если в компании уже есть правильно построенная ETL-система и грамотно организованы информационные потоки, то внедрение Data Governance не будет технологически сложным.
Data Governance как бизнес-функция в контексте цифровой трансформации
Data Governance не является некой моделью отношения к данным, использование которой гарантирует сиюминутный успех. Подтверждением этому служат компании, которые занимают лидирующие позиции в своих сегментах рынка даже при слабо развитых подходах к управлению данными. Но если предприятие намерено идти по пути цифровой трансформации, то без Data Governance обойтись будет непросто.
Впрочем, в России разговоров пока куда больше, чем реальных внедрений. Кому-то интересны только отдельные составляющие, но полноценно реализованных проектов — лишь несколько десятков.
По опыту общения с нашими заказчиками, я бы сказал, что 10% компаний уже внедрили подобные решения, 20% в данный момент их внедряют, а 30% всерьез рассматривают такую возможность. Примерно 40% не считают внедрение этих технологий приоритетной задачей в ближайшие несколько лет, — рассказывает Егор Осипов. |
Какие проблемы с данными решают решения класса Data Governance
На российском рынке многие компании действительно не всегда понимают, что им делать с тем массивом данных, который есть в их распоряжении. Аналитики выделяют три основных проблемы: проблему качества, проблему знания и проблему контроля.
Проблема качества данных, наверное, всем понятна, — говорит эксперт практики Big Data компании «Крок» Егор Осипов. — Многие компании уже внедрили у себя инструменты для управления качеством. Если говорить про проблему знаний, то если BI-система позволяет лучше понимать, что происходит с бизнесом заказчика, то Data Governance — что происходит с данными бизнеса. Это набор инструментов, с помощью которых бизнес и ИТ понимают, какие данные есть в активе предприятия, откуда они появляются, как связаны между собой, как рассчитываются, кто за них отвечает. Плюс, конечно, когда мы говорим про проблему контроля, мы должны четко понимать, кто и когда получал доступ к данным, какие данные являются чувствительными и так далее. |
Правда, зачастую бизнесу непросто решиться на внедрение Data Governance. Обычно это связано с тем, что уже существующая ETL-система и само хранилище данных строились давно и по тем методикам, которые не позволяют легко внедрить Data Governance.
Вторая сложность, с которой сталкиваются компании при принятии решения — назначение ответственных. В методологии Data Governance прописано, что все данные требуют ответственных. А ответственность мало кто любит, — отмечает Владимир Колганов, руководитель направления «Системы хранения данных» компании «Крок». — Методология не позволяет во всех ошибках сделать виноватыми ИТ-службу, потому что ее реализация требует тесного взаимодействия ИТ и бизнеса. Это большая работа, которая зачастую требует создания нового органа управления или консорциума по данным. Без такого подхода решение просто не будет грамотно реагировать на задачи бизнеса. |
Какие технологии обеспечивают управление данными
Data Governance — довольно широкий термин, и технологий при реализации стратегии используется множество. При этом сами производители часто обладают разным видением того, какие решения относить к этой стратегии. Наиболее популярны подходы компаний Informatica и Collibra, а среди ключевых программных продуктов называются Data Quality, Master Data Management, Metadata Management, Data Stewardship.
Как разработать и реализовать в компании стратегию Data Governance
Компания должна быть готова к структурным изменениям и к необходимости обновления устаревших хранилищ данных. Так как процесс этот достаточно болезненный и требует узких специалистов, то и внедрение Data Governance сложно провести исключительно своими силами. Инфраструктуру хранения данных необходимо готовить к новым вызовам совместно с проверенным технологическим партнером, который сможет провести ее корректный аудит и поможет определить, какие качественные изменения потребуются для перехода к Data Governance.
Все зависит напрямую от уровня зрелости ИТ-архитектуры, которая реализована в компании. Если она была спроектирована не по лучшим образцам, которые существуют на рынке, то системы хранилища данных будут меняться наиболее серьезно, — предостерегает Егор Осипов. — Если же она была спроектирована в соответствии с лучшими enterprise-практиками, то глобальных изменений не потребуется. Это связано с тем, что компании, которые разрабатывают продукты, также ориентируются на лучшие примеры, а не создают решения в вакууме. |
Сама работа с данными, которые стали стратегическим цифровым активом, требует от вычислительной инфраструктуры максимальной гибкости. Поэтому главной задачей CIO становится выстраивание архитектуры для производительной работы аналитики и платформ. В конечном счете это ведет к созданию новых ценностей для конечных потребителей и увеличивает прибыль. Как DevOps-сервис помогает «разгрузить» высоконагруженные системы BPMSoft
Например, Data Governance подразумевает создание единой виртуальной среды для работы с данными. Для этого необходимы правильно выстроенные мощности, объединяющие производительные вычислительные платформы для больших массивов информации, СХД для архивных данных, накопители для хранения горячих данных и быстрого доступа к ним в любой момент времени.
С учетом этой потребности, мы предложили рынку специальный подход — «умное хранение данных», — рассказывает Владимир Колганов. — Он предусматривает разделение данных на горячие и холодные, и позволяет разграничить их в зависимости от частоты использования. Горячие данные эффективно размещаются на производительных носителях, например, all-flash-массивах. А холодные хранятся на медленных СХД. Это позволяет не только снизить расходы на инфраструктуру для хранения данных, но и сбалансировать управление ими в ходе оптимизации процессов принятия решений. |
Уже после создания готовой к переходу на Data Governance вычислительной инфраструктуры, директор по данным (CDO) будет решать, где хранить данные. Это можно делать внутри компании, а можно передать на аутсорсинг в ЦОД или облако. Попутно может быть создана архитектура для любой платформы, например, с помощью модели HaaS (Hardware-as-a-Service) – набирающего популярность варианта аутсорсинга вычислительных ресурсов. Оборудование в необходимой для этого конфигурации может арендоваться и размещаться в коммерческом ЦОДе без капитальных затрат. Эксперты считают, что это сделает переход к Data Governance более мягким и экономически обоснованным.
Какие проекты реализованы в России
Многие российские компании начинают готовить инфраструктуру и переходить к Data Governance, реализуя проекты отдельными блоками. Например, для крупной компании из сектора массовых пассажирских перевозок специалисты «Крока» реализовали проект по созданию предметно-ориентированной базы данных (ПОИБД).
Она собирает информацию о продажах билетов и доходах от перевозок, а также помогает получать гибко настраиваемую аналитику по сотням атрибутов с помощью больших данных, — приводит пример Владимир Колганов. — А в проекте по оптимизации хранилища данных для федеральной страховой компании «Крок» помог ускорить обработку данных и перенести на платформу с новой архитектурой более 10 ТБ архивных данных, необходимых для развития страховых продуктов. Сократив время построения отчетности в 150 раз, страховая компания может оперативно анализировать состояние бизнеса, быстро выводить на рынок новые продукты и услуги, использовать данные для развития отношений с клиентами. |