Интервью TAdviser: Вячеслав Яшкин, Ак Барс Банк - об успешной миграции КХД в интерьере импортозамещения
Современный банк всегда находится в состоянии постоянного развития. Так, Ак Барс Банк вышел на новый уровень взаимодействия с клиентами, в основе которого – качественная клиентская аналитика и новые технические возможности банка. Очередному этапу развития отвечает новая стратегия развития банковского бизнеса, включающая, в том числе задачу импортозамещения. О том, как Ак Барс Банк осуществил миграцию корпоративного хранилища данных на фоне активной реализации стратегии цифровой трансформации, рассказал Вячеслав Яшкин, директор по информационной безопасности и управлению данными Ак Барс Банка.
Банк «Ак Барс» относится к числу продвинутых организаций в плане перехода к концепции data driven бизнеса. Корпоративная стратегия управления данными и соответствующий штат появились еще в 2014 г. В таких условиях смена корпоративного хранилища банка – весьма непростой проект. Какие события привели к такому серьезному решению?
ВЯЧЕСЛАВ ЯШКИН: Сложность ситуации определял целый ряд факторов. Во-первых, банк, действительно, активно занимается цифровой трансформацией, и управление данными как стратегическое направление было выбрано давно. Вот только реализовать его в полном объеме непросто. Людей не хватает — когда я пришел в банк на нынешнюю позицию – это случилось в 2018 г. — у меня в подчинении было семь (!) человек. Во-вторых, то направление, которое у нас занимается управлением данными, только за время моей работы пережило уже четыре смены руководителя офиса управления данными. И это несмотря на то, что мы выстраиваем деятельность по управлению данными на основе международной признанной методики DAMA DMBOK. Это книга, написанная экспертами Международной ассоциации управления данными (DAMA), представляет собой, пожалуй, наиболее полное и актуальное введение в дисциплину управления данными с обзором лучших практик.
Так вот, в этой книге хорошо описаны методические подходы к управлению данными на предприятии – буквально «Делай раз, делай два, делай три». Загвоздка в том, что понимание, КАК это реализовать всегда уникально для каждой организации, сильно зависит от ее специфики. Кстати, про меня тоже думали, что я долго не задержусь на своей позиции. Но мне удалось направить ситуацию в позитивное русло.
В-третьих, управление данными – это не ИТ. Это понимают далеко не все руководители этого направления, тем более, это сложно осознать людям из бизнес-направлений – еще не так давно они нас воспринимали исключительно, как технологическое направление, которое обеспечивает работу КХД (корпоративного хранилища данных).Как DevOps-сервис помогает «разгрузить» высоконагруженные системы BPMSoft
Вроде бы, простая вещь – корпоративный глоссарий, но как подчас трудно бизнес-сотрудникам понять, что вносить данные в глоссарий нужно, чтобы они были переиспользованы, что нужно оформлять заявки во внутрикорпоративных коммуникациях, ведь это сервисная модель и т.д.
И на этом фоне возник четвертый аспект – проблемы с масштабированием работающего решения на базе программно-аппаратных комплексов для хранения и анализа данных IBM Netezza. Самая большая сложность была с интеграциями информационных систем. У нас в банке работает больше 600 ИТ-систем, половина из них — это системы, так или иначе связанные с бизнесом, причем около 60 – ИТ-решения уровня mission critical. Когда мне досталось это хранилище, с ним было интегрировано 5-6 систем: блок CRM, зарплатные клиенты и т.д. Но темпы цифровизации банка требовали радикального увеличения количества интеграций, потому что аналитические системы работают на данных КХД, и качество аналитических результатов напрямую зависит от количества подключенных систем. И получить это бизнес хотел, естественно, в предельно сжатые сроки.
У решения IBM оказались проблемы с масштабированием?
ВЯЧЕСЛАВ ЯШКИН: В 2019 г. корпорация IBM свернула бизнес Netezza, а клиентам предложила переход на другое решение — Integrated Analytics System. Причем, за время эксплуатации классического хранилища IBM очень сильно изменился ландшафт и объем данных, с которыми работает банк. И получилось так, что для дальнейшего развития хранилища нужно было либо покупать второй мэйнфрейм либо мигрировать на решение IBM другой архитектуры, не мэйнфрейм, с поддержкой СУБД DB2. Правда, сами инженеры IBM не могли уверенно говорить о легкой и прозрачной миграции на новое решение.
Таким образом, гибкости миграции вендор обещать не мог, а затраты времени и финансовых ресурсов были весьма существенными. К тому же на тот момент у нас еще не было выстроено управление данными, и «ценник» развития в стиле IBM был очень велик. И мы решили искать вариант перехода на более гибкое решение, которое позволило бы легко наращивать ИТ-мощности на базе типовых серверов и таким образом развивать хранилище.
Требование импортозамещения было в списке критериев?
ВЯЧЕСЛАВ ЯШКИН: Импортозамещение в данном случае стало, скажем так, вишенкой на торте. Мы составили больший список критериев выбора, включая скорость работы, отказоустойчивость, масштабируемость, гибкость, легкость перехода с текущего решения на новое. Лидерами списка кандидатов стали: аналитическое хранилище данных Vertica и массово-параллельная СУБД для хранилищ данных Greenplum на основе PostgreSQL, причем в разных вариантах: open-source Greenplum, Pivotal и Arenadata. Решения IBM тоже рассматривали в качестве кандидадов для миграции.
Решения из группы лидеров сильно различались?
ВЯЧЕСЛАВ ЯШКИН: Да, различия были существенными. Так, Vertica была явно хуже, с точки зрения миграции данных, то есть мы могли сильно потерять на переписывании данных. Так, решение Pivotal не обеспечивало функциональность мониторинга и восстановления после сбоев, которые нам были нужны. Семейство Greenplum в целом, больше подходило для наших задач, в силу того что логика СУБД PostgreSQL обеспечивала большую легкость миграции данных. Но мы провели детальное сравнительное тестирование с большим количеством разнообразных параметров. Я не жалею, что потратили на тестирование архитектуры КХД целый квартал, — это позволило нам сделать обоснованный выбор в пользу отечественного решения Arenadata.
Некоторые вещи, которые были нам нужны, были реализованы только в Arenadata. Кроме того, Arenadata – лучшее решение, с точки зрения доступности разработчиков для доработки решения под наши специфические требования, если возникнет такая необходимость. От СПО варианта Greenplum отказались, потому что ставить полностью open source решение на продуктивную среду – достаточно рискованная затея, особенно, при нашей численности команды. В частности, по этой причине для нас имело высокую ценность наличие дополнительных модулей Arenadata, расширяющих функционал мониторинга, восстановления, отказоустойчивости.
Как это решение выглядит, с точки зрения «железа»?
ВЯЧЕСЛАВ ЯШКИН: С позиций масштабируемости, естественно, плюсы на стороне программного решения: мы не привязаны к какому-либо «железу». У банка – свой ЦОД. Буквально месяц назад полностью завершился перенос туда абсолютно всех банковских систем. Если нам необходимо увеличение мощностей, ИТ-департамент просто масштабирует типовые сервера, и мы переиспользуем имеющиеся мощности. Более того, можно в цифрах бизнесу показать, сколько ресурсов мы потребляем, и какой результат при этом приносим.
Вариант остаться на старой модели на оборудовании IBM означал, что в этой ситуации пришлось бы докупать новые мэйнфреймы, лицензии, а политика лицензирования IBM вообще очень непростая - все стоимости растут экспоненциально. А с Arenadata выгод в плане прозрачности ценообразования намного больше.
В каком состоянии сейчас находится проект миграции КХД?
ВЯЧЕСЛАВ ЯШКИН: В январе коллеги выключили рубильник на старом хранилище, и с этого момента мы работаем полностью в новом КХД. К этому времени была разработана корпоративная модель данных, она запущена в полномасштабную работу на новом хранилище.
Для технического перехода на новое хранилище приходилось останавливать бизнес-процессы?
ВЯЧЕСЛАВ ЯШКИН: Если я скажу, что совсем не прерывали, мне вряд ли поверят. Скорее, снижали активность тех или иных задач. Просили коллег проявить понимание, что в таких задачах увеличивалось время поставки данных из хранилища. Но по большей части, переход на новое хранилище происходил практически бесшовно. Работа все время продолжалась. За это время мы успели интегрировать еще ряд систем, и они были добавлены в новое КХД.
А старый мэйнфрейм?
ВЯЧЕСЛАВ ЯШКИН: Слишком расточительно допустить, чтобы такой ресурс полностью выбывал из работы. Решаем вопрос относительно его переиспользования, например, в качестве второго хранилища для задач тестирования.
Новое хранилище заступило на боевое дежурство. Какие задачи теперь у вас на повестке дня?
ВЯЧЕСЛАВ ЯШКИН: Много задач ждут своего решения. Большой пласт работ – дальнейшие информационные интеграции. На настоящий момент интегрировано порядка двух десятков систем. Предполагается дальнейшее развитие в нынешнем году.
Как я уже упоминал, мы вышли на следующий виток развития в части переиспользования данных. Это достаточно сложный процесс. Потому что технологии тяжелые, за ними стоит много взаимозависимостей, хотя по факту они называются очень просто — сервисная модель ИТ. Это достаточно близко к тому, что, например, во фреймворке ITIL прописывают в части работы с ИТ-ландшафтом.
Что в этом составляет главную сложность?
ВЯЧЕСЛАВ ЯШКИН: Простым языком объяснять бизнесу, что именно мы от них хотим, и какую пользу они от этого получают. Поэтому в течение этого года мы серьезно занялись методологией, просвещением, обучением. Почему это непросто? Речь ведь идет не об аналитике Big Data, где мы используем фактически все доступные данные. Бизнес-сотрудники работают в своих прикладных системах, и для их задач нужно забирать из хранилища только конкретные атрибуты, возможно, предварительно что-то рассчитать или, наоборот, разбирать данные на составные части и т.д.
При этом бизнесу далеко не всегда понятно, почему мы не можем эти расчеты делать на продуктовых системах в «боевой» базе. Например, рассчитать на большой выборке, сколько у нас приросло клиентов, или провести на ней некоторую событийную аналитику, скажем, посчитать, у какого количества клиентов родился ребенок, а сколько клиентов вышло на пенсию. Мы не можем запускать подобные запросы на обработку в боевые системы, поскольку это вызовет увеличение их нагрузки, а они работают, в первую очередь, в интересах клиента, который вошел в Личный кабинет поработать со своими данными.
Собственно, для этого мы и строим хранилище, в котором можно делать такую аналитику, причем практически в реальном времени. Но для этого нужно получить от бизнес-подразделений их бизнес-требования к аналитическим данным. Это всегда непросто, в любых компаниях.
Как Вы представляете себе идеальную модель обработки данных в КХД?
ВЯЧЕСЛАВ ЯШКИН: С нового года у нас начинается новый стратегический цикл развития на следующие пять лет. Ему соответствует функциональная стратегия на пять лет. Одна из существенных задач ближайшего будущего – обеспечить существенную масштабируемость, как розничного бизнеса, так и корпоративного, и научиться выстраивать результативные отношения с клиентами. Таким образом, розничному бизнесу мы должны помочь находить в данных корпоративного хранилища бизнес-инсайты с помощью инструментов BI-аналитики (сейчас у нас используется Tableau). Цель – обеспечить им работу в формате self-сервиса, чтобы они могли самостоятельно искать эти инсайты для себя.
Для корпоративного бизнеса мы хотим реализовать доставку инсайтов с розничного рынка, чтобы помочь им в формировании собственных инсайтов. Иными словами, мы целенаправленно движемся в сторону полноценного управления корпоративными данными Data Governance.
Вы проводите измерения цифровой зрелости банка?
ВЯЧЕСЛАВ ЯШКИН: Да, конечно. Мы используем международную методику - модель оценки возможностей управления данными DCAM (Data Management Capability Assessment Model). Мы ставим задачу прирасти по уровням зрелости DCAM. По многим пунктам у нас сейчас уровень 1 – 2, нужно подняться до 4 – 5 уровня за предстоящую пятилетку. Это амбициозная цель, но по многим аспектам мы хотим не только дозреть до автоматизации, скажем, четвертого уровня, но и хотя бы один год прожить на этом уровне, и еще что-то улучшить.
Это подразумевает очень большую работу по каждому направлению: включает в себя такие тематики, как стратегия управления данными, процессы управления данными, блок мастер-данных и нормативно-справочной информации, архитектура, качество данных, операционное управление, безопасность, собственно хранилище — отдельный блок, а также управление мета-данными.
Уровень мета-данных в каком-то виде уже реализован?
ВЯЧЕСЛАВ ЯШКИН: По этому направлению мы в самом начале пути. Для нас это задача приблизительно на ближайшие полгода. Сейчас есть инструмент, предназначенный для ИТ-специалистов. Например, он помогает реализовать связанность терминов для глоссария и с этой целью информация раскладывается по мета-данным. Правда, пока нет работы с мета-данными на уровне бизнеса.
Реализовать это очень заманчиво. Сейчас думаем, как это эффективно сделать. Одно точно понятно: невозможно сделать такой объем работы силами конкретного подразделения, пусть даже в нем работает не семь человек, как раньше, а гораздо больше.
А как? Пригласить аутсорсера?
ВЯЧЕСЛАВ ЯШКИН: Нет. У меня цель: в решение этой задачи должен быть вовлечен весь банк. И вот реально сможет появиться новая ценность мета-данных для сотрудников. Собственно, именно с этим мы сейчас и работаем – над тем, чтобы появились роли людей, а не просто какой-то выделенный центр, который все это выполнит по запросу бизнеса. Это командная игра. Невозможно просто посадить группу аналитиков или технарей, чтобы они создали красивые инструменты для бизнеса, совершенно не вовлекая в это сам бизнес. Так что очень радует, что бизнес включается в эту командную игру. Например, у нас появился новый зампред по розничному бизнесу, и он внимательно изучает методику DAMA DMBOK – очень заинтересован в этой тематике.
Сегодня для этих целей мы используем популярный BI-инструмент – Tableau. Мы его запускаем не только для получения красивой картинки: каждый термин подлежит определению, а определение, в свою очередь, складывается во внутреннюю википедию. Это достаточно простой инструмент, временный. Когда-нибудь в будущем перейдем к полноценному инструменту. Но сегодня радует, что люди вовлекаются в работу с глоссарием, записывают определения, понимают значения терминов и т.д.
И вот уже появляется новая роль – пока условно она обозначена как CDO блока розницы. Это тот человек, который отвечает именно за управление данными в своем блоке, который понимает, какая аналитика может быть построена на них и т.д. Если в целом говорить о той ценности, которую приносит банку КХД, то с прошлых времен такой ценностью является умение считать главный KPI – активных клиентов банка. Этот показатель рассчитывается только в хранилище, и это, в частности, определяет его достоверность. Дальше мы начали развивать аналитику данных и мета-данные. В настоящее время идем в сторону более крупных сущностей для предоставления отчетности, скажем, для Банка России.
Финансовый регулятор сегодня разворачивается в сторону data-центричных хранилищ данных. Как вы относитесь к такому прямому обмену данными с регулятором?
ВЯЧЕСЛАВ ЯШКИН: Хорошая и правильная идея! Но, думаю, уровень зрелости многих банков пока еще отстает от такого формата. На профильных конференциях в этом году не раз обсуждалась эта теме. Потребность регулятора понятна, да, и бизнес тоже хочет как можно быстрее получать данные, чтобы были качественными и не нуждались в дополнительной проверке. Последние проверки банковского сектора со стороны ЦБ РФ показали, что многие процессы пока еще не дозрели до поддержки таких форматов взаимодействий – прямого обмена данными. Так что эта тенденция — правильная, вопрос только в том, как с этим справиться, ведь на рынке у нас ощущается большой дефицит высокопрофессиональных экспертов.
Все эти события в области управления данными, наверное, опять потребовали изменений в оргштатной структуре Вашего направления?
ВЯЧЕСЛАВ ЯШКИН: В конце прошлого года мы произвели полное изменение штатной структуры. Оно было нужно, так как ИТ отдельно не управляло тематикой хранилища, и нам нужен был свой технический блок. Тогда у нас появилось четыре блока: Центр платформ управления данными (это центр ИТ-компетенций), Центр компетенций по хранилищу (это больше разработка и системный анализ архитектуры), блок архитектуры данных и BI-отчетности и отдельные Центры компетенции качества данных. Замечу, что наличие своего ИТ в офисе управления данными – это, скорее, наша специфическая особенность, я ожидаю, что с ростом зрелости мы сможем это направление передать в ИТ.
Но сегодня мы приходим к выводу, что структуру еще раз надо менять. Основная причина изменений – выделение сущностей по тематикам мета-данных и нормативно-справочной информации (НСИ), что требует гораздо более сильного вовлечения бизнеса. Поэтому мы выделяем из блока Центра компетенций управления качеством данных тематику мета-данных в отдельный блок. Там у нас будет сосредоточена тематика развития процессов управления данными и управление самими мета-данными. И вот с чем мы столкнулись на рынке – отсутствие соответствующих программ обучения. Поэтому своими силами создаем свой учебный курс для сотрудников новых Центров.
Сегодня уже можно дать сравнительные оценки процессов или операций при переходе от старого хранилища к новому?
ВЯЧЕСЛАВ ЯШКИН: Нужно немного подождать. Дело в том, что у нас произошли серьезные изменения в продуктах – банк начал работать с коробочным предложением. Это не просто конкретный банковский продукт для клиента, а набор ценностных предложений, который содержит много разных позиций. При исполнении определенных требований, например, получателя регулярной зарплаты или при условии регулярных трат денежных средств, этот продукт клиент получает бесплатно. И мы должны добавить комплекс расчетных показателей в хранилище. Это коробочное решение сформировано, а для расчета используется новая система, которую нужно интегрировать с хранилищем.
Кроме того, нужно реализовать для бизнеса инструменты поведенческой аналитики на базе нового хранилища. Есть настоятельный запрос от бизнеса – увидеть, как те многочисленные активности, которые запускает банк на рынке, отражаются на его бизнесе, как при этом меняется взаимодействие клиента и банка.
Сейчас мы интенсивно работаем над запуском таких аналитических инструментов. Ожидаем увидеть такие срезы данных в марте.
Вот эти новые активности предъявляют какие-либо новые требования к хранилищу в плане доступности, надежности, производительности данных?
ВЯЧЕСЛАВ ЯШКИН: Знаете, мы всегда предъявляем самые высокие требования к вопросам доступности и безопасности данных. В прошлом году, кстати, в моем подчинении появилось подразделение организации непрерывности деятельности банка. И недавно мы получили сертификат по непрерывности бизнеса по стандарту ISO 22301. Насколько я знаю, мы первый банк в России, который получил такую сертификацию.
Это очередной шаг в хорошо продуманной стратегии: два года назад мы получили сертификат по ISO 20000 по ИТ-сервисам, и в этом году подтвердили сертификат по стандарту ISO 27001 в области информационной безопасности. Плюс к этому в нынешнем году мы получили еще и ESG рейтинг. ESG – это ведь не только про «зеленые» технологии и охрану окружающей среды, это в целом Environment-Social-Governance. В частности, тематика с просвещением людей в части финансовой грамотности, противодействия мошенничеству — это тоже про ESG. Финансовая устойчивость физлиц — это тоже про ESG. Так что в тематике данных также есть направления, связанные ESG. Например, финансовые инструменты, которые мы можем предоставить через данные. Скажем, помогать клиентам эффективнее пользоваться копилками или научить правильному целеполаганию, например, не просто взять кредит с какой-то целью, а накопить на эту цель и т.п.