Директор Департамента систем управления данными БФТ-Холдинга Максим Зацепин – о том, как инструменты Data Governance создают единую экосистему управления данными.
В современном мире данные становятся ключевым активом любой организации. Системный и качественный процесс управления данными делает их более эффективными, надежными и безопасными, позволяя бизнесу получать дополнительную выгоду, принимать более взвешенные решения и минимизировать риски. В основе такого процесса лежит стратегический подход Data Governance, дополненный технологиями Master Data Management (MDM).
Data Governance – ответ на растущий объем корпоративных данных
Data Governance – это комплексный стратегический подход, который помогает компаниям системно управлять корпоративными данными, формировать и развивать культуру осознанного использования информации. С его помощью описываются основные характеристики данных: из каких источников они поступают, кто является их ответственным владельцем, каким стандартам качества они соответствуют, где они хранятся и как защищены, кто и на каких условиях может их использовать.
Можно выделить два основных сценария, когда компания начинает планировать внедрение Data Governance.
Первый сценарий: плановое масштабирование. С ростом бизнеса, в том числе его штата, структурных подразделений и ИТ-инфраструктуры, увеличивается и объем данных, которые накапливаются в корпоративных системах и хранилищах. Компания заранее задумывается о том, как в дальнейшем будет работать с этими данными, чтобы не допустить в них хаоса. Она выбирает подходящий инструмент, начинает отлаживать процессы и выстраивать дата-культуру. Благодаря этому управление растущим объемом данных изначально соответствует процедурам Data Governance. Однако так происходит далеко не всегда: часто упускается момент, когда данные в компании превышают критический объем.
Второй сценарий: уже существующий хаос в управлении информацией. К сожалению, гораздо чаще встречается ситуация, когда компания сталкивается с проблемами поиска данных, отсутствием прозрачности в их использовании и доверия к ним, сложностями или даже невозможностью принятия решений на основе разрозненной информации. В этом случае внедрение Data Governance происходит более сложно и сопровождается, как правило, необходимостью принятия более радикальных административных мер.
Таким образом, Data Governance помогает организовать системную работу с корпоративными данными. При этом необходимо понимать, что этот подход не ограничивается только развертыванием специализированной информационной системы. В Data Governance всегда включены все компоненты бизнеса: люди, технологии и процессы.
Люди: основные пользователи Data Governance
Пользователей системы Data Governance можно разделить на две группы.
Потребители данных – это сотрудники, которые пользуются результатами процесса управления данными. К ним относятся, в частности:
- топ-менеджмент, которому нужна оперативная и качественная отчетность для принятия решений;
- бизнес-пользователи, применяющие данные и отчетность в повседневной деятельности;
- технические специалисты – системные аналитики, которым нужна полная и достоверная информация для формирования аналитических срезов.
Исполнители – команда специалистов, которые занимаются обработкой данных для потребителей. При внедрении Data Governance они объединяются в отдельное подразделение – Data Office. В нем могут быть несколько функциональных ролей, основные из которых следующие:
- Data Owner (владелец данных), отвечающий за реализацию политики управления данными;
- Data Steward (куратор), отвечающий за качество данных;
- технические специалисты (Data Custodian, Data Architect, Data Engineer).
Команда Data Office в рамках подхода Data Governance изучает, документирует и описывает данные, создает базу знаний, с которой в дальнейшем будут работать бизнес-пользователи.
Технологии: основные инструменты Data Governance
Data Governance включает несколько ключевых инструментов:
- бизнес-глоссарий создает единую терминологию и понимание показателей;
- каталог данных служит для централизованного хранения метаинформации, полученной из систем-источников, и связывает данные между собой, обеспечивая их целостность, прозрачность и доступность;
- Data Lineage – модуль, предназначенный для отслеживания и документирования движения данных от источника до потребителя;
- Data Quality – модуль управления качеством данных, который помогает выявлять ошибки, обнаруживать аномалии и определять несоответствия с ожидаемыми значениями;
- MDM-система – это отдельный компонент экосистемы управления данными в рамках комплексного подхода. Если Data Governance базируется на метаданных, обеспечивает описание и контроль всех корпоративных данных, то MDM отвечает за качество и нормализацию конкретных мастер-данных, гарантируя их достоверность и актуальность.
Симбиоз взаимодополняющих друг друга систем Data Governance и MDM создает наиболее мощный инструмент управления данными в организации и позволяет быстро и экономично сформировать ту «единую версию правды», которая нужна любой компании, чтобы обеспечить качество и актуальность данных для принятия решений.
Процессы: необходимо участие каждого
Четко выстроенные процессы – неотъемлемая часть Data Governance.
При внедрении Data Governance очень важно идти от проблематики, конкретной задачи, которую компания хочет решить. Для этого нужна команда консультантов-методологов, которая опишет процессы As Is и To Be (каковы они есть и какими они должны быть), выявит узкие места в работе с данными, подберет оптимальные продукты и опишет стратегию. Техническая команда специалистов вендора и заказчика выполнит настройку системы и технические интеграции с источниками и другими смежными ресурсами. Дата-офис будет в дальнейшем продвигать культуру управления данными в компании, осуществлять контроль загруженных в систему данных и продвижение лучших практик, выставление KPI по качеству данных для владельцев данных, собирать метрики и коммуницировать с ответственными исполнителями.
Выстроенный процесс необходим на каждом этапе работы с данными. Например, формирование глоссария лучше всего начинать с предметной работы с определенным доменом данных: выделения ключевых показателей, которые в нем используются, разметки и описания данных. Полученный MVP проще тиражировать на всю компанию, чем сразу заниматься каждым доменом отдельно или создавать глоссарий по всей компании. При этом стоит привлечь компетентных консультантов, которые помогут выстроить процессы, зафиксируют роли, выстроят всю цепочку работы с терминами. Заказчик же должен все полученные инструменты верифицировать и обеспечить их внедрение в рабочий процесс, выделив для этого ответственных специалистов. Только таким способом – будучи глубоко интегрированным в бизнес-процессы – Data Governance начнет приносить пользу.
Также важно отметить, что именно с процессов всё и начинается. В идеале культура работы с данными должна вестись в компании всегда, независимо от ее размера, а инструмент для этого уже будет выбираться в зависимости от решаемых задач, стоящих перед бизнесом. Например, на начальных этапах, когда данных не так много, управлять ими можно, используя табличные редакторы или системы управления корпоративным контентом. Когда же корпоративные системы разрастаются и объемы данных растут, стоит выбирать более мощный инструмент из тех, что в достаточном количестве уже есть на рынке.
Как в классической стройке – возводить здание с нуля гораздо легче, чем перестраивать. Чем раньше компания начнет формирование процесса управления знаниями, тем меньше усилий ей потребуется для того, чтобы впоследствии реализовать сценарий органичного перехода к комплексному Data Governance.
Тренды: современные тенденции в управлении данными
Рынок управления данными активно развивается под влиянием нескольких тенденций.
- Внедрение искусственного интеллекта для автоматизации типовых процессов. Инструменты Data Governance предназначены для поиска и проверки данных, их документирования, описания, определения связей, разметки, маркировки. Многие из этих процессов рутинные, и часть из них можно автоматизировать при помощи ИИ.
- Проактивный подход позволяет предсказывать проблемы при обработке данных до их появления. Видя все связи объектов, понимая, где находятся источники и кто владелец данных, какие проверки по ним назначены, система может подсветить пользователю потенциальную ошибку, чтобы, например, Data Steward мог оперативно ее предотвратить. Технически это может быть реализовано в режиме Copilot, который будет всегда сопровождать пользователя в его работе.
- Интеграция Data Governance с методологией гибкого управления данными DataOps дает возможность эффективно поддерживать непрерывный цикл работы с данными в компании.
- Инструменты самообслуживания (Self-Service) в системе Data Governance делают ее более доступной для бизнес-пользователей. С их помощью можно самостоятельно находить нужные данные и строить отчеты без привлечения технических специалистов.
Будущее Data Governance также связано с появлением различных отраслевых инструментов управления данными (для отдельных отраслей и бизнес-функций), а также с расширением интеграционных возможностей Data Governance с системами-потребителями.
Опираясь на комплексное построение Data Governance с учетом всех его компонентов и передовых технологий, заказчики смогут как можно быстрее получить от этого подхода ожидаемый эффект: повысить прозрачность данных и доверие пользователей к ним, сократить время на поиск и анализ информации, улучшить качество принимаемых решений и снизить операционные риски.
Приглашаем на вебинар «Культурные данные», или зачем бизнесу Data Governance и MDM?»
БФТ-Холдинг, разработчик MDM-системы с ИИ-сервисом нормализации данных «БФТ.ЕНСИ», и технологический партнер TData проведут совместный вебинар о том, почему качество данных и культура работы с ними становятся для бизнеса не теорией, а практическим фактором эффективности. Эксперты расскажут, что сегодня происходит с рынком данных, какие инструменты реально работают и каких бизнес-эффектов стоит ожидать от внедрения Data Governance и MDM.
Вебинар состоится 19 февраля в 11:00 (МСК).
Источник: РБК