DAMA-DMBoK для управления данными в проектах внедрения корпоративных информационных систем
- Подробности
- Опубликовано: 28.12.2024 10:25
- Автор: Степанов Дмитрий Юрьевич
- Просмотров: 17

Аннотация: в статье рассматривается свод знаний DAMA-DMBoK по управлению данными и его применение при внедрении ERP-систем. DAMA-DMBoK структурирует информацию по управлению данными от момента возникновения потребности до их ликвидации. Свод знаний включает 11-ть доменов знаний и дополнительные 5-ть тематических разделов, описывающих все аспекты работы над данными. Выполнив сопоставление этапов жизненного цикла ERP-системы и областей знаний DAMA-DMBoK, формулируется следующий вывод. Бизнес-процесс работы над данными является одним из множества процессов предприятия, подлежащих автоматизации, поэтому большая часть инициатив DAMA-DMBoK реализуется в проектах имплементации корпоративных информационных систем по умолчанию за исключением стратегического управления информационными активами.
Ключевые слова: свод знаний по управлению данными, dama dmbok свод знаний по управлению данными, управление данными dama dmbok, dmbok свод знаний по управлению данными, dama dmbok guide, управление данными, data management body of knowledge, качество данных, руководство данными, моделирование и проектирование данных, безопасность данных, интероперабельность данных, управление документами, средства управления документами, справочные и основные данные, метаданные, архитектура данных, хранилища данных, бизнес аналитика.
Скачать: PDF (статья), PDF (выпуск №28).
Понимание данных прошло эволюционный путь от структуры хранения информации до ключевого элемента в конкурентной борьбе. Сегодняшние информационные технологии, такие как: искусственный интеллект, машинное обучение, предиктивная аналитика, рекомендательные технологии, существуют благодаря большим данным, анализу данных и стремительному развитию вычислительной техники.
Раньше все было иначе. Изначально данные рассматривались как составной, но обязательный элемент компьютерной программы, наряду с командами и алгоритмами. Постепенный функциональный рост софтверных программ от приложения до программного обеспечения, программной системы, информационной системы и корпоративной информационной системы менял взгляд на данные. Уходя от рассмотрения данных только лишь в контексте нормализации данных и СУБД, акцент последовательно перешел к вопросам миграции данных, поддержания их качества и, наконец, бизнес-процессу управления данными.
Сейчас существует отдельный класс программных систем MDM, ориентированный на управление данными. Ведение основных и переменных данных, НСИ и обработка остатков – все это существенные операции бизнес-процесса над данными. Не так много литературных источников, содержащих анализ именно бизнес-процесса работы над данными, исключая детали нормальных форм, SQL-запросов и прочих технических вопросов. Среди них выделяется свод знаний по управлению данными или DAMA-DMBoK, рассмотрению которого будет посвящена данная работа.
Цель статьи состоит в обзоре свода знаний DAMA-DMBoK по управлению данными и его применения в проектах внедрения ERP-систем. Достижение указанной цели потребует реализации следующих задач:
- анализ свода знаний DAMA-DMBoK для управления данными;
- сопоставление доменов знаний DAMA-DMBoK и этапов жизненного цикла ERP-систем;
- уточнение области применения DAMA-DMBoK.
1. Свод знаний DAMA-DMBoK по управлению данными
Вспомним основные вехи, связанные со сводом знаний DAMA-DMBoK. В 1980 году была официально зарегистрирована международная добровольная некоммерческая организация DAMA International (Data Management Association), систематизирующая знания и опыт в области управления данными. В 2009 году ею было выпущено первое руководство по своду знаний DAMA-DMBoK, ставшее основным ресурсом для подготовки специалистов в области данных [1]. Теперь введем ключевые определения, касающиеся данных.
Определение 1. Управление данными – разработка, исполнение и контроль выполнения программ, практик и политик предоставления, проверки, защиты и повышения ценности данных и прочих информационных активов на протяжении всего их жизненного цикла.
Определение 2. Свод знаний по управлению данными (Data Management Body of Knowledge, DMBoK) – это набор лучших международных практик для управления данными, собираемый ассоциацией DAMA.
Методология DAMA-DMBoK по управлению данными включает 11-ть областей знаний:
- руководство данными, где упоминаются стандарты и законы, относящиеся к данным, ведется надзор за данными путем разграничения ролей и полномочий, введения должностных обязанностей и мониторинга аналитической отчетности по ним;
- моделирование и проектирование данных, здесь строятся и нормализуются структуры данных, отражаются потоки данных, описывается то, как требования пользователей, относящиеся к данным, будут реализовываться;
- хранение и операции с данными, реализующая поддержку и сопровождение обработки различных видов данных, включая контроль производительности, резервное копирование, репликацию данных и др.;
- безопасность данных, гарантирующая конфиденциальность и защиту данных от несанкционированного доступа, а также обеспечение коммерческой тайны за счет сбора требований к безопасности и имплементирования решений к ним;
- интеграция и интероперабельность данных, объединяющая и консолидирующая данные в рамках отдельных хранилищ данных и/или между ними посредствам ETL и ESB-систем, а также SOA;
- управление документами и контентом, обеспечивающая работу с неструктурированными данными для соблюдения требований нормативно-правового регулирования за счет применения ECM, DMS и CMS-систем;
- справочные и основные данные, здесь описывается процесс ведения наиболее критичных для предприятия данных, снабжающий актуальной и правдивой информацией все бизнес-процессы предприятия. Вводятся мастер данные, задающие бизнес-сущности, и справочные данные, представленные списками перечисленных значений, реализуемые в MDM и RDM-системах соответственно;
- ведение хранилищ данных и бизнес-аналитика, где задается процесс управления данными для поддержки принятия решений, извлечения ценности из данных и формирования отчетности. Определяются DW-системы, представленные базами данных и механизмами сбора, очистки, преобразования, хранения данных; а также BI-системы, предназначенные для визуализации данных, построения аналитической отчетности, проведения анализа данных и машинного обучения;
- метаданные, задающая процесс ведения «данных о данных», включая интеграционные потоки и прочую информацию для их понимания. Выделяют бизнес (преобразования, расчеты и логические формулы), технические (названия таблиц баз данных, ER-диаграммы, ETL-операции) и операционные (журналы выполнения пакетной обработки данных, частота/время запуска журналов и др.) метаданные;
- качество данных, вводящая методические решения для измерения, оценивания и повышения качества данных. Выявляются критически важные объекты данных, анализируются и устраняются проблемы, связанные с ними;
- архитектура данных, определяющая концептуальное видение по управлению информационными активами организации в соответствии с ее целями, строится корпоративная архитектура данных, а также формулируются стратегические требования к данным и дизайнам решений для достижения выгод компании;
а также такие тематические разделы, как:
- этика обращения с данными, в котором подчеркивается влияние данных на человеческие жизни, ценность данных и говорится о последствиях злоупотребления данными;
- большие данные и наука о данных, где для последнего задается ключевой бизнес-процесс, включающий операции от выбора стратегии больших данных для бизнеса до внедрения модели, дающей полезную информацию;
- оценка зрелости управления данными согласно модели CMM;
- организация управления данными и ролевые ожидания, знакомящий с ролями в области данных и распределением их ответственности согласно RACI-матрицы;
- организационные изменения и управление данными [1].
2. Области знаний DAMA-DMBoK и жизненный цикл ERP-систем
Области знаний DAMA-DMBoK могут быть представлены в виде пирамиды Питера Айкена, иллюстрирующей ситуации, в которых оказываются многие организации: от внедрения программных продуктов, оперирующих данными, до использования передовых практик по извлечению и аналитике данных. Таблица ниже демонстрирует логическую последовательность этапов работы над данными. Однако свод знаний DAMA-DMBoK не предписывает строгую последовательность выполнения инициатив, задающих домены знаний, несмотря на упоминание в нем модели зрелости компаний в части бизнес-процессов по управлению данными [1].
Табл. 1. Пирамида Питера Айкена
№ фазы | Описание фазы | Область знаний DAMA-DMBoK |
Фаза 1 | Покупка организацией приложения с поддержкой СУБД |
|
Фаза 2 | Организация сталкивается с проблемой качества имеющихся данных при применении приложения |
|
Фаза 3 | Осознания необходимости функции руководства данными для достижения стратегических целей компании |
|
Фаза 4 | Компания использует преимущества данных и осуществляет аналитическую деятельность | – |
В контексте жизненного цикла ERP-систем [2], состоящего из пред-проекта внедрения, проекта имплементации и пост-проекта, данные рассматриваются через призму двух активностей [3]:
- миграция основных и переменных данных, подразумевающая перенос исторической информации в целевую систему на момент продуктивного запуска программного решения;
- управление бизнес-процессом ведения мастер данных, в частности при обработке контрагентов (поставщики, клиенты и др.) и номенклатурных позиций (материалы, товары, услуги и др.).
Управление данными представляется как регулярный бизнес-процесс, сравнимый с закупками, продажами и финансами, к которому предъявляются всевозможные требования и которые необходимо реализовать в информационной системе [4]. Сам же процесс обработки требований усложняется наличием потребности в миграции данных. Таким образом, большая часть инициатив из областей знаний DAMA-DMBoK реализуются в ходе предпроектного обследования и проекта внедрения ERP-системы (табл. 2).
Табл. 2. Этапы жизненного цикла ERP-системы и области знаний DAMA-DMBoK
Жизненный цикл ERP-системы | Область знаний DAMA-DMBoK | |
Вид проекта | Этап | |
Предпроект внедрения | Бизнес-кейс |
|
Тендер | ||
Договор внедрения | – | |
Проект внедрения | Мобилизация | – |
Анализ |
|
|
Проектирование | ||
Реализация | – | |
Тестирование | – | |
Подготовка к промышленной эксплуатации | – | |
Гиперподдержка промышленной эксплуатация |
|
|
Проект пост- внедрения | Поддержка промышленной эксплуатации | – |
Прекращение применения |
|
Как следует из таблицы выше, вопросы, связанные с качеством и пониманием данных, стратегическим видением их развития, становятся актуальными после внедрения ERP-системы: на фазе поддержки программного решения, что соответствует пониманию пирамиды Айкена. Напротив, задачи ведения НСИ и управления документами прорабатываются намного раньше по сравнению с точкой зрения Питера Айкена, что обусловлено критичностью данных, без которых невозможно запустить в продуктивную эксплуатацию разрабатываемую систему.
3. Область применения DAMA-DMBoK
Уточняя область применения свода знаний по управлению данными, необходимо упомянуть следующее. ERP-системы являются наиболее представительным программным обеспечением с точки зрения объема автоматизируемых бизнес-процессов предприятия. Только проекты имплементации подобных систем длятся 0,5-1,5 лет и стоят десятки, а то и сотни миллионов рублей. В этой связи, большинство критически важных проектных активностей явно описываются в методологии внедрения ERP-системы. Типовое распределение задач включает в себя 6-ть групп работ, которые согласуются с пониманием корпоративной архитектуры TOGAF (рис. 1).
Рис. 1. Уровни внедрения корпоративных информационных систем
Одной из ключевых активностей имплементации программных систем является обработка данных, под которую выделяют отдельную функциональную группу. Данная группа участвует в сборе требований к данным и лидирует миграцию данных в целевом софтверном решение. Таким образом инициативы DAMA-DMBoK связанные с выявлением и идентификацией требований к данным (например, атрибуты и виды данных, обеспечение безопасности данных и соблюдение законодательства РФ в области данных), проектированием TO-BE процесса для управления данными (к примеру, операции создания, изменения, удаления и согласования данных), предложением программного решения (MDM-системы для ведения НСИ и интеграция с прочими системами), ведением хранилищ данных и бизнес аналитикой (соответственно DW и BI-системы) рассматриваются как типовые проектные задачи жизненного цикла ERP-систем.
Прочие домены знаний DAMA-DMBoK, не упомянутые в жизненном цикле программных систем и связанные преимущественно с качеством данных и стратегическим видением их использования, привносят ценность в процесс управления данными, однако на более поздних стадиях нежели проект внедрения ERP-системы.
Заключение
Свод знаний DAMA-DMBoK отлично решает задачу структурирования информации по управлению данными на протяжение всего их жизненного цикла: от потребности до ликвидации. Введенные 11-ть доменов знаний и 5-ть тематических разделов описывают все аспекты работы над данными, включая перспективные области их применения. В проектах внедрения ERP-систем бизнес-процесс работы над данными является одним из множества процессов предприятия, подлежащих автоматизации. Поэтому большая часть инициатив DAMA-DMBoK реализуется в них по умолчанию, за исключением стратегического управления информационными активами, что является прерогативой не проекта внедрения, а поддержки.
Литература
- DAMA-DMBoK: Свод знаний по управлению данными. Второе издание / DAMA International [пер. с англ. Агафонова Г.]. – М.: Олимп-бизнес, 2024. – 828 с.
- Stepanov D.Yu. The lifecycle of corporate information systems // Proceedings of 6th International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency. – 2024. – p.593-597. – URL: https://stepanovd.com/science/article/197-2024-4-thelifecyclecis.
- Еременко Я.O. Особенности миграции данных в SAP ERP // Корпоративные информационные системы. – 2019. – №3(7). – с. 22-28. – URL: https://corpinfosys.ru/archive/issue-7/67-2019-7-migration.
- Степанов Д.Ю. Концепции, методы и способы миграции основных и переменных данных в корпоративных информационных системах (часть 1) // Корпоративные информационные системы. – 2020. – №1(9). – с. 49-61. – URL: https://corpinfosys.ru/archive/issue-9/89-2020-9-datamigration.
Выходные данные статьи
Степанов Д.Ю. DAMA-DMBoK для управления данными в проектах внедрения корпоративных информационных систем. – 2024. – №4 (28) – c. 26-31. – URL: https://corpinfosys.ru/archive/2024/issue-28/280-2024-28-damadmbok.
Об авторе
![]() |
Степанов Дмитрий Юрьевич – кандидат технических наук, доцент МИРЭА, принимал участие более чем в 10 проектах внедрения корпоративных информационных систем на базе SAP, Microsoft и Sage. Специализируется на управлении материальными потоками, сбытом и системой документов. Автор более 25 статей, в том числе публикации в журналах «Логистика сегодня», «Вопросы экономических наук», «САПер» и др. Электронный адрес автора: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра. |
Статьи выпуска №28
- Основные изменения в правовом обеспечении информации в 2025 году;
- No-code платформы и приложения;
- BABoK для бизнес-анализа в ИТ-проекта;
- DAMA-DMBoK для управления данными в проектах внедрения ERP-систем.