经常有读者朋友会交流讨论这样的问题,为什么DMBOK中对数据标准提及的少之又少?是不是不重视数据标准,几乎没看到什么完整的篇幅来讲数据标准,但在其他的数据治理书籍中都会有专门章节来讲标准。
这个问题,我的理解首先就是中西方文化的差异。在西方人的观念里面,做任何事情都要尽可能的标准化,DMBOK本身就是一个标准化的产物,下图一是DMBOK1.0中提到的这本指南的编写目标。DAMA希望人们能在理解数据管理的相关概念、实践方面有标准一致的认识。
图一:DMBOK的编写目标
然后大家可以翻书回顾下第三章数据治理的活动–实施数据治理–发起数据标准和流程一节,里面就提到数据管理的每一个知识领域都有需要标准的概念,摘录如下图二:
图二:DMBOK2中提及需要标准化的内容
DMBOK车轮图中,唯一一个地位特殊的知识领域就是数据治理,数据治理做什么,最主要的一项职能就是建章立制啊!DMBOK2在后续的每一个知识领域中,都有专门的治理一节。对这些需要标准化的内容有更详细的描述,要求针对每个领域的治理都要把上述的各种需要标准化的内容确定下来,落实到字面上和行动中。所以说DMBOK不重视数据标准,这个说法是不成立的,恰恰相反,其实是整本DMBOK都在阐述标准。
接下来说说,为什么其他很多数据治理书籍,都把数据标准单独拿出来浓墨重彩的介绍,我的理解如下:
很多相关书籍讲的数据标准相对DMBOK中标准化概念是狭义的数据标准,重点指的是在数据模型方面的标准。确实,这些模型方面标准的内容多、变化更新频度大、制定起来难度高,执行起来涉众多。其实到现在,在数据模型标准方面能做到全生命周期管理的最佳实践都不多,故大家在这方面的探讨最多也就不奇怪了,也算是缺什么补什么吧。
而其他方面的标准,如密码的强度,也是安全标准之一,但相对起来,无论是制定还是执行都比较容易了,也就没什么可以讨论的了。
最后简单讨论下,如何建立一套有效的数据标准并落地呢?
还是DMBOK2给我们的答案,大家再回忆下第三章里面提到的良好数据治理程序的三个特点:可持续发展、嵌入式、可度量,具体解释参考图三。
图三:良好数据治理程序的三个特征
在数据模型的相关标准上,之所有以前一直标准制定不好,制定好了又执行不好,就是在上面三点没有落实好。
首先标准制定上,现在强调敏捷开发,如果标准制定后是一次性的,缺少持续的标准维护,标准处处制约开发(实质是业务发展),那么标准就会被人诟病得不到执行了。所以现在业界开始重视数据治理,金融系统甚至要求必须配备相关的岗位、定期的修订相关标准纳入合规考核范畴。
其次是嵌入式,建模、开发、运营过程中的手动环节太多,没有系统的把关控制和扎口管理,即使有良好标准也很难落实得到执行。故现在较好的最佳实践是采用企业级的建模平台软件,标准导入到平台中,任何新建模型或者修改模型,必须从标准的数据元、标准的前缀、词根等进行选择,任何不遵循标准的模型根本就无法进入程序开发环节,也没法进入到生产系统,开发过程中就做到了实时对标。把事后审计,变成事中控制。但是根据笔者了解,能做到这种实践的单位还是屈指可数。
最后是可度量,如果有了持续维护、满足业务要求的良好标准,以及全生命周期、全流程的系统落标控制,那么做度量也就有了基础和意义,不听话的就要当心被拉清单了!
如果能在这三个方面努力,久久为功,相信有效的数据标准一定能落地。不过知易行难,需要大家一起探索实践!
作者简介:马欢:DAMA 会员,DAMA数据管理专家,《DMBOK数据管理知识体系(第1&2版)》中文版主译者,CDMP Master。