近几年,金融机构通过开展数据治理,形成了数据标准管理的制度流程,编制了数据标准库,但在贯彻标准的过程中,总会遇到问题和挑战,如因不同语境下的数据定义不同,导致数据标准在使用上存在歧义等。数据标准管理不仅要制定好标准,还应找到标准落地过程中的实施关键点,针对落标系统的数据现状制定有效应对策略。下面我们从银行存量系统改造实践中,讲讲如何通过数据标准落地,来实现数据标准管理价值。
01 业务系统标准落地关键点
数据标准管理,不仅要标准编得好,更要标准落地得好。究其关键,就是将数据标准真正落实到数据模型设计中,从数据源头解决数据质量问题。对于银行业来讲,很多系统是独立建设、独立建模的,内部无法共享复用模型,最大的障碍是数据标准工作是滞后于银行业务系统建设的,没有做到数据标准贯彻落实,导致还是出现同义不同名,同名不同义的情况。如何解决存量系统落标,成为绝大多数银行实施数据标准化的最大难题。
业务系统落标的关键点在于数据模型的设计必须符合数据标准,否则落标过程就没有抓手。所以业务系统先要管理好数据模型、数据字典以及代码枚举值,摸清模型存量系统不一致的情况,尤其是枚举值、编码规则、数据类型、属性名称等严重影响业务应用的情况,这种状况给系统开发人员理解模型和数据应用带来困惑。因此,为减少开发人员之间以及开发人员与业务人员之间的沟通成本,实现数据模型复用的第一步就是对模型属性项进行标准化,使之命名规范,定义精确,技术规范统一。
02 标准落地实践中的问题及解决方案
1.同名不同义
案例描述:在某银行不同的业务系统中,“币种”是一个使用非常广泛的业务字段,但每个系统对该字段的定义和取值范围均不同。例如,系统A中“RMB-人民币”,“USD-美元”,“EUR-欧元”;系统B中“123-人民币”,“456-美元”,“789-欧元”;系统C中“01-人民币”,“02-美元”,“03-欧元”
解决方案:为了解决同名不同义的问题,可以通过数据标准统一定义和规范字段的含义和取值范围。有两种解决方案,一是参考国际币种标准发文,将不同系统中的币种类型映射到标准币种的代码值;二是通过增加前缀的方式,制定不同领域特定的标准,例如”存款币种”、”担保币种”,“套汇币种”,在实践中过程中可根据具体情况进行选择。
又如,在某银行不同的业务系统中,存在同一枚举类型的字段,但不同系统对枚举值的定义存在冲突。例如,系统A将客户的”联系方式类型”分为”01-家庭电话”、”02-手机”等,而系统B将其分为”TEL-家庭电话”、”MOB-手机”等。为了解决枚举值冲突的问题,也可以通过数据标准来统一定义和规范枚举值,数据标准制定枚举值时可参考该字段的源头系统或权威系统进行制定,例如系统A作为客户信息的主数据系统,数据标准制定时则应优先参考系统A的建议。
2.同义不同名
案例描述:在某银行不同的业务系统中,存在表示相同含义的字段,但命名不同。例如,一个系统将”借贷标志”字段命名为”借贷方向”,而另一个系统将其命名为”借贷类型”,它们都用来标识当前交易中的借或贷。
解决方案:为了解决同义不同名的问题,可以通过数据标准来统一字段的命名规则,明确字段的名称和格式。在数据落标过程中,将不同系统中的字段映射为统一的数据标准,例如都采用行内业务通用叫法”借贷标志”作为字段名字。
3.数据格式不统一
案例描述:在某银行不同的业务系统中,存在相同字段的数据格式不一致的问题。例如,一个系统将”MAC地址”的格式定义为”XX-XX-XX-XX-XX-XX”,而另一个系统将其定义为”XX:XX:XX:XX:XX:XX”。系统内金额类字段的精度不统一,存在decimal(20,4)、decimal(18,2)等各种精度,导致不同下游的计算金额结果有偏差。
解决方案:为了解决数据格式不一致的问题,可以引入数据域的概念来解决。这属于建模规范的一部分,在建模过程中进行统一定义与标准化,再被各个属性引用。域是属性值集合的通用表示,用于规范属性的数据类型、长度、取值范围、取值规则等,每个属性都必须定义域,并遵循域定义。为便于管理,从粗到细按照“域组/域”对域体系进行定义及管理,将域划分为几大域组。分为:文本类、数值类、金额类、日期时间类、标志类、编码类、代码类等。
4.属性名称不规范
案例描述:“渠道类型”、“渠道编号”、“渠道代码”在实际使用过程中,都可用来指代面向客户办理业务时的渠道类型代码,但是因为不同系统的使用习惯,导致名称差异。又如“开户机构”、“交易机构”、“记账机构”等名称不完整的字段,单从名称上看,容易引起歧义,不清楚具体指的是机构编号还是机构名称,会直接影响业务的数据应用。
解决方案:建立企业级字典规范,通过统一数据字段的命名和技术定义,使得跨项目组之间的数据交换和溯源理解有了质量和效率的保障。在字典规范项命名方面,同类型的数据对象的命名要遵循统一的规范要求,做到同名同义,没有歧义,命名采用{基本词….基本词}+类别词,通过对类别词的规范化使用,可以使属性名称对数据内容的表达更加清晰,准确,便于管理。
5.落标结果争议解决
案例描述:银行业务系统之间数据引用错综复杂,很多落标字段所在系统属于副本,字段名称与主本系统有差异,单纯从副本角度进行落标,可能导致落标结果与主本系统有差异,产生争议。例如某一系统定义了一个字段“源节点客户号”,该系统数据在落标时将字段落为“客户号”,实际业务使用时发现该字段内容并非通常所说的客户号,而是源系统定义的一个技术主键,导致争议。
解决方案:针对落标争议问题,可建立落标申请准入机制,严控准出规范,增加落标结果主本系统确认,提高落标结果准确性。
03 结语
数据标准管理价值实现的关键在于企业内部的业务系统建设要遵循这些标准,并在此过程中促使数据标准的优化和完善,使数据标准是有用且可持续的。在数据标准贯彻落地过程中,应在业务部门、业务系统中循环渐进,迭代执行,明确业务场景或业务价值,防止或减少数据孤岛,促进数据共享,并且可以根据业务的实际变化进行更新,形成闭环管理流程。因此,未来数据标准管理要与业务管理、数据架构管理协同一致,使数据标准在业务场景充分落地,实现管理价值最大化
文章来源:“数据治理周周谈”微信公众号