数据是组织最重要的资产
实践 | 企业数据资产盘点方法概述

实践 | 企业数据资产盘点方法概述

摘要:在当前的大数据背景下,数据作为数字经济的关键要素已经得到广泛认可。企业需要为广泛的数据消费需求提供优质数据供给,而数据资产盘点是实现这一需求的基础性工作。本文回顾了信息资产、数字资产、数据资产等概念的发展,提出企业数据资产盘点的目标和价值,分析了盘点工作中的数据资产范围,给出过程安全稳定、结果准确可靠的盘点原则,并详细阐述了数据资产盘点工作的具体实施方法。

关键词:数据资产;大数据;数字经济;企业数据资源;信息系统

0 背景

近年来,随着生产力水平的逐渐提高、社会关系的不断进步、经济活动的日益发展及移动互联网、物联网、智能终端等技术的广泛应用,各类数据资源的积累呈现出爆炸性增长的趋势。同时,由于人工智能、AIoT、云计算等技术的推动,全球数据量还在无限制地扩展和增加,根据国际权威机构Statista 的统计和预测,全球数据量在2019年约达到41ZB。此外,国际数据公司IDC统计显示,全球近90%的数据将在这几年内产生,预计到2025年,全球数据量将比2016年的16.1ZB增加十倍,达到163ZB。数据量增长的规模化和数据应用场景的全面化将为企业的数据资产使用带来推动作用。

数据资产概念的理论研究大致经历了从信息资产、数字资产到数据资产的发展过程。“信息资产”最早由Stuart Kaback于1977 年介绍一款索引系统时提及,他认为该系统是一种无价的信息资产[1],1981年,Forest W. Horton给出信息资产定义,并指出信息资产与其他资产存在重大差异[2]。1995年,英国路透社的《信息作为一种资产:无形的金矿》一文报道了对500名英国公司高管进行关于信息资产的调查情况[3],调查显示超过25%的公司表示信息是其最重要的资产。

上世纪90年代开始,“数字资产”开始成为研究热点。1996年,Helen Meyer[4]最早提出了数字资产概念。2006年Albert Va n Niekerk[ [5]给了数据资产定义。2009年,国际数据管理协会《DAMA数据管理知识体系指南》[6]指出:数据被认为是一项重要资产。

数据资产的概念早在1974年便被学者Richard Peters提出,他认为数据资产包括持有的政府债券、公司债券和实物债券等资产。随着时间的推移,人们对数据资产的认识不断深入,其重要性愈发显著。2009年,Tony Fisher指出数据是一种资产,企业要把数据作为企业资产来对待。2011年,世界经济论坛发布的《个人数据:一种新资产类别的出现》报告中指出个人数据正成为一种新的经济“资产类别”。2018年4月,中国信息通信研究院云计算与大数据研究所发布的《数据资产管理实践白皮书(2.0版)》中将数据资产定义为“由企业拥有或者控制的、能够为企业带来未来经济利益的、以物理或电子的方式记录的数据资源,如文件资料、电子数据等”。近年来,数据资产与区块链[7]、云计算[8]等新技术相结合,并在电力企业数据资产管理[9]、图书管理[10]取得了一定的研究成果

现阶段的数据资产发展已经进入智能数据基础阶段,企业将数据供应链上的各个环节通过智能化、自动化方式进行改造,实现程式化的数据采集与数据应用,规范管理的数据湖,智能化的数据接入、数据管理和数据供给,广泛的自助分析,并为数据消费提供智能数据供给服务。

为实现数据供给的要求,一项重要的基础性工作便是数据资产盘点。只有通过全面梳理企业中作为资产的数据,才能使数据从业者了解数据资产全貌、绘制数据资产地图、有机串联数据的技术面与业务面,以便让企业中的数据能看清、可理解、相关联,进而为制定更好的数据策略、搭建更强的数据信任、实现更智能的数据应用打下坚实基础。

1 目标和价值

目前,国内各大企业经过多年的信息化建设,已积累了种类繁多、体量庞大的数据,并且随着业务的持续发展,业务范围、资产规模、客户规模均不断扩大,产生的数据规模也在快速增长。而数据规模的快速增长为企业带来了数字化转变、智能化变革的机遇,同时也对数据资产的掌控能力提出更高要求。因此,全面推进数据资产盘点工作,是摸清数据资产家底、明确数据资产存量、识别数据资产范围、搭建数据资产地图的重要手段,也是准确识别出有价值的数据资产,并对数据资产开展统一规范管理,进而实现数据资产价值最大化和良性循环的重要基础性工作,开展数据资产盘点工作正当其时。

总体上来讲,企业开展数据资产盘点工作的目标是:通过开展企业级的数据资产盘点,明确企业数据资产全貌,助推数据资产全生命周期的统一管控,为数据资产的增值利用提供良好基础,促进数据价值变现。

2 盘点范围

企业开展数据资产盘点的过程中,需要结合所盘点的系统情况,划定系统中需要进行盘点的数据表范围。原则上仅针对各系统在业务环节源端产生的基础表,以及终端产生直接应用结果的数据表进行盘点。具体来讲,可以结合数据资产的概念圈定盘点范围,即对“企业在运营活动中形成的,由企业拥有、全过程可控,并能给企业带来价值的数据”开展盘点,当拥有、可控、具有价值三个条件全部满足时,识别为数据资产盘点的对象范畴。企业数据资产可分为如下几个类型:

(1) 基础表:系统直接产生、直接反应业务运营情况的基础数据表,同时具有由该系统拥有、可控、具备应用价值的特征,是数据资产盘点的主要内容。需要注意的是,根据数据资产概念,仅对该系统拥有的数据表进行盘点,调用其他系统的数据不进行盘点,例如分析系统中调用的业务数据不进行盘点。

(2) 代码表:系统中的代码相关数据,属于参考数据,需要进行盘点。

中间过程表:中间过程表由于具有临时性、变动性大的特点,不具备数据资产的可控性特征,且大数据分析、应用价值不高,因此不进行盘点。

(3) 报表、指标:属于分析数据,是系统在运营分析后产生的相关结果,具有分析、共享价值。盘点时需要根据情况进行识别,仅对业务系统和分析系统中的固定报表进行盘点,对于变化频率高、自定义的报表不进行盘点。

此外,针对系统中不同数据表的特殊情况,进行实际盘点工作时,可根据数据特征、数据应用场景、数据分析价值进行进一步识别。

3 盘点原则与方法

3.1 盘点原则

为了更好地开展企业数据资产盘点工作,保证盘点过程安全稳定,保证盘点结果准确可靠,应遵循如下原则开展具体工作:

(1) 前瞻性:数据资产盘点应该站在整个盘点旅程的角度进行规划和实践,充分考虑数据资产规范、搜索获取、分析应用、绩效评估、可视化展示等需求。

(2) 全面性:数据资产盘点范围要全面覆盖企业的所有数据资产,但在落地实践过程中,企业也可以分阶段开展盘点工作。

(3) 基础性:选择数据资产最稳定的本质属性或特征作为盘点内容,确保盘点内容不因环境因素而发生变化。

(4) 系统性:将需要盘点的数据资产的属性或特征按一定排列顺序予以系统化,并形成一个合理的分类体系。

(5) 确定性:对于盘点范围内的任何一项数据资产,在分类体系中应该有唯一确定的基本单元与之相应。

(6) 可拓展性:目录框架应满足数据资产不断发展和变化的需求,允许在目录框架中增加新的盘点内容而不影响原有内容。为使用者进行延拓细化创造条件。

(7) 安全性:减少数据盘点工作对于业务活动和系统运行的影响,避免出现数据丢失或泄露等失误,给企业带来损失。

(8) 保密性:数据是企业重要资产,数据资产盘点过程中,盘点人员要严格遵守保密要求,避免触及敏感信息。

3.2 盘点方法

数据资产盘点工作,整体包括准备阶段、盘点阶段、汇总阶段三部分流程,其中,盘点阶段根据所盘点系统的不同类型和特征,包含4个子流程,分别针对套装软件、自开发系统、分析系统、数据仓库开展盘点工作。

3.2.1 准备阶段

不同系统对于盘点文档的需求存在差异,盘点开始前,需对获取或生成的业务及技术文档准备情况进行核查,确认文档可供盘点使用。同时,向各盘点系统运维支持人员申请各系统查询权限并确认。准备阶段主要工作可分为:

(1) 确认操作权限:

由各系统运维支持人员提供各系统前台显示和后台数据库查询权限,盘点人员对所需用户权限在目标系统进行验证,为后续进行数据资产盘点打下基础。

(2) 形成数据字典:

系统数据字典是系统盘点过程中的重要依据,如技术支持人员能提供盘点系统的完整数据字典,由技术支持人员提供;如技术支持人员不能提供完整数据字典,需由技术盘点人员通过数据库工具导出该系统完整数据字典。

(3) 形成功能操作清单:

针对系统功能文档不全的历史遗留系统,由盘点业务人员创建系统功能操作清单,支撑系统功能与业务分类的关系对照。

(4) 进行业务分类:

根据盘点系统的业务定位,参考组织已有的业务分类体系,补充完善业务分类体系。

(5) 确认盘点文档完整:

根据收集与自主生成的文档,确认盘点文档是否完整。

3.2.2 盘点阶段

(1) 定位数据资产:

圈定需要盘点的数据资产范围,明确盘点对象清单,为后续进行数据资产盘点打下基础。

1) 定位数据资产:对照文档及系统,判断文档与系统一致性,定位业务流程涉及的数据资产和其它在套装软件中自开发数据资产的盘点范围。

2) 自动生成盘点表格:以数据资产名称为基础,自动生成盘点表格,盘点表格仅包括《数据资产盘点表格》部分,生成的盘点表格会自动填写数据资产分类、系统名称、指标编码三部分内容,并根据系统情况自动填写其他属性的部分内容,供后续盘点使用。

(2) 填写盘点表格:

由业务盘点组和技术盘点组根据系统前台信息及后台数据情况,分别进行数据资产盘点表格初步填写,并收集需要沟通的业务及技术问题。

1) 明确业务分类:基于系统业务流程设计,根据已有的业务分类体系,对已经与业务流程关系的数据资产的业务分类进行识别。

2) 查询数据量:打开数据浏览器,查询数据量,计算新增条数(每月)。

3) 根据数据字典填写盘点表格:根据数据字典的信息,填写《数据资产盘点表格》的管理属性、技术属性和技术属性,以及《数据资产项盘点表格》的管理属性和技术属性。

(3) 沟通及补充完善:

基于已收集的问题,与相关业务部门、技术支持组进行集中沟通或现场讨论,并对数据资产盘点表格进行补充完善。沟通业务部门,完善管理属性:针对相关的业务及管理问题,集中与相关业务部门开展讨论,可采用集中会议、邮件等形式。针对相关的技术及资产问题,集中与系统开发厂商,即技术支持组开展讨论可采用集中会议、现场讨论等形式。

(4) 汇总整理:

汇总形成数据资产目录:在数据资产盘点初步完成后,业务人员对数据资产盘点表格进行汇总,并使用工具对部分内容进行生成或批量标准化转换。

3.2.3 汇总阶段

汇总阶段需要将所有盘点系统的盘点结果合并,形成统一的数据资产目录,并完善关联资产名称和数据资产编码。主要工作包括:

汇总形成数据资产目录:汇总各类盘点子系统形成的数据资产目录,合并生成统一的《数据资产盘点目录》。

完善关联资产名称:使用自动化工具,将《数据资产盘点目录》中关联资产内容中的代码转换为数据资产名称。

形成数据资产编码:使用组织规划数据资产统一编码规则,生成数据资产编码。

4 总结

本文综述了信息资产、数字资产、数据资产的概念形成和发展过程,讨论了企业进行数据资产盘点的重要性和必要性。在此基础上,本文给出了包含基础表、代码表、指标和报表的企业数据资产盘点范围,并详细阐述了企业数据资产盘点的具体实施步骤,包括准备阶段、盘点阶段和汇总阶段。研究结果表明,全面推进企业数据资产盘点工作,并正确地划定企业数据资产盘点范围并形成完善的资产盘点方法论,能够摸清企业数据资产家底,明确数据资产存量,识别数据资产范围,并深入促进数据资产应用,更好地发挥数据资产价值。

在后续工作中,将结合实际业务情况,深入研究不同企业的数据资产目录框架架构方法,同时考虑如何加强数据盘点的项目管控,保证盘点工作全过程的高质量完成。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注