本文翻译自 McKinsey Digital 的文章 The data-driven enterprise of 2025,仅供大家学习参考。
加速的技术进步,公认的数据价值,以及不断增强的数据素养,正在改变”数据驱动”的含义。到2025年,智能工作流程,以及人类与机器之间的无缝互动,可能会像企业资产负债表一样成为标准,大多数员工将使用数据来优化他们方方面面的工作。我们知道2025年已经近在咫尺,但它是至关重要的。新型数据驱动型企业将具有七个方面的特征,我们已经看到许多公司展示了其中的一些特征,还有更多的公司正在开始按照这样的旅程前进。那些能够最快取得进展的公司将从数据支持能力中获得最大价值。例如,那些20%的息税前利润(EBIT)由人工智能(AI)贡献的公司,更有可能参与到支持这些特征的数据实践中。本指南旨在帮助高管们了解最新数据驱动型企业的特点以及它们所带来的能力。本文还提供了一些资源,以深入了解如何将它们嵌入你的组织中。以下是数据驱动型企业的七个特征:
- 数据被嵌入到每个决策、互动和流程中。
- 数据被实时处理和交付。
- 灵活的数据存储使集成的、可随时使用的数据成为可能。
- 对待产品一样对待数据的运营模式。
- 首席数据官的作用被扩大到能够产生价值。
- 数据生态系统的成员资格是常态。
- 数据管理被优先考虑,并在隐私、安全和弹性方面实现自动化。
这七个特征将定义新的数据驱动型企业。那些能够最快取得进展的公司将从数据支持的能力中获得最大价值。
1. 数据被嵌入到每个决策、互动和流程中
今天
在很多组织中,企业往往零星地应用数据驱动的方法,采用一些预测系统或人工智能驱动的自动化,看到了一些价值,但是实际效率低下。许多业务问题仍然通过传统方法来处理,常常需要几个月或几年时间才能来解决。
到2025年
几乎所有员工都自然而然地定期利用数据来支持他们的工作。他们不是默认通过制定冗长的–有时甚至是多年的–路线图来解决问题,而是被赋予了权力询问创新的数据技术如何能在几小时、几天或几周内解决挑战。组织能够更好地进行决策,以及将基本的日常活动和定期发生的决策自动化。员工可以自由地专注于更”人性化”的领域,如创新、协作和沟通。数据驱动的文化促进了持续的绩效改进,以创造真正差异化的客户和员工体验,并推动发展今天尚未广泛使用的复杂新应用程序。
日常应用
- 商店经理利用实时分析提供差异化的购物体验,以识别和引导忠诚度计划的客户在他们购物的过程中,向他们认为感兴趣的产品提供信息,并简化或完全自动化结账过程。
- 电信公司的网络运营人员利用自主网络,自动识别需要的区域。维护并强调根据使用情况来建立网络的机会。
- 采购经理经常应用数据驱动的流程来即时分流采购以获得批准,这样他们就可以专注于建立一个更有效的合作伙伴战略。
关键促进因素
- 愿景和数据战略,以强调和优先考虑数据的转型用例。
- 人工智能等复杂用例的技术推动,如基于云的基础设施;支持实时分析的架构;以及支持非结构化数据查询的灵活的数据库/数据模型工具。
- 广泛的组织数据素养和数据驱动的文化,让所有员工了解并接受数据的价值。
如何开始
- 阅读Winning with AI is a state of mind(赢在人工智能是一种境界)一文,可以了解更多关于向人工智能组织转变的信息,并学习如何从人工智能领导者那里利用数据的力量。
- 如果还没有开始,从提高员工对数据使用和人工智能的技能入手。分析学院可以提供帮助。
- 参考Getting AI to scale(获得人工智能的规模)一文,了解如何重新想象每个工作流程、旅程和功能,以便利用数据和人工智能。
- 阐明对数据驱动型组织的愿景。
2. 数据被实时处理和交付今天
由于受到传统技术结构的限制,采用更现代架构带来的挑战,以及密集实时处理工作的高计算要求,来自连接设备的数据只有一小部分被实时地采集、处理、查询和分析。公司往往必须在速度和计算强度之间做出选择,这可能会延迟更复杂的分析,并抑制实时用例的实施。
到2025年
庞大的互联设备网络通常实时收集和传输数据与洞察信息。新的和更普遍的技术(如用于实时分析的Kappa或Lambda架构)极大地改变了为最终用户生成、处理、分析和可视化数据的方式,从而带来更快、更强大的洞察力。随着云计算成本的不断下降,以及更强大的“内存”数据工具(例如Redis、Memcached)联网,所有组织都可以合理地使用最复杂的高级分析。总而言之,这使许多更高级的用例成为可能,向客户、员工和合作伙伴提供洞察力。
日常应用
- 物理资产的维护团队,如工厂中的资产,经常利用连接的传感器网络来实时检测维护需求。
- 产品开发人员使用非结构化数据,并在网络数据上释放无监督的机器学习算法,以检测深层隐藏的模式,并开发出比现在更丰富的客户用例(例如,通过使用互联网协议数据和网站行为,实时为特定客户提供个性化的网络体验)。
- 金融分析师使用替代的可视化工具,有可能利用增强现实/虚拟现实(AR/VR)来为涉及多个变量的战略决策进行可视化分析,而不是局限于今天常见的典型的二维仪表盘。
关键促进因素
- 整个业务架构概览,理解跨资产、流程、洞察力和干预举措的整合,并能够识别实时机会。
- 更强大的边缘计算设备(例如物联网传感器),最基本的设备也能”在源头”产生和分析可用的数据。
- 先进连接技术基础设施,如5G,以支持来自联网设备的高带宽、低延迟的数据。
- 内存计算,为密集型分析工作提供更快、更有效的计算方式。
如何开始
- 利用经过实际验证的参考数据架构,实现模块化、灵活性和可扩展性的支持能力。
- 升级为云端数据平台,以满足未来的数据和分析需求,如实时功能。
- 了解支持蜂窝网络的计算设备未来发展趋势。
3. 灵活的数据存储使集成的、可随时使用的数据成为可能
今天
尽管数据的激增是由非结构化或半结构化的数据导致的,但大多数可用的数据仍然是使用关系型数据库工具以结构化的方式组织的。数据工程师经常花费大量的时间来手动探索数据集,建立它们之间的关系,并且将它们连接在一起。他们还必须经常使用手动和定制的流程将数据从自然的、非结构化的状态提炼成结构化的形式,这些流程耗时长,不可扩展,而且容易出错。
到2025年
数据从业者越来越多地利用一系列的数据库类型,包括时序数据库、图形数据库和NoSQL数据库,使数据的组织方式更加灵活。这使得团队能够更容易和更快地查询和理解非结构化和半结构化数据之间的关系,这加速了先进的AI能力的发展和发现数据中的新关系来推动创新。将这些灵活的数据存储与实时技术和架构的进步相结合,使得企业能够开发新的数据产品,如”客户360″数据平台和数字孪生–物理实体(如生产设施、供应品、甚至人体)的实时数据模型。更先进的技术,如强化学习也使得利用复杂的模型和传统机器学习能力成为可能。
日常应用
- 金融机构经常使用图数据库技术和通用数据模型,将来自多个来源(营销系统、企业资源规划系统、网络数据)的客户数据流实时建模整合为一个单一的、统一的、360度的客户视图。
- 运输和物流公司利用实时位置数据和嵌入车辆和运输网络的传感器来开发供应链或运输网络的数字孪生系统,从而实现一系列潜在的使用场景(如假设模拟、互动监测和实时监测位置的洞察力)。
- 建筑团队从建筑物上的传感器抓取和查询非结构化数据,使他们能够简化设计、生产和运营;例如,他们可以为建筑项目选择不同类型材料模拟对财务和运营的影响。
关键促进因素
- 现代化数据架构,支持更灵活的数据存储。
- 数据模型和数字孪生的发展得以复制现实世界的系统。
如何开始
- 实施文化和技术变革,使数据架构现代化。
- 识别关键数据集(如客户购买频率、客户属性),以后可以组织成数据资产(例如,客户的完整视图),并为这些数据资产制定一个分类方案。(例如,一个商业数据产品,如”客户360″)。
- 探索灵活的本体论和知识图谱,以映射不同类别的数据和数据点之间的关系。
- 升级现有的数字模拟器,将其重新平台化到云环境中,并更新API,以支持更复杂的AI能力,如强化学习。
4.像对待产品一样对待数据的运营模式
今天
一个组织的数据职能,如果存在于IT之外,则可以采用自上而下的标准、规则和控制措施来管理数据。数据通常没有真正的”所有者”,来确保它们被整合好以备各种方式使用。数据通常被存储在重复的、孤立的、昂贵的环境中,使得组织内的用户(如寻找数据以建立分析模型的数据科学家)很难快速找到、访问和整合他们需要的数据。
到2025年无论是由内部团队还是外部客户使用,数据资产作为产品得到组织和支持。这些数据产品有专门的团队,负责嵌入数据安全和发展数据工程(例如,转换数据或不断整合新的数据源),并实施自助式访问和分析工具。数据产品以敏捷的方式不断发展,以满足消费者的需求,利用DataOps(数据的DevOps)和持续集成以及交付流程和工具。总之,这些产品提供的数据解决方案可以更容易和重复地用于满足各种业务挑战,并减少提供新的人工智能驱动能力的时间和成本。
日常应用
- 零售公司的专职团队开发数据产品,如”产品360″,并确保数据资产继续维护以满足关键用例的需求。
- 医疗机构包括付款人和医疗分析公司,建立产品团队,开发、维护和发展”病人360″数据产品,以改善健康结果。
关键促进因素
- 数据战略,确定数据的商业案例并对其进行优先排序。
- 了解组织的数据源和它们所拥有的数据类型。
- 建立一个数据产品负责人和团队的运营模式,其中可以包括分析专家、数据工程师、信息安全专家和其他必要的角色。
如何开始
- 在业务中嵌入人工智能团队,并授权他们使用这些数据产品设计、开发、部署和不断增强新的人工智能驱动的产品。
- 采用一个数据治理的操作模式,确保数据质量,并将数据当作产品来对待。
5.首席数据官的作用被扩大到能够产生价值
今天
首席数据官(CDO)和他们的团队作为一个成本中心,负责制定和跟踪政策、标准和程序的遵守情况,以管理数据并确保其质量。
到2025年
CDO和他们的团队作为一个业务单位,承担着盈利和亏损的责任。该部门与业务团队合作,负责构思使用数据的新方法,制定整体的企业数据战略(并将其作为业务战略的一部分),以及孵化通过使数据服务和数据共享货币化,获得新的收入来源。
日常应用
- 医疗保健组织的CDO与业务部门合作,为患者、付款人和供应商提供新的基于订阅的服务可以改善病人的体验。这些服务可能包括定制治疗计划,更准确地标记误码的医疗交易,以及改善药物安全。
- 银行的CDO代表政府机构和其他合作伙伴,将内部数据导向的服务商业化,如欺诈监测和反洗钱服务。
- 消费产品CDO与销售团队合作,利用数据来推动销售转化,并共同承担达到目标指标的责任。
关键促进因素
- 在业务单位领导及其团队中提升数据素养,为与CDO及其团队合作创造能量和紧迫感。
- 一个经济模型,如自动损益追踪器,用于确认和归因数据和成本。
- 具有创新眼光的顶级数据人才。
- 采用风险资本式的孵化器运作模式来支持实验和创新。
如何开始
- 对于CDO来说,开始与业务部门的领导进行对话,以确定利用数据来推动业务价值的机会。
- 制定整体的优先事项,以记分卡和指标为基础,涵盖组织健康、人才和文化,以及数据质量。
- 加强合乎道德的数据使用,确保新的创收数据服务与企业的价值观和文化相一致。
6.数据生态系统的成员资格是常态
今天
数据往往是孤立的,甚至在组织内部也是如此。虽然与外部的数据共享安排伙伴和竞争者正在增加,但它们仍然不常见,而且往往很有限。
到2025年
大型复杂的组织使用数据共享平台来促进组织内部和组织之间的数据驱动项目的合作。数据驱动的公司积极参加数据经济,促进数据的汇集,为所有成员创造更有价值的洞察力。数据市场使数据的交换、共享和补充成为可能,最终使公司有能力建立真正独特和专有的数据产品并从中获得洞察力。总的来说,交换和结合数据的障碍大大减少,以这样一种方式将各种数据源汇集在一起,产生的价值远远大于其各部分的总和。
日常应用
- 制造商通过开放的平台与他们的合作伙伴和同行分享数据,以建立一个更全面的全球供应链视图。
- 制药和医疗机构汇集各自的数据(例如,制药研究人员收集的临床试验数据,医疗保健机构收集的匿名患者数据),以便每个公司能够更好地实现其目标。
- 金融服务机构利用数据交换来创造新的能力,例如,通过提供环境信息来支持有社会意识的投资者,对上市公司的社会和治理(ESG)评分。
关键促进因素
- 采用共同的数据模型以促进数据协作的便利性。
- 发展数据联盟和共享协议;近年来出现了一些数据共享平台,可以促进机构内部和机构之间的数据交流。
如何开始
- 阅读更多关于不同类型的数据生态系统和成功生态系统的最佳实践。这里有金融服务、零售和医疗保健方面的例子。
- 选择对你的组织来说最重要的数据生态系统原型。
- 采用数据共享工具、协议和程序。
7.数据管理被优先考虑,并在隐私、安全和弹性方面实现自动化。
今天
数据安全和隐私通常被视为合规性问题,这是由新生的监管数据保护任务和消费者开始意识到他们的信息被收集和使用的程度所驱动的。数据安全和隐私保护往往是不充分的或单一的,而不是针对个别数据集的。为员工提供安全的数据访问是一个高度人工的过程,容易出错且时间长。人工操作的数据恢复流程使其难以快速、全面地恢复数据,造成长时间的数据中断风险,影响员工的工作效率。
到2025年
受《弗吉尼亚州消费者数据保护法》(VCDPA)、《通用数据保护条例》(GDPR)和《加利福尼亚州消费者隐私法》(CCPA)等不断变化的监管期望的推动,组织思维已完全转向将数据隐私、道德和安全视为所需的能力范畴;消费者对其数据权利的认识不断提高,并且安全事件的风险越来越高。自助服务供应门户使用预定义的”脚本”管理和自动化数据供应,以安全和可靠的方式向用户提供近乎实时的数据访问,大大提高了用户的生产力。稳定自动的备份程序确保了数据的弹性;更快的恢复程序可以在几分钟内而不是几天或几周内,迅速建立和恢复数据的”最后良好副本”,从而在技术故障发生时将风险降到最低。人工智能工具可用来更有效地管理数据,例如,通过自动识别、纠正和修复数据质量问题。总之,这些努力使企业能够在数据和数据管理方式两个方面建立更大的信任,最终加速采用新的数据驱动服务。
日常应用
- 有在线业务的零售商需要明确说明他们收集的消费者数据,通过消费者门户网站获得用户的同意,并允许他们”选择加入”个性化选项。
- 拥有高度敏感数据的医疗和政府机构建立了先进的数据弹性协议,每天自动多次备份数据,并在需要时确定”最后的良好副本”实现无缝恢复。
- 零售银行自动提供支持面向客户的应用程序所需的信用卡数据,特别是在开发或测试期间,以提高开发人员的生产力。并提供对数据的访问,比今天传统的手工工作更有效和安全。
关键促进因素
- 提升整个组织范围内的数据安全重要性认知。
- 提高消费者对个人数据保护权利的认识和积极参与程度。
- 采用自动化数据库管理技术,实现自动供应、处理和信息管理。
- 采用基于云的数据弹性和存储工具,促进数据的自动备份和恢复。
如何开始
- 考虑采用数据伦理学框架来理解和评估潜在的伦理学问题,以及数据和分析活动的监管影响,特别是涉及消费者数据的情况。
- 考虑利用云工具来存储、管理和保护优先数据,对于已经驻留在云上的数据,利用自动备份和弹性能力及工具作为网络安全政策的一部分。
- 随着新的自动供应和弹性能力的发展,创建一个迁移路线图。
- 采用敏捷的、迭代的方法来制定、审查和修订治理和控制协议,以利用即将到来的机会来实现数据库管理的自动化,例如,通过建立一个自助供应门户,并在兼容的数据平台上强制执行自动备份和恢复程序。
译者介绍
温为民:主译者,DAMA 会员,DAMA数据管理专家,项目管理师,PMP,Prince2、国家二级心理咨询师。
马欢:校对,DAMA 会员,DAMA数据管理专家,《DMBOK数据管理知识体系(第1&2版)》中文版主译者,CDMP Master。