数据是组织最重要的资产
涂辉招 | 论交通领域数据分类分级与资产化

涂辉招 | 论交通领域数据分类分级与资产化

导读:在数据成为生产要素的大背景下,数据的分类分级管理是数据成为资产和要素的关键,本文为同济大学涂辉招教授对交通你够用数据分类分级的思考。


交通领域数据分级分类

01数据的风险等级

数据风险主要包括泄漏、滥用、违规、传输、非法访问等。为了能够保障数据合规有效流通起来,需要构筑三道防线:管理防线、法律防线和技术防线。各个行业都在紧锣密鼓地推进构筑这三道防线,尤其是落实在具体操作层面。三道防线的核心理念是平衡与合规、合法。

在平衡合规与发展过程中,技术防线一般都聚焦在数据分类分级。比如,上海市委网络安全和信息化委员会办公室发布的数据分类分级指南提出“四个危害对象”和“三个风险等级”。

“四个危害对象”分别为:

  • 国家安全
  • 公共利益
  • 个人权益
  • 组织权益

“三个风险等级”则为

  • 核心数据
  • 重要数据
  • 一般数据

不同级别的数据采取不同的保护措施。国家对个人信息和重要数据进行重点保护,对核心数据实行严格保护。这意味着将来核心数据是难以在市场上进行流通交易的

02交通数据的分类分级

在交通领域,交通运输部办公厅最近发布的《公路水路交通运输数据分类分级指南》,把危害对象分为了五个,区分得更细致,但风险级别还是三级。交通是公益性的服务,所以把政治安全和国家安全放在非常重要的地位,同时又将运行安全、社会稳定、公共安全纳入其中。既然核心数据难以被流通交易,那就需要对数据进行降维处理,比如进行数据脱敏等,实现数据风险等级降级。

交通是大行业,按业务领域进行分类,可分六大领域:公路、道路、城市交通、水路交通、公共交通和其他交通。分类之后是进行分级,对于如何区分核心数据、重要数据,交通运输部门提出了三个指标:规模、精度、深度。精度涉及到高精度定位,数据开发利用存在一定的困难;深度涉及到敏感信息挖掘的程度。

03交通数据分类分级案例

同济大学支撑上海市大数据中心交通委团队,按照规模、精度、深度三个维度将交通领域数据分成红、橙、蓝三色属性。数据精度方面,危险品运输如果涉及实时定位信息,则属于红色核心数据。在保证合规的前提下,如何应用这些信息是关键。数据深度方面,虽然交通领域涉及到个人ID等信息,但是深度不一样。如果在这些身份信息上进行了深度挖掘,且又具有一定规模,那可能会得到深度敏感信息,这也属于红色核心数据。

数据分类分级另外一个比较好的案例,是智慧民航数据治理规范数据安全。智慧民航针对不同危害对象,然后提出不同的风险等级标准。对于智慧民航来讲,安全准则也是三道防线。比如第一道防线合规,更多的是从法律层面讲;从技术层面上,需要全程可控;从管理层面上来讲,希望云平台能实现动态可控和可审计。归根到底智慧民航还是围绕危害程度、分级标准和三道防线来构筑,实现不同领域、不同行业数据的分类分级。

智慧民航另外一个非常好的概念,就是对数据全生命周期的保护。从数据采集、传输、存储、使用、共享和销毁全生命周期,都要求对数据进行分类分级。尤其是分级以后需要采取安全防护做事。比如四级以上安全风险,针对数据存储提了一个非常明确的要求:即网络安全建设及监督管理宜满足网络安全等级保护3级要求。三级以上安全风险,在数据传输过程中,物理介质传输不离开相关责任人监视控制范围,并提出了一些非常明确的相关措施来实现整个数据分级分类的指导。

如何实现交通数据资产化

01七层级数据资产化中台

交通领域数据资产化在上海市交通委科技信息处的指导下正在形成一个统一的框架,即考虑七层级要素数据资产化中台。那么如何实现交通领域数据资产化促进数据的流通?

第一层级数据对象。把数据底座打牢,上海智能交通系统的顶层设计很明确提出“七可”数字底座:可监测、可视化、可交互、可预测、可决策、可赋能、可拓展。

第二层级质量评估。保证交通领域数据可以交易流通,其本质是不需要垃圾数据的,而是要高质量数据。因此,数据质量的评估指标和评价方法的提出是非常关键的。

第三层级价值评估。针对不同的用户需求,其数据价值是不一样的。同样的,数据价值的评估指标和评价方法的提出是非常关键的,也是数据价值实现的前提保障。

第四层级权属管理。基于区块链的数据确权,包括数据资源持有权、加工使用权、产品经营权等。需要强调的是,在拥有数据的同时还需要承担相应的数据风险。

第五层级数据治理。在数据安全风险评估的基础上,分级分类只是数据治理的一部分,还有信息安全、算法杀熟等数据治理问题。此外,数据治理要把数据本身的标准化提到非常重要的位置,甚至作为数据治理的主要方向。

第六层级交易平台。任何数据都难以实现点对点的交易流通共享,这时需要一个数据交易平台,它是架起数据生产者、数据消费者和数据使用者之间的桥梁。

这六个层级如果都实现了,才能真正考虑数据具体的应用场景,这是第七层级。为了搭建交通领域数据资产化的中台,我们在架构体系里考虑了七个层级。我们举一个应用案例,自动驾驶已广泛开展全链条测试。全链条测试是自动驾驶技术全面落地前的完整测试过程,包括仿真模拟测试、封闭场地测试、开放道路测试、示范应用测试,共四个环节。大规模的道路测试产生了海量的数据,蕴含高额潜在价值,亟需通过数据资产化方式来赋能自动驾驶技术的发展、智能汽车与智能交通产业生态的构筑。然而,自动驾驶路测数据资产评估却面临数据安全难保障、数据质量难确保、数据价格难确定、数据权属难明确等四难挑战。从政府和企业来讲,都面临如何提升自动驾驶技术,实现商业价值的问题。如何释放海量测试数据的作用是迫在眉睫的。

02如何应对四难挑战

为了应对四难挑战,可以从资产化的视角出发。在整个数据资产化发展过程中,从数据到数据资源,再到数据资产及产品,数据的定义、权属、质量和价值四个维度是不一样的。数据资产化就是以数据为载体和表现形式,能够持续发挥作用并且带来经济利益的数字化资源。最近我们同济大学正在跟智能汽车创新发展平台(上海)有限公司合作,围绕自动驾驶全链条数据如何实现数据资产化,来打造一些数据产品,进而实现数据资产的交易价值。通过我们初步的研究分析,数据质量越高,交易量增加幅度就越大。因此,数据质量是实现资产交易最关键的要素。数据资产化后,不管是信息量、定价还是数据产生的整体效用,都增加了,这对生产者、数据交易所平台、消费者都有好处。

关于数据隐私问题,在数据合规发展的过程当中,如果数据涉及国土安全等,就不能被交易共享流通,数据要被保护起来,对数据的信息量、定价和整体的效益利润率都会大大降低。我们最近的研究表明,如果对数据采取脱敏脱密等措施,可以大大加快数据的交易共享流通。

最后,就是数据的标准化问题。2021年由上海市交通委科技信息处牵头成立了上海市智能交通标准化技术委员会,同时编制了上海市智能交通标准体系,涉及到4大类23个门类。4大类里面有一类是基础类。基础类有几个方面是跟数据相关的。其中一个是参考架构,数字底座的架构能不能统一除了架构以外,还需要把数据分类分级、模型体系、数据质量、数据价值、数据安全、交易标准等进行标准化统一。

03结语

这仅仅只是交通领域的数据,如果针对全市全行业数据来说,数据标准的内容和要素会更多。数据资产化的标准化,包括数据资产识别、检索、应用、审计、变更、盘点。

我的总结语就是:

数据本身是无用的,除非从中获取到有价值的洞察!

作者:涂辉招:同济大学交通运输工程学院教授、博士生导师,同济大学城市风险管理研究院副院长。

来源:上海数据交易所研究院

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注