第二章 区块链高质量发展与数据治理

习近平总书记在中共中央政治局第十八次集体学习中的讲话内涵丰富,思想深邃。他敏锐地抓住现代信息技术发展的前沿热点,强调要加快推动区块链技术和产业创新发展,高屋建瓴地提出我国区块链技术发展蓝图,为我们指引了方向。同时他又要求客观辩证地看待创新技术的“双刃剑”效应,强调要加强对区块链技术的引导和规范,加强风险研究和分析,加强行业自律,落实安全责任,依法治链,推动区块链安全有序发展。

应该说,要不要发展区块链,已无争议,怎么发展才是当前亟须回答的关键问题。本章认为,先从数据存证、共享入手是务实策略,考虑到技术前沿在公有链,我们应支持公有链的研究,基于现实环境,联盟链或许是应用落地的较优选择。密码学是区块链技术的重要基石,应加强国产密码算法应用和创新发展,以保障我国区块链安全可控。当前最重要的是,我们应提倡区块链的高质量发展,为此,需要加强链上和链下数据治理(Data Governance),建立有效的区块链数字治理体系。

一、先从数据存证、共享入手,逐步向价值网络发展,是务实的落地策略

从现阶段技术的成熟度看,区块链在价值转移方面,还存在性能上的争议,但其本身就是一个点对点的数据共享网络,因此其在数据存证、共享方面的适用性存在较少分歧。在总书记的重要讲话中,促进数据共享是他指出的五大区块链作用之一,也是他强调的区块链重点应用方向。利用区块链数据共享模式,可实现政务数据跨部门、跨区域共同维护和利用,促进城市地区在信息、资金、人才、诚信等方面更大规模的互联互通,保障生产要素在区域内有序高效流动,提升城市管理的智能化、精准化水平。

但是区块链技术本身对数据高度冗余的要求,客观上增加了计算与存储开销;另外区块链技术在数据透明方面的特性,需结合安全多方计算、同态加密、零知识证明(Zero-Knowledge Proof,简写为ZKP)等隐私保护技术,才能保障大范围的应用,而隐私保护技术本身的效率还在提高过程中。

因此当前比较合理的实现方法是链上共享数据的哈希指纹存证与信息披露,真实数据按照“数据不出门、数据不落地、数据可用不可见”三原则,依托安全隐私保护技术在链下按照授权来共享使用,随着基础设施与安全技术的进步,有计划地将系统和数据迁移到区块链上,进而发展成为价值网络。

二、技术研究在公有链,场景应用在联盟链

从私有链到联盟链、公有链,社区信任程度逐步递减,相应带来的技术难题(比如共识机制、性能问题、隐私保护等)逐步递增。私有链类似于传统信息系统,联盟链是相互信任的机构之间的互联互通,介于去中心化和中心化之间,根据业务场景的要求,不一定只采用POS(Proof Of Stake,股权证明)或POW(Proof Of Work,工作量证明),可采用BFT(拜占庭容错)等传统共识机制,也可以采用多种共识协议相结合的混合共识机制,Libra就是联盟链。而公有链的相互信任程度最低,高度开放和容错下的安全和性能挑战所要求的技术水平最高。公有链的前沿技术突破,将为联盟链和私有链现有技术问题提供新的解决方案。因此,就学术而言,区块链的技术创新关键点更多的是在公有链上。支持公有链的研究,推进联盟链的应用,是我国区块链发展战略的应有之义。

三、以监管科技应对金融科技,是区块链治理的应对之道

可以说,区块链的去中心化对金融监管提出了全新的问题和挑战,完全开放自由的公有链存在合规风险,如承载金融科技应用则必须予以改进。应对之道或许是以监管科技应对金融科技,联盟链是许可链,既可以开展跨机构应用,也可以为行业自律和监管提供服务。鉴于此,可考虑在不损害区块链技术优势的前提下,在公有链上增加监管节点,保障公有链的合法合规,或者采用多链策略,即采用联盟链+公有链的“二元模式”,将联盟链在相关监管部门注册,开展链上监管,去中心化应用则使用公有链,开展去中心化商业活动。若有需要,监管者亦可从联盟链穿透到公有链,管控全局。基于依法合规的现实要求,联盟链或许是应用落地的较优选择。

四、国产密码算法的应用和创新发展,是我国区块链安全可控的基础

本质上,区块链是一个基于密码学原理的分布式共享存储与计算系统,其对中心化机构的扬弃和对密码学技术的依赖,标志着一种全新范式的控制权的转移。就这一个角度而言,国产密码算法的应用和创新发展,意义重大。关键领域的区块链应用,密码学技术必须符合国家密码标准。

目前,国家密码局公布的中国自主研发的国家商用密码算法,包括SSF33、SM1(SCB2)、SM2、SM3、SM4、SM7、SM9、祖冲之密码算法(ZUC)等。其中SSF33、SM1、SM4、SM7、祖冲之密码算法是对称算法,SM2、SM9是非对称算法,SM3是哈希算法。国密算法有优点,但也有需要改进的地方。以SM2为例,相比传统的ECDSA(椭圆曲线数字签名算法),两者的签名和验签的核心步骤相近,SM2签名验证算法加入了较多的检错功能,提高了签名验证系统的数据完整性、系统可靠性和安全性。与广泛应用的RSA数字签名算法相比,SM2在同等安全强度下所需密钥位数更少,且密钥对生成速度、签名速度,均优于RSA数字签名算法。但SM2也有其劣势,比如验签速度相比RSA处于明显的劣势,尚需改进。

目前,国密算法还没有覆盖到同态加密、零知识证明、多方安全计算等,急需拓展相应国密算法库,并实现标准化。而随着我国区块链应用跨出国门,国密算法也应一并走向世界,成为国际标准。这些都对我国国密算法提出了更高的要求。

虽然区块链的应用是去中心化的,但区块链的密码标准体系则是由特定的机构所掌控的。可以说,谁掌握了密码标准体系,谁就掌握了区块链发展的话语权。

五、加强链上和链下数据治理,是现阶段推动区块链高质量发展的关键

如前所述,数据的互联互通应是现阶段区块链技术的重点应用方向,联盟链或将是其主要形式。但我们应提倡区块链的高质量发展,警惕“大干特干,一拥而上”的无序低质量发展。需要强调的是,区块链上的数据应该是具备较高价值的可公开的不宜修改的数据。这是它的特性,更是它的优势和品质所在,若无谓地把无价值的且可随意更改的数据上链,实际上是对区块链技术的滥用,也无法构建起符合实际业务需求的应用。为此,我们需要建立有效的区块链数据治理体系,以保障区块链应用的质量。

通俗来说,数据治理是指所有为提高数据质量而展开的业务、技术和管理活动,包括组织架构、政策制度、技术工具、数据标准、流程规范、监督考核等。国际数据管理协会(DAMA)的《数据管理知识体系指南》(DMBOK)则将数据治理框架定义为数据控制、数据架构管理、数据开发、数据操作管理、数据安全管理、数据质量管理、参考数据和主数据管理、数据仓库和商务智能管理、文件和内容管理、元数据管理等10个方面。针对区块链技术的特性,或许可从以下几个方面入手,构建区块链数据治理体系。

(一)加强链下数据治理的评估与监督,防止短板效应

区块链技术可以解决链上的信任问题,保障链上原生数据的真实性、准确性与一致性,但对于链下数据,区块链则“鞭长莫及”,无法保证其质量。倘若链下源头数据被“污染”了,区块链上流转的数据就成了“垃圾”,也就是所谓的“垃圾进垃圾出”(garbage in,garbage out)。因此,高质量链下数据是高质量区块链的前提。而要实现这个前提,则需要依靠各节点的链下数据治理。虽然说各节点的链下数据治理似乎是各家自己的事情,但某一节点的数据治理缺失往往会限制区块链的整体质量和价值,形成短板效应。因此,各节点应采取有效的技术工具、管理手段和组织体系,对数据在计划、获取、存储、共享、维护、应用、消亡全生命周期可能存在的质量问题,进行识别、度量、监控、预警和改进。

为了避免短板效应,可考虑成立联盟链联合工作组,评测各节点链下数据治理的成熟度,督促各方提高上链的数据质量,必要时可设置数据治理成熟度的准入门槛。目前已经有比较成熟的数据治理评价模型可供采用,比如国际商业机器公司(IBM)的数据治理成熟度评估模型(DGMM)、能力成熟度模型集成协会(CMMI)的数据管理能力成熟度模型(DMM)、美国企业数据管理协会(EDM Council)的数据管理能力评估成熟度模型(DCAM),以及我国信息技术标准化技术委员会在2018年发布的数据管理能力成熟度评估模型(DCMM)。

(二)参照主数据管理理论,开展链上数据治理

在数据治理框架中,主数据管理是核心。所谓的主数据是指描述机构核心业务实体的,在机构内外被广泛应用和共享的数据,是机构的核心资产,具有高价值和高敏感性。构建统一的主数据标准,可将原先各个处于竖井之中的业务系统打通,实现数据的全局一致性和准确性。事实上,区块链技术也可看作跨节点主数据的集成技术或架构。因此,我们可参照主数据管理理论,开展链上数据治理。

一是清晰的业务需求。不是所有的数据都要上链,只有需要多方共享的高价值数据,或者说只有主数据,才需要上链,早期甚至只有主数据的哈希指纹存证在链上。

二是明确的主数据规则和标准。联盟链的各方应预先在标准和规则层面达成一致:各节点的上链数据在链下统一标准,或者各自规范,仅在上链时通过数据抽取引擎(比如ETL、ESB),将异构数据转为链上统一格式的标准数据集。如果是前者,那么各方应共同制定链下数据标准,即统一的数据定义、分类、记录格式和编码,以及分类规范、编码结构、数据模型、属性描述。如果是后者,各节点在数据上链之前通过数据抽取引擎,对欲上链的数据进行一系列的加工处理,以形成标准统一的主数据,再根据链上数据规范要求进行数据存证与信息披露。

三是统一的链上元数据标准。为了使多源的链上数据能被区块链各参与节点方准确理解和使用,需要事先对每个数据元素进行元数据定义,消除数据的二义性,降低数据集成的成本,让各方能够在统一的逻辑框架上解读和验证链上与链下数据。

四是适当的干预机制。欧盟的《通用数据保护条例》(General Data Protection Regulation,简写为GDPR)规定数据主体享有知情同意权、访问权、拒绝权、可携权、删除权(被遗忘权)、更正权、持续控制权等多项权利。其中,删除权(被遗忘权)是指数据主体有权要求数据控制者立刻删除与其有关的个人数据及其副本、备份和任何链接。更正权是指数据主体有权要求数据控制者更正并且完善与其有关的个人数据的权利。从这个角度看,区块链的难以篡改特性与上述两个数据主体权利存在一定的冲突。因此,需要在联盟链上建立适当的干预机制,以满足法律上的数据主体权利保护要求和其他合规要求,而且这也是保障良好网络生态的应有之义。

五是科学的管理体系。数字治理本质上是一种管理活动,需要有相应的运维组织、管理流程和考核机制,推动数据标准规范的落地实施和有效执行。比如可考虑成立联盟链联合工作组,负责开展明确数据需求、制定标准、统一规则、监督评估等治理工作,并负责评测各节点的链下数据治理成熟度,行使节点的许可准入权力。

(三)加强数据安全管理与隐私保护,保障数据资产价值

随着数字经济时代的到来,数据已成为关键的生产要素。数据具有经济价值,是重要资产。如何在数据共享的同时,又避免数据泄露,自然是数据治理的重中之重。在需求规划时,各节点应预先梳理各自的数据,识别哪些是非密数据,哪些是保密数据,哪些是敏感数据,哪些是边缘数据,哪些可公开,对谁可见,和谁共享,在此基础上,根据数据的价值、敏感性和隐私性进行分级,制定访问控制矩阵和差异化隐私策略。在数据上链时,应保证接口安全。无论链上数据访问,还是链下数据访问,应有身份认证、分级授权等访问控制,防止攻击者假冒合法用户获得访问权限,保证系统和数据的安全。在数据的传输和共享过程中,可根据数据的共享和安全需要,对不同的数据进行脱敏,或者采用数据加密技术,比如零知识证明算法对数据加密,亦可采用一些通道技术来限制数据共享范围,控制数据泄露风险。

六、结语

当前,发展区块链技术俨然成为一种不可阻挡的技术趋势,是全球产业变革的全新赛道,各国均在发力,加速布局。在这样一个全球瞩目的阵地,我们应扎实备战,抢占技术制高点。习总书记的讲话是我国区块链技术创新和产业发展的指导思想和根本宗旨,我们应积极贯彻落实总书记重要讲话精神,珍惜战略机遇,求真务实,勇于探索,使区块链技术在建设网络强国、发展数字经济、助力经济社会发展等方面真正发挥作用。