在“完善公共数据开放共享机制”部分,《方案》指出要“建立健全高效的公共数据共享协调机制,支持打造公共数据基础支撑平台,推进公共数据归集整合、有序流通和共享”。
数字经济的发展离不开数据生产要素,而制约数据要素市场发展的一个主要问题是数据供给不足。由于数据作为准公共品的非竞争性和部分排他性等特征,又存在数据安全问题,导致数据产品存在价格趋于零、确权难和交易不积极等问题;这让传统的先确权再交易的方式不完全适用于数据产品,从而存在数据供给不足的问题。
在这样的背景下,推动公共数据开放共享,将有效缓解数据供给不足问题。
完善公共数据开放共享机制至少有如下三个好处。
一是可以降低数据资源获取成本。公共数据开放,使数据需求方无需或仅支付成本价格,从而可以降低交易成本;我国各地普遍要求政府编制数据开放目录,并在政府设置的数据开放平台上载明,可以降低搜寻和甄别成本;公共数据开放规则明确,数据供需双方的权利义务清晰,有利于降低合规成本。
二是提高公共数据利用效率,公共数据开放一方面是向市场提供数据资源,另一方面也是借助市场力量打破公共数据沉睡状态,使数据资源得到合理使用。政府可在不增加税收、节约财政资金的前提下,使公众能获取更多的产品服务。
三是有利于矫正数据要素市场失灵。政府一般通过监管和参与两种手段矫正市场失灵。目前,数据应用中非法获取、滥用等市场失灵频现,政府实行了诸多监管举措。但仅靠监管“一条腿走路”也会影响效率,并带来寻租等新的不公平,有必要打通另一途径——政府通过开放公共数据“参与”市场,在丰富数据要素供给的同时,为数据市场规范发展树立标杆。
在“建立健全数据流通交易规则”部分,《方案》指出要“探索‘原始数据不出域数据可用不可见’的交易范式,在保护个人隐私和确保数据安全的前提下,分级分类、分步有序推动部分领域数据流通应用”。这其中有两个要点。
一是交易范式尽量实现原始数据不出域。这一交易范式符合当前数据生产要素确权难的现状。推动这一交易范式,可考虑将培育数据交易市场的重点落在培育基于数据价值的数据服务交易,谨慎推进基于明确数据权属的原始数据交易。一方面,这是由于数据生产要素的特殊性,导致明确一些数据的权属有较大的难度;二是用户信息,尤其是关于个人的姓名地址等敏感信息的原始数据,不宜明确归属于非用户个人的第三方;三是从国际经验看,欧美等国也没有将数据权属划归第三方企业或者数据分销商的制度安排。
二是分级分类、分步有序,可考虑通过发放数据牌照或者许可证来实现这一目标。具体来说,相关部门可考虑先划定发放数据牌照的范围,再结合数据信托与公共机构管理,通过发放分级牌照(或者数据许可证)的方式来规范数据共享与使用。由公共机构颁发数据许可证的做法在世界数据保护制度中有先例。例如,1973年瑞典《数据法》就规定设立数据审查委员会(Data Inspection Board)负责立法的实施和个人数据的保护。鉴于数据确权的困难,将数据信托与公共机构管理相结合作分级数据牌照(或数据许可证)的制度安排,既可以保护用户对自身数据的所有权,又能促进数据的分享和使用,推动数据要素市场的培育。
这一制度安排需要推进以下方面的工作。
一是明确除了不需发放数据牌照之外的情况,数据企业均应持有不同级别的数据牌照。
二是数据牌照的类型分级可以按照基础数据的采集、分析、衍生数据的分析和研发等来分类。
三是要明确数据牌照的发放、限制使用与吊销流程。用户将数据委托给专门受理、判断和颁发数据牌照的公共机构,公共机构作为受托机构,要对申请的数据企业作个案审查以决定是否给数据企业分级数据牌照,并监督企业在事先约定的范围内共享和使用数据。通过分级牌照制度,获得牌照的企业可以在限定范围内使用数据以及根据上述数据产生的、数据牌照框架内允许的衍生数据。如果相关用户发现企业数据使用的实际行为超出许可证支持的设计范围,就能提请确权中心介入调查。如果认定数据企业违反相关约定,公共机构可以对牌照降级甚至吊销牌照。
四是发放数据牌照的制度安排需要明确数据主体和数据企业的权益保护和争端处理机制,也就是需要监管部门明确数字企业的哪些行为属于侵权行为并公布明确的数据争端处理流程。
在“拓展规范化数据开发利用场景”部分,《方案》强调了要发挥领军企业和行业组织的作用,尤其是“在金融、卫生健康、电力、物流等重点领域,探索以数据为核心的产品和服务创新,支持打造统一的技术标准和开放的创新生态,促进商业数据流通、跨区域数据互联、政企数据融合应用。”
这一指引,反映了政府对数字时代的未来趋势有前瞻性的深刻把握。
数字时代,在不同场景中开发利用数据正在成为社会治理的核心,关于人的重要决定,如衣食住行、生老病死、就业失业、言论传播,越来越取决于不同场景中基于数据的运算结果。
恰当利用要素数据开发利用场景,可以发挥如下四点优势:一是推动市场环境更透明、信息更易于自由流动;二是降低了搜寻成本;三是降低了准入门槛;四是推动技术突破、效率提升,出现产品和服务创新以及创新生态。这些新业态可以被分为两类。一类业态属于从0到1的变化,是指将过去大量无法利用的信息现在用于新业态,例如利用驾驶员的身体姿态来判断其疲劳程度从而优化保险定价;另一类新业态则属于从1到N的变化,这是指数字技术让满足长尾客户的需求变得更加容易,出现了更多个性化定制的产品。由此可见,《方案》提及的产品和服务创新、创新生态、数据融合应用等,正是顺应了这一大趋势。
但是,如果没有能规范化数据开发利用场景算法的应用也带来不少管理方面的挑战,其中算法歧视、算法黑箱、算法助力垄断等问题尤为受到关注。以“大数据杀熟”为代表的算法歧视问题,是指运用大数据分析和用户画像,歧视对待不同用户群体从而获取垄断收益的现象。这里的用户既包括消费者,也可能包括供应链上的其他环节,如商家、外卖小哥等。算法黑箱问题是指由于技术本身的复杂性和一些排他性商业政策,算法犹如一个未知的“黑箱”,用户不清楚算法的目标和意图、不知晓设计者和使用者对算法生成内容的责任归属,更无法评判和监督相关算法及其设计者和使用者。人类的普遍利益在于实现可理解、可信赖的人工智能。因而算法黑箱是目前需要面对的紧要问题。算法相关垄断问题是指为了确保和巩固自身的数据利益和优势地位,处于市场支配地位的平台企业可能会利用大数据和算法来排除和限制市场竞争。具体来说,一些平台或企业可以运用算法规则、垄断协议、拒绝交易、纵向约束等方式,策略性设置数据访问和数据共享壁垒,增加用户转换成本,来提高其竞争对手进入市场的门槛和成本,防止后者以此来跨越市场壁垒,进入其所在的市场内与其展开竞争。
拓展规范化数据开发利用场景可考虑推动重视算法规则透明化,推动重在输入输出和结果评估的算法审计。这是因为要规范数据开发利用场景,就需要对数据开发利用场景是否规范作出评估。算法审计指收集有关算法在特定应用场景中使用时的表现的数据,然后使用这些数据来评估算法是否对人们的某些利益(或权利)产生了负面影响,从而评估算法本身好坏的过程。
监管部门推动算法审计至少可以有四方面作用。一是评估某些算法是否合法合规,如监管部门审计银行的放贷算法,以评估其是否确实能够在不增加不良率的情况下做好风控;二是评估算法是否符合经济社会运行规律,是否能避免“劣币驱逐良币”现象;三是评估算法供应商和买家的风控能力,通过算法审计来评估相应企业面临的道德和声誉风险,以及在出现风险时的补救能力;四是为平台企业的利益相关方增加算法方面的信息透明度,帮助他们在投资、与平台打交道等方面做出知情选择。
就算法审计的具体框架而言,可以要求平台明确对不同利益相关方,报告对算法训练和算法评估及选择中用到的数据来源与质量、算法预测或优化目标、算法使用的技术、算法运行效果等。评估维度可包含是否歧视、有效性、透明度、安全性和可获得性等方面。
最后,建议成立高规格数据治理委员会,全面统筹安排与数据治理相关的数据生产要素、算法治理和个人信息保护与数据安全等方面的工作。由于大数据、算法和其他数字技术的应用已经深入渗透社会经济生活的方方面面并将更快速、更全面地深入,数据治理状况将深刻影响我国数字经济和社会治理的走向,以及我国参与国际竞争与合作的态势。现有的由国家网信部门统筹协调、多部门联合的数据治理制度框架不能前瞻性地安排数据治理的全部工作,需要成立更高规格数据治理委员会来应对新形势。该委员会的工作内容可包括:制定数据生产要素的交易范围、算法治理和个人信息保护与数据安全等方面的指南;执行数据牌照的申请、审核、发放、限制使用和吊销;推动算法审计;协调个人信息保护和数据安全方面的工作;设定争端解决与协调机制等。在治理思路上,重在通过恰当的治理机制设计、通过发展技术来解决新技术带来的问题,尽量避免“一刀切”式监管。
来源:《经济》杂志-经济网
作者:北京大学数字金融研究中心主任 黄益平
北京大学数字金融研究中心副主任 沈 艳
编辑:马明 审核:赵琬姝