学术观点 -> 应邀专家
数据资产统计与核算问题研究
作者:许宪春、张钟文、胡亚茹    发布:2022-02-16    阅读:3432次   


中国经济社会数据研究中心 2022-02-15 16:45



来源:学习强国平台

摘要:伴随着数字化技术与经济社会各领域的深度融合,数据呈现爆发式增长趋势和多元化应用价值。数据作为新型资产,应以何种方式纳入统计和国民经济核算,从而在宏观经济统计数据中客观、科学地体现数据资产在经济社会发展中发挥的重要作用,是统计和国民经济核算理论亟待突破的时代难题。本文基于国民经济核算研究范式,结合理论研究及实地调研,提出描述数据生产过程的“数据价值链”,以明确“数据”作为关键生产要素的概念及生产属性,并结合数据的特征,提出数据资产的概念,进一步基于数据支出资本化核算的基本分类,探索数据资产价值的测度方法和基础统计资料来源。本文试图为中国数据资产统计与核算工作提供理论依据和方法支撑,为数字化转型背景下国民经济核算理论、统计标准和调查方法创新做出贡献。

关键词:数据资产 统计 国民经济核算 价值测度

一、引言

近年来,伴随着云计算、物联网、人工智能等为代表的数字化技术与经济社会各领域的深度融合,数据驱动的新产业、新业态和新商业模式不断涌现,数据呈现爆发式增长趋势和多元化应用价值。党的十九届四中全会提出,“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”,首次将数据纳入生产要素并强调形成其收入分配机制。2020年中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,进一步明确提出了加快培育数据要素市场,推进政府数据开放共享,依法合规开展大数据交易。数据已经成为关键生产要素,并具有重要的战略资源价值,其资本化成为必然趋势。

目前的国民经济核算国际标准《2008年国民账户体系》(以下简称“2008年SNA”)还没有明确提出数据的资本化处理,仅在“数据库”固定资本形成的估价原则中涉及到数据。具体讲,2008年SNA建议自用型的数据库按照成本总和进行估价,包括以适当格式准备数据的成本、数据库开发过程中所用的任何相关人力成本和资产资本服务,以及任何相关的中间投入成本,但不包括数据的获取或产生的费用(2008年SNA,10.113段);同时,2008年SNA建议用于销售的数据库采用市场价格来估价,这个市场价格中包括数据库所包含的信息的价值(2008年SNA,10.114段)。

然而,数字经济时代,得益于数据产生、收集、存储、加工处理和开发应用技术的快速迭代升级,数据驱动的商业模式和价值创造模式不断创新。基于广泛的实地调研发现,并非所有数据驱动的商业模式或应用场景都涉及数据的市场交易,更多情形下企业或机构经过加工和积累形成的数据往往并不直接售卖,而是用于内部使用;数据价值也不一定体现为直接的货币化价值,而是以“非货币交易”模式,实现降本增效、提升产品和服务质量或创造社会效益(Goodridge and Haskel,2015;Ahmad and Van de Ven,2018)。诸如青岛海尔集团搭建的COSMOPlat工业互联网平台,通过联结的产品、设备、传感器等物联网节点自动采集企业生产经营活动产生的研发、采购、生产、物流、销售、人力资源和财务等各环节的企业内部数据以及用户行为数据、设备运行数据,利用大数据分析技术实现单件小批量的柔性化和大规模定制化生产,优化工艺流程、提升生产效率的同时,实现产品智能升级,也为用户提供更具个性化的智慧生活服务及问题解决方案。又如,贝壳找房作为数据驱动的新居住服务平台,依靠业务员对线下交易的人、房、客信息进行数据采集,并对包含中国332个城市约2.26亿处房产、450万张景观图和1020万处建筑物等信息的真房源数据进行数字化存储,形成住宅数据库(“楼盘字典”),通过每日实时更新海量真房源和新价格,实现房产交易中人、房、客数据交互流程的标准化、数字化和智能化,同时利用智能扫描设备研发、VR场景构建算法和三维重建等数字化分析技术,打造了VR房源应用场景,从而精准连接供需两端,全方位提升用户在购买新房和二手房售买、租赁、装修以及社区服务等居住需求的服务体验。再如,上海浦东新区政府部门依托“政务云”项目,基于构建的浦东新区政务信息资源目录体系,将相关委办局采集、核准及提供的海量政务数据构建形成基础数据库和各类业务专题数据库,进一步通过对数据进行加工、挖掘、分析和可视化监管,实现政务数据的全生命周期管理和共享交换,通过数据的跨部门协同共享与整合,显著提升公共管理和政务服务水平。

可见,数据的价值体现在企业生产经营、居民生活和政府治理等诸多方面,但在企业资产负债表和宏观经济统计数据中却尚未体现(Nguyen and Paczos,2020)。数据的范畴已经远远超出数据库的范畴(International Monetary Fund,2019),自用型数据和免费服务情形下的数据价值,2008年SNA没有给出建议,且2008年SNA建议数据价值只有在数据库发生市场交易时才予以记录的原则,也可能需要随着数据驱动模式的创新做出调整。2020年3月,联合国统计委员会第51次会议将“数据如何纳入国民账户体系”明确列入SNA研究议程,所涉及的数据和数据资产的概念、数据的特征及权属界定、数据资本化范围及类型、数据资产的定价方法等统计与核算问题,目前仍处于初步探索阶段,国内外尚未达成共识,这给准确评价数字化转型背景下数据作为关键生产要素对经济增长的贡献以及从资本要素角度理解经济增长带来了困难,也是统计和国民经济核算理论亟待突破的时代难题。

当前,中国拥有国际领先的数字经济实践,拥有全球最大的电子商务市场,移动支付交易额是美国的11倍,拥有全球1/3的独角兽企业,完备的制造业产业链体系正在进行数字化转型实践,数字经济发展与数字社会建设正在向纵深推进,这为探索研究和解决数据资产统计与核算国际难题提供了宝贵机遇。本文基于深入的理论文献研究和广泛的调研经验,对数据的概念及生产属性、数据特征及数据资产的概念界定、数据支出资本化核算基本分类、数据资产价值测度方法和统计资料来源等问题进行系统研究,试图为中国数据资产统计与核算工作提供理论依据和方法支撑,为数字化转型背景下国民经济核算理论、统计标准和调查方法创新做出贡献,推动中国数据资产统计与核算实践工作的开展。

后续内容安排如下:第二部分提出数据价值链框架,辨析并明确数据概念及其生产属性,进而结合数据特征和国民经济核算标准,对数据资产的概念进行界定;第三部分提出数据支出资本化核算的基本分类;第四部分探讨基于“调整的成本法”进行数据资产价值测度的具体方法;第五部分探讨数据资产价值测度的统计资料来源;最后一部分是结论与研究展望。

二、数据资产的概念

(一)“数据”的概念及其属性

“数据”概念及其生产属性的界定,是数据资产统计与核算研究需首要阐明的基础性问题。关于“数据”概念的认识,较早来源于信息学领域。Akoff(1989)构建了包含“数据—信息—知识—智慧”(DIKW)层次结构的信息金字塔模型,其中的数据是指对事物、事件、活动和交易的基本记录和描述,是未经进一步加工的原始数据。随后,Varian(2018)基于DIKW模型提出了“数据—信息—知识—决策”框架的数据金字塔,并将数据金字塔与数据价值链(即数据生产过程)紧密联系起来,与OECD(2013)和Moro Visconti等(2017)分别在描述个人数据和大数据的生产过程时提出的数据价值链观点一致。美国经济分析局研究员Rassier等(2019)则明确阐释了数据金字塔与数据价值链都反映的是数据的生产过程,即如何从非结构化的低价值数据形态转变为结构化的可以被用于商业模式或其他明确用途的高价值数据形态。加拿大统计局在构建数据投资的测算框架时也提出了类似的包含观察、数据、数据库和数据科学4个环节的数据价值链,将观察与数据作了明确区分(Statistics Canada,2019a)。国内学者李静萍(2020)界定数据是未经开发的数据,包括来源于机构自身的数据(如个人的身份和行为数据)和从外部单位获取的数据(如统计调查得到的数据),认为数据是一种客观事实和观察,是经济社会活动的伴生物,无论采集与否,数据都是客观存在的。

关于“数据”生产属性的探讨,既有研究观点不一。Ahmad和Van de Ven(2018)认识到了数据驱动商业模式的盛行对2008年SNA关于数据库核算方法带来了挑战,但建议在稳健的数据资产核算方法被开发出来之前,仍遵循2008年SNA关于数据库的核算原则,数据价值不记入自给型数据库的中间投入,数据视为非生产活动结果。Rassier等(2019)指出数据价值链就是数据的生产过程,从而数据应该被视为生产活动的结果。加拿大统计局明确区分观察与数据之后,指出观察是客观存在的,不是生产活动的结果;而作为数据资产价值构成的数据、数据库和数据科学这三大数据形态都是生产活动的结果(Statistics Canada,2019a)。李静萍(2020)认为数据是一种客观事实和观察,不是生产活动结果,数据进入国民账户体系的唯一途径只能作为非生产资产。

通过回顾上述代表性文献,本文认为全面理解和洞察“数据”的概念及其生产属性,离不开对“数据价值链”的构建和剖析。基于已有研究成果并结合实地调研的案例,借鉴OECD(2013)和Rassier等(2019)的研究思路,本文构建了包含“数据收集、数据存储、数据分析和数据应用”4个阶段的数据价值链,从而描述数据的生产过程,即如何从非结构化的低价值数据形态转变为结构化的可被应用于特定使用场景的高价值数据形态。

第一个阶段是“数据收集”,指以数字化形式对观察进行的采集、获取、传输等记录活动,该阶段将观察以数字化形式记录为原始数据。零散、单一的原始数据往往是非结构化的,本身没有或只有极小的内在价值,当原始数据集成一定体量后,才有可能带来潜在价值。值得强调的是,作为数据价值链的起点,数据收集阶段涉及到两个值得辨析的概念,“观察”与“原始数据”。观察是指事物、事件、活动和交易的客观存在,比如个人的姓名、性别、喜好,天气情况,房屋的位置、面积等属性,机器的运转情况,网上购买商品等行为。不论是否发生数据采集活动,观察是客观存在的,也不一定被人们感知和记录。显然,观察不是生产活动的结果,不在国民经济核算的范畴之内。而原始数据是指出于保存历史记录和辅助后续决策等经济目的和社会发展目标而有意识地对观察进行的基本记录,往往需要投入相应的人力、物力资源进行记录,比如案例中COSMOPlat使用传感器、电脑、移动设备记录的机器运行数据、贝壳通过业务员进行采集并数字化的楼盘字典数据、政府统计部门通过统计人员调查或采集工具自动获取的经济社会数据。可见,原始数据的形成过程符合2008年SNA对“生产活动”的定义,即在机构单位控制和负责下,利用劳动、资本、货物和服务作为投入以生产货物或服务的活动(2008年SNA,6.2段),原始数据是生产活动的结果。

第二个阶段是“数据存储”,对所收集的数字化数据进行数据清洗、整理和编码,并以自有服务器或云端运维的方式将数据进行存储,形成标准化、结构化的数据,以供高效访问和使用。因数字化采集技术和数据存储能力的大幅提升,数据收集和存储两个阶段可能瞬时合并完成,但数据的存储阶段仍然需投入劳动和资本等资源进行生产,经过存储的数据是生产活动的结果。

第三个阶段是“数据分析”,指数据科学家或开发应用人员利用数据科学、数据挖掘、机器学习等分析手段对上述已标准化、结构化的数据进一步加工分析,提炼输出有用的知识,建立知识图谱,数据进一步增值。如案例中的COSMOPlat、贝壳找房和浦东政务云平台等为了发挥数据的价值都经历了这一阶段。

第四个阶段是“数据应用”,指基于数据分析形成的知识做出决策,并进一步将决策应用于特定使用场景,最终实现数据的多元化应用价值。比如COSMOPlat实现大规模定制化生产并提供智能产品服务,贝壳找房实现购房者与房源的高效匹配以及提供VR看房服务,上海浦东的海关部门利用政务云平台的企业法人库中信用档案数据,极大提升了跨境交易的物流效率。

由数据价值链可见,数据之所以成为数字经济时代的新型生产要素,主要缘于物联网、云计算、大数据、人工智能为代表的数字化技术的迅速发展,计算机、传感器和其他电子采集设备取代了纸和笔等传统记录工具,使得数据能以数字化形式记录和存储,并以前所未有的规模和速度进行分析应用,从中获得真知灼见和决策,最终广泛地与经济社会各领域深度融合,创造巨大经济价值。由此,本文基于完整的数据价值链,提出国民经济核算框架下的“数据”定义:数据是已记录为可存储、传输或处理的数字化形式的观察结果,并能够从中获取信息和知识以支持决策。数据的核算范围包含价值链全流程上各阶段形成的数据形态,但不包括数据收集阶段未经数字化记录转化之前的观察。

(二)数据的特征

数据作为生产活动的结果,从产品类别看,兼备货物和服务的特征(Mandel,2012),属于独立于货物和服务的知识载体产品范畴(2008年SNA,6.22段),OECD提出的数字经济框架也由此将数据作为与货物和服务并列的独立产品类别(Ahmad and Ribarsky,2018)。进一步地,从资产属性看,数据具有知识产权产品的一些特征,与知识产权产品中的研发和计算机软件一样,数据具有非竞争性、非消耗性,但同时,数据也具有诸如时效性、价值融合增值、非货币交易模式等特有属性。基于深入的文献梳理以及广泛的实地调研,我们总结归纳出数据的主要特征如下。

特征1:数据具有非竞争性。对于传统资产来说,资产具有竞争性,即一种资产被一个人完全拥有,其他人就无法再拥有该资产;如果多人共同拥有一种资产,每个人只能拥有这种资产总价值的一部分,而不是全部。与传统资产不同,数据具有非竞争性,数据被一个人获得后,其他人还可以继续获得该数据,无论有多少人获得数据,他们都拥有数据的全部,而且数据被共享使用的次数越多,价值越大。同时,非竞争性使得复制数据的成本低(边际生产成本为零或接近零),同一数据几乎可以被无限复制,但复制的数据价值因没有创造“新”的信息或知识,复制数据不会带来额外价值,只会带来额外成本(Moody and Walsh,1999)。

特征2:数据具有非消耗性。有别于传统的固定资产(例如机器或建筑物)会在使用中自然地衰减或损耗,数字化形式的数据可以永久存储,且在使用过程中往往不会衰减或损耗(Rassier et al.,2019),反而会产生新数据,使用的次数越多,数据体量越大,这将给数据资产的折旧核算带来挑战。

特征3:数据具有时效性。数据的价值可能随着时间的推移因过时而贬值,但贬值的速度主要取决于数据的类型和用途。比如,交通出行数据对于出行者的有效性在某一时点之后就不重要了,但对于交通部门运营决策目的来说,这些数据的价值可能在一段时间后会增加。

特征4:数据可以实现融合增值。单一数据的价值往往有限,但是通过与其他数据融合,能够挖掘的有效信息更多,数据价值也会增加(Li et al.,2019)。例如,企业销售数据和消费者行为数据的融合使用,可以帮助企业更有针对性地研发设计新产品和创新服务模式,带来更多利润。

特征5:数据的价值与应用场景有关。同一数据在不同的应用场景会产生不同的价值(OECD,2013)。例如交通出行数据,网约车公司可以利用它匹配司机和乘客,提高出行服务效率,增加收入;政府部门则可以利用这些数据优化道路建设,提高交通服务质量。

特征6:数据的价值创造存在非货币交易模式。数据价值的最终体现并非只有市场交易(用于销售)带来的货币化价值增值,更多情形下,数据价值体现在企业或单位内部创建并使用数据的“非货币交易”中(Ahmad and Van de Ven,2018),利用基于数据的信息和知识,通过降本增效、提升货物和服务的质量,最终带来利润或社会效益。比如,个人获取免费媒体服务的同时,提供媒体服务的平台企业则对应获取了个人数据,进而利用数据优化服务内容和质量,个人获得了福利,企业获取了利润。

特征7:数据的价值受其准确性、真实性和完整性影响。准确性是指数据的来源以及收集过程的可靠程度,基于准确性较高的数据能够做出正确决策,从而提升数据的价值,但准确性对数据价值的影响很大程度上取决于数据类型和使用方式;真实性主要是指数据所反映的信息的真实程度,若其反映的信息真实程度下降到某一水平以下,变成“错误信息”,数据将失去价值;完整性主要是指数据所包含有效信息的完备程度,数据所包含的信息越完整,基于数据做出的相应决策的准确性和有效性越高,数据价值越大。

(三)数据资产的概念界定

现有研究主要从企业视角对数据资产的概念界定进行了探索(李雅雄、倪杉,2017;朱扬勇、叶雅珍,2018;中国信息通信研究院,2018;司雨鑫,2019;张俊瑞等,2020),提炼了数据资本化的核心要素,例如特定主体拥有或控制、能够为其所有者带来经济利益、价值可计量等。从宏观管理和国民经济核算视角对数据资产展开探讨的不多。Rassier等(2019)从供给使用的角度指出,如果数据在未来生产中能够被重复使用就可以视为资产,且由于数据具有完整的价值生产过程,应被视为生产资产。加拿大统计局认为数据是否被视为资产取决于数据在使用过程中能否持续一年以上,并且指出数据作为中间投入和最终消费的比例是很低的,大多数被作为资本形成(Statistics Canada,2019a)。李静萍(2020)认为数据具有明确的经济所有权归属和收益性,具备了2008年SNA中“资产”的基本要素,认定数据为非生产资产。总体来说,对于如何在国民经济核算中界定数据资产目前并没有形成共识。

2008年SNA关于“资产”的定义指出,“资产是一种价值储备,代表经济所有者在一定时期内通过持有或使用某实体所产生的一次性或连续性经济利益。它是价值从一个核算期向另一个核算期结转的载体”(2008年SNA,3.30段)。可见,能纳入资产核算范畴的数据,至少同时满足经济所有权明确和收益性这两个基本属性。对于经济所有权,2008年SNA指出,经济所有者是指由于承担了有关风险而有权享有该实体在经济活动期间内运作带来的经济利益的机构单位。对于数据来讲,经过收集、存储、分析和应用这一增值过程,并最终应用于特定的场景,从而创造数据的价值。每个阶段的数据拥有者,具备了使用该阶段的数据来获取价值的权利,并且承担了使用数据可能存在的风险。因此,本文提出,数据的经济所有者是为了经济目的而控制和使用数据的机构单位,数据经济所有权是明确的,数据的经济所有权可能沿着数据价值链从一个单位转移到另一个单位。对于收益性,单一、零散的原始数据几乎是没有价值或者价值很低的,但数据经过收集融合、存储集成形成结构化数据,在此基础上经过分析形成有用的知识,最终找到明确应用场景的数据,能够为其经济所有者带来收益。综上,我们认为数据能够满足2008年SNA关于“资产”确认的两个基本条件,即经济所有权明确和具有收益性。

另外,2008年SNA关于“资产”概念的一个关键点是“在一定时期内持有或使用”,尽管对“一定时期”并没有给出明确限定,但在“固定资产”的确认条件中提出了“生产过程中被反复或连续使用一年以上”的原则,这成为区分产出作为中间投入与资本形成的标准,也是计算机软件、数据库和研发等知识产权产品能否视作固定资产的一项重要判定标准。对于数据而言,因其具有时效性特征,针对不同的数据类型和使用场景,数据的使用寿命有长有短。比如贝壳找房平台,经过10多年的前期投入,建立了全国范围内最大的住宅数据库“楼盘字典”,用于在未来若干年内为用户提供交易服务。在这种使用场景下,贝壳数据的预期使用寿命会超过一年,则可以被视作固定资产,将数据支出视作固定资本形成总额;而电子商务网站通过收集近期的用户购物浏览数据,用于推送限时特价折扣商品的定向广告,数据时效性只有几个月甚至是几天,这些数据因快速过时而大幅贬值,应被视为中间投入。

综上,遵循2008年SNA关于“资产”的“经济所有权明确”和“具有收益性”这两个基本属性,进一步根据资产(尤其是“固定资产”)关于使用时期的要求,本文将“数据资产”定义为:拥有应用场景且在生产过程中被反复或连续使用一年以上的数据。因此,能视作资产的数据,一定是生产资产,相应的支出会作为固定资本形成直接对GDP产生影响,从而反映出数据作为关键生产要素对经济增长的贡献。

三、数据支出资本化核算的基本分类

从数据价值链可见,数据支出资本化核算时需要考虑供给和使用两个阶段(如图1所示)。数据的供给,即指数据经过收集、存储、分析和应用阶段形成数据产品,以供自给性使用或出售;数据的使用,对于数据支出资本化核算来说,即指市场生产者或非市场生产者将自己生产或购买的数据产品以资本服务的方式与土地、劳动、资本、技术、管理和知识等生产要素相结合共同作用于其他生产活动,生产出新的产品或提供新的服务,同时也创造知识,从而源源不断地产生或积累新的数据。因此,针对本文重点研究的数据资产统计与核算问题,在对数据支出进行资本化核算时可以从供给和使用两个阶段来研究其基本分类。

在数据支出资本化核算中,从数据的供给端看,数据有国内生产和进口两类。对于国内生产,数据可按供给方式和供给主体进行划分。按照供给方式可划分为自给性生产和交易性生产两类;按供给主体可划分为个人数据、企业数据和政府数据三大类:(1)个人数据是与个人有关的,被记录在各种电子设备、社交网络、提供服务的企业以及政府数据库中以物理或电子形式记录的数据资料(World Economic Forum,2011)。(2)企业数据又分为传统业务数据和物联网数据两大类。传统业务数据是指企业在研发、生产、销售、人力资源和财务管理等生产经营活动中产生的数据;物联网数据是指通过传感器自动获取的来自物品和设备的数据。(3)政府数据是指各级政府及其职能部门收集、产生或拥有的数据,包括政府通过普查、全面调查、抽样调查等方式获得的数据,以及政府行使行政职权过程中自然生成的行政记录数据。

在数据支出资本化核算中,从数据的使用端看,数据有国内使用和出口两类。国内使用按使用者的性质不同分为市场生产者和非市场生产者,市场生产者主要是指企业,非市场生产者包括政府和非营利性组织。基于数据支出资本化核算的供给与使用,可以将数据划分为7种类型,详见表1。

四、数据资产价值测度的基本方法

(一)测度方法选择

关于数据资产这种新型资产,目前学术界和实际工作部门尚未形成成熟的价值测度方法。从会计核算角度看,数据资产属于无形资产,数据资产价值测度可以借鉴无形资产的测度方法,主要包括收益法、市场法和成本法3种基本方法。

收益法是基于数据资产的未来预期应用场景,对数据资产预期产生的经济收益折现得出数据资产的合理价值。理论上讲,收益法能恰当地反映数据资产“拥有明确的使用场景并能够为其经济所有者带来收益”这一必要条件,也能较直观地反映数据资产的经济价值。然而,因数据的用途多样,其作为资产的使用期限也充满未知,为其经济所有者带来的潜在未来收益流更是具有极大不确定性,收益法在实践中难以实现。

市场法是指参照市场上同类或类似数据资产的近期交易价格估计目标数据资产的价值。理论上讲,当市场上有足够多的数据交易类型和模式,可以收集到完整、可靠的类比目标资产的可比指标、技术参数等信息时,应该采用市场法。然而,由于数据的价值具有与应用场景相关这一特征,数据资产应用场景的多样性使得价值变动十分敏感,导致较难在市场上匹配到同类或类似的数据资产。同时,数据具有非竞争性特征,使得市场交易的往往是数据的复制许可或使用许可,此时的市场交易价格多数反映数据复制许可或使用许可的价值,而不是数据资产原件的价值。从实践层面来讲,目前中国乃至全世界范围内数据市场存在交易标准、规则及法律不完善等问题,交易型数据资产仍属少数,绝大多数数据资产仍是自给型。因此,市场法仅适用于极少数数据资产原件的市场交易情形,并不适用于绝大多数自产自用型数据资产的估值。

成本法主要是指通过加总数据生产过程中的各项成本来测度数据资产价值,包括数据价值链增值过程中的劳动成本、中间投入以及使用的资本服务成本。从国民经济核算国际标准看,2008年SNA建议采用生产成本总和(即“成本法”)对为自身最终使用的产出进行估值(2008年SNA,6.124段和6.125段),且该方法已经成为经典的无形资产价值测度方法,在无形资产资本测度及其对经济增长影响的宏观经济分析研究中应用广泛(Corrado et al.,2009;田侃等,2016;郑世林、杨梦俊,2020)。从实际操作规范看,《知识产权产品资本测度手册》作为知识产权产品测度的实践指导,建议在实际核算中采用成本法对自给型软件、数据库和研发等知识产权产品进行估值(OECD,2010)。中国资产评估协会,作为全国性的行业性非营利性社会组织,于2019年12月制定并印发了《资产评估专家指引第9号——数据资产评估》,以指导资产评估机构及其资产评估专业人员开展数据资产评估业务,在阐述了市场法、收益法和成本法各自的优劣和适用性之后,文件第二十九条明确提出,“可以考虑使用成本法,而收益法和市场法通常适用于交易性和收益性较好的数据资产评估”。中国信息通信研究院(2020)提出了改良的市场法、收益法和成本法的数据资产价值评估模型,鉴于数据应用实际情况,认为应优先采用成本法,并指出考虑了数量、质量、应用和风险4个维度的数据资产价值影响因素之后的改良成本法,能够更为合理、有效地评估数据资产价值,减少价值低估误差。从资料获取来源和方式看,会计记录和统计调查资料能直接提供数据生产活动相关的成本费用数据,且考虑到数据资产有别于一般无形资产或知识产权产品的独有特征,成本费用会计资料和统计调查数据,也能为基于生产成本的调整改良模型提供相对客观的参考依据。综上,相对于其他方法,成本法更具客观性、可靠性和较强可行性。

(二)成本法的核算原则

结合上述对成本法适用性的充分讨论,本文遵循国民经济核算框架,使用成本法进行数据资产价值测度,还应遵循以下基本核算原则:一是以投入成本为基准对成本法进行调整。首先,结合前文数据资产的确认条件可知,数据最终是否被应用于具体场景,是判定其能否成为资产的必要条件和关键步骤。若数据没有被投入使用,即使前期投入大量收集、存储、维护以及管理等生产成本,也仍旧没有价值,则数据资产价值为零。其次,数据的非竞争性使得数据的价值随着被使用次数的增加而增加(特征1),应考虑数据资产使用者的数量和使用次数等价值加成因素对总成本进行价值调整,来反映数据资产的共享性和价值累积性。此外,数据的准确性、真实性和完整性是影响数据资产价值的质量因素(特征7),但不同类型数据及其使用场景对数据质量的要求不同,且目前缺乏标准化度量,本文从宏观层面的成本法核算中暂不考虑上述质量因素。

二是仅考虑数据资产原件的估值。鉴于实践中数据交易市场处于初步探索发展阶段,绝大多数数据资产是自给型,对于自给型的数据资产只涉及到原件的估值。对于可能出现的数据复制品,通常有两种情形:一种是由于数据的非竞争性使得数据可以以很低的边际成本或者零边际成本被复制,但是并没有特定的使用场景,从而没有产生价值;另一种是复制品通过使用许可或复制许可的方式发生了市场交易,此时复制品是有价值的,但目前交易的情况仍属少数。本着务实精神,数据固定资本形成总额核算的重点聚焦于如何利用成本法测算数据资产原件的价值。

三是不考虑“重估效应”。实践中,数据价值与特定应用场景及潜在新用途密切相关,存在“重估效应”。一方面,对于某份没有投入特定应用场景且未曾被认定为资产的数据,即便没有投入更多生产活动,但因发现或预估其有新用途而被首次认定为资产,即发生了“经济出现”(2008年SNA,12.18段),该数据资产的估值可能会发生大幅增加;另一方面,数据新用途通常特定于不同应用场景,可以从根本上改变数据作为生产要素的价值创造过程,而应用场景的多样化、非标准化,使得潜在新用途带来的经济价值具有极大不确定性(特征5)。对于第一种情形下的数据资产价值,是指数据在某一时期内因发现其新用途带来的“经济出现”,使得该数据首次被记录为资产而导致总资产物量的增加,则该数据资产价值应在资产负债表的资产物量其他变化账户中体现,而成本法只衡量生产活动创造的数据固定资本形成总额的价值,故该价值不在本文的成本法估值内;对于第二种情形下的数据资产重估价值,使用成本法估价理应做出相应调整,以反映多样化应用场景对数据资产估值的影响,但这需要获得直接可观察到较完善的数据要素市场估价信息。鉴于中国数据交易市场的实际情况,这类事后重估因素不列入本文的成本法估值内。

(三)成本法的具体估计方法

1.成本法的理论构成项目

成本法是指通过加总数据生产活动中的各项成本投入来测度数据资产的价值,数据生产活动的成本具体包括劳动者报酬、中间投入、固定资本消耗、资本净收益和其他生产税净额等几项。结合上述2008年SNA关于成本法的核算原则以及数据支出资本化核算的基本分类,对于不同类型数据的使用场景,市场生产者和非市场生产者的成本法具体构成项目有所不同。对于非市场生产者而言,因数据的生产不以盈利为目的,数据资产价值只包括劳动者报酬、中间投入、固定资本消耗和其他生产税净额,不包括资本净收益;而对于市场生产者而言,数据的生产以盈利为目的,数据资产价值还应加上资本净收益。

其中:(1)劳动者报酬是指支付给直接从事数据收集、数据存储、数据分析和数据应用的人员以及直接提供数据生产相关服务的人员的劳务费用,包括工资、薪金以及所有相关福利和费用,如奖金、假日津贴、养老金缴纳费用和其他社会保障支付费用、工资税等。(2)中间投入包括数据生产活动中直接投入的非资产性的材料、物资费用,通过经营租赁方式租入的设备租赁费用,以及用于数据生产活动的设备运营费用和咨询服务、行政费用等。(3)固定资本消耗是指从事数据生产活动所使用的固定资产折旧,固定资产包括仪器与设备、建筑物、计算机软件等。(4)资本净收益是指用于数据生产活动的固定资产的资本净收益。(5)其他生产税净额是指其他生产税与其补贴之差。其他生产税是指除了产品税之外,企业从事数据生产活动而应缴纳的所有税收,包括数据生产活动所使用的土地、建筑物、其他资产等的所有权或使用而征收的税收,或是针对雇佣劳动力或支付劳动者报酬而征收的税收。其他生产补贴是指产品补贴以外的,因从事数据生产活动所应得的补贴,主要包括对工资或劳动力的补贴。

具体地,基于数据价值链的收集、存储、分析和应用4个阶段,我们将上述数据生产活动成本划分为以下几个方面:(1)数据收集阶段,数据的获取成本,诸如通过调查、移动设备定位、传感器捕获、提供免费服务、补贴和折扣等方式获取数据的成本;(2)数据存储阶段,数据存储过程中投入的劳动成本,包括以恰当的格式准备(创建和更新)数据的成本等;与数据存储相关的中间投入,包括不能被确认为软件固定资产的支出(比如以经营租赁方式使用的数据库管理系统的支出)等;数据存储过程中所使用资产的资本服务成本,诸如计算机、云盘等数据库管理系统提供的容量许可,数据访问、监控、备份与恢复以及实例管理等资本服务成本等;(3)数据分析和应用阶段,为获得有用的知识和洞察力,在数据挖掘、验证、清理、融合以及特定用途的情景化建模分析过程中投入的成本,包括数据分析处理工程技术人员、大数据工程技术人员等新兴职业人员的劳动成本,与数据分析和应用相关的中间投入(比如购置的使用期限为一年或更短的软件使用许可证的支出),所使用的软件工具(自给性开发使用的软件原件、购买的定制软件或软件复制品的使用许可证以及开源R或Python等编程语言)和计算机硬件设备的资本服务成本等;(4)此外,总成本还将包括数据生产过程中用于中间投入的行政和间接管理费用,如直接用于数据生产活动的人力资源管理和财务控制、电力、建筑维护和电信服务的成本。

同时,类似于研发支出资本化(高敏雪,2017),数据支出资本化也应基于GDP核算框架,这就需进一步考察数据支出资本化核算的重复计算问题。一方面,从概念及特征来看,数据作为一种新型资产属于知识产权产品范畴(OECD,2010);另一方面,从生产活动的性质和内容来看,虽然基于数据价值链全流程的数据生产活动与2008年SNA定义的计算机软件和数据库、研发活动存在某些重合部分,但因活动内容各有侧重和不同,不能从属于计算机软件和数据库、研发活动中的任何一类。因此,我们认为应单独识别数据生产活动,并将数据作为独立的知识产权产品类别。

那么,遵循2008年SNA和《知识产权产品资本测度手册》的核算原则,基于上述数据生产活动总成本开展的数据资产价值测度,应将已经计入2008年SNA(10.103段、10.111段和10.113段)计算机软件、研发固定资本形成总额中的数据生产活动相关成本给予剔除,以避免重复计算。主要有以下几方面:(1)根据《知识产权产品资本测度手册》(OECD,2010)关于软件固定资本形成总额的估价原则,应剔除数据分析和应用阶段已经计入软件固定资本形成总额的自有软件开发成本以及购买的软件成本;(2)因数据资产创建过程中涉及到的部分创造性活动,比如数据科学家对视频、图片和文本等数据的挖掘、验证、清理、融合和信息分析工作以及软件工程师开发新原理、高智能的新算法等工作(比如发现数据新特征的探索性数据分析)属于2008年SNA定义的研发活动范围,故剔除已经计入研发固定资本形成总额的有关成本;(3)剔除数据生产过程中与计算机软件和研发活动有关的行政和间接管理费用。

2.成本法的具体操作及调整方法

采用成本法测度数据资产价值的关键问题是,如何在统计实践层面,获取国民经济核算原则下的劳动者报酬、中间投入、固定资本消耗、固定资本净收益和其他生产税净额的详细统计数据。这主要涉及几个方面的技术性难题:一方面,统计调查制度不完善,缺少数据资产价值核算的基础数据来源。现有统计调查制度并未单独对数据生产活动进行识别和统计,无法直接提供用于测度数据资产价值的成本费用统计资料,需专门设计一套针对数据资产价值测度所需要的基层法人单位的统计调查报表;另一方面,成本费用统计调查与国民经济核算的计价原则不一致。因统计调查遵循收付实现制原则,而国民经济核算遵循权责发生制原则,需要对统计调查取得的成本费用数据进行口径调整和数据转换,才能得到国民经济核算原则下数据资产的生产成本。此外,数据生产活动成本费用统计无法涵盖数据资产价值测度总成本构成中的所有项目,比如市场生产者使用的数据资产价值包含的资本净收益,成本费用统计调查不涉及该项目,需要通过其他间接方法进行估算。

前文已提及,目前中国乃至全世界范围内数据市场存在交易标准、规则及法律不完善等问题,绝大多数数据资产属于自产自用型,数据资产原件的市场交易极少。鉴于此,在市场交易信息不充分的情况下,在国民经济核算实践中,自给型和交易型数据资产原件均可采用成本法估价,借鉴自产自用知识产权产品价值核算思路开展基于成本法的数据资产的价值核算,也具有较强的可操作性。《知识产权产品资本测度手册》(OECD,2010)及《弗拉斯卡蒂手册:研究与试验发展调查实施标准》(OECD,2015)提供了使用成本法推算自给型知识产权产品的固定资本形成总额的指导准则和调查实践经验,视不同资料来源及其完备性,建议具体结合使用“需求法”和“供给法”对总成本进行推算,然后比较两种结果,以互相验证校准。其中,“需求法”是指基于法人单位的统计调查,获取调查单位从事数据生产活动的详细的成本费用信息,进而直接得到数据资产的成本估计值。“供给法”是指利用数据生产活动中的劳动人员数和生产时间比例推导得出劳动投入量,然后用劳动投入量乘以工资率,加上其他非劳动成本,即可间接推算专门从事数据生产活动的总成本。两种方法的信息来源不同,但所指的成本类型和内容是一致的,没有孰优孰劣之分,若能分别使用两种方法并进行比较调整,无疑是最好的选择。

本文认为,应结合使用需求法和供给法。具体地:一方面,采用需求法,可选取数据密集型法人单位作为样本试点,有针对性地设计基层法人单位数据生产活动的成本费用专项调查,直接收集得到详细的、准确性较高的数据生产活动相关人员劳务费用、直接投入费用、固定资产使用等数据,并进一步通过口径调整和数据转换,得到符合国民经济核算原则的生产成本构成;另一方面,结合供给法,在剩余待估样本法人单位中仅开展劳动成本调查,并利用上述样本单位调查数据推算出数据生产活动成本构成中的相关资本服务成本、中间投入成本与劳动成本的比率,用于推算非调查单位的资本服务成本以及中间投入成本,进而得到非调查单位的数据生产活动总成本。此时,基于供给法的数据资产价值估算公式如下:

成本法数据资产价值=直接从事数据生产活动的工作时间占其实际工作时间的平均比例×相关职业类型人员总数×职工平均工资+用于数据生产活动的中间投入成本+与数据生产活动相关的资本服务成本+其他生产税减补贴

值得注意的是,应结合前述成本法的具体核算原则,对上述以总成本为基准的数据资产价值进行调整,以充分反映数据资产因有别于一般知识产权产品的独有特征对数据资产价值的影响。鉴于统计与核算的客观性和可操作性,我们不考虑诸如应用场景模式、准确性、真实性和完整性等目前难以标准化或量化的主观特征,仅考虑其中可被统计调查和衡量的客观特征:(1)数据最终是否被应用于具体场景(特征5)。没有投入应用场景的数据只发生了成本,没有带来价值,则数据资产价值为零。(2)数据资产使用者数量和使用次数应乘以数据资产总成本(特征1)。当数据资产第一次被使用时,它的价值即以总成本来衡量,后续使用人次的增加将增加数据资产的价值,以反映数据价值的累积性。利用这些特征对基于成本法的数据资产价值估算方法进行调整,将有助于突出哪些信息最有价值(使用频率最高),哪些信息的投资回报率(价值与成本之比)最高,从而可以进行有效的数据管理和资产定价(Moody and Walsh,1999)。由此,本文提出对基于成本法的数据资产估计方法进行以下调整,最终得到基于“调整的成本法”数据资产价值的估算公式:

调整的成本法数据资产价值=数据资产的总成本×是否被应用于具体场景(“是”则取值“1”;“否”则取值“0”)×使用者数量×使用次数

五、数据资产价值测度的统计资料来源

(一)数据生产活动相关人员劳动成本调查表的设计

对于劳动者报酬,通过数据生产活动相关人员的劳动成本调查资料来测度。首先需要明确数据生产活动相关人员及职业的定义,然后结合国际经验和中国职业分类标准,具体界定中国从事数据生产活动的相关职业分类,最后构建一套针对法人单位开展的数据生产活动相关人员工作时间及劳动工资调查表,用于确定各法人单位关于数据生产活动投入的劳动成本,进而为宏观层面的劳动者报酬核算提供微观统计调查资料。

1.数据生产活动相关人员及职业定义

在大数据迅速增长的创新领域,标准职业分类难以适应不断变化的新职业类型。Mandel和Scherer(2014)利用大数据招聘广告数量乘以基于标准职业分类(SOC)的官方就业数据得出的IT行业“职位/招聘广告”乘数,估算了2014年英国整体经济的大数据就业人数,约为29.4万。Chebli等(2015)提出了简化的数据价值链框架,包含数据构建、知识创造和基于数据的知识的应用3个阶段,并将数据生产活动相关职业仅限定于数据构建和知识创造两个阶段,从而确定了22个数据相关职业,并进一步利用社交媒体大数据来源,通过计算SOC各职业分类中拥有大数据技能的员工比例,最终估计英国市场部门的大数据就业总量约为19万。Hawk等(2015)将数据相关的职业定义为,使用相当先进的计算机技术处理或分析数据作为重要工作表现的职业。具体来说,他们利用美国劳工部开发的职位描述系统数据库对41项工作活动的重要性按1~100进行评分,将分析数据或信息、处理信息、与计算机交互3项与数据高度相关的工作活动中平均重要性得分不低于80的职业判定为数据相关的职业,从而确定了91个数据相关的职业。美国经济分析局的研究人员Rassier等(2019)在Hawk等(2015)的基础上,将数据相关的职业限定为计算机和数学职业组别中上述3项工作活动的平均重要性得分在85分以上的职业,从宏观层面对美国数据生产活动中发生的劳动报酬进行了估算。加拿大统计局基于国家职业分类(NOC)将数据生产活动中3种不同形态,即数据、数据库和数据科学,所包含的职业进行了梳理,包括金融和投资分析师、消费者(客户)和信息服务主管、数据录入员、其他客户和信息服务代表、调查访问人员和统计人员、数学家、统计学家和精算师、经济学家和经济政策研究者及分析师、社会政策研究员、顾问和项目官员、计算机及信息系统主管、数据库分析员和数据管理员、信息系统测试技术人员、统计官员和相关研究支持职业(Statistics Canada,2019b)。

借鉴国际经验和中国数据生产活动实践,基于前文提出的数据价值链,本文将数据生产活动相关人员定义为,直接从事数据收集、数据存储、数据分析和数据应用的人员以及为数据生产活动提供相关服务的人员,如网络与信息安全的管理员、信息通信信息化系统管理员等。结合《中华人民共和国职业分类大典》中有关职业分类的说明(国家职业分类大典修订工作委员会,2015),本文界定了50个数据相关职业,归为信息技术与管理、数学与统计、专业数据分析、经济与金融、测绘技术和地理信息服务6个类别(详见附录附表1)。

2.数据生产活动相关人员工作时间及劳动工资调查设计框架

基于现有从业人员及工资总额统计调查表式,开展法人单位数据生产活动相关人员的工作时间调查和劳动工资调查,以获得从事数据生产活动的各职业类型人员的劳务费用,进而为利用成本法核算宏观层面的数据资产价值中的劳动者报酬提供数据基础。其中,判断各职业类型人员直接花费在数据收集、数据存储、数据分析和数据应用这4项活动的时间占实际工作时间的比例,是测度数据生产活动相关人员工资的重要依据。若该时间比例能通过统计调查报表直接获得,则可将该时间比例与该职业类型人员的工资总额相乘,直接得到数据生产活动相关人员的劳务费用。具体调查表式如下所示(表2)。

若被调查者无法直接填报该时间比例,则需要间接地通过调查问卷的形式,以上述4项数据生产活动对于各职业类型工作表现的重要性来确定。比如,采用5级量表,即对“不重要、有些重要、重要、很重要、非常重要”5个重要性等级进行打分,将该重要性平均得分标准化为百分比,并假定该百分比得分等于数据生产活动的时间占比,将该百分比得分与该职业人员的工资总额相乘,最终也能得到数据生产活动相关人员的劳务费用。

(二)数据生产活动经费支出调查表的设计

对于固定资本服务成本(包括固定资本消耗和资本净收益)和中间投入成本的测度,主要结合使用需求法和供给法,两种方法均需依托法人单位的数据生产活动调查数据,但资料来源不同。

对于数据生产活动的经费支出,仅限于法人单位专门为数据收集、数据存储、数据分析和数据应用等生产活动直接支付的费用,包括经费内部支出和经费外部支出,经费外部支出包括外购数据以及委托外部采集、存储或分析应用数据等费用支出;经费内部支出又包括日常性支出和资本性支出两大类。日常性支出指当期法人单位内部数据生产活动的直接支出,包括人员劳务费以及收集、存储、分析和应用数据过程中发生的直接投入等其他日常经费支出;资本性支出,即当期用于数据生产活动的固定资产支出,是指当期法人单位内部购置的用于数据生产活动的固定资产价值,包括土地与建筑物、仪器和设备、计算机软件等。

关于数据生产活动经费内部支出调查具体调查表式的设计,本文参照中国研究与试验发展经费情况统计调查表式,设计见表3。

可以基于详细的经费内部支出调查数据,利用需求法直接测度资本服务成本。资本服务成本包括数据生产活动中所使用的固定资产的固定资本消耗及其资本净收益。如果可以获得从事数据生产活动的单位足够详细的经费支出数据,尤其是过去时期的资本性支出数据,则可遵循OECD《资本测度手册》(OECD,2009)资本服务测度原则,首先利用永续盘存法来估计固定资本存量,进一步通过设定折旧率和资本回报率,最终计算得到资本服务成本。采用这样的方法时,经费支出调查中的资本性支出是测度数据资产价值构成中固定资本服务成本的基础,但这里的资本性支出与国民经济核算中的固定资本形成总额存在口径上的差异。出于国民经济核算目的,经费支出数据需要进行口径调整。比如,根据2008年SNA的核算原则,土地的价值不应包括在固定资本形成总额中,故应在资本性支出总费用中扣除土地价值,从而得到与数据生产活动相对应的固定资本形成总额,方可适用永续盘存法。

也可使用供给法对资本服务成本进行间接测度。以样本单位经费支出调查数据为基础,通过推算资本服务成本与劳动成本的比率,并在待估样本单位中仅开展劳动成本调查,获取数据生产活动中的人员劳动成本,即劳动者报酬数据,从而按比率间接推算非调查的待估样本单位的资本服务成本。该比率有两个参考来源:一是参考被调查的法人单位足够详尽的经费支出数据;二是通过筛选界定从事数据生产活动的行业分类,参考行业层面的生产经营或投入产出数据。此时,数据生产活动的行业分类也是值得重点研究的问题。

类似地,中间投入成本也参照同样的思路,使用需求法直接获取数据,或使用供给法按与劳动成本的比率进行推算,不再赘述。

(三)成本法其他构成项目的资料来源

对于数据生产活动中涉及的其他生产税,2008年SNA规定包括工薪或劳力税,土地、房屋或其他建筑物定期税,营业和执业执照税,固定资产使用或其他活动税,印花税,污染税等(2008年SNA,7.97段)。被调查单位可能无法提供明确数据信息,但可基于现有相关统计调查制度进行推算。比如中国一套表统计调查中,财务状况调查中的“应付工资薪酬”可提供工薪或劳力税计提标准,“管理费用”可提供劳动补贴数据;固定资产投资调查中“建设用地费”可提供土地使用税;此外,“税金及附加”可提供企业因从事生产经营活动按税法规定应缴纳的各种专项费用,比如城市维护建设税、资源税、土地使用税、污染税、印花税等其他生产税数据,等等。但进一步需要考虑的问题是,单位税收与补贴的总额度如何分摊得到专门用于数据生产活动的其他生产税净额,这涉及到相关资料来源和各项分摊比例的确定问题。但整体推算思路,仍可结合运用前述的需求法和供给法。

此外,基于调整的成本法测算思路,在数据资产价值测度的基础统计资料调查中,需要重点关注数据是否被应用于具体场景、数据资产原件的使用者数量和使用次数等调整项目的具体情况。与一般的知识产权产品相比,这也正是数据资产的独特性在统计测度中的重要体现。

六、结论与展望

本文结合理论研究及实地调研对数据资产统计与核算问题进行了系统探讨:首先,本文提出了包含数据收集、数据存储、数据分析及数据应用4个阶段的数据价值链,并基于此探讨了数据概念及其生产属性。我们认为在讨论数据作为关键性生产要素时,数据是指已记录为可存储、传输或处理的数字化形式的观察结果,并能够从中获取信息和知识以支持决策。数据是生产活动的结果,其核算范围包含价值链全流程上各阶段形成的数据形态。其次,结合数据特征,基于2008年SNA关于“资产”和“固定资产”的界定标准,本文将“数据资产”定义为拥有应用场景且在生产过程中被反复或连续使用一年以上的数据,并认为数据资产应作为生产资产纳入国民经济核算。再次,通过数据支出资本化核算的基本分类,提出数据资产价值应采取调整的成本法进行核算,并基于数据价值链对数据生产活动的成本进行了解析,进一步遵循GDP核算框架考察数据支出资本化与2008年SNA已经进行资本化核算的计算机软件和数据库、研发等知识产权产品的成本构成可能存在的重复计算,在数据资产价值测算中给予剔除。最后,结合国民经济核算国际标准和中国现有统计调查制度,探索建立了中国数据生产活动职业分类,在此基础上探讨了成本法构成项目的基础统计资料来源问题。本文的研究成果将为中国数据资产统计与核算工作提供理论依据和方法支撑,也将为数字化转型背景下国民经济核算理论、统计标准和调查方法创新提供有价值的启示。

数据纳入生产资产范畴,给生产统计、收入统计、消费统计、投资统计等政府统计核算理论与方法带来了新的挑战(许宪春等,2021),数据资产的统计与核算问题仍有许多需要深入探讨的研究议题。一是数据资本存量和资本服务核算问题研究。本文初步探讨了数据支出资本化核算中关于数据资产的概念、特征、分类、价值测度及数据来源等流量测度问题,为了全面反映数据资产对经济增长、资本积累、收入分配等宏观经济指标的影响,数据资本存量和资本服务测度中依赖的折旧、价格缩减指数、资本回报等关键技术问题依然需要深入研究,并且由于数据资产的独特属性,相关参数的估计面临新的挑战。二是数据的所有权界定问题研究。尽管本文界定了数据的经济所有权主体,但数据在其价值形成过程中涉及多种权利类型和多个权利主体,导致不同应用场景下、不同类型数据的权利归属问题难以界定。尤其是平台企业通过免费服务的方式获取了大量的个人数据,数据的访问与控制权集中在平台企业手中,企业通过数据驱动的商业模式获得丰厚回报,用户对个人数据的权属如何界定,进而如何参与企业收益的分配尚需进一步研究。未来,随着区块链技术的广泛应用,用户将可以控制和追溯个人数据的流动,从而将有利于数据不同类型权属的界定。三是数据生产活动相关职业分类研究。随着数据驱动的新产业、新业态、新商业模式不断创新,标准职业分类难以适应不断变化的新职业类型。与数据相关的职业包括数据采集员、数据标注师、数据配置师、数据分析师、数据科学家等尚需要通过企业调研进行系统梳理和评估认定,未来利用招聘网站等平台大数据,建立形成中国的数据相关职业分类,是推进和落实数据资产核算实践的基础性研究工作。四是知识产权产品的核算问题研究。数据作为新型生产要素的重要性已经超越了数据库范畴,同时数据生产活动与计算机软件和研发等创新活动密切相关,数据生产活动与已经进行资本化核算的计算机软件、数据库和研发在统计实务中面临就业范围、经费支出等方面难以清晰划分的问题。然而,中国尚未建立数据库核算的方法与制度,关于自产自用软件和研发的核算方法和统计调查制度有待补充与完善,亟需进一步探索和完善知识产权产品范围及分类,厘清数据与计算机软件、数据库和研发等知识产权产品之间的关系,以全面准确地揭示数字化时代的知识产权产品的经济价值规模和结构以及知识产权产品资本化核算对GDP的贡献,深化革新中国各类知识产权产品核算方法与统计调查制度,为中国推进统计现代化改革和构建现代化统计调查体系提供参考。

(注:文中图表有删减。)

原文刊发:

许宪春、张钟文、胡亚茹:《数据资产统计与核算问题研究》,《管理世界》,2022年第2期,第16~30页。