立即购买
赛智时代赵刚:数据要素的十个思考
  • 赛智时代赵刚:数据要素的十个思考

    Innov100
    2021-10-08 18:09:28
  • 数据要素市场化是当前产业界和学术界的一个重要议题。2021年1月,我的专著《数据要素:全球经济社会发展的新动力》出版,希望能为建立数据要素市场化的理论体系贡献一点力量。2021年9月26日,我受邀为中组部、中央网信办、工信部等三部委组织的“实施国家大数据战略专题培训班”的学员们做专题演讲,谈了谈我对数据要素的十个思考,也是对我的专著中核心观点的提炼和总结,以飨读者。

    思考一:为什么数据是一种新的生产要素?

    2019年10月,中央在19届4中全会上首次提出数据是一种生产要素,明确要求“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。虽然只有一句话,却是一字千钧!这将推动形成一种全新的要素市场——数据要素市场,也将为数据驱动的数字经济发展开启新的篇章。

    1、什么是生产要素?

    生产要素(Factors of Production)是经济学的一个基本概念,是指进行社会生产经营活动时所需要的各种基本要素,如土地、劳动、资本等。

    生产要素有两个基本含义:第一,生产要素都能为经济增长作出贡献。第二,生产要素都能参与收入分配。因而,都能建立起“由市场评价贡献、按贡献决定报酬”的要素市场化机制。

    图1 生产要素的分类

    按照上面两个标准,生产要素有:土地、劳动力、资本、企业家才能、技术、数据等,如图1。

    土地是生产要素,土地能为经济增长作出贡献,要素提供者能通过地租来参与收入分配,可建立土地要素市场;

    劳动力是生产要素,劳动力能为经济增长作出贡献,要素提供者能通过工资来参与收入分配,可建立劳动力要素市场;

    资本是生产要素,资本能为经济增长作出贡献,要素提供者能通过利息等来参与收入分配,可建立资本市场;

    企业家才能是生产要素,企业家才能可为经济增长作出贡献,要素提供者能通过股权分红等来参与收入分配,可建立创业投资市场;

    技术是生产要素,技术可为经济增长作出贡献,要素提供者能通过技术专利费等参与收入分配,可建立技术交易市场。

    2、为什么数据是一种新的生产要素?

    数字经济是以使用数字化的数据、信息和知识作为关键生产要素、以现代信息网络作为重要载体、以信息通信技术的有效使用作为效率提升和经济结构优化的重要推动力的一系列经济活动。

    我们也可以用上面两个标准来判断数据是不是一种新的生产要素?

    第一,数据是不是能够为经济增长作出贡献?

    2018-2020年,数据驱动的全球数字经济年复合增长率41.8%。

    第二,数据的提供者或控制者能不能参与收入分配?

    2021福布斯富豪榜前20位,有9位来自数字经济领域,首富是控制着全球最大数据财富的全球最大的电商、最大的云计算公司——亚马逊公司的贝佐斯。

    有更多的证据表明,数据具有经济和社会价值,能为经济增长作出贡献;数据能为其拥有者带来财富,也能以某种方式参与收入分配。尽管数据对经济增长作出贡献以及参与收入分配的机制仍需深入研究,但数据作为生产要素的地位却是公认的。

    3、数据是不是当今时代最重要的生产要素?

    美国经济学家约翰·加尔布雷思说过:“任何一个时代都有个最重要的生产要素,在不同的发展阶段,同一社会的不同时期,谁掌握最重要的生产要素,谁就掌握了权力,在收入分配中获得更多的收益”。

    图2 最重要的生产要素

    当今时代,经济社会正在实现数字化、网络化和智能化,商业活动正在迁徙到数字基础设施作为底座的数字化商业平台上,数据在经济社会活动中的重要性越来愈突出。拥有更多的流量和用户就会拥有更多数据,拥有更多数据,就带来更多的流量和用户,这一正反馈的结果是数据资产控制者及其收益的“大者恒大”。谁掌握了数据这个要素,谁就在经济活动中获得更多的收益和价值,这是一个非常重要的趋势。虽然,我们暂时还没有更多证据表明它就是这个时代最重要的生产要素。

    思考二:数据如何参与生产活动的?

    1、数据是加工出信息和知识(数据产品)的原材料

    数据是加工出信息和知识的原材料,我们可以把信息和知识称为数据产品。经过数据处理的过程(即数据采集-传输-计算-存储-分析,也称为数据加工的过程),数据被还原(生产)出信息,并通过人或机器对信息的总结提炼,可以获得知识。

    这个数据产品的生产过程,可以类比为原油生产出石化产品、矿物质生产出冶金产品、原材料加工出机电产品等生产过程,如图3。

    图3 数据产品生产过程类比

    因此,数据是一种产生信息和知识的资源,一种原材料,也是一种生产资料,所以有人把它比喻为“数据石油”或“数据金矿”。

    2、数据的生产、流通和消费

    数据或其产品,也有明确的供给侧和需求侧,也可以划分为数据生产、数据流通和数据消费三个主要阶段。只是对数据的产业链,并不是泾渭分明的三个阶段,而可能是交叉或并行的,如图4。

    数据生产(数据处理),即从数据原材料加工出数据产品,让数据更有其使用价值。数据生产的主要工序(及生产技术)有:

    l  数据采集(传感器、测量分析仪器)

    l  数据传输(光纤宽带、移动通信)

    l  数据计算(计算机、服务器、云计算)

    l  数据存储(内存、存储设备、数据库)

    l  数据分析(OLAP、机器学习、AI、可视化)

    数据流通,即将数据从供给侧流转到需求侧,让数据触达用户。数据流通的主要活动(及渠道)有:

    l  数据开放(政府数据开放平台、数据开放网站)

    l  数据共享(政府数据共享平台、社会数据共享平台)

    l  数据交易(数据交易所、交易网站)

    l  数据金融(数据银行、数据证券所)

    数据消费(应用),即在需求侧使用数据产品,发挥其价值。数据消费的主要活动(及场景)主要有:

    l  数据商用(精准营销、精准物流、精益制造)

    l  数据民用(健康码、一网通办、数据信用)

    l  数据政用(城市大脑、数据铁笼)

    图4 数据参与生产的过程

    思考三:一切数据化意味着什么?

    一切数据化,意味着我们的物理世界正被网络连接起来,可计算、可分析,一个数字化的物理世界;也意味着我们创造了一个新的数据世界,它具有计算空间和想象空间,不同于现实的物理世界,并可反作用于现实的物理世界。

    1、意味着物理世界正在变成一个数字化、网络化和智能化的世界

    物理世界正被网络连接起来,物理世界变得可计算、可分析,我们的物理世界正在发生变化!互联网正成为经济社会的基础设施;物联网+5G推动万物实时网络连接起来;云计算成为政府和企业的数字业务平台;智能工具成为新时代的生产工具;互联网协同成为业务创新的重要模式;数据成为商业社会的生产资料和生产要素;区块链成为商业社会的信任机制;人工智能程序/机器人成为新型劳动者,如图5。

    图5 物理世界的数字化

    2、意味着我们正在创造物理世界的一个数字孪生世界(数据世界)

    关于物理世界所发生的一切终将都被记录下来,形成一个完全的数据世界,经过数据处理,曾经的物理世界被还原成为一个数字孪生的世界,如图6。然而,不仅于此!数据的演算、预测和想象力可以制造出若干个“平行世界”,它们只存在于数据世界,并不是现实物理世界的孪生或者镜像,就像一个个世界演变的“剧本”,可以让我们对物理世界的演变有更多思考和想象。

    图6 数据世界的形成

    3、意味着全球数据财富激增

    一切数据化,意味着全球数字数据资源储量每18个月翻一番,蕴藏巨大的财富价值。IDC统计,到2020年,全球将拥有50ZB以上的数据量;到2025年,全球每年产生的数据将高达175ZB,如图7。工信部数据显示,近年来我国数据量年均增速超过50%,到2020年,我国数据总量占全球约20%,成为数据大国之一 。

    图7 全球数据量的增长

    思考四:数据的经济价值是什么?

    1、数据的经济学特点

    特点一:数据是一种“信息矿”。数据是对事实的记录和描述(符号),数据蕴藏着世界运行的信息。可以用于作为解释、推理和计算的原材料,但没有对数据的分析和挖掘,就无法发现有意义的信息和知识。

    特点二:数据没有稀缺性。数据来源于世界的生生不息,这意味着,数据“取之不尽,用之不竭”。物以稀为贵,数据本身并不贵!稀缺的是计算数据的技术和分析数据的算法,所以贵的是数字技术和算法。但数字技术的拥有者通过对数据的垄断和控制,可以制造稀缺性。

    特点三:数据具有公共性,很多人可以同时使用数据。

    特点四:数据具有可复制性,数据复制成本低,可被多次重复利用。

    特点五:数据具有物理载体依赖性,数据处理的过程必须依赖于物理的技术“载体”。

    特点六:数据的经济价值会随着时间流逝而降低。

    特点七:数据可以被彻底删除。

    2、数据的基本价值

    数据的基本价值就在于:不确定性的世界需要信息。

    通过数据处理,经过“算力+算法+数据”,我们可以获得信息,对世界的不确定性有更确定性的把握,这就是数据的基本价值,如图8。

    从功能上来看,数据的价值体现在获得信息,“通过计算获得信息”、“大部分信息(资料)的复用”、“精确控制(所需要的信息)”、“精准匹配(最需要的信息)”、“训练算法(读懂信息)”以及“预测未来(的信息)”等功能。

    从应用场景来看,数据的价值就体现在各种场景中使用信息,包括数据网贷、健康码查询、电商精准推荐、数据排产、基于房型数据的家装C2B、基于数据的手机定制化制作、数字健康监测、大数据影视剧制作等应用场景。

    从应用效果来看,数据的价值就体现在“知己知彼”的信息,用数据要素去整合、替代或者优化各种生产要素的配置,最终实现提高生产效率、提高市场交易效率、优化生产要素配置结构和效率、减少其他生产要素的投入、推动全要素的高效连接和融合、创新产品和业态等,实现数据的经济价值。

    图8 数据的价值

    思考五:谁拥有更多的数据资产?

    1、真正的数据资产控制者

    随着互联网、移动通信、物联网、云计算、大数据、人工智能等新一代信息技术的应用,数字经济加快发展。由于云计算具有计算资源的网络化、虚拟化、灵活配置和动态管理等特性,越来越多的计算、存储、网络、安全、应用的资源汇聚到云计算平台上,形成了不同层次的服务模式,包括基础设施云、平台云、应用云等。计算资源的集聚也带动了用户和数据资源的集聚,因此,真正控制更多数据资产的,是云上的云基础设施服务商、云平台服务商、互联网云应用服务商等,他们才真正拥有大量的数据资产。

    图9 数据资产的控制者

    2、数据资产计量与估值

    数据资产的计算与估值,有三种基本方式:

    (1)用信息量估值,即用数据所蕴含的信息量进行估值。一般来说,数据量越大,信息量就越大。而数据量是与云平台上的人或物的流量成正比的,用户量越大,数据量越大,信息量一般也越大,数据资产价值就越大。例如,电信运营商,就比较常用网络的信息流量来进行估值和定价。

    (2)用应用频次估值,即用数据所能应用的次数进行估值。数据被使用越多,价值越大。因此,数据被需求或被使用的频次越高,被使用的场景越多,应用价值越高。例如,联系人通讯信息是不同场景中使用频次最高的数据,其价值就高于个人的其他数据。

    (3)用数据隐私保护所付出的成本进行估值。为了不侵犯个人隐私,数据控制者需要对数据进行脱敏、加密等处理,这种处理所付出的成本,也可以作为数据估值和定价的一个依据。

    图10 赵刚在三部委“实施国家大数据战略专题培训班”上演讲

    思考六:数据权是一种什么样的权利?

    数据确权是数据资产化的重要前提。但数据确权是一个复杂的过程。数据权,既不是一种简单的物权,也不是一种简单的人格权。这是由数据的定义和特性决定的。

    数据是对事实的记录和描述。形成数据的过程中,至少涉及两类主体,一类是数据的事实主体,一类是数据的记录和描述主体。就像镜子前人,他在镜子中形成了他的像(数据),人是人像的事实主体,我们称之为“数据主体”,而镜子的主人是人像的控制主体,我们称之为“数据控制者”。数据的形成,离不开人,也离不开镜子。因此,数据权是一种一种二元共有的新型权属。

    图11 数据权的隐喻

    1、数据主体的数据人格权等

    数据主体(像的主人),因为提供事实而申张有关事实的权利,如个人数据的主体,他能够主张人格权不受侵犯。

    2、数据控制者的数据控制权

    数据控制者(镜子的主人),因为控制技术载体而控制着数据,他因为对技术载体的投资而付出巨大成本,理应主张相应的数据控制权收益。

    因此,在明晰数据主体和数据控制者各自的权利特点后,就能更加明确的为数据权进行确权,满足不同主体的权利主张。

    思考七:数据是一种什么样的商品?

    经济学家曼昆在《经济学基础》中把商品分为四种类型。我用这个模型对数据商品进行了分类,如图12。

    图12 数据商品的分类

    数据一般具有非排他性,一个消费者使用数据时,不会阻止另一个消费者同时使用它。根据数据的非排他性,数据主要可以作为公共资源或公共产品,如天气预报的数据。除非用某种收费方式实现排他性,如会员收费。

    数据一般也具有非竞争性,一份数据可以被不同消费者重复使用,而且重复使用不会降低数据的大小或质量。根据数据的非竞争性,数据主要可以作为俱乐部产品和公共产品,如收费的饮鹿网数据账户和天气预报数据服务。除非在采用某种技术手段限制数据被重复使用后,数据可以具有竞争性,如拥有私钥的数字货币、限制使用次数的数据等。

    数据的收费相对简单一些,但限制数据的重复使用就困难得多,也不符合数据的基本特性。因此,合理的数据商品化路径有两条:第一,仅考虑数据商品的非竞争性和排他性,这决定了在数据市场上,其更适合成为俱乐部产品,理论上看,这将是数据交易的主要模式;第二,综合考虑数据商品的非竞争性和非排他性,数据就更适合作为公共产品,这是政府公共数据开放共享的基本原因。

    技术有手段,可以做到让数据具有竞争性,但成本会很高。数据垄断者也可以制造数据的竞争性,但没有数据的流动,也就没有数据价值的实现。

    思考八:数据要素该如何交易?

    2020年3月30日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》提出“加快培育数据要素市场”的三个主要任务:一是推进政府数据开放共享;二是提升社会数据资源价值;三是加强数据资源整合和安全保护等。并要求全面贯彻落实以增加知识价值为导向的收入分配政策,充分尊重科研、技术、管理人才,充分体现技术、知识、管理、数据等要素的价值。要求引导培育大数据交易市场,依法合规开展数据交易。要求建立健全数据产权交易和行业自律机制等。

    1、政府和各类组织加强公共数据产品的开放共享

    政府数据开放:政府数据开放是通过对各类数据的进行处理,形成三类不同的数据:无条件开放数据、有条件开放数据以及不予开放数据。政府将一些公共数据进行无条件开放,包含工商、重大项目、投融资等数据。对有条件开放的数据,政府则通过大数据运营公司结合社会数据进行开发利用。目前,我国地方政府开放平台达到108个,开放了教育科技、民生服务、道路交通等多个领域的公共数据。但是我国政府数据开放实践一直存在数据量少、价值低、可机读比例低,开放的多为静态数据、数据授权协议条款含糊、缺乏便捷的数据获取渠道、缺乏高质量的数据应用以及缺乏便捷、及时、有效、公开的互动交流等问题。

    政府数据共享:政府数据共享是部门间的共享,包括有条件、无条件和不予共享等类型,基本原则是“共享是常态,不共享是例外”。2016年,国务院颁布了《政务信息资源共享管理暂行办法》,要求推动政务信息系统互联和公共数据共享,增强政府公信力,为政务信息资源共享建立了规范和框架。2017年,国务院发布《关于推进公共信息资源开放的若干意见》。随着国家大数据战略实施,我国正全面推进建设全国一体化的国家大数据中心,推进国家层面的公共数据开放和基础数据跨部门、跨区域共享。政府的一网通办、联合监管等应用也促进了数据共享。但政府信息孤岛、部门间数据共享难的问题仍较突出。

    社会数据开放:阿里、腾讯、百度等互联网公司也开放了部分数据给社会。

    2、现有数据市场流通的结构、问题和主流模式

    数据要素流通和市场化配置是实现数据要素经济价值的关键。在市场上,数据流通的主要模式是数据交易,有很多数据交易模式,包括直接交易数据、数据交易所、资源互换、会员账户服务、数据云服务交易、API访问、基于数据保护技术的数据交易、利益相关方的数据平台+数据交易等多种形式,具体内容参见我的专著。

    图13 数据流通的现有结构

    但是,当作私有化数据产品的数据交易明显不足。首先,国内大部分数据交易所交易清淡,年总交易额不足亿元,这是一个现实。然而,据奇安信数据安全研究院称,每年在暗网平台出售的各类泄露数据多达上万起,每年泄露的数据总量约数十亿条,交易金额约10亿元人民币。究其原因,主要是由于数据的商品特性决定的。一是数据的非竞争性,你卖给他人的一份数据,他可以低成本复制无数份。二是数据确权难,你卖的数据,是你的吗?三是数据交易可能触犯个人隐私、商业秘密、国家安全,你卖的一份数据,可能侵犯上亿用户的权益。四是数据垄断,大部分人的数据被少数平台所控制。

    当前市场环境下,俱乐部数据产品应是最适宜数据的交易模式。如天猫为会员提供的“数据银行”服务,饮鹿网全年会员服务等。研究机构Value Report的数据2018年全球大数据即服务市场约50亿美元。

    3、在新型权属关系下,数据要素交易的三种新模式

    我研究认为,在数据的新型二元权属关系下,围绕对数据主体和数据控制者权利的侧重,可以创新出三种新的交易模式,如图14。

    模式一:以不侵犯数据主体的人格权等为前提,推动数据控制权的交易,如隐私计算技术所支撑的数据交易,实现了“数据可用不可见”,“可用”的是数据控制权,“不可见”的是数据主体的隐私等。

    模式二:以不侵犯数据控制者的数据控制权为前提,或者法理上规定数据控制权屈从于数据主体人格权,从而实现尊重数据主体人格权的交易。如同一平台不同服务主体间的数据交易,比如淘宝的数据共享给支付宝,并允许数据主体受益;再如,欧盟数据立法GDPR规定了不同平台间的数据主体的可携带权,就允许用户将facebook上的个人数据携带到twitter上。

    模式三:统一评价和计量数据主体人格权等和数据控制者的数据控制权,并量化出各自贡献和收益。如通过第三方交易所公证交易,或者区块链存证数据交易等。

    图14 数据交易的三种新模式

    思考九:如何激活数据要素市场?

    1、激活生产要素市场,核心在于利益“分配”

    建立“由市场评价贡献、按贡献决定报酬”的机制,是激活要素市场的关键,其本质在于建立一个利益“分配”的机制。根据以往生产要素市场化改革的经验,利益分配机制是关键。十一届三中全会后,分产到户,体现多产多得,充分激活了农村市场。改革开放初期,分工协作,体现按劳分配、多劳多得,充分激活了劳动力市场。证券市场发展初期,分股到民,体现按股分红,充分激活了资本市场。在大众创业、万众创新的时期,按股分利,充分激活了企业家创业市场。同样,大量培养科技人才,分技到人,按技取酬,充分激活了技术创新市场。

    当前,国家通过建设数字新基建来推动数字化、网络化和智能化,正在让人人互联、万物互联,让每个人都可以生产和消费更多数据,推进信息普惠和数据开放,每个人都会获得更多数据。这正是“分数到人”的举措进一步实现“按用分利”,也将激活数据要素市场。

    图15 激活数据要素市场的机制

    2、实现“业务数据化-数据资产化-数据业务化”

    “由市场评价贡献、按贡献决定报酬”的数据要素的市场化配置机制一旦形成,数据提供者都可以更公平参与收入分配。数据生产者,通过采集、加工、分析数据就可以积累数据资产,实现数据业务化,通过数据资产获得收入;数据流通者,通过开放、共享、交易数据也可以获得收益;数据消费者,通过使用数据实现价值。

    数据资产化后,个人或企业拥有的数据可以和土地、设备、资金等一样,计入资产负债表,可以利用数据资产直接变现,可以买卖和交易数据资产。可进行数据资产的金融创新,开展数据银行、数据信托等新业务,实现数据资本化。

    由此,更多人、更多财富、更多企业将投入数据要素的生产和消费,更多人会致力于消除世界的不确定性,精准的进行业务和管理决策。数据驱动的数字经济将进一步繁荣,数字经济革命能级进一步提升!

    思考十:如何进行数据治理?

    数据治理的原则是公正诚信、尊重隐私、注重责任、开放共享、统筹安全、标本兼治等。

    公共数据治理应遵循数据伦理、数据立法、公共数据治理的原则,通过伦理建设、数据立法、公共数据治理框架等实现全社会的数据治理目标。

    组织数据治理应纳入公司治理和IT治理的整体框架下。公司治理是股东通过公司治理结构对经营管理层进行管控的制度安排,如董事会、财务审计、绩效考核等。IT治理是公司治理的一个有机组成部分,它包括领导力、组织结构和流程等制度和机制,确保IT维系和拓展组织的业务战略目标。组织数据治理是对组织的数据开发和利用的一种管控制度安排,通过战略、组织、架构、标准、政策、流程、管理等制度和机制,确保数据的开发和利用符合组织的业务和IT战略。

    组织数据治理的制度安排主要有数据战略、数据组织、数据流程与制度、数据架构、数据技术架构、数据资产管理、数据质量管理、数据标准、数据安全与风险审计等流程。

    图16 组织数据治理框架

    组织数据治理的各个模块形成一个有机整体,需要全局统筹、系统化执行。DCMM数据能力成熟度模型和DSMM数据安全能力成熟度模型等,是开展数据治理的重要工具和方法论。

    作者简介:

    赵刚,博士,现任赛智产业研究院院长,北京赛智时代信息技术咨询有限公司CEO,饮鹿网创始人,赛智区块链(北京)技术有限公司创始人。兼任中国电子商会大数据专委会秘书长、中国电子学会工业工程分会副主任。曾任工信部赛迪研究院“赛迪学者”、赛迪时代公司总裁、赛迪顾问股份有限公司高级副总裁。

    在信息化领域耕耘19年,服务的国家部委、省市政府、大型企业客户超过100家。北京、贵州、重庆、天津、南宁等省市数字经济专家,《北京市数字经济战略研究》《国家大数据(贵州)综合试验区实施方案》《天津大数据应用场景计划》《贵阳大数据行动纲要》《贵阳区块链发展和应用白皮书》等顶层设计项目负责人。

    著有专著《数据要素:全球经济社会发展的新动力》《数字化信任:区块链的本质与应用》《区块链:价值互联网的基石》《大数据:技术与应用实践指南》《IT管理体系:战略、管理与服务》。

    ▎本文系Innov100原创文章,转载请标明出处。

    更多精彩内容请登录https://www.innov100.com官方网站

    或扫描下方二维码,点击关注微信公众号(ID:sagetimes)



数据服务
月报系列
咨询服务
培训服务