立即购买
赛智时代:多方数据融合发展路径研究
  • 赛智时代:多方数据融合发展路径研究

    Innov100
    2021-07-21 17:57:48
  • 摘要:推进公共数据、社会数据、互联网数据等多领域、多方位数据融合,对于发挥数据要素价值、推进数据要素市场化具有重要的现实意义。赛智时代课题组通过研究多方数据融合发展现状和难点,针对性提出多方数据融合技术、平台、标准、市场等方面的发展建议。

    一、我国多方数据融合发展现状

    多方数据融合是指跨部门、跨领域、跨行业的数据融合创新,反映了数据与经济发展和决策之间的有机关联,体现了数据作为数字经济发展关键要素而越发重要的特点。随着我国数字经济的发展,单个行业数据存在割裂性不能满足经济高质量发展需求,需要更加全面、多方位的数据融合分析。

    图1 多方数据融合结构图

    目前政府和企业都在探索多方数据融合的协同创新,挖掘数据的商业价值,促进产业提质增效升级,目前已经取得一定成果。政府层面,北京金融公共数据专区,汇聚企业税务、社保、医保、公积金、政府采购等近30个部门20多亿条政务数据,破解与金融机构的合作壁垒,帮助银行业公共数据用起来;北京国际大数据交易所,利用隐私计算等技术,绕开数据所有权的争论,给数据流通交易打造“数据可用不可见,用途可控可计量”的安全环境,助推多方数据融合,挖掘数据价值。上海公共数据开放平台,围绕开放数据产生了长三角绿色供应链平台等一批创新应用案例,同时上海数据交易中心也在推进数据交易流通。贵州推动大数据和实体经济深度融合,印发《贵州省大数据融合创新发展工程专项行动方案》支撑大数据融合创新。企业层面,腾讯智慧零售平台将一方数据、腾讯数据、渠道伙伴数据(广告)、合作伙伴数据进行融合,实现数据更加有效、有用的分析。京东、拼多多与抖音合作,将视频浏览数据和APP搜索数据进行融合分析,实现商铺更加有效的广告投放和仓储存放。技术层面,以多方安全计算、可信执行环境、联邦学习等为代表的隐私计算技术为流通过程中数据的“可用不可见”提供了解决方案,已在金融、医疗、政务等领域开始推广应用。

    二、多方数据融合存在的难点

    (一)数据融合技术门槛高

    多方数据融合是实现数据要素价值化的重要方式,高度依赖信息技术,对数据存储设备、数据脱敏、隐私计算、数据分析技术等方面具有很高的要求。随着2021年6月我国通过了《数据安全法》,我国数据法律体系日益完善,数据合规监管日趋严格,对数据融合技术要求和安全保护方面有了更高要求,进一步提升了数据融合门槛。多方数据融合高技术门槛在一定程度上限制了我国多方数据融合市场的进展。

    (二)数据安全问题突出

    数据本身具有易复制,存在方式上具有虚拟性特点,而多方数据融合又需要跨行业、跨领域,这导致数据隐私与安全问题愈发突出。从数据价值产生流程来看,多方数据融合需要经过连接所需多源数据库并获取相关数据、研究和理解所获得的数据、梳理和清理数据、数据转换和建立结构、数据组合、建立分析数据集进行数据分析等六个基本步骤,数据要素应用分析跨度大,数据不断流动,带来数据泄露和通过逆向学习的方法还原原始数据的风险。

    (三)公共数据易汇聚难融合

    国家电子政务网站接入中央部门和相关单位共计162家,接入全国政务部门共计约25.2万家,国家层面实现公共数据汇聚,各地方政府建立电子政务平台,实现了省内数据汇集和开放,我国公共数据已经实现了汇聚和共享。但由于数据脱敏难,各部门、各行业协会公布的公共数据质量参差不齐,限制了多方的数据融合分析效果,使得数据融合价值大大折扣,公共数据与企业数据融合难创新、产品难落地。

    (四)融合数据不易得

    数据交易是获得跨行业、跨领域数据进行多方数据融合分析的重要方式。但我国尚缺乏实现数据资产化、商品化和标准化的交易要件体系,在数据交易事前阶段,缺乏针对数据产品和交易商的评估体系,在交易事中阶段,缺乏统一的交易撮合定价体系,在交易事后阶段,缺乏数据可信监管体系,这些问题制约了数据要素的顺畅交易流通,制约了我国多方数据融合创新。同时,我国互联网巨头掌握着大量的数据,建立多方数据融合合作,为其他企业提供数据分析服务是其一贯的商业模式,而互联巨头不愿共享数据,大大增加了数据获取难度。

    三、推动多方数据融合发展的建议

    (一)推动“隐私计算+区块链”等技术商业化发展

    隐私计算作为推动实现数据“可用不可见”的一类重要技术,在数据安全流通、价值释放过程中发挥着不可替代的作用。区块链是一种防篡改、可追溯、共享的分布式账本管理技术,可以实现原始数据的链上存证核验、计算过程关键数据和环节的上链存证回溯。区块链与隐私计算结合,推进原始数据在无需归集与共享的情况下,实现多节点间的协同计算和数据隐私保护;同时解决数据过度采集、数据隐私保护,以及数据储存单点泄露等问题。区块链确保计算过程和数据可信,隐私计算推进数据可用而不可见,实现更广泛的多方数据融合。

    (二)建立公共数据集成开发平台

    利用多方安全计算等技术建成数据集成开发平台,对数据进行集中清洗、加工和脱敏,确保敏感数据不出域、数据价值不打折。推动公共数据资源与企业生产数据、供应链数据、消费数据、贸易流通数据等行业数据资源的融合应用,实现数据资源要素的高效配置和经济社会的高效协同,解决社会发展的瓶颈,也有助于培育和发展数字经济新产业、新业态和新模式。

    (三)探索建立多方数据融合制度标准

    多方数据融合利用需要规范数据融合标准,在数据安全、数据可见性、隐私与商密保护等方面建立标准。安全标准方面,修订完善现行隐私计算框架,建立系列标准,推广第三方隐私计算安全认证。数据责任方面,数据融合参与各方通过协议方式,约定彼此的数据安全权利和义务边界,明确各自的责任范围,未来在标准层面制定进一步明晰各方权利义务。利益分配方面,研究探索多方数据融合场景下数据利益的分配制度。

    (四)繁荣数据交易市场促进多方数据融合

    推动数据交易市场完善与繁荣,才能有效促进多方数据融合发展。第一,完善数据交易规则,通过构建确权原则、指导确权方向,对数据进行清晰的产权界定。第二,完善数据交易市场生态,整合数据源提供方、算法参与方、场景参与方、技术支撑方、数据交易服务方等,共同组建数据交易生态,使数据进行更加有效流通。第三,探索数据交易新模式,探索数据信托、数据资产证券化等新型业务模式,满足多样化的市场需求。

    注:本文摘自赛智时代数据要素课题组完成的研究报告,详细内容请点击饮鹿网产业报告栏目阅读。

    ▎本文系Innov100原创文章,转载请标明出处。

    更多精彩内容请登录https://www.innov100.com官方网站

    或扫描下方二维码,点击关注微信公众号(ID:sagetimes)


数据服务
月报系列
咨询服务
培训服务