相关文章
研究|吕指臣、卢延纯:数据要素高质量供给的全链路建设框架
2025-10-19 12:06

关注+星标

不错过任何一次推送


摘要

数据要素作为新型生产要素,是发展数字经济的战略性资源和关键驱动力,也是新质生产力的核心内涵之一,对建设数字中国的目标和发展数字经济具有战略意义。当前,我国数据要素供给市场仍处于建设初期,存在一系列堵点和痛点,提升数据要素的供给质量,成为打通数据要素流通、交易和应用全链条的首要任务。为此,建议着力以“四大底座、三方主体、两个支撑、一揽子服务”为核心的“4+3+2+1”全链路建设框架,解决当前数据要素的供给挑战。

Abstract

图片


文丨吕指臣 卢延纯

吕指臣:清华大学国情研究院出站博士后、国家发展和改革委员会价格成本和认证中心助理研究员
卢延纯:国家发展和改革委员会价格成本和认证中心主任
原文载 | 《宏观经济管理》,2024 年第9期
引用格式|吕指臣,卢延纯.数据要素高质量供给的全链路建设框架研究[J].宏观经济管理,2024(09): 28-38.


在全球数字经济飞速发展的背景下,数据要素作为新型生产要素的重要性日益凸显,已成为推动经济增长、提升产业竞争力和实现社会治理现代化的重要驱动力。当前,发展数字经济、建设数字中国是推进中国式现代化、实现中华民族伟大复兴的重要战略选择,而数据要素是实现新旧动能转化、发展新质生产力、打造经济发展新引擎的核心。

2024年5月14日,国家发展改革委、国家数据局、财政部等部门联合印发《关于深化智慧城市发展推进城市全域数字化转型的指导意见》,明确提出要构建数据要素赋能体系,加快推进数据产权、流通交易、收益分配、安全治理等制度建设,促进数据要素高效流通和使用。

在此背景下,实现数据要素的高质量供给,确保数据要素在整个链条中的流通、共享与应用,成为包括政府和企业在内的社会各方关注的焦点问题。

基于数据要素的高质量供给议题,梳理国内数字经济和数据要素领域的重要政策文件,总结数据要素在我国发展总目标中的战略性意义,在深入阐释和理论综述的基础上,分析当前数据要素供给的关键环节和主要痛点,总结提升数据要素高质量供给的核心思路,可提出“4+3+2+1”的全链路建设框架,为数据要素高质量供给提供理论支持和实践指导,并助力数字经济高质量发展和数字中国建设。




一、数据要素在建设数字中国战略目标中的意义

党的二十大报告指出,要加快建设网络强国、数字中国。针对建设数字中国的总体要求,习近平总书记在致首届数字中国建设峰会的贺信中提出,要适应我国发展新的历史方位,全面贯彻新发展理念,以信息化培育新动能,用新动能推动新发展,以新发展创造新辉煌。中共中央、国务院从顶层设计和发展全局的视角,2023年印发《数字中国建设整体布局规划》(以下简称《规划》),明确了建设数字中国的战略路径,提出了“2522”①整体框架[1]。“2522”整体框架中的第一个“2”即为夯实数字基础设施和数据资源体系两大基础,而构建整体性、协同性的数据资源体系,就是要全面提升数据资源的规模和质量,充分释放数据要素价值。

建设数字中国战略目标的实现依赖于数字经济的发展。数字经济作为现代社会的新经济形态,正以前所未有的速度推动着生产方式、生活方式和治理方式深刻变革,成为重塑全球经济结构、改变全球竞争格局的先进力量。数据要素是数字经济的核心,党的十九届四中全会首次提出将数据作为新的生产要素纳入分配制度。这充分肯定了数据作为生产力的一种新兴形态,是数字经济发展中的基础性资源和战略性资源。2020年,中共中央、国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》首次系统性提出对要素市场化配置的指导意见,其中,数据作为新型生产要素被写入,凸显了大数据对经济高质量发展的推动作用[2]。2022年12月,中共中央出台了《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”),从数据产权制度,数据要素流通和交易制度,数据要素收益分配制度,数据要素治理制度4个方面构建起数据基础制度的核心支柱,推动形成中国特色的数据要素治理新模式[3]。2024年,国家数据局会同中央网信办等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,以发挥数据要素的乘数效应,赋能应用场景为出发点,明确到2026年底各行业和领域结合数据要素协同增效加速发展的工作目标,提出激活数据要素潜能、充分释放数据要素价值[4]。

2023年9月,习近平总书记在黑龙江考察期间首次提出“新质生产力”,发展新质生产力成为我国在新发展阶段打造经济发展新引擎的重要指引。推进经济高质量发展,必须积极培育和发展新质生产力[5]。新质生产力作为以数字化、网络化、智能化的新技术为支撑,以科技创新为核心驱动力的新生产力形态,关键生产要素是数据。数据要素通过低边际成本、强渗透性和融合性的特点,推动生产资料、生产方式、资源配置方式不断优化升级,从而推动生产力提升和数字经济发展。我国是世界第二大数据产量国,2023年数据产量达到32.9ZB,比2022年的8.1ZB增长超3倍,2019—2023年CAGR达到70%。2019—2023年,我国数字经济规模和结构呈现持续增长向好的态势(见图1)。可以看出,2023年,我国数字经济规模已达到53.9万亿元,比上年名义增长7.4%,连续12年显著高于同期GDP名义增速,数字经济占GDP比重达到42.8%。数据全要素生产率逐年提升,从2012年的1.66提升至2022年的1.75②。

图片

此外,我国数字经济产业结构进一步优化,数字产业化和产业数字化呈现二八比例结构,服务业数字化和工业数字化双轮驱动。数据要素市场加快建设,数据产权、流通交易、收益分配、安全治理等基础制度逐步完善,数据产业体系进一步健全,数据资源供给数量和质量稳步提升,数据确权、定价、交易流通等市场化探索不断涌现。在数据要素赋能行业应用方面,近年来,数字政务服务效能大幅提升,传统产业转型升级,数字企业发展壮大,数据银行、数据信贷等新产品彰显创新活力,数据要素价值进一步释放。




二、理论研究基础

(一)数字经济是高质量发展的推动力

数字经济作为新的经济形态,通过数字技术与实体经济深度融合,提高经济社会的数字化、网络化、智能化水平。随着技术进步,数字经济呈现出新特征,衍生出众多新产品新业态新模式,逐步深化为数字产业化、产业数字化、数字化治理和数据价值化。数字经济的实质内涵是应用数字技术、积累数据要素并挖掘数据价值[6],数据资源、现代信息网络和新兴通信技术共同构成了数字经济的三大要素[7]。

在数字经济与高质量发展的关系上,主要存在“动力说”和“构成说”。前一种观点认为,数字经济是推动新时代我国高质量发展的新引擎和关键驱动力[8-9],在微观层面规模经济、范围经济记在黑龙江考察期间首次提出“新质生产力”,发展新质生产力成为我国在新发展阶段打造经济发展新引擎的重要指引。推进经济高质量发展,必须积极培育和发展新质生产力[5]。新质生产力作为以数字化、网络化、智能化和网络经济促进高质量发展,在中观层面推动产业转型升级形成新业态,在宏观层面表现为全要素生产率的提升。后一种观点认为,数字经济是高质量发展的组成部分而非动力[6],两者存在逻辑一致性。数字产业化和产业数字化构成了数字经济的微观基础,而数字经济与实体经济融合能够为产业带来创新效应、关联效应和融合效应,推动产业升级。

(二)数据要素将贯穿经济社会运行的全链条

数据要素是在讨论数字经济的生产力和生产关系的语境中对“数据”的指代。企业层面的数据要素是指为企业提供决策支持、创新驱动和效率提升的关键数据资源[10]。

数据要素化是赋予数据要素属性的过程。数据要素属性包括产生主体、时间、地点、类别、安全属性、质量等级、权属等。数据要素化需要数字技术作为生成、流通、利用的基础[11],也需要数据要素与其他生产要素有机结合[12]。在数据要素化路径上,数据既可作为独立的生产要素进入生产、流通、消费等经济各环节,也可与其他要素相互作用,提升传统生产要素的边际收益率[13]。数据要素在决策支持、资源优化、创新推动和提高生产效率方面起到了关键作用[10],数据要素化通过优化资源配置、提高生产效率为经济发展提供驱动力[14]。

总之,数据在参与价值创造的过程中(见图2)体现了其要素的本质,且通过参与创造价值的过程系统全面地贯穿在经济社会的全链条中。

图片

(三)数据要素化是数据价值化的起始点

相关研究指出,数据价值化按照数据资源化、数据资产化、数据资本化3个阶段推进,数据要素化是数据资源化、资产化、资本化的基础步骤(见图3),是数据价值化的起始点。

图片

数据资源化对数据进行各项处理,形成可采、可见、标准、互通、可信的数据资源。然后通过流通交易为提供方带来经济收益,即数据资产化。最后通过金融产品的形式拓展数据价值,即数据资本化,主要包括数据信贷融资与数据证券化两种方式。

在资源化到资产化、资本化的过程中,需要合理的公允价格支撑,王建冬等探讨如何构建适配全国统一数据大市场的要素价格形成机制的问题,根据数据资源化、资产化和资本化提出了价格形成机制的研究思路[15]。




三、数据要素供给的关键环节及当前痛点

(一)关键环节

数据要素的供给涉及数据的整个生命周期。此周期指某个集合的数据从产生或获取到销毁的过程,主要分为采集、存储、整合、呈现与使用、分析与应用、归档和销毁几个阶段,可分为数据归集(采、备)、数据治理(存)、数据开发(算)、数据交易(用、产)四大关键环节(见图4)。

图片

1.数据归集。作为数据要素供给的关键起始环节,数据归集主要是将来自各个数据源的数据集中存储到统一的位置或平台上。这个过程包括从不同系统、日志、程序、设备或传感器中采集和提取数据,并将其转移到中央数据库、数据仓库或数据湖中。其目的是集中管理和存储数据,以便后续的数据分析、数据挖掘、业务智能和决策支持等任务,通常涉及数据的收集、传输、清洗和存储。这个环节是数据分析和挖掘的重要一环,主要是为了确保数据的完整性可靠性,并为后续的数据处理和应用打下基础。

2.数据治理。数据要素高质量供给的前提是把相关数据治理好,即通过制定规范、政策和流程以管理保护数据资源。目的是确保数据的质量、安全、合规性和可信度,以支持数据驱动的决策和业务运营。数据治理需要设置适用于收集、存储、处理和处置数据的内部标准(称为数据策略)。在具体内容上,数据质量管理、元数据管理、合规性管理、数据生命周期管理等,均属于数据治理。这个环节是数据要素供给的管理基础。

3.数据开发。数据开发更大程度上可认为是数据要素供给的发展基础,主要是将整理后的数据转化为有用信息和洞察力,也可称为数据计算或数据加工。通过有效的数据开发,可更好地利用数据资产,深入解读面对的信息、客户、市场,提高业务效率和竞争力,创造更大价值。常见的数据开发包括编码研发和规范建模,编码研发用于构建计算任务,规范建模用于构建逻辑化的数据模型。数据开发的成果可呈现为丰富多元化的产品形态,具体取决于组织的需求和目标。

4.数据交易。数据交易主要是以数据作为产品分类定价、流通和买卖的行为,是数据要素流通的基本方式之一,也是数据要素高质量供给的逻辑基础,主要为了帮助数据要素实现信息与货币的交换。在此过程中,交易的标的是深度分析过滤、提炼整合及脱敏处理后形成具有交换价值和技术可行性的衍生数据产品。数据交易的标的包括来自政府、企业和个人的各类数据,数据交易的形式主要有双边数据交易、数据交易平台和开放数据集市场。数据交易所是我国广泛采用的交易形式,2015年成立了我国第一家数据流通交易机构贵阳大数据交易所。

(二)当前痛点

1.数据的非标准化。我国数据标准化存在一系列问题。在供给侧,来自各行业的数据类型和来源不断丰富,包括金融、互联网、政务、医疗健康等多个行业的数据在形成、采集、处理和存储等过程中(见图5),其形式和作用具有明显差别。各地区的数据分布、产业特征以及关注重点不同,也导致采集标准在不同区域之间的差异。这种差异最终造成数据的不完整和噪音较大,影响了数据在跨行业、跨区域方面的流通和充分利用。我国的数据产量已达到32.9ZB,但真正开放、共享和使用的量较小,存在数据质量不够、标准不一致、碎片化、分散化等问题。如当前政务数据平台所归集的数据中,内容完整比例仅占16%。就我国数据要素市场标准化进程而言,仅在数据要素流通的4个环节发布了国家标准,即数据权利、数据定价、数据交易和数据监管,而在其他环节如数据入市和数据托管,以及具体要求如数据质量和产品形态等方面,仍缺乏统一标准。

图片

2.数据要素的确权。权属界定不清是数据要素化的最大障碍之一[16],数据的权属界定具有复杂性,目前,对数据生产者、数据收集者、数据运营者等参与主体的权利划分,在理论和实践层面均未形成共识[17]。数据要素规模巨大、种类繁多,非损耗性和非排他性使其溯源和确权的难度较高,产权主体界定为数据生产者或是数据控制者存在争议[18],且网络环境下数据确权与传统确权存在较大差异[11]。王建冬等研究认为,数据市场普遍存在确权、定价、互信、入场和监管“五难”困境,主要是因为数据买卖双方对数据价值评估存在“双向不确定性”[19]。针对确权问题,数据二十条确立了“建立公共数据、企业数据、个人数据的分类分级确权授权制度”的指导思想。据此,许多学者提出了不同的机制设计和解决方案。如,以民法典确立的民事权利体系为基础建立健全相应的确权授权机制[20],以洛克劳动赋权理论和马克思劳动价值理论为财产规则建立企业数据确权制度[21],从平面化到层级化的“三三制”数据确权法[22],明确数据及数据权利谱系[18],建立中立性的网络数字平台,等等[11]。

3.数据交易的模式。得益于政策和经济环境的支持,我国的数据交易市场在近3年实现了快速的增长。2022年,数据交易市场规模约为876.8亿元,比上年增长42%②。虽然体量已较大,但对比我国大数据产业规模1.57万亿元而言,未来仍有可观的增长空间(见图6)。预计未来3—5年,我国数据交易市场能实现34%的年复合增长率,至2025年市场规模有望达到2046亿元③。

图片

然而,当前的数据交易模式仍需完善,由于缺乏权威和统一的数据可信流通基础环境,数据交易双方很难建立有效的信任机制,数据交易的摩擦成本仍较高。数据交易分为场外交易(双方依法自行交易)和场内交易(数据交易平台),目前大多数交易依赖于场外交易(见图7)。场外交易模式在事前阶段缺乏对交易方和数据产品的评估体系,很难保证数据的质量;在交易事后阶段缺乏可信的第三方监管,会产生“道德风险”。

图片

全球范围内已有的数据要素市场普遍采用了交易所模式,其理应实现3点制度保障,标准化的交易标的、基于第三方保证信用机制、严格的强制信息披露制度。然而,在数据要素市场的特殊场景下,由于数据的高度个性化和无形化,市场信息不对称,以及数据价值依赖于保密性的特点,交易所模式仍存在数据质量、信任机制、安全保障、流通效率、价值损失等诸多问题。

截至2024年3月底,我国已成立了49家数据交易场所④,但目前运营的数据交易所的数据产权不清、交易活跃度不高、新技术支撑不充分、平台同质化竞争等问题仍较突出。

4.数据要素的定价。数据要素的价值本身存在不确定性和时变性,不仅与自身的规模质量、获取时点、格式和呈现特征相关,与具体应用场景相关,而且数据要素在交易中存在“信息悖论”⑤,数据要素的价值依赖于信息的隐私性[16]。此外,数据要素的非标准化和应用场景的特异性增加了制定统一数据定价规则的难度,相同的数据要素对不同买方有价值差异,且范围较大[12,16]。应借鉴我国公共资源实行政府指导定价的办法和改革方向,考虑数据定价难的普遍性、特殊性,以及公共数据市场的发展阶段和使用场景,提出公共数据价格形成的相关方法[23]。

5.数据要素的收益分配。数据要素收益分配的复杂性在于需要考虑多方主体的利益。合理分配的前提是厘清各个市场分配主体所扮演的角色,根据不同应用场景设置相应的分配顺序和规则。在成本层面,收益分配的首要问题是数据产品服务的生产成本难以核算,数据要素的成本核算模型构建不易达成共识。在收益层面,数据产品和服务的市场价值因人而异、因情而异,难以对其精确核定。数据二十条指出,要建立体现效率、促进公平的数据要素收益分配制度。实践中,不同类型和应用场景的数据,也应适配不同的收益分配原则,如,公共数据的收益分配应遵循公平原则,企业数据的收益分配遵循数据贡献原则和市场定价原则,特殊场景的个性化数据遵循合同约定原则。在允许数据要素流通交易的情况下,数据要素也可通过初次分配、再分配和第三次分配的方式参与收益分配。

6.数据安全流通技术不成熟。数据价值依赖于流通过程中的安全性。在数据流通过程中,存在隐私泄露、数据复制和篡改、数据丢失、非法获取和滥用的风险。这些问题均会导致数据资产的价值损失,甚至带来更大的法律风险。因此,信息安全和隐私保护技术是数据高质量高效流通的基础支撑,常见的数据安全流通技术包括加密、隐私计算、数据脱敏、数据遮蔽和掩码、安全协议和传输保护、数据合成,以及事中监控和事后审计等(见表1)。我国在隐私计算领域的产业化开展较早,具有一定的竞争优势,已在金融、政务、医疗、互联网等行业开展了实践应用,但在安全多方计算、同态加密、区块链、量子加密等其他新技术手段安全技术领域仍有待加强。

图片

除上述问题外,数据要素市场还面临着数据质量参差不齐、数字基建配套不足、数据市场准入和竞争规则不完善、交易后监测跟踪不到位等问题。




四、提升数据要素高质量供给的核心思路

(一)从供给侧治理入手,自上而下打通产业链

数据要素形成生产力的最终目标是让数据资产流通至能实现价值创造的需求端,发挥乘数效应和价值增值作用。但是,我国的数据要素市场仍处于建设初期阶段,尚未形成体系化、完整的、可使用的数字产品,数字产业链的供给侧质量低、数量少,限制了下游应用的开发探索,且非标准化和规模不足导致数据产品的生产成本高企,影响下游市场的估值定价环节。

供给侧堵点具体表现在数据存储、计算的基础设施尚不够完善,数据要素的产权界定不清晰,数据治理和加工环节存在空白,因此,呈现数据产品的可用性、实用性较低,不能满足需求侧主体的实际应用要求。

总之,提升数据要素的高质量供给是提升数据要素价值实现能力的基础,从数据供给侧入手开展数据要素治理能够帮助数据市场建立高质量、可信赖的数据基础,自上而下打通数据产业链,为数据在下游需求场景的应用和赋能提供更加可靠的支持。

(二)数据要素分类分级管理

数据分类分级是构建完善数据要素市场的基本前提,数据二十条明确了数据分类分级的重要意义,并作出了顶层部署。根据该文件,数据分类分级主要为实现3点目标:推动完善数据要素产权制度构建;促进数据要素规范交易;优化数据安全治理结构。

在数据产权制度方面,应建立公共数据、企业数据、个人数据的分类分级机制,明确不同数据主体的责任,建立不同分级标准和使用规范。

在数据要素的开放共享和流通上,根据使用场景和用途用量,结合数据流通范围、影响程度和潜在风险,对数据安全定级,明确各环节各主体的使用范围和使用边界,促进数据要素的合法合规交换流通。

在数据安全治理上,数据分类分级明确了不同级别数据的安全水平,对不同数据的处理活动作出详细规定,如针对一般数据、重要数据和核心数据应采取不同的保护措施,数据出境安全评估和审查等。

此外,数据分类分级对不同级别数据遭到泄露、篡改后的惩罚机制作出详细规定,为数据要素市场的有效监管和处置提供了依据。

数据要素分类分级管理作为推动数据要产权制度构建的实践方式,也将从更深层次上为数据要素产权确定奠定基础。确定数据要素产权是提升数据高质量供给的关键部分。

数据产权的确定涉及多方面。

一是分离界定客体、主体。数据客体包括数据和信息,信息的功能在于消除认识上的不确定性,数据是信息内容记录的载体,两者紧密结合,但又有不同的功能定位,应加以区分。

二是考虑数据非排他性和可再生性特征,即数据能无限复制给多个主体同时使用,在不影响其他使用者利益的同时不会减少。实际上,数据二十条提出的“三权分置”的数据产权制度框架,包括了数据资源持有权、数据加工使用权、数据产品经营权,这为数据要素产权的确定提供了基本遵循。

基于权利分割的思想,先对数据产权的客体、主体及内容层层分离,剥离掉与数据确权无关的干扰要素,再通过数据产权结构性分置的方式,实现数据产权在多元主体之间的合理配置。在考虑数据生产、分配、流通、消费等环节上,全面厘清数据上不同利益主体间的关系,并根据公共数据、企业数据和个人数据自身的特性分类分级确权授权。

具体而言,通过确定数据来源和生成者,参考相关法律法规,审查相关合同和协议,分类数据类型,区分所有权和使用权,实施数据管理和保护措施等一系列步骤,系统地确定和保护数据要素的产权,推动数据合法、安全、高效使用。

(三)一体化集中式管理

实现数据要素的高质量供给,应采取一体化集中式管理模式而非分散式管理模式。一体化集中式管理将数据托管、治理、开发、交易等环节纳入统一系统,由单个或多个主体管理和监测,明确管理职责,强调顶层设计和统筹管理。针对数据治理的痛点难点,一体化集中式管理具有以下优势。

一是方便制定和实施统一标准和规范,确保数据在不同部门和业务之间的一致性和标准化,避免“数据孤岛”和重复采集,提高数据的整合和利用效率。

二是促进资源优化利用并降低成本。通过一体化集中式管理,优化数据采集、存储和管理的资源利用,减少重复的资源投入,提高算力资源、系统资源、人力资源利用效率,更好控制成本。

三是提高数据质量保障和可信度。在数据的来源和生成环节,统一管理有助于确保数据的质量、准确性和完整性。在数据生成的过程中,统一监测有助于确保数据符合标准规范,且在采集、存储和传输过程中不受损坏或篡改。

四是畅通数据要素在组织内外的应用和共享。一体化集中式管理为制作数据资产名录提供便利性条件,数据的标准化处理和入库归集流程有利于数据存储、查询和提取的规范高效,数据生成和流通过程均可追溯、可审计,使得数据在组织内外的交流和共享更加顺畅。

(四)提供一站式全链路解决方案

一站式全链路解决方案意味着在数据产品的开发供给过程中,供给方能提供数据从采集、归集、清洗、存储、计算、分析到应用、交付等所有环节的服务,形成最终可用的标准化或非标准化数据产品。与之相对的供给方案是将供应链拆分成多个环节,每个环节对应单个市场,由不同的供给方和服务方负责参与并提供产品和服务。提供一站式全链路解决方案的好处有以下几方面。

一是提高效率和降低成本,避免不同环节之间的衔接问题而导致信息丢失、重复工作等,通过打通上游各环节,优化整个数据处理流程,提高效率,降低开发、运维成本。

二是优化用户体验,需求方可以在同一平台或通过同一供应商获得完整的数据产品服务,无需在不同的平台之间切换或处理不同的接口、格式。

三是提升数据质量,全链路中的每个环节统一管理,进行质量控制和监测。这有助于确保数据的准确性、完整性、一致性,提高数据产品的可信度可靠性。

四是降低风险,提高合规性。通过提供成熟的数据产品和全链路解决方案,降低数据处理过程中的风险,而且更容易地实施合规性控制和监管。




五、数据要素高质量供给的全链路建设框架

(一)“4+3+2+1”全链路建设框架

基于实现数据要素高质量供给的目标,可提出“4+3+2+1”的全链路建设框架:以四大底座为基础,以三方主体为核心,以两个支撑为保障,以一揽子项服务为价值实现载体(见图8)。

图片

(二)四大底座

根据数据要素供给的4个关键环节(数据归集、数据治理、数据开发、数据交易),建立相应基础设施底座:数据托管、数据治理、数据开发、数据交易,旨在赋能数据要素的全链路流通,加快价值实现。

1.数据托管。该底座旨在负责归集整理政务、企事业单位以及行业数据资源,位于数据要素供给环节的前期采集备份阶段,目的是对杂乱无序的数据初步整理,为后续数据治理开发提供基础,主要职能包括数据归集和要素化。数据托管底座的核心任务是承担原始数据的归集工作,尽可能确保各来源数据的完整性。如,一个城市或地区的数据托管底座需归集包括政务民生、基础教育、环境保护、医疗影像、法庭档案、公安视频等多行业数据,以及政务云和数仓等多场景产生的数据。归集过程通常使用逻辑接入和物理汇聚两种方式。数据要素化作为数据托管底座的另一项核心职能,指的是对数据要素化处理,赋予数据各种属性,如增加数据归属权,对数据质量初步整理,确保数据完整性、可用性、合规性等。同时,应明确数据的初始价值,确认数据的安全等级。

2.数据治理。该底座的职能是对归集的数据标注、清洗、脱敏和脱密处理,同时,对结构化和非结构化数据标准化,实现数据的分类分级管理。这一过程旨在提升数据管理水平和数据质量,推动数据资源化,为后续数据开发提供有效的数据资源。在数据治理过程中,常常会面临诸如数据不统一、不完整、重复、错误等质量问题。为满足对外提供数据服务的需求,应建设先进的数据治理工具,对政府、企业和行业数据抽取、加载、转换、清洗加工和梳理。

治理底座的功能包括数据集成、规范设计、数据开发、数据管理服务、数据分析服务、数据质量监控、安全评价、标准转换、模型转换等。数据治理应辅助行业知识库的智能化建设,提供大数据存储、大数据计算分析引擎等数据底座,协助企业建立端到端智能数据系统,实现数字化转型。

3.数据开发。该底座主要负责对数据加工、挖掘分析,包括AI算法、场景化建模和商业智能。数据开发底座应建立多样化的数据开发利用机制,利用数据融合技术将多元、异构、海量数据融合,形成数据产品。开发底座应具备以下能力。

一是授权数据集加工能力,即通过数据要素托管底座进行数据归集,并利用数据治理工具将原始数据融合为授权数据集,并将元数据注册到数据目录系统上,形成平台统一的数据目录。

二是数据服务开发能力,即根据客户需求,结合企业私域数据二次开发,并将最终数据产品服务以完整的框架呈现,通过简单可用的方式提供服务,使需求方能够“随时、便捷、随需”获取数据资源。

三是数据开发流程能力,解决从数据开发、发布到上线的全流程问题,确保数据在开发态和运行态之间的隔离,保障数据安全。

四是数据联合建模能力,通过AI工具提取授权数据集的特征,开发“元数据模型”,并利用多方安全技术模型开发工具和联邦学习模型开发工具,实现联合分析场景应用和联邦数据模型的开发。

4.数据交易。该底座的主要形态为数据交易所,参与主体包括技术和平台提供商、规章制度制定和监管者、买家和卖家。数据交易形态主要包括原始数据、数据标签和训练生成模型;购买情形有个体模式和合作模式。数据交易底座不生产也不汇聚数据,而是起到撮合作用,将数据要素视作有价商品交易、交付和结算。数据交易底座应提供以下服务。

一是数据信息登记。明确规则和规范,使用数据产品库的标准化方式进行归集,在登记过程中保障数据的安全性、合规性、保密性。

二是数据产品交易。在建立交易规则上,秉持公开公平公正的原则,在交易流程上,减小交易摩擦,提升交易效率,可使用区块链技术搭建交易系统,交易权属包括数据产品所有权、使用权、收益权和跨境等交易。

三是数据运营管理。明确数据运营机构的准入条件,指导中介服务机构提供全面合规的运营服务,建立中介商和需求方的对接市场,完善运营服务链条体系。

四是数据资产金融科技。通过多方安全计算等技术实现数据安全和资产化,实现对交易过程和资金结算的实时监测。

值得关注的是,数据交易底座的建立需要有良好的引导基础,应以公共数据先行,通过公共数据引导市场数据。公共数据是当下最容易入场交易的数据,且可为社会各方提供一定公信力和示范效应。公共数据是形成中国式数据供应链价格链的重要一环,建议核算公共数据成本,通过授权运营的方式推动公共数据供应链价格链形成,夯实数据要素驱动基础[24]。

(三)三方主体

数据要素高质量供给的全链路框架包括三方主体:数据提供方、数据运营方、数据监管方,三方承担着不同的权利和责任,且在相互关系中发挥着重要作用。

数据提供方是数据进入托管基座的主体,包括政府部门、企事业单位、各类企业和个人,拥有数据的所有权或使用权,在遵守数据分类分级的法律法规的前提下,有权提出数据的开放和使用要求。

数据运营方是经有关部门审批后具备资质的专业运营主体,一般由大数据集团和数据交易所组成,分别负责数据开发和数据流通。数据运营方拥有对数据加工、分析、经营的权利,可根据需求提取数据价值,开发数据产品或提供数据服务。

数据运营方需要确保数据的质量和安全,对数据流通全程监测,遵守数据使用协议和相关法律法规。数据监管方一般为政府下设的数据主管部门,负责制定数据监管政策和规定,公共数据的授权和审批,监督和管理数据提供方和数据运营方的行为,确保数据合规使用和安全保护。

三方主体共同承担着数据要素供给环节中的不同职能。数据提供方向运营方提供数据资源,运营方则通过加工处理提取数据价值,并提供数据产品或服务给市场需求方。数据监管方则负责监督和管理整个数据供给过程,确保数据的合规性安全性。三者之间密切合作,共同促进数据要素的高效利用,保障数据生态的健康发展。

(四)两个支撑

在数据要素资源化、资产化和资本化的价值实现过程中,需要提供两个支撑:运营支撑和合规监管支撑。

运营支撑增强数据要素供给全链路上的运营管理能力,其核心内容是设计运营支撑目标、组织、流程和规范,实施主体是数据运营方。通过体系化运营,确保数据要素的有序运转和持续实现数据价值,以持续提升数据要素产品的业务、数据和服务水平,最终实现资源配置的最优化和效益的最大化。

合规监管支撑侧重于对数据市场化流通、消费和增值的全环节,以及管控相关参与主体行为的合法合规性,其实施主体是数据监管方,核心目的是风险控制,以确保数据供给、流通、使用的全过程安全合规。合规监管包括以下内容:审核管理数据供给方及数据授权申请;监管、审计和溯源数据采集接入过程的安全性、合规性;监管、审计和溯源数据开发利用方的数据加工处理过程;监管和审计数据运营方的数据资产认证、注册、定价、发布、支付等过程;留存授权存证、流程存证;实现对数据流通各个环节、各类主体、各个场景的全过程动态监管等。

(五)一揽子服务

在上述四大底座、三方主体、两个支撑的数据要素供给框架下,数据运营方可向公众或需求主体提供多元化的数据产品和一体化的数据服务,有助于需求方实现数据要素的全面管理和应用,为企业数字化转型提供有力支持。

一揽子服务包括:数据加工处理(ETL工具、批处理、实时处理)、数据治理和管理(集成服务、质量管理)、数据存储和长期保存(数据仓库、数据湖、数据集市)、数据分析和价值挖掘(可视化工具、模型预测、聚类分析、推荐系统)、AI增值服务(智能算法、生成式服务)等,在效果上实现多个行业的数据汇聚、引流和安全保障,并通过多元算力分析实现数据价值的变现,助力数据要素的价值实现和产业赋能等。

提供一揽子服务能够满足客户在数据处理和管理方面的全方位需求,简化流程和管理成本,加快数据处理速度,提高工作效率,提升服务的专业化、定制化,促进需求方业务发展和竞争力提升。

发展数字经济、完善数据要素市场是推进中国式现代化建设的必经之路。目前,数据要素正加速融入生产环境,越来越显著地发挥着特有的价值。未来,政府和数据龙头企业应发挥引领带动作用,持续建立健全数据要素市场的制度体系,加快数据基础设施建设和核心技术研发创新,鼓励示范区创新引领,强化数字平台建设,建立数据质量评估体系,实现数据精准透明监管。为实现产业链供应链优化升级,构建新发展格局,推动经济社会高质量发展,建立数字经济时代发展的新路径、新模式。

*注:原文注释及参考文献略



编辑 | 阮萍晶
审核 | 鄢一龙
    以上就是本篇文章【研究|吕指臣、卢延纯:数据要素高质量供给的全链路建设框架】的全部内容了,欢迎阅览 ! 文章地址:http://baitong.kub2b.com/quote/2541.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往网资讯移动站http://mob.kub2b.com/,查看更多   
发表评论
0评