首页 > 新闻 > 公司新闻 > 新闻详情

软通智慧发布全国首部《高质量数据集建设及运营前沿报告2025》,助推数据要素市场高质量发展

内部会员一码资料

4月29日,第八届数字中国建设峰会期间,软通智慧数据要素首席科学家林镇阳博士在2025数字中国可信数据空间与人工智能生态高峰论坛上正式发布了全国首部高质量数据集建设及运营前沿报告2025》(以下简称“报告”),立足数据要素市场发展需求,系统性构建从理论到实践的全链路创新路径,为我国数据要素市场规范化、规模化发展提供重要指引,助力数字中国建设迈向纵深阶段。




武汉大学信息管理学院副院长吴江,国家信息中心大数据发展部数据要素处处长王璟璇,北京理工大学公共管理系主任、粤港澳大湾区数字经济与科技协同创新研究院副院长尹西明,中国质量认证中心区块链与数据服务部部长、产业教授王锋,浙江大学计算机创新技术研究院副院长、浙江大学人工智能研究所副所长郑小林等机构专家共同见证发布。

内部会员一码资料

作为编写组组长、中国信息协会数据要素专委会专家,林镇阳在发布现场介绍,报告从高质量数据集全生命周期的宏观视角出发,深度剖析了我国高质量数据集发展现状和趋势,并精心布局标准体系、建设模式、平台架构、流通利用、政策激励和未来展望等七大章节,深入解析数据要素与前沿技术的融合路径及赋能机制,为市场多元参与主体量身打造兼具前瞻性与实操性的解决方案与实践指南,助力构建以数据驱动为核心的高质量发展新体系。


林镇阳表示:“高质量数据集是数据要素市场和AI智能融合发展的‘燃料库’,标准化建设将加速数据供给侧改革。报告首创"政策牵引-标准筑基-平台赋能-生态协同"四位一体发展范式,提出三大创新突破:一、构建国内首个"合规-内容-规模-价值"四维高质量数据集标准体系,实现全生命周期智能管控;二、设计行业级可信数据流通架构,创新"零级-一级-二级"市场联动机理,破解数据要素市场化价值化协同难题;三、发布"数据要素×科创中心"场景引擎,推动数据服务市场与行业大模型深度耦合和长效运营。”


近年来,人工智能、大数据等技术呈爆发式发展,各行业对高质量数据的需求急剧攀升。当前,中国高质量数据服务市场规模已达约40亿元,预计到2028年将大幅增长至170亿元。与此同时,以Deepseek为代表的高效推理大模型、智能体快速崛起并广泛部署,数据汇聚产量低、供给质量低、利用效率低的问题愈发凸显,高质量数据集建设的重要性不言而喻。在此背景下,在国家政策的指引下,软通智慧联合国家信息中心、中国信息协会数据要素专委会等多家单位,精心组织、缜密策划,《高质量数据集建设及运营前沿报告2025》应运而生。


在标准体系方面,报告基于数据属性和数据生命周期理论,从“合规属性、内容属性、规模属性、价值属性”四个维度展开深入研究,构建了高质量数据集标准体系框架。这一指标体系本质上是一个可扩展的方法论框架,在实际落地过程中,通过“专家经验校准+技术工具赋能+行业场景适配”的方式实现动态优化,最终引导科技企业、龙头企业投身高质量数据集建设,为产业大模型应用赋能。

在建设模式方面,报告创新性提出构建一套完备的全生命周期质量管控体系,涵盖数据来源、生产过程及运营过程三大核心环节,确保高质量数据集在构建、管理及对外服务等各个环节的质量稳定。在评价模式方面,报告明确提出在数据资产化过程中或数据资产存续期间,需依据数据资产中的数据内容质量情况、数据资产的使用与收益情况,对数据质量、应用价值进行全面、客观的评价。

在平台架构方面,报告创新性地提出了“需求拆解、数知优化、服务创发”的三大思路,为高质量数据集平台建设提供了全新的方向。在此过程中,通过场景集梳理和数据解构,高质量数据集建设运营综合服务平台实现数据预处理、数据标注、知识提炼、知识提质、知识测评,形成高质量数据集、高质量知识库。这些成果将以数据集市、联合众创等多种形式,为人工智能大模型、智能体等使用方提供坚实的数据支撑。

此外,报告还强调了基于可信数据空间的高质量数据集流通模式、市场长效运营机制、场景驱动等方面的重要意义。以“数据要素×科创中心”为例,通过构建一站式运营实体,完善制度技术支撑体系,组建专业人才生态网络,深化场景应用创新机制,打造集技术研发、场景应用、产业孵化为一体的创新生态单元,推动数据要素价值在本地化场景的高效释放。

此次报告的发布,不仅是软通智慧技术积淀与行业洞察的集中呈现,更为行业实践提供了宝贵的指导和参考。随着高质量数据集建设的不断推进和数据要素市场的日益成熟,软通智慧将继续秉持创新驱动的理念,加强与政府部门、科研机构、企业等各方的合作交流,共同推动数据要素市场的高质量发展,为数字中国的建设贡献更多的力量。