全国数据资源调查报告(2025年)

习近平总书记指出,当今世界正在加速迈入智能时代,数据的基础资源作用和创新引擎作用日渐显现。党中央、国务院高度重视数据工作,就健全数据要素基础制度、深化数据资源开发利用、促进实体经济和数字经济深度融合等方面作出全面部署。国家数据局成立以来,贯彻落实党中央、国务院决策部署,坚持以数据要素市场化配置改革为主线,围绕数据基础制度、数据基础设施、数据融合应用和场景建设、全国一体化数据市场建设、数据产业培育5个方面打出一套“组合拳”,夯实数据领域核心技术攻关、数据标准化、数字人才培养3个基础,突出数据赋能人工智能创新发展1个重点,探索形成了“531”的工作体系,持续推动数据“供得出、流得动、用得好、保安全”,促进数据要素全面赋能经济社会发展。

贯彻落实《中华人民共和国国民经济和社会发展第十五个五年规划纲要》提出“构建国家数据资源体系,健全数据资源统计调查制度,建立全国数据资源‘一本账’”的工作部署,国家数据局修订了《全国数据资源统计调查制度》。在此基础上,组织开展2025年度全国数据资源统计调查工作,调查有效样本数量4.25万个,覆盖除国际组织外所有国民经济行业门类。在保持数据供给、流通与开发利用等指标体系连续性的基础上,本年度调查实现了双向扩容:一是向“新主体”拓展,将地方数据集团、可信数据空间等纳入调查范围;二是向“新热点”拓展,将词元(Token)调用、高质量数据集流通交易、企业数据要素投入、数据增值等产业发展热点作为调查研究重点,持续提升对我国数据资源全景刻画、结构性分析和前瞻性研判能力,形成《全国数据资源调查报告(2025年)》。

调查结果显示,我国数据要素市场化价值化进程显著提速,数据资源 供给体系、数据流通体系和数据开发利用体系协同演进,正由数据资源规 模扩张向数据要素价值释放跃升,呈现以下显著特征:

一是数据资源规模保持高速增长态势。2025年,全国年度数据生产总 量1 达52.26泽字节(ZB),同比增长27.28%,增速较上年提升2.28个百分 点。我国数据生产总量占全球约27.44%。从主体看,企业成为数据生产的 主力,数据生产增量约九成来自企业数据,产业数智化转型成效明显。从 行业和领域看,工业制造、交通物流、软件和信息技术服务业等行业数据生 产量增幅较大,同比分别增长1.27泽字节(ZB)、1.22泽字节(ZB)、0.92泽 字节(ZB),有效发挥“领头羊”“压舱石”作用。具身智能、低空经济等新 兴领域数据生产量高速增长,增速分别为477.78%、75%。全国数据存储总 量达2.53泽字节(ZB),同比增长21.05%。结构化数据存储量为0.56泽字 节(ZB),同比增长43.59%,占数据存储总量的22.13%,数据质量持续提 升,加速向可计算、可分析形态转化。

二是算力基础设施建设稳步推进。“东数西算”工程全面实施,全国一 体化算力网加快构建,智能算力供给水平稳步提升。截至2025年底,全国智 能算力规模达159万PFLOPS(FP16),通用算力向智能算力的代际更替加 速,成为支撑人工智能发展的关键基础设施。智算资源集聚优势逐步显现, 八大国家算力枢纽(含十大集群)智算规模占全国智算规模的80%以上。

三是数据资源开发利用更加高效。随着“数据要素×”行动、公共数 据“跑起来”示范场景建设、国有企业数据效能提升行动、国家数据基础设 施建设先行先试、可信数据空间发展行动计划等纵深推进,数据融合应用 和场景建设不断深化,数据要素价值加速释放。公共数据资源开发利用成 效显著。公共数据用于共享、开放、授权运营的数据量均快速增长,申请共 享的数据集数量同比增长近30%,公共数据开放数据量和授权运营数据量 同比分别增长31.71%、53.96%。公共数据带动各行业数据加快融合应用, 场景覆盖产业发展、教育科技、医疗健康、民生服务、基层治理等领域。企 业用数活力加速释放。2025年,企业数据技术投入同比增长17.37%。企业 数据产品和服务数量同比增长29.29%,交易额同比增长39.8%,数据产品 和服务从数字化副产品向赋能业务增长的驱动引擎转变。

四是数据流通交易效果初显。全国一体化数据市场建设加快推进,市 场活力进一步激发,数据要素价值加速释放,为高质量数据付费的市场共 识正在形成。数据流通活跃度不断提高。2025年,全国数据跨境流通总量 为142.34艾字节(EB),同比增长14.88%。数据跨省流通总量为2949.12艾 字节(EB),同比增长19.01%,广东、浙江、江苏、山东、河南等经济大省数 据跨省流通量位居前五。企业数据流通总量为1935.36艾字节(EB),同比 增长25.17%。头部平台企业和中央企业2 的数据流通规模均值是其他企业 的140多倍,数据流通枢纽功能持续强化。数据付费意愿不断提升。样本企 业中,11.65%的企业购买过数据,购买数据费用同比增长22.36%。头部平 台企业和中央企业购买数据费用均值是其他企业的60倍。金融、软件和信 息技术服务业等行业购买过数据的企业比例均超30%,大幅高于行业平均 水平。

五是数据赋能人工智能迈入规模化应用新阶段。人工智能发展从通 用大模型到行业垂域模型,再到代理型人工智能形态演进,对数据的需求也从基础语料到行业高质量数据集拓展。调查表明,2025年,用于人工智 能训练和推理的数据总量为199.48艾字节(EB),同比增长42.86%,推 理数据量达101.34艾字节(EB),首超训练数据量。高质量数据集数量超 11万个,规模超908拍字节(PB),同比分别增长61.13%和142.58%。全年 词元(Token)调用量约21100万亿,词元(Token)正成为人工智能的新度 量衡。

同时也要看到,当前我国数据市场建设还处于起步阶段,数据价值释 放仍有较大潜力。2026年是“十五五”开局之年,也是“数据要素价值释放 年”,随着数据基础制度加快健全完善、数据基础设施规模化部署和应用 能力不断增强、全国一体化数据市场建设持续推进,数据要素在更大范围、 更深层次参与资源配置的条件正加速形成。展望未来,我国数据资源规模 优势将加快向价值优势转化,数据要素将在赋能经济社会发展和治理能力 提升、促进生产方式深层次变革和生产力革命性跃迁中发挥更加重要的基 础性、战略性作用。

请使用手机浏览器、微信、百度网盘扫一扫获取网盘文件