大数据采集和处理能力是指一个地区、组织或系统在既定制度与技术条件下,对多源、高频、大规模数据进行获取、传输、存储、清洗、分析与应用的综合能力。该能力通常以信息基础设施为物质基础,以数据处理与计算技术为支撑,并通过实际应用场景得以体现。
在区域或城市层面,大数据采集和处理能力通常被视为衡量数字化基础、智能化水平及数据要素配置能力的重要维度,为研究产业升级、企业行为与经济结构变化提供关键支撑。
本文参考《中国工业经济》王林辉等(2025)一文中关于地级市大数据采集和处理能力指标的衡量和测算方法,采用信息传输、计算机服务和软件业从业人员数占所属地级市总从业人员数的比重表征和测算:
一、数据介绍数据名称:地级市-大数据采集和处理能力
数据范围:297个地级以上城市
时间范围:2003-2024年
样本数量:6535条
数据来源:《中国城市统计年鉴》、各地方统计年鉴
二、数据指标年份 | 省份 |
城市 | 省份代码 |
城市代码 | 所属地域 |
胡焕庸线 | 信息传输、软件和信息技术服务业从业人员数 |
总从业人员 | 大数据采集和处理能力 |
三、参考文献[1]王林辉,姜昊,董直庆.工业智能化会重塑企业地理格局吗[J].中国工业经济,2022,(02):137-155.
四、数据概览大数据采集和处理能力=信息传输、软件和信息技术服务业从业人员数/总从业人员数
填补说明:
线性插值。利用数据的线性趋势,对各年份中间的缺失部分进行填充,得到线性插值版数据,这也是学者最常用的插值方式。
回归填补。利用原数据集中的核心变量信息,基于线性插值版数据,通过建立回归方程,对缺失值进行预测填补。
注:由于该方法填补数据较多,不能完全反应地区真实情况,谨慎使用。
五、包含内容
六、全部内容下载链接: