全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
530 0
2024-11-15

在深入研究《中国工业经济》中何瑛(2024)的研究方法后,笔者精心统计了上市公司年报中涉及数据资产的多个相关词频。我们以“信息”“网络”“数字”“数据”这四个核心词汇作为出发点,构建了一个包含相似词汇的词集。进一步地,我们根据数据资产的具体应用场景和用途,将其细致划分为自用型数据资产和交易型数据资产两大类。

一、数据资产化构建与统计概览

我们专注于企业数据资产化的词频统计,共涉及上百个关键词。通过对这些词频的深入分析,我们可以洞察到企业数据资产化的整体趋势和发展状况。此外,我们还提供了数据资产化词频均值的趋势分析,以便用户能够更直观地了解数据资产化的动态变化。

二、数据详细介绍

  • 数据名称:上市公司-数据资产化上百个词频统计
  • 数据范围:覆盖了全国范围内的5630家上市公司
  • 数据年份:时间跨度从2001年至2023年,提供了长达23年的数据支持
  • 样本数量:共计63051条记录,涉及多个变量,数据丰富且全面
  • 数据来源:所有数据均来源于上市公司的年度报告,确保了数据的权威性和准确性
  • 数据整理:由作者进行专业整理,提供了便捷的数据访问和分析平台
  • 数据说明:数据集包含了数据资产化词频的明细数据以及文本统计面板,方便用户进行深入研究和分析
  • 更新时间:数据于2024年11月进行了最新更新,确保了数据的时效性和准确性

三、数据整理与预处理

在数据整理过程中,我们执行了以下关键步骤:

  • 爬取了1999年至2023年的上市公司年报原文数据。
  • 将原始报告文本整理为面板数据格式,便于后续分析。
  • 统计了年报全文的文本长度,包括中英文部分的文本长度。
  • 构建了一个数字化术语词典,并将其扩充到了Python的jieba库中,以提高文本分词的准确性。
  • 去除了停顿词,并统计了各个明细词汇的数目。
  • 计算了数据资产化相关词频的总和,并保留了这些词频数据以及明细词频数据。

四、核心指标与详细分类

我们的数据集提供了丰富的核心指标和详细分类,包括但不限于:

  • 公司基本信息:如年份、股票代码、公司简称、行业名称和行业代码等。
  • 年报文本信息:如年报标题、全文文本总长度以及仅中英文部分的文本总长度等。
  • 数据资产化词频:包括数据资产总词频、自用型数据资产总词频和交易型数据资产总词频等。
  • 数字化与数据相关指标:涵盖了数字基础设施、数字设备、数字经济、数字技术创新等多个方面,以及数据采集、数据开发、数据存储、数据计算等数据处理流程中的各个环节。
  • 信息与网络相关指标:涉及信息基础设施、信息设备、信息披露以及网络基础设施、网络数据中心等多个领域。

此外,我们还提供了与数据安全、数据交易、数据服务等相关的详细分类和指标,以满足用户在不同应用场景下的需求。

企业数据资产化文本分析数据 (mda和年报两种方法)

五、数据概览

综上所述,我们的数据集提供了一个全面、详细且权威的企业数据资产化分析平台。通过深入挖掘这些数据,用户可以洞察到企业数据资产化的整体趋势、发展特点以及潜在机遇和挑战。无论是对于企业自身还是对于研究机构而言,这些数据都具有极高的价值和意义。










二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群