立即打开
一、数据简介
数据名称:上市公司企业竞争关系数据
数据来源:上市公司年报
时间跨度:2010年-2024年
区域跨度:中国上市公司
数据格式:xlsx
二、研究背景
企业之间的竞争关系是理解市场动态和企业行为的重要基础。本数据基于2010年至2024年期间的中国上市公司数据,包含公司基本信息、行业分类、地址信息、经营范围和主营业务等内容,参考潘红波和杨海霞(2022)的方法构建了企业间的竞争关系指数。
该指标在研究中可用于检验竞争效应机制,例如竞争者融资约束是否促进企业并购行为。企业并购行为不仅受自身经营和财务状况影响,还受行业竞争环境影响,因此引入竞争关系指标能够更准确地捕捉行业竞争对企业并购决策的作用。研究表明,竞争者融资约束对企业并购行为的促进效应随着竞争关系的增加而增强,验证了竞争效应机制的存在,表明企业更倾向于在竞争激烈的市场环境中,利用竞争者融资约束带来的机会发起并购以获取竞争优势。
三、指标构建方法
1. 文本预处理
为构建企业的竞争关系指数,首先从企业经营范围的文本描述中移除表示排除性内容的语句,包括:'禁止'、'不含'、'不包括'、'不涉及'、'不包含'、'不'、'不牵涉'、'不涵盖'、'不涵括'、'不算'、'不计'、'除外'、'以外'、'之外'等。通过移除这些排除性语句,可以更准确地提取企业的实际经营范围内容,为后续的文本相似度计算提供更纯净的文本数据。
2. 文本分词与向量化
Step1:使用jieba进行中文分词,去除经营范围文本中的停用词和排除性语句。
Step2:将分词结果转换为"文档—词"向量形式。
3. 余弦相似度计算
竞争关系的计算采用余弦相似度公式:
Similarity_ij = (V_i · V_j) / (|V_i| × |V_j|)
其中:
- V_i和V_j分别是公司i和公司j的"文档—词"向量
- · 表示向量的点积
- |V_i|和|V_j|分别是向量的模(即向量的长度)
4. 相似度指标说明
文本相似度的数值范围在0到1之间:
- 数值越接近1,表示两家公司的经营范围越相似,竞争关系越强
- 数值越接近0,表示两家公司的经营业务差异越大
- Similarity_ij = 1,表示公司i与公司j之间的经营业务在年度t完全一致,即经营业务语料文本所用的实词完全一致
- Similarity_ij = 0,表示公司i与公司j的经营业务在年度t完全不同,即经营业务语料文本所用的实词完全不同
5. 数据筛选
根据计算出的文本相似度,筛选出相似度大于或等于阈值(例如0.3)的公司对。相似度越高,表示该公司周围有更多经营范围相似的公司,竞争越激烈。本数据整理了2010-2024年相似度大于0.3的公司对,约491912条数据。此数据可衡量企业所处的竞争环境,亦可作为工具变量。
四、数据指标
Symbol:股票代码
ShortName:公司名称
EndDate:统计截止日期
IndustryName:行业名称
IndustryCode:行业代码
IndustryNameC:行业名称C级分类
IndustryCodeC:行业代码C级分类
IndustryNameD:行业名称D级分类
IndustryCodeD:行业代码D级分类
RegisterAddress:注册具体地址
OfficeAddress:公司办公地址
Lng:办公地经度
Lat:办公地纬度
BusinessScope:经营范围
RegisterLongitude:注册地经度
RegisterLatitude:注册地纬度
PROVINCECODE:所属省份代码
PROVINCE:所属省份
CITYCODE:所属城市代码
CITY:所属城市
相似度:企业竞争程度指标(基于经营范围文本余弦相似度计算)
五、应用场景
1. 企业并购研究:分析竞争环境对企业并购决策的影响
2. 市场竞争分析:识别行业内竞争格局和竞争对手
3. 产业组织研究:研究市场结构与企业行为的关系
4. 融资约束研究:检验竞争者融资约束对企业行为的溢出效应
5. 工具变量:可作为企业竞争环境的工具变量使用
六、参考文献
[1] 潘红波,杨海霞.竞争者融资约束对企业并购行为的影响研究[J].中国工业经济,2022,(7):159-177.
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
栏目导航
热门文章
推荐文章
扫码加好友,拉您进群