上市公司财经新闻数据库1994-2024含网络新闻报刊财经新闻报道信息及量化统计日度数据
中国上市公司财经新闻数据库(CFND)由哈尔滨工业大学经济与管理学院开发,国内首个采用
人工智能算法来采集、整理和分析上市公司财经新闻的大数据平台。数据来源涵盖近500家网络媒体和400多家报纸刊物,提供上市公司财经新闻基本信息、量化统计信息以及新闻相似度分析等
一、上市公司财经新闻库数据的介绍
1.数据内容及年份
(1)网络财经新闻基本信息:2001-2023年
(2)网络新闻量化统计(按自然日):2001-2023年
(3)网络新闻量化统计(按交易时间):2008-2023年
(4)网络财经新闻相似度:按新闻事件区分,无时间区间
(5)报刊财经新闻基本信息:1994-2024年
(6)报刊财经新闻量化统计:1994-2024年
(7)报刊财经新闻相似度:按新闻事件区分,无时间区间
3.数据范围:上市公司
4.数据格式:xlsx
Scode[股票代码]-上市公司股票代码
Coname[公司简称]-上市公司的简称
Date[统计日期]-量化指标的统计时间
Newsnum_Title[标题出现该公司的新闻总数]-一天内新闻标题出现该公司的新闻总数,统计时段为0:00-24:00
Newsnum_Cont[内容出现该公司的新闻总数]-一天内新闻内容出现该公司的新闻总数,统计时段为0:00-24:00
Posnews_All[正面新闻数(全部)]-一天内上市公司全部正面新闻总数,统计时段为0:00-24:00
Neunews_All[中性新闻数(全部)]-一天内上市公司全部中性新闻总数,统计时段为0:00-24:00
Negnews_All[负面新闻数(全部)]-一天内上市公司全部负面新闻总数,统计时段为0:00-24:00
Posnews_Ori[正面新闻数(原创)]-一天内上市公司原创正面新闻总数,统计时段为0:00-24:00
Neunews_Ori[中性新闻数(原创)]-一天内上市公司原创中性新闻总数,统计时段为0:00-24:00
Negnews_Ori[负面新闻数(原创)]-一天内上市公司原创负面新闻总数,统计时段为0:00-24:00
Scode[股票代码]-上市公司股票代码
Coname[公司简称]-上市公司的简称
Industry[行业名称]-上市公司所属2012年证监会行业分类名称
Indcode[行业代码]-上市公司所属2012年证监会行业分类代码
Newsid[新闻ID]-标识新闻报道的唯一ID
Reptime[报道时间]-新闻报道的时间
Repmedia[报道媒体]-新闻报道的媒体名称
Mediarea[报道媒体所在地区]-报道媒体所在省份和城市
Sourcemed[来源媒体]-新闻转载自的媒体名称
Newsemot[新闻情感]-新闻的语气,1代表正面,0代表中性,-1代表负面
Orirep_Dum[是否原创]-新闻是否属于原创性新闻
URL[采集网址]-新闻来自的网址
senten_Num[正文句子数]-新闻正文中的全部句子数
titlementioned[标题是否提及]-在标题中是否提及了该上市公司
codesentNum[正文提及句子数]-正文提到该上市公司的句子数
codecontentNum[正文提及次数]-正文提到该上市公司的次数
companyNum[提及全部公司数]-该新闻提及的全部上市公司数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则提及全部公司数为2
allcodesentNum[提及全部公司句子数]-该新闻提及的全部上市公司的句子数
allcodecontentNum[全部公司提及次数]-该新闻提及的全部上市公司的次数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则全部公司提及次数为7
(近8GB数据的网盘链接)