全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
322 0
2025-07-31
上市公司财经新闻数据库1994-2024含网络新闻报刊财经新闻报道信息及量化统计日度数据



中国上市公司财经新闻数据库(CFND)由哈尔滨工业大学经济与管理学院开发,国内首个采用人工智能算法来采集、整理和分析上市公司财经新闻的大数据平台。数据来源涵盖近500家网络媒体和400多家报纸刊物,提供上市公司财经新闻基本信息、量化统计信息以及新闻相似度分析等

一、上市公司财经新闻库数据的介绍
1.数据内容及年份

(1)网络财经新闻基本信息:2001-2023年

(2)网络新闻量化统计(按自然日):2001-2023年

(3)网络新闻量化统计(按交易时间):2008-2023年

(4)网络财经新闻相似度:按新闻事件区分,无时间区间

(5)报刊财经新闻基本信息:1994-2024年

(6)报刊财经新闻量化统计:1994-2024年

(7)报刊财经新闻相似度:按新闻事件区分,无时间区间


3.数据范围:上市公司

4.数据格式:xlsx

Scode[股票代码]-上市公司股票代码
Coname[公司简称]-上市公司的简称
Date[统计日期]-量化指标的统计时间
Newsnum_Title[标题出现该公司的新闻总数]-一天内新闻标题出现该公司的新闻总数,统计时段为0:00-24:00
Newsnum_Cont[内容出现该公司的新闻总数]-一天内新闻内容出现该公司的新闻总数,统计时段为0:00-24:00
Posnews_All[正面新闻数(全部)]-一天内上市公司全部正面新闻总数,统计时段为0:00-24:00
Neunews_All[中性新闻数(全部)]-一天内上市公司全部中性新闻总数,统计时段为0:00-24:00
Negnews_All[负面新闻数(全部)]-一天内上市公司全部负面新闻总数,统计时段为0:00-24:00
Posnews_Ori[正面新闻数(原创)]-一天内上市公司原创正面新闻总数,统计时段为0:00-24:00
Neunews_Ori[中性新闻数(原创)]-一天内上市公司原创中性新闻总数,统计时段为0:00-24:00
Negnews_Ori[负面新闻数(原创)]-一天内上市公司原创负面新闻总数,统计时段为0:00-24:00



Scode[股票代码]-上市公司股票代码
Coname[公司简称]-上市公司的简称
Industry[行业名称]-上市公司所属2012年证监会行业分类名称
Indcode[行业代码]-上市公司所属2012年证监会行业分类代码
Newsid[新闻ID]-标识新闻报道的唯一ID
Reptime[报道时间]-新闻报道的时间
Repmedia[报道媒体]-新闻报道的媒体名称
Mediarea[报道媒体所在地区]-报道媒体所在省份和城市
Sourcemed[来源媒体]-新闻转载自的媒体名称
Newsemot[新闻情感]-新闻的语气,1代表正面,0代表中性,-1代表负面
Orirep_Dum[是否原创]-新闻是否属于原创性新闻
URL[采集网址]-新闻来自的网址
senten_Num[正文句子数]-新闻正文中的全部句子数
titlementioned[标题是否提及]-在标题中是否提及了该上市公司
codesentNum[正文提及句子数]-正文提到该上市公司的句子数
codecontentNum[正文提及次数]-正文提到该上市公司的次数
companyNum[提及全部公司数]-该新闻提及的全部上市公司数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则提及全部公司数为2
allcodesentNum[提及全部公司句子数]-该新闻提及的全部上市公司的句子数
allcodecontentNum[全部公司提及次数]-该新闻提及的全部上市公司的次数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则全部公司提及次数为7



(近8GB数据的网盘链接)

6b8f3cf7f548993cff09a276c55ba9d.png


013a5acdcbe28c4bbb89f7205ef43ca.png

57666d23fa54221ad01635390816aa7.png 08bfec8b7ed99ebf07f166c9dba678e.png

6e8f60e7b5f0429d87aac1719538892.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群