全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2370 3
2021-07-14
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-7-14 20:23:39
从东方财富网抓取的个股帖子,数据第一列为股票代码,第二列是该上市公司股吧的页码,第三列是月份,由于网页数量太多抓取的时候只抓取了标题页,而标题页并没有显示年份。本人对于原始数据进行了排序 命令:sort 股票代码 month 页码 。dataex展示的是排序后的数据。现在想根据股票代码与页码生成年份,最小的页码的区间为2021年,依次类推,如果页码之间的差值超过5,那就将年份设置为2020
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-14 20:50:30
最后想要的结果是这样的
股票代码 页码 month year
"000004" 21 "03" 2021
"000004" 22 "03" 2021
"000004" 23 "02" 2021
"000004" 24 "02" 2021
"000004" 24 "03" 2021
"000004" 25 "02" 2021
"000004" 25 "01" 2021
"000004" 26 "02" 2021
"000004" 26 "01" 2021
"000004" 27 "01" 2021
"000004" 28 "01" 2021
"000004" 29 "01" 2021
"000004" 30 "01" 2021
"000004" 30 "12" 2021
"000004" 31 "01" 2021
"000004" 31 "12" 2021
"000004" 32 "12" 2021
"000004" 33 "12" 2021
"000004" 34 "12" 2021
"000004" 35 "12" 2021
"000004" 213 "11" 2020
"000004" 214 "11" 2020
"000004" 215 "11" 2020
"000004" 216 "11" 2020
"000004" 217 "11" 2020
"000004" 261 "11" 2019
"000004" 262 "11" 2019
"000004" 263 "11" 2019
"000004" 264 "11" 2019
"000004" 265 "11" 2019
"000004" 293 "11" 2018
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-14 20:57:37
原始数据已经根据股票代码、month、页码排序(命令:sort 股票代码 month 页码)。根据股票代码和month(bys 股票代码 month)对页码进行分组以生成年份year。页码分组规则如下:最小的一组为2021年,如果页码上下行的差值大于5,则为第二组,生成年份2020,效果为2楼
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群