全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心 数据求助
4362 15
2020-07-08
一致行动人.png 大股东持股.png

如图所示 我想按照年份和证券代码分组 然后如果股东名称里面的股东出现在一致行动人里面过的话给删除 求教大佬需要怎么做 软件为R语言


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-7-9 14:39:49
没读懂,您想删哪一个。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-9 16:11:55
llb_321 发表于 2020-7-9 14:39
没读懂,您想删哪一个。
大佬好 我想删除第二张图中的观测值 就是如果相同公司 同一年中这个大股东属于一致行动人的话就把这行观测删除
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-9 18:12:17
这样啊,我在外面,而且没有数据,不好写代码,您先按这个思路试一试吧:
把第一张表的变量“一致行动人”的所有样本提取出来,形成一个字符串向量ccc,问题是向量ccc的各个元素是顿号分隔的字符串,所以要先将这个字符串向量合并成一个大的字符串,可以用d<-paste(ccc,collapse = "、"),注意函数里给的分隔符用原始表中显示的中文顿号。然后,用stringr包 d<-str_split(d,"、") %>% unlist(),这样大字符串就分词成单独的股东名称了,最后这个d应该是一个字符串向量。
接着就可以直接用dplyr::filter()将第二张表里股东名称与d里的股东名称相同的样本筛选掉。
应该不难,你摸索着来吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-9 18:19:26
处理的关键,是你第一张表里一致行动人的每个样本是不确定数量的股东字符串,所以必须想办法,把每个样本的股东名称分开。
因此,采用上面所说的先合并再分割的方法。
处理过程中,注意每一步形成的数据的属性。另外,在最开始读入形成数据框时,在代码中最好加上 stringsAsFactors = FALSE,以免出现因子型变量,可能会出错。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-7-10 22:19:06
llb_321 发表于 2020-7-9 18:12
这样啊,我在外面,而且没有数据,不好写代码,您先按这个思路试一试吧:
把第一张表的变量“一致行动人” ...
想问大佬 如果设成一个大的字符串那年份和公司怎么办
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群