求大佬解答怎么处理一致行动人

加油12345678

4571

收藏 2020-07-08

如图所示我想按照年份和证券代码分组然后如果股东名称里面的股东出现在一致行动人里面过的话给删除求教大佬需要怎么做软件为R语言

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

llb_321

2020-7-9 14:39:49

没读懂，您想删哪一个。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

加油12345678

2020-7-9 16:11:55

llb_321 发表于 2020-7-9 14:39
没读懂，您想删哪一个。

大佬好我想删除第二张图中的观测值就是如果相同公司同一年中这个大股东属于一致行动人的话就把这行观测删除

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

llb_321

2020-7-9 18:12:17

这样啊，我在外面，而且没有数据，不好写代码，您先按这个思路试一试吧：
把第一张表的变量“一致行动人”的所有样本提取出来，形成一个字符串向量ccc，问题是向量ccc的各个元素是顿号分隔的字符串，所以要先将这个字符串向量合并成一个大的字符串，可以用d<-paste(ccc,collapse = "、")，注意函数里给的分隔符用原始表中显示的中文顿号。然后，用stringr包 d<-str_split(d,"、") %>% unlist()，这样大字符串就分词成单独的股东名称了，最后这个d应该是一个字符串向量。
接着就可以直接用dplyr::filter()将第二张表里股东名称与d里的股东名称相同的样本筛选掉。
应该不难，你摸索着来吧

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

llb_321

2020-7-9 18:19:26

处理的关键，是你第一张表里一致行动人的每个样本是不确定数量的股东字符串，所以必须想办法，把每个样本的股东名称分开。
因此，采用上面所说的先合并再分割的方法。
处理过程中，注意每一步形成的数据的属性。另外，在最开始读入形成数据框时，在代码中最好加上 stringsAsFactors = FALSE，以免出现因子型变量，可能会出错。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

加油12345678

2020-7-10 22:19:06

llb_321 发表于 2020-7-9 18:12
这样啊，我在外面，而且没有数据，不好写代码，您先按这个思路试一试吧：
把第一张表的变量“一致行动人” ...

想问大佬如果设成一个大的字符串那年份和公司怎么办

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

llb_321

2020-7-11 17:36:49

通常，一致行动人关系是固定的，不会今年一个样明年另一个样，所以前面说的方法，只是把符合一致行动人标准的股东从第二张表删除，不管是哪年的。如果考虑年份的话，可以在处理之前按年份分组，分组处理后在再合并结果。你说的公司问题，其实是考虑有几家公司出现股东重叠的可能，比如传化集团就是传化股份和新安股份的股东。
需要复杂一些的处理，不分组了，思路是把之前的处理过程变化一下，可以编个字符串处理函数，然后用apply族函数对每一个样本使用函数，处理结果与这个样本的年份和代码变量关联，形成类似第二张表的结构，之后就可以用anti_join函数删除一致行动人了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

llb_321

2020-7-11 17:42:54

比如第一张表第一个样本，用之前str_split方法把一致行动人字符串分成四个股东名称的字符向量，然后这个向量转成数据框，增加两个变量年份和代码，当然增加的变量的四个值是一样的。全部样本处理后，就会形成第二张表类似的结构了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

白青浅

2020-7-18 10:17:04

求问楼主的数据来源是哪个数据库？我也要用这项数据，可以一起探讨处理~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

加油12345678

2020-7-18 12:13:29

白青浅发表于 2020-7-18 10:17
求问楼主的数据来源是哪个数据库？我也要用这项数据，可以一起探讨处理~

大股东持股来自国泰安一致行动人来自choice 想问小伙伴用啥子软件进行数据处理？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

白青浅

2020-7-20 09:50:42

加油12345678 发表于 2020-7-18 12:13
大股东持股来自国泰安一致行动人来自choice 想问小伙伴用啥子软件进行数据处理？

Stata，我只需要看大股东是否存在在一致行动人条款中，用的regexm函数。

但是这个方法最bug的是，有的公司类型的股东。
股东数据中的名字与一致行动人条款中不完全一样，往往就简写，而且省略的字不一定是在哪个位置。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

白青浅

2020-7-20 11:44:35

白青浅发表于 2020-7-20 09:50
Stata，我只需要看大股东是否存在在一致行动人条款中，用的regexm函数。

但是这个方法最bug的是，有的 ...

可能是我潜水太多居然没有权限加好友。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

豆芽菜qxl

2020-9-10 23:43:39

可以求一份一致行动人的数据吗

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

申申2015

2020-11-3 17:29:24

可以求一份一致行动人数据吗，谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jst418569

2021-3-10 22:19:08

你这个一致行动人哪里来的？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

www~.

2023-3-20 18:08:10

请问楼主处理了吗想请教一下

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群