全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
9649 8
2015-11-20
我现在有个表格,目前一步一步地筛选,到SICCD这个地方卡住了。
Capture.PNG


复制代码


我第一步选出share code为10和11的公司,用了下面的命令:
复制代码

然后我选择年份范围,命令如下(如果有知道像这种年份怎么根据头四位年份筛选的,望指教)
复制代码
此处两个$之间的东西在帖子里总变,暂时不知道怎么弄,就把第一个$换成¥,code里还是$哈~

接下来我有筛选了一下交易所代码为1的公司,并且去掉了SIC code缺失的数据:

复制代码



最后我想去掉utility和finance公司,即SIC开头为40-49,52-59的公司:
复制代码

然后这个命令就出错了
复制代码

我又试了一下subdata2那种形式的命令,也是这个错误,希望大家给我指导指导。
subdata5 <- subdata4[(subdata4$SICCD<4000)&(subdata4$SICCD>4999),]这种形式出来的是0 observation。。。

另外这种通过特定部分的字符筛选数据有没有什么简便的方法?例如20000101-20151231的日期里,只选择第五位是1第六位是0,即所有的10月,留下20001001,20001002...

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-20 05:43:38
@求证1加1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-20 08:47:32
A!=B 换成 A %in% B==F
substr('777888',2,4)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-20 10:53:58
万人往LVR 发表于 2015-11-20 08:47
A!=B 换成 A %in% B==F
substr('777888',2,4)
这个F就是c()么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-20 10:59:15
万人往LVR 发表于 2015-11-20 08:47
A!=B 换成 A %in% B==F
substr('777888',2,4)
我试出来了,明白你的意思了
我把最后的code写成了
subdata5 <- subset(subdata4,subdata4$SICCD %in% c(4000:4999, 6000:6700) == F)

那么为什么我之前subdata2就能出来,换成subdata5就不行了呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-20 11:38:28
1!=c(1,2,3)
1 %in% c(1,2,3)==F
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群