全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4099 17
2016-02-09
示范数据如下,原始数据比较大。
x = c("max", "unit", "rate", "max", "unit", "rate", "max", "unit", "rate", "unit", "rate")

我的问题是:知道要循环c("max", "unit", "rate"),如何找出有缺失的组别,例如上面x数据中最后一组少了"max",然后进行补齐呢?注意的是我没有类似group ID的数据列,所有有些常用的方法不能直接用。

我的目的是补齐这个序列,看看缺失哪些,进而知道其他相邻的列缺失的数据。这列相当于我缺失的组ID。

非常感谢!
----------------------------------
借用@jiangbeilu的说法,我有这样一个序列:
1 2 3 /1 2 3/ 1 2   /1 2 3/   2 3/1 2 3/   2  /1 2 3/
我想要把每组都变成 1 2 3,注意没有group ID,但是我每组我知道有2,所以知道总共有多少组。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-2-9 15:50:18
提示: 作者被禁止或删除 内容自动屏蔽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-9 17:12:45
你的问题是不是可以转化成这样的:
1 2 3 /1 2 3/ 1 2 /1 2 3/ 2 3/1 2 3

/代表一组,其中,你是想,如果发现了1 2,也就是第三组,就补成 1 2 NA,的形式吧?
如果是补成3的话,我想只要确定了多少组,然后直接rep(1:3,n)就可以了。

所以,没有这么简单。
2 3这样一组,你是希望补成 1 2 3是吧?不过单独一个 2 3 也可以补成NA 2 NA/NA NA 3的形式,这个样子是两组。
所以还是不那么好操作的。
请把您的问题描述清晰一些好么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-9 23:07:56
ryoeng 发表于 2016-2-9 15:50
不大明白楼主的问题,`dplyr::mutate()`应该行吧?
数据里暂时没有可以group_by的变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-9 23:08:38
jiangbeilu 发表于 2016-2-9 17:12
你的问题是不是可以转化成这样的:
1 2 3 /1 2 3/ 1 2 /1 2 3/ 2 3/1 2 3
你理解的是对的。我稍微编辑了下我的问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-10 16:47:51
那这个问题就很简单了,比如你知道有10组,
只需要:
复制代码

重复10组这样的向量,就完成了要求了,也无需追究原来序列的缺失问题了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群