全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1288 6
2016-10-22
悬赏 100 个论坛币 已解决
我是R初学者我在进行数据清理,一个变量☞学历(文盲、小学  初中   高中  大专   本科   硕士   博士),我把变量合并下,合并为(文盲  小学为小学、初中高中 为中学   大专 本科  硕士 博士为大学)请问用什么命令比较好。

最佳答案

zerofung 查看完整内容

最简单的方法就是, df$学历[df$学历=="文盲"]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-10-22 11:10:47
最简单的方法就是,
df$学历[df$学历=="文盲"] <- "小学"
df$学历[df$学历 %in% c("初中","高中")] <- "中学"
df$学历[df$学历 %in% c("专科","本科","硕士","博士")] <- "大学"
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-22 11:22:59
自己顶一个贴子。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-22 22:34:27
论坛币给你了,
请详细给讲解下。
好不。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-22 22:44:54
继续奖励。谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-10-23 16:27:45
offandon 发表于 2016-10-22 22:34
论坛币给你了,
请详细给讲解下。
好不。
本来想用有序因子来处理,但发现还是太麻烦。直接用这种方法去替换省事。这里的美元符号显示得不好,以下我用中文“美元”来代替shift+4这个符号。以最后一个     df“美元”学历[df“美元”学历 %in% c("专科","本科","硕士","博士")] <- "大学"     为例。
中括号里的 %in%是判断符号,a %in% b就是判断a是否在b里,是就返回一个true,向量化后,就返回一串的true和false。中括号里的东西可以单独运行一遍,看看就懂。
df是你的dataframe,df“美元”学历,可以调用你的学历那一列(当然这个学历是你的dataframe的列名),中括号作为索引,里面接一串的true和false就返回了学历里每一个索引为true的元素(在这里就是每一个专科本科硕士博士),把这些元素都替换为“大学”。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群