全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
9812 9
2017-08-01
悬赏 50 个论坛币 已解决
很多行很多列的数据

其中某两行除了一个属性A不同,其他属性全部相同。某两行除了一个属性B不同,其他全部相同。请问该如何合并呢。

简单粗暴,直接上图。
          原始数据111.png    

         目的数据111.png                


                           

另,由于我做的是用shiny读取excel并进行相关操作,可能有的excel只有属性A重复,有的只有属性B重复,有的A和B都重复。如果能写成自动判断是否重复然后再进行相关操作就最好了。(注:只有SITE和Kind会出现重复,且ID是唯一识别标识)


求指教,谢谢!

最佳答案

jimaocai 查看完整内容

整体思路和原来一样,但是因为有两列,所以在by() 函数里对两行进行了计算,因为两行有有交互的关系,所以用了一个ifelse条件语句,意思是比如当一个重复组: --------------------- SITE Kind shanghai baby shanghai beauty ---------------------- baby和beauty,写成baby,beauty,但是该组前面一列里是shanghai shanghai,因为两个名字一样,所以不写成shanghai,shanghai 这个代码对大数据处理也应该还快的, ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-1 21:12:33
整体思路和原来一样,但是因为有两列,所以在by() 函数里对两行进行了计算,因为两行有有交互的关系,所以用了一个ifelse条件语句,意思是比如当一个重复组:
---------------------
SITE      Kind
shanghai baby
shanghai beauty
----------------------
baby和beauty,写成baby,beauty,但是该组前面一列里是shanghai shanghai,因为两个名字一样,所以不写成shanghai,shanghai

复制代码

这个代码对大数据处理也应该还快的,比对每一行进行循环要快很多。
在这个网页上好像有些代码会自动被转换成数学公式,乱码主要发生在"x$SITE" 和 "x$Kind"上,中间是美元符号。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-1 21:45:15
比较笨的一个方法
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-1 21:53:42
deem 发表于 2017-8-1 21:45
比较笨的一个方法
i是是什么呢? 我这边运行有错误   最好能给出完整代码  谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-1 22:07:07
奢香夫人1 发表于 2017-8-1 21:53
i是是什么呢? 我这边运行有错误   最好能给出完整代码  谢谢!
括号放错位置了,是对所有的行进行循环。
这就是完整代码
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-1 22:07:09
奢香夫人1 发表于 2017-8-1 21:53
i是是什么呢? 我这边运行有错误   最好能给出完整代码  谢谢!
括号放错位置了,是对所有的行进行循环。
这就是完整代码
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群