整体思路和原来一样,但是因为有两列,所以在by() 函数里对两行进行了计算,因为两行有有交互的关系,所以用了一个ifelse条件语句,意思是比如当一个重复组:
---------------------
SITE Kind
shanghai baby
shanghai beauty
----------------------
baby和beauty,写成baby,beauty,但是该组前面一列里是shanghai shanghai,因为两个名字一样,所以不写成shanghai,shanghai
这个代码对大数据处理也应该还快的,比对每一行进行循环要快很多。
在这个网页上好像有些代码会自动被转换成数学公式,乱码主要发生在"x$SITE" 和 "x$Kind"上,中间是美元符号。