全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2162 2
2018-04-23
想用R语言完成的操作如下,现在有大量的观测值,每个观测值有var1和var2两个中文字符串,我希望在var3中显示var1字符串有但是var2字符串没有的汉字,在var4中显示var2中有但是var1中没有的汉字,应该在R中如何实现呢?

屏幕快照 2018-04-23 下午10.41.32.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-4-24 00:37:48
library(stringr)

data001=data.frame(v1= c("你好一二r1c1","你好r2c1一二"),v2=c("三四你好r1c2","三r2c2四你好"))

v3=c()
v4=c()

for (row in 1:nrow(data001)) {

  x=Reduce(setdiff, strsplit(c(as.character(data001$v1[row]), as.character(data001$v2[row])), split = ""))
  x=paste(x, collapse = '')
  v3=c(v3,x)
  y=Reduce(setdiff, strsplit(c(as.character(data001$v2[row]), as.character(data001$v1[row])), split = ""))
  y=paste(y, collapse = '')
  v4=c(v4,y)
}

data002=data.frame(data001,v3,v4)
data002
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-24 14:16:30
rainningpoet 发表于 2018-4-24 00:37
library(stringr)

data001=data.frame(v1= c("你好一二r1c1","你好r2c1一二"),v2=c("三四你好r1c2","三r ...
太感谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群