请教一个R语言编程小问题

熊小贤

3381

收藏 2013-10-13

悬赏 200 个论坛币已解决

假设我有一组数据
id          name          value
1          jin, joy          1
2             jou             6
3             po, yu          3
4             gh                3
5             kl, yu          2
6             tt                5
7             ttk                1
8             dd, bbs，tt 9
9             irr                2
10          jii                3
我想把第二列中有逗号分隔的名字分开(有的可能有很多逗号分隔的名字不止两三个)，并输出到下一行，没有逗号的不动：
希望输出结果这样：
id          name       value
1          jin             1
1          joy             1
2             jou          6
3             po             3
3             yu             3
4             gh             3
5             kl             2
5             yu             2
6             tt             5
7             ttk             1
8             dd             9
8          bbs             9
8             tt             9
9             irr             2
10          jii                3
希望各位大神不吝指点，非常感谢！！

最佳答案

统计R浪人查看完整内容

> id name value newdata newdata id name value 1 1 jin 1 2 1 joy 1 3 2 jou 6 4 3 po 3 5 3 yu 3 6 4 gh 3 7 5 kl 2 8 5 yu 2 9 6 tt 5 10 7 ttk 1 11 8 dd 9 12 8 bbs 9 13 8 tt 9 14 9 irr 2 15 10 jii 3 >

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

统计R浪人

2013-10-13 10:26:11

> id<-newid
> name<-newname
> value<-newvalue
> newdata<-data.frame(id,name,value)
> newdata
id name value
1 1  jin    1
2 1  joy    1
3 2  jou    6
4 3 po    3
5 3  yu    3
6 4 gh    3
7 5 kl    2
8 5 yu    2
9 6 tt    5
10  7  ttk    1
11  8 dd    9
12  8  bbs    9
13  8 tt    9
14  9  irr    2
15 10 jii    3
>

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

熊小贤

2013-10-13 10:52:00

现在这里谢谢了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nieqiang110

2013-10-13 19:10:25

你好！假定你的数据名为data，你要转换的列为name
data$name<-gsub(","," ",data$name) #去掉逗号“,”注意双引号中有一个空格，这样才是几个单词。谨记。
regexp<-"([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+)" #定义你的名字中最多的单词表达模式，你的例子中是3个。如果是4个，就是regexp<-"([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+) "
data$name<-sub(pattern=regexp,replacement="\\1",x=data$name) #将3个单词的名字转换为1个单词
regexp<-"([[:alpha:]]+) ([[:alpha:]]+)" #定义你的名字中2个单词的表达模式。
data$name<-sub(pattern=regexp,replacement="\\1",x=data$name) #将2个单词的名字转换为1个单词
data$name #显示最终结果
#注意一定要按顺序来，不可倒换顺序，否则出错。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

熊小贤

2013-10-13 19:42:36

nieqiang110 发表于 2013-10-13 19:10
你好！假定你的数据名为data，你要转换的列为name
data$name

您没明白我的意思我是想输出结果直接显示成
id          name       value
1          jin             1
1          joy             1
2             jou          6
3             po             3
3             yu             3
4             gh             3
5             kl             2
5             yu             2
6             tt             5
7             ttk             1
8             dd             9
8          bbs             9
8             tt             9
9             irr             2
10          jii                3

不是单纯对第二列操作

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nieqiang110

2013-10-13 20:37:06

哈哈哈，
你好！假定你的数据名为data，你要转换的列为name
data$name<-gsub(","," ",data$name) #去掉逗号“,”注意双引号中有一个空格，这样才是几个单词。谨记。
regexp<-"([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+)" #定义你的名字中最多的单词表达模式，你的例子中是3个。如果是4个，就是regexp<-"([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+) "
data$name<-sub(pattern=regexp,replacement="\\1",x=data$name) #将3个单词的名字转换为1个单词
regexp<-"([[:alpha:]]+) ([[:alpha:]]+)" #定义你的名字中2个单词的表达模式。
data$name<-sub(pattern=regexp,replacement="\\1",x=data$name) #将2个单词的名字转换为1个单词
data$name #显示最终结果
#注意一定要按顺序来，不可倒换顺序，否则出错。
data

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

nieqiang110

2013-10-13 20:39:18

你的原始数据名为data,第二列修改后，数据自然显示好了。给我的程序加一行，写上数据名，自然就好了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

童小军

2013-10-13 22:24:30

复制代码

data.rar
大小:(193 Bytes)

马上下载

本附件包括：

data.csv

根据上面的方法，还是得不到想要的结果？？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

ywh19860616

2013-10-13 23:41:15

nieqiang110 发表于 2013-10-13 19:10
你好！假定你的数据名为data，你要转换的列为name
data$name

正则表达式用的很好，学习了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nieqiang110

2013-10-14 00:05:31

X<-"ax"
Y<-"as,vy"
Z<-"ss,rr,tt"
M<-c(X,Y,Z)
M<-gsub(","," ",M)
M
regexp<-"([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+)"
M<-sub(pattern=regexp,replacement="\\1",x=M);M
regexp<-"([[:alpha:]]+) ([[:alpha:]]+)"
M<-sub(pattern=regexp,replacement="\\1",x=M);M

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nieqiang110

2013-10-14 00:06:03

上面这个例子可以，我试试后发给你

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nieqiang110

2013-10-14 00:15:14

> #read the data
> data<-read.csv("data.csv",header=T)
> data$name<-gsub(","," ",data$name)
> regexp<-"([[:alpha:]]+) ([[:alpha:]]+) ([[:alpha:]]+)"
> data$name<-sub(pattern=regexp,replacement="\\1",x=data$name);data$name
[1] "jin joy" "jou"    "po yu" "gh"    "kl yu" "tt"
[7] "ttk"    "dd"    "irr"    "jii"
> regexp<-"([[:alpha:]]+) ([[:alpha:]]+)"
> data$name<-sub(pattern=regexp,replacement="\\1",x=data$name);data$name
[1] "jin" "jou" "po"  "gh"  "kl"  "tt"  "ttk" "dd"  "irr" "jii"
> data
id name value
1 1  jin    1
2 2  jou    6
3 3 po    3
4 4 gh    3
5 5 kl    2
6 6 tt    5
7 7  ttk    1
8 8 dd    9
9 9  irr    2
10 10  jii    3
楼主：你好！我将运算的程序发给你。我用的是RStadion。刚才程序出错，我检查了一下，原因在于你数据文件中的逗号是中文格式的逗号，改成英文格式下的逗号就可以了。这次我是亲自用你的数据运算出来了。

附件列表

data_name.rar

大小:1.03 KB

马上下载

数据以及R程序

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

熊小贤

2013-10-14 09:28:01

nieqiang110 发表于 2013-10-14 00:15
> #read the data
> data data$name regexp data$name regexp data$name data
id name value

正则表达真的看不懂，所以没弄明白真是谢谢您了又学习了
下面的统计R浪人也给了不错的答案我看他论坛币挺少的我最佳先给他了
我一会儿会另开一个悬赏记得来领论坛币

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

熊小贤

2013-10-14 09:30:23

nieqiang110 发表于 2013-10-14 00:15
> #read the data
> data data$name regexp data$name regexp data$name data
id name value

正则表达不太懂所以之前一直没看明白真的谢谢您了给我解答了这么多
不过下面统计R浪人也给了不错的答案我看他论坛币挺少的最佳先给他了
一会儿我会令开一个悬赏记得来领取啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kaifengedu

2013-10-14 13:08:22

统计R浪人发表于 2013-10-13 10:26
> id name value newdata newdata
id name value
1 1 jin 1

一点建议,if语句可以不要,直接写为

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

统计R浪人

2013-10-14 17:39:05

kaifengedu 发表于 2013-10-14 13:08
一点建议,if语句可以不要,直接写为

不错，学习了，以后多交流

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kaifengedu

2013-10-15 07:22:37

统计R浪人发表于 2013-10-14 17:39
不错，学习了，以后多交流

没问题,以后互相学习!

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jmpamao

2013-10-15 18:31:13

也可以不用循环的

复制代码

> data2
id  V1 value
1 1 jin    1
2 1 joy    1
3 2 jou    6
4 3  po    3
5 3  yu    3
6 4  gh    3
7 5  kl    2
8 5  yu    2
9 6  tt    5
10  7 ttk    1
11  8  dd    9
12  8 bbs    9
13  8  tt    9
14  9 irr    2
15 10 jii    3

另外向  @qoiqpwqr问好

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

D调、的华丽~

2013-10-15 22:21:16

统计R浪人发表于 2013-10-13 10:26
> id name value newdata newdata
id name value
1 1 jin 1

好厉害！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

统计R浪人

2013-10-16 07:53:06

jmpamao 发表于 2013-10-15 18:31
也可以不用循环的> data2
id V1 value
1 1 jin 1

不用循环这样效率更高，以后要向楼主学习多使用lapply、sapply写代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhangtao

2013-10-17 09:54:02

统计R浪人发表于 2013-10-13 10:26
> id name value newdata newdata
id name value
1 1 jin 1

朋友，能说说您编程的思想吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

统计R浪人

2013-10-17 10:10:10

zhangtao 发表于 2013-10-17 09:54
朋友，能说说您编程的思想吗？

我觉得最好的是楼上jmpamao的实现方法；我是字符串先分割，然后提取再存储到新的对象中。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

tbjwaixy

2013-11-11 11:27:15

学习了。谢谢你

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

最佳答案

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群