全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1138 4
2016-05-26
rm(list=ls())
same = sample(1:500,100)
index1 = sample(501:5000,500)
index2 = sample(501:5000,300)
id1 = c(same,index1)
id2 = c(same,index2)
name1 <- paste("V",id1,sep="_")
name2 <- paste("V",id2,sep="_")
data1 <- data.frame(id1=name1,y=rnorm(600))
data2 <- data.frame(id2=name2,x1=rbeta(400, 1, 2))
上面的代码是生成数据的,你们不需要去修改任何东西。你们根据上面生成的data1和data2,id1和id2表示名字,将两个数据按照名字进行合并。注意,我们不需要修改为一致的名称,比如id,merge命令可以实现这样类型数据合并。
具体要求:
1、将data1和data2进行合并,合并后的新数据为data_new。
2、将data_new中的y和x1建立回归模型,即y=c+beta1*x1+error,并把结果用表格形式输出,需要包括系数、标准误、t值和p值等。当然,有同学乐意用手动去整理表格的,也非常欢迎。
3、写出merge命令中by.x,by.y,all.x,all.y这四个选项表示什么意思。
这道题怎么做,代码怎么写

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-5-27 10:05:01
先回答这个:merge命令中by.x,by.y,all.x,all.y
1.by.x也就是x的索引列
2.by.y也就是y的索引列(by.x,by.y一起看就是x的某列(或多列)的值等于x的某列(或多列)的值)
3.all.x=T:表示保留x的所有值,假设x与y关联后,x中有没关联到y的部分,x的值依旧保留。
4.all.y=T:同理,如果学过sql的话,all.x=T可以看成left join,all.y=T可以看成right join。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-5-27 10:13:11
第一个问题 data_new<- merge(data1,data2,by.x="id1",by.y="id2") #求交集

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-5-27 15:55:31
第二个问题
lm1<- lm(data_new$y~data_new$x1)
lm1
其中(Intercept)是常数 ,data_new$x1是x1的系数 ,error是不可测的随机变量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-5-27 15:58:18
好像显示的代码有些问题
\[lm1<- lm(data_new$y~data_new$x1)\]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群