如何用一個dataframe同時做兩組甚至更多組的lm迴歸呢 ?

hkhorsetrack

1132

收藏 2018-04-29

各位大大好,

dataframe 如下 :

Index	Type	Day	Real
1	A120	1	0.583
2	A120	2	0.534
3	A120	3	0.555
4	A120	4	0.512
5	A120	5	0.513
6	A120	6	0.499
7	A165	1	0.641
8	A165	2	0.587
9	A165	3	0.539
10	A165	4	0.506
11	A165	5	0.579
12	A165	6	0.440

A120, A165 是兩种型号, 如何用一個dataframe同時做兩組甚至更多組的lm迴歸呢 ?

Index	Type	Day	Real	predict
1	A120	1	0.583	?
2	A120	2	0.534	?
3	A120	3	0.555	?
4	A120	4	0.512	?
5	A120	5	0.513	?
6	A120	6	0.499	?
7	A165	1	0.641	?
8	A165	2	0.587	?
9	A165	3	0.539	?
10	A165	4	0.506	?
11	A165	5	0.579	?
12	A165	6	0.440	?

得到lm迴歸式後, 又如何在將所有day 的 predict 結果存predict col. 中呢?
補回代碼 :
ydata <- data.frame(index = 1:12, type = c(rep("A120",6),rep("A165",6)), day = c(1:6,1:6),
real = c(0.583,0.534,0.555,0.512,0.513,0.499,0.641,0.587,0.539,0.506,0.579,0.440))

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

cheetahfly

2018-4-29 10:00:37

hkhorsetrack 发表于 2018-4-29 00:04
各位大大好,

dataframe 如下 :

认真阅读Hadley Wickham的R for data science，关于建模的那一章，论坛里有资源。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

hkhorsetrack

2018-4-29 11:21:09

謝謝cheetahfly,
小弟英文程度去不了高中, 英文太難理解了, 更怕誤解了內文.
由於自己是門外漢, 所以這個帖想問是技巧, 我想邊做邊學的, 再次謝謝

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

rainningpoet

2018-4-30 01:16:35

不是很明白你的问题。你的数据应该就是 Real= y +y1 * Type+y2*Day . 用线性回归得到 y , y1,y2 然后代入就等到每个预测predict.
如果你用不同的模型或不同的参数就会得到不同的 y,y1,y2 。然后得到的 predict 也不一样。

PS：如果你英文水平真的不到高中。建议你先学习英文。因为在R 就是用英文写的。www.datacamp.com 这个网站不错。可以把英文和R 一起学了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

hkhorsetrack

2018-5-1 17:03:24

library(lme4)
library(lattice)
library(nlme)
library(dplyr)

ydata <- data.frame(index = 1:12, type = c(rep("A120",6),rep("A165",6)), day = c(1:6,1:6),
real = c(0.583,0.534,0.555,0.512,0.513,0.499,0.641,0.587,0.539,0.506,0.579,0.440))

fitted_models = ydata %>% group_by(type) %>% do(model = lm(real~day, data = .))
fitted_details <- fitted_models %>% augment(model)

這個是我昨天學会寫的, 問題原意是所有資料都存一個dataframe里, 但当中可能包含几組甚至千百組組合(type), eg.中国的不同省巿,
雖然用一條 lm 可以推算dataframe里的資料, 但未必能貼近現實, 所以我想分組做 lm , 但將一個dataframe分拆成几組甚至千百組再進行 lm 十分費時, 再逐個看結果亦費時, 所以想尋找 "技巧" 可以加速得到結果.
fitted_models 里, 有一個col 叫 .fitted, 我想將這個結果放在predict中, 如果我沒記錯, 這個應是 Yi,
請問还有其他更簡單方法嗎?

另外, 多謝上面的大大善良意見, 我的日子不多了, 微分只學了不足100小時, 程度还很有限, 英文对我更是太遙遠了.
待我弄好模型再學習, 感謝.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

rainningpoet

2018-5-2 00:05:55

雖然用一條 lm 可以推算dataframe里的資料, 但未必能貼近現實, 所以我想分組做 lm , 但將一個dataframe分拆成几組甚至千百組再進行 lm 十分費時.

如果有那么多种不同的情况。直接把type 当作一个模型的变量好了。或者你把type 聚类成几个type 再做几个模型。

我没有听说过做很多个模型的。世间万物多少有共性。比如你把中国的省聚类成南方/北方/西部之类的

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

栏目导航

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群