全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
7177 21
2011-01-18
悬赏 1 个论坛币 未解决
诸位高手,现在俺遇到一个不大不小的问题:
有两组数据集,分别使用线性回归尽心拟合,相应得到两个回归公式
Line 1:     y=a1+b1x                      (1)
LIne 2:     y=a2+b2x                      (2)

现在想比较b1和b2有没有显著性差异!注意:我已经找到协方差方法可以处理。现在的问题只是关于bootstrap的问题。
使用bootstrap,我们可以得到许多的模拟样本的b1值,根据模拟样本的b1值计算其均值和标准差进而可以推算公式中b1的标准差;同理,亦可得到一组b2的模拟样本值。现在我需要提出的问题是:

能够直接使用模拟样本的b1和模拟的样本b2直接使用方差分析,来比较两个公式中b1和b2的估计值有没有显著性差异呢?

请高手不惜赐教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-1-18 11:34:02
两组数据: were they from same sample or not? If not, or say they are independent, for what reason you compare the coefficient between them ??

If they are from the same sample. You can code them as 0 for sample 1 or 1 for sample 2 and make this as one variable in you data. Using ANOVA, you can compare them directly  without bootstrappintg if they are "normal" enough.

If they are not "normal" enough, or skewed, then you can use bootstrap to test whether the coefficient of that coded variable is significant or not.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-18 13:53:17
谢谢!
但是你还没有回答我的问题。一组数据来源于温度(x)对卵期发育速率(y, 即完成卵期的所需时间)的影响,另外一组来源于问对对蛹期发育速率的影响。大量观察证明在适温范围内,发育速率是温度的线性函数。
卵期:y=a1+b1 x
蛹期:y=a2+b2 x
其实我并不是想对比b1和b2,而是要对比 - a1/b1和 - a2/b2,它们代表一种有生物学意义的温度(直线和x轴的截距)。


我使用bootstrap,来sample卵期的数据,假设做了1000次,使用回归,自然可以得到1000个-a1/b1;同理,sample蛹期的数据,可以得到1000个-a2/b2。那么我的问题其实是对比1000个-a1/b1的值和1000个-a2/b2的值,做了方差分析,发现存在显著性差异。能够就可以说上边谈到的-a1/b1和-a2/b2(注意:不是使用bootstrap得到的模拟值再回归得出系数,而是对原始数据进行回归,得到的回归系数)存在显著性差异呢?

都是残差符合正太分布的。

明白我的问题了吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-18 14:35:08
As I said, if they were completely different experiments. Then there is no reason to do so, because they are indenpendent to each other, not comparable.

If exact the same temperature X, resulted in different rates of development of Y1 and Y2, then  your approach seems reasonable to me.  However as I have no knowledge in your field, so I cannot tell whether the approach is appropriate to your analysis

All simply, you could just standardise temperature effect, say Y1/X, and Y2/X, and make the comparison.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-18 16:01:59
我觉得你的样本是小样本,用bootstrap进行估计出的效果应该比原始数据的要好,更有说服力。
另外,我对4楼朋友的说法有异议,来自不同总体的样本还是有可比性的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-1-18 16:53:11
zhangtao 发表于 2011-1-18 16:01
我觉得你的样本是小样本,用bootstrap进行估计出的效果应该比原始数据的要好,更有说服力。
另外,我对4楼朋友的说法有异议,来自不同总体的样本还是有可比性的。
Offcoz we can compare two samples. But what he wanted was to provide two regressions from those two different samples (if they were from different experiments), and compare ratio of regression coefficients between those two regressions.  If those two experiments were completely differently designed, I don't think such approach is appropriate.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群