全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
5120 5
2010-10-26
各位大侠,我不是统计学专业出身,但最近的一篇论文需要很多的统计学知识和技巧,各种数据真把我搞的焦头烂额,希望各位前辈能够指点一二,在下不胜感激!
我的论文是调查某几个基因的多态性与胃病发生之间的关系,用的是case-control的方法,自变量涉及性别、年龄、细菌感染与否,基因型,因变量分为胃癌组,胃炎组,对照组。统计软件是SPSS17.0
我遇到的问题有如下几个:
1、自变量基因型有3个水平,我将它们赋值为1、2、3,在分析时没有采用哑变量的分组方式,而是在数据变量视图中采用数据缺失的方法,因变量也采用这种方法用二元logistic回归实现数据分析。这样的做法是否可行,有什么弊端?
2、在对自变量性别、年龄、细菌感染对研究人群作单因素分析时发现,细菌感染的组间卡方检验p>0.05,没有显著差异。但据生物学理论细菌感染可能与基因型交互作用影响胃病的发生,我对基因型和细菌感染和胃病做析因分析,采用GLM单变量分析,结果显示p<0.05,这能否说明细菌感染和基因型存在交互作用?
3、在做二元logistic分析时,细菌感染(A),基因型(B),二者交互作用(A*B)是否一起放入协变量栏进行分析,设置reference时是单独的A reference还是单独的B reference或者将两个reference同时引入?我将二者的reference一起引入,给出的结果A(1)*B(1)的p<0.05,这时候得到的OR值它的含义是什么,是指A(1)与B(1)的联合作用与对照相比发生胃病的风险值么?我发现在引入交互作用项后,基因型的p值和OR值都发生了改变,在给出结果的时候是以这个为准还是以没有交互作用项时的为准呢?
4、在本例中交互作用的关系是否可以通过细菌感染与否对基因型的分层计算来实现呢?

大概就是这些问题吧,希望大家能看明白,里面可能有些问题的提法就是错误的,还请您不吝赐教啊!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-10-27 09:34:53
快沉了,顶一下,请大家帮忙发表意见!是我的表述有问题大家看不明白么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-27 09:38:56
今年研究生数学建模A题就是这样的!你可以看看《Logistic回归模型——方法与应用》
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-27 09:46:07
一诺仁兄,《Logistic回归模型——方法与应用》这本书网上有pdf版本的么?可否麻烦给我个链接地址呢,谢谢啦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-27 11:49:48
http://www.pinggu.org/bbs/thread-726374-1-1.html,这个里面有,是版主汇总的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-27 13:25:52
谢谢楼上的答复。因为是新手,所以很多资料下不了。我从其他途径把《Logistic回归模型——方法与应用》下了,也在网上搜到了2010年全国研究生数学建模竞赛A题。从专业角度来讲,生物学家在完成了人类基因组的序列测定以后,对基因组的解读是目前的一个关键问题,它的复杂度超乎想象,我想需要生物学和统计学高手双管齐下才能看出点端倪。我的专业是生物学,统计上学时学到过,但基本已经还给老师了,现在是现学现用,遇到的问题一堆。看过一些国内和国外的相关文献,有些分析是依葫芦画瓢,挺粗浅的,有的仿佛有些价值但碍于统计知识不能深入领会。
对于自变量的选人问题《Logistic回归模型——方法与应用》中提到如果自变量p<0.25都应作为可能的候选变量。
现在的问题集中在自变量之间存在交互作用用什么方法来做,判别标准是什么,它们对因变量的影响怎么做,spss的输出结果怎么解释,有何意义。
附件列表
1.jpg

原图尺寸 65 KB

1.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群