全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
7619 9
2010-11-29
各位老师,我是统计学的新手。最近在看很多发表的文章时,都把很多连续变量,比如我们医学的血红蛋白等值,分成4组。比如说95g以下的一组,95-105的一组,105-130的一组。130以上的一组。但是我一直没有搞懂他们分组的依据是什么,文章中也没有详细描述。而且这些分组也不是医学的正常和不正常之间的界限。并且不同的文章其分组的数值也不同。请各位老师指点。还有,根据该变量不同的分组,以其中一个分组的OR值为1,其他分组相对的OR值怎么算。谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-11-29 22:38:52
没有人帮忙回答吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-29 22:51:33
将连续变量(协变量)分组纯粹是为以后是说明方便,没什么特殊含义,如果不分组,那结果中的OR解释为该变量每变化一个单位导致因变量OR的变化是多少,这在实际工作中没什么意义------血红蛋白95g和96g有什么实际区别呢?而且此时的基线值是连续变量中那个最小值,所有其它值都以该最小值为参考,想一想,那得多少个OR?分组以后就简单多了。
logistic的OR值计算,是以分组编码中数字最小的那个组为参照(是编码值最小,不是说实际数值最小),所有其它组都是相对于这个组的OR值自动计算。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-29 23:01:10
请问chyshl老师,那个OR值的自动计算在SPSS里面怎样实现呢。是要重新把自变量重新赋予 1、2、3、4的分类变量值吗?确实不懂,请指教。谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-30 02:27:41
分组的另外一个重要原因是看:不同组之间是否会存在差异,或不同的规律.这在实践中也是很重要的,至于分组的临界点在哪里,这就需要技术和判断了,当然现有文献的做法可供参考
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-11-30 11:02:39
貌似不是赋值1.2.3.4之类,而是0 0 0 0,0 0 0 1,0 0 1 0之类,那个赋值0 0 0 0的,就是基线参照组。如果分4组,输出结果中就是3组,基线参照组不输出,类似于产生哑变量产生时的n-1.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群