全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
43931 8
2014-07-12
本文转载自: 丁香园论坛--->循证医学与临床运用讨论版
原帖名称:  【原创】我们一起来学习:Meta 回归在stata12.0中的实现(图解版)(大侠请进,有问题要请教你们!!)
原帖发布时间:                                                                                                                                                          2014-02-13 17:00
原帖链接:  http://ebm.dxy.cn/bbs/topic/27463743
原帖作者还提供了相应的数据文件(无需丁香园论坛币)
下载链接: http://d.dxy.cn/detail/6197764

原帖全文如下:

在寒假里面结合周版主的视频和DXY里面关于Meta回归的帖子,自己总结了关于Meta回归在Stata 12.0中是如何进行操作的。下面与大家一起分享和探讨有关Meta回归的问题!
在开始Meta回归之前,我觉得有必要介绍一下Meat回归的基本概念。
(一)Meta回归的定义
Meta回归本质上仍是一种回归分析方法,它与logistiic 回归、线性回归等回归方法的区别是:Meta回归的回归对象是单个研究,而logistiic 回归、线性回归的回归对象是单个研究中的个体资料。Meta回归在Meta分析中常用来探讨各研究间异质性的来源及其大小,并经一步解释异质性对Meta分析中合并效应量的影响。具体说来,Meta回归中,异质性来源可以是实验干预的剂量、年龄、地点、语言等等。
(二)Meta回归在Stata12.0 中的操作步骤
(本实例的数据见附件)

步骤一:在Stata12.0中按照如下格式录入数据:



(直接将数据从Excel Copy到stata,然后用rename命令进行重命名。)
步骤二:由于abstract,itt,allo和 phd是字符变量,在meta回归是软件无法识别(varlist: abstract: string variable notallowed),故在进行meta回归之前需要对其进行赋值。在命令栏中输入命令:
. gen abs=abstract=="Yes"

. genitt1=itt=="Yes"

. genallo1=allo=="Yes"

. genphd1=phd=="Yes"
(注意:根据95%CI计算selogor的命令:genselogor=(log(ul)-log(or))/1.96)
所得结果如下:



步骤三:我们先进行单个协变量的回归。所谓协变量(covariate),是指除了因变量之外,可能影响反应变量的其他变量。举个例子。比如我们研究维生素A的剂量与腹泻发生率的关系,这里Vit A的剂量就是因变量(independent variable or explanatory variable ),腹泻发生率就是反应变量(dependent variable or response variable)。如果我们在Meta分析中发现Vit A的干预方式(solution, syrup or tablet),研究地点(China, America,Japan)和干预时间(6 months,1 year or even 2 years)等因素对腹泻也有影响。那么,在"维生素A的剂量与腹泻发生率的研究"中,协变量就是干预方式、研究地点和干预时间。这儿我们的协变量随便定为duration。选项卡说明如下:


说明1:
1. Dependent(y)一栏中输入反应变量。对于连续变量,这儿输入SMD(或WMD,MD);对于二分类变量,这儿输入logrr或者logor;
2.Covariates一栏中输入协变量,这儿应输入duration;
3. Within-study Varibility一栏中有两个选项,一个是Std.Error,另外一个是Variance。这一栏要求选择对回归系数进行加权的依据,一般选择Std. Error。还有一个选项是Variablename,要求指出每个研究内包含Std. Error 的变量,这儿应该是sesmd(如果是二分类变量,则是selogrr或者selogor;
4.BS Method一栏要求选择算法,这儿一般选择ReML(限制性最大似然法)。


说明:
1.Randomsize:勾选此项,则Stata在绘制图形的圆圈时,其圆圈的大小将取决于每个研究的权重(


)而不是研究的精度()。事实上,Randomsize选项是否勾选,对于回归结果影响不大。原因是:由于研究间的变异()较小,因此权重和精度的值很接近。若勾选Randomsize选项,将会使圆圈的变小;
2. Graph:勾选此选项,在结果中将会产生相应的图形。注意,只有在一个协变量时,此选项才适用;




3.Eform:勾选此选项,结果回归系数结果将以指数形式表示。




(Eform勾选状态)


(Eform未勾选状态)步骤四:点击OK后,将得到相应结果:



结果的解读:
1.Tau2——研究间变异大小的分量,其值越小,说明其模型的拟合优度越好;
2. I-square-res——异质性能解释的残差变异大小,在这儿,异质性能解释残差变异的55.83%(另外残差变异的44.17%由研究间变异解释);
3. Adj R-squared——当前纳入模型的协变量所能解释的研究间变异的大小,在这儿,duration能解释的研究间变异的大小为55.16%。
步骤五:若纳入多个协变量,则可以得到以下结果:



结果解读:
Model F(5,4)withKnapp-Hartung modification——对所有协变量的联合检验,零假设是所有协变量的回归系数等于0。F(5,4)中,5表示纳入协变量的数目,4表示???;若P值小于检验水准(0.01或0.05),则提示在纳入的多个协变量中,至少有一个协变量与反应量有关(至于是哪个协变量与之有关以及有关的程度,无法从P值推断)。
步骤六:随着纳入模型的协变量数目的增多,所得结果犯I类错误的概念随之增加,因此有必要采用蒙特卡罗法来对P之进行校正:


勾选Permute选项框,在右侧的数值框中输入蒙特卡罗法随机排列的计算次数。一般5000或者20000次。若选中Univariable,则计算结果更加准确。


(Permutations=50)


(Permutations=100)

(Permutations=200,并勾选Univariable)若纵向的P值逐渐增大(到底是纵向还是横向??请高手拍砖),说明确实存在I类错误,如下图所示:


另外,由于蒙特卡罗法为随机排列,所以如果要想使两次结果相同,在进行蒙特卡罗法之前应使用命令:set seed 15160401。

好了,我的演示步骤到此结束。若有不对之处,请斧正!谢谢

(三)Meta回归的注意点:(1)确保有足够的研究个数纳入纳入回归分析,如至少对每个协变量模型要保证10个观察结果;(2)预先设定研究过程中所要分析的协变量;(3)选择少的协变量;(4)探索每个协变量必须符合科学原理;(5)协变量之间不能有交互作用。
(四) 在meta回归中纳入协变量个数的推断公式:N=纳入研究数/10。
(五)Meta回归中的疑问(请高手解惑!!!!)
(1)多分类变量(>=3)的Meta回归
我参考了《实用循证医学方法学》中有关多分类变量的哑变量赋值方法,但是还是有些疑问。现叙述如下。假设region(America, China and Japan)这个协变量对smd有影响。我在stata中哑变量赋值方法如下:tablulate region, generate (country),结果如下:






我的问题是:
1.country1就是Ameica吗?country 2就是China吗?!country 3就是Japan吗?!如果是的话,为什么回归结果中只有country1 和country3,country 2跑哪儿去了?!还有,_cons一行表示什么意思?!
2.我想研究的是region这个协变量是不是异质性的来源,但进行哑变量赋值后,region被分割为了三个新的协变量。就本例来说,如果country 1和country 2 的P值小于检验水准,country 3的P值大于检验水准,也就是说country1 和country 2 这两个协变量是异质性的来源,country 3不是。那么region 到底是不是异质性的来源呢?!
(2)关于蒙特卡罗运算
在蒙特卡罗运算中,周版主的视频中说“若P值逐渐增大,说明确实存在I类错误”。那到底是横向比较P值还纵向呢(下图为例)?!

(3)在下图中,F(5,4)中,5表示纳入协变量的数目,4表示什么呢??

(4)Meta回归与剂量反应我在PLOS Medicine 上面看到DXY战友发表的一篇文章,上面有一个剂量反应的图(见下图1)与我们Meta回归的图(纳入一个协变量时,见图2)很像.请问,图一的剂量反应就是通过Meta回归实现的吗?!Meta回归与剂量反应到底有什么关系?!

(图1)


(图2)
                                                            Data-Metareg.xls(14.5k)                                                                                                                                        在线查看


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-7-12 17:48:42
学习了,谢谢哟。O(∩_∩)O~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-17 14:51:44
“我的问题是:
1.country1就是Ameica吗?country 2就是China吗?!country 3就是Japan吗?!如果是的话,为什么回归结果中只有country1 和country3,country 2跑哪儿去了?!还有,_cons一行表示什么意思?!
2.我想研究的是region这个协变量是不是异质性的来源,但进行哑变量赋值后,region被分割为了三个新的协变量。就本例来说,如果country 1和country 2 的P值小于检验水准,country 3的P值大于检验水准,也就是说country1 和country 2 这两个协变量是异质性的来源,country 3不是。那么region 到底是不是异质性的来源呢?!“

就是虚拟变量陷阱啊  Dummy Variable Trap
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-18 20:05:43
一个小孩子 发表于 2014-7-17 14:51
“我的问题是:
1.country1就是Ameica吗?country 2就是China吗?!country 3就是Japan吗?!如果是的话, ...
抱歉,我目前无法回答你的问题!
建议:请到原作者的发帖论坛中向原作者询问。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-9-19 13:31:07
学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-6 21:17:19
学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群