全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
2774 0
2012-09-30

Statistical Modelling for Complicated Censored Data with Dependent Structure

        复杂删失数据的统计分析是现代统计学的研究热点之一,是各相关学科发展的重要内容.分析复杂删失数据,建立相应的统计模型,揭示数据的内在规律,是发展各相应学科的重要基础.特别是在生物学、医学、生态学、人口学、环境学和经济学等学科的研究中,随着实验技术、检验方法和数据分析手段的日益提高,所获得的数据在结构上越来越复杂精细,所提供的信息也越来越繁杂,因而也对数据的定量分析提出了更高的要求.同时,由于实验条件和其他原因,反映变量与删失时间具有某种相依性,如何在各种相依结构下建立相应的统计模型,进行统计推断以及模型诊断等,也是当今统计学与生物学、医学、生态学、社会学、环境学和经济学等学科交叉中重要的研究热点问题之一.复杂删失数据主要包括删失数据、截断数据、区间删失数据、复发事件数据、成组数据、集合数据、纵向数据、丢失数据、测量误差数据等.在传统的生存分析中,主要是在反映变量与删失时间相互独立的情况下研究各种参数、非参数和半参数模型的统计问题[1]'主要包括参数回归模型、乘积限估计、Cox模型、比例几率回归模型、加速寿命模型、线性模型、半参数线性转移模型、Aalen可加风险率模型、随机效应比例模型以及各种边际半参数模型等.主要使用的估计方法有:计数过程鞅方法和各种似然方法,包括极大似然、拟似然、伪似然、部分似然、偏似然、边际似然、经验似然等.实际观察数据中,反映变量与删失时间往往具有某种相依性,使得对复杂删失数据的统计建模和推断变得十分困难,传统的方法不适用,必须寻找新的有效的统计方法.目前这方面的研究已有一些进展.其中,Emoto和Matthews[2]在生存时间与删失时间服从二维Weibull模型下研究了参数的极大似然估计;Huang和Wolfe[3]在随机效应变量服从对数正态下,利用EM算法获得了成组数据的估计方法;Wang等人[4]和Huang等人[5]分别研究了带信息删失和死亡时间的复发事件数据的估计问题;Zeng[6,7]利用协变量降维和似然方法讨论了比例风险模型的估计方法;Huang等人[8]利用随机效应和条件似然方法研究了面板计数数据的估计问题;Peng和Fine[9]利用人为的删失方法讨论了相依删失下加速寿命模型的秩估计;Sun等人[10,11]分别利用半参数条件模型和联合模型两种方法研究了纵向数据相依结构下复杂删失数据统计建模问题407下反映变量依赖观察时间和删失时间的估计问题.
       由于反映变量与删失时间存在各种复杂的相依关系,目前仍然存在着一些重要的难题有待于寻找有效的统计方法去解决.主要是怎样充分利用数据提供的信息,合理地建立这些相依变量所满足的统计模型.对于非参数模型,如何获得其最有效的估计;对于一些高维数据,为了避免维数祸根问题,需要寻找合理的半参数模型来拟合数据,同时给出有效的模型参数估计和模型检验方法.另外,对于相依结构下带有测量误差或者丢失的复杂删失数据统计建模也是需要研究的前沿统计问题.这些研究结果将为临床诊断提供重要的理论依据和实际指导,并对生物和医学等领域的研究起着推动作用.
参考文献
KalbfleischJD,PrenticeRL.TheStatisticalAnalysisofFailureTimeData.2ndedHoboken:Wiley,2002
EmotoSE,MatthewsPC.AWeibullmodelfordependentcensoring.AnnStatist,1990,18:1556—1577.
HuangX,WolfeRA.Afrailtymodelforinformativecensoring.Biometrics,2002,58:510-520
WangMC,QinJ,ChiangCT.Analyzingrecurrenteventdatawithinformativecensoring.JAmerStatistAssoc,2001,96:1057—1065
HuangCY,WangMC.Jointmodelingandestimationforrecurrenteventprocessesandfailuretimedata.JAmerStatistASSOC,2004,99:1153—1165
ZengD.Estimatingmarginalsurvivalfunctionbyadjustingfordependentcensoringusingmanycovariates.AnnStatist,2004,32:1533—1555
ZengD.Likelihoodapproachformarginalproportionalhazardsregressioninthepres。enceofdependentcensoring.AnnStatist,2005,33:501—521
HuangCY,WangMC,ZhangY.Analysingpanelcountdatawithinformativeob。servationtimes.Biometrika,2006,93:763—775
PengL,FineJP.Rankestimationofacceleratedlifetimemodelswithdependentcensoring.JAmerStatistAssoc,2006,101:1085.1093
SunJ,ParkDH,SunL,ZhaoX.Semiparametricregressionanalysisoflongitudinaldatawithinformativeobservationtimes.JAmerStatistASSOC,2005,100:882—889
SunJ,SunL,LiuD.Regressionanalysisoflongitudinaldatainthepresenceofinfor—mativeobservationandcensoringtimes.JAmerStatistAssoc,2007,102:1397-1406
撰稿人:孙六全中国科学院数学与系统科学研究院
“10000个科学难题”数学编委会编著.10000个科学难题 数学卷.科学出版社,2009.05.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群