全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4942 4
2013-12-02
最近在做老师给的一个课程作业,其中遇到一些问题。希望有人能够帮忙解决。
有一组数据一共有128个人,其中包括60个patient with colorectal cancer,其他68个是control组的。对每个人的48个genes的基因表达程度进行了收集,得到相关数据。要分析出来那个基因会影响cancer。

老师给出了一种方法。就是先分别对每个基因进行rank。分别选取top 25%,50%,75%和bottom25%,50%,75%的patient和control的数据来做6组two sample t test。这样会得到6组t值,选取最大的那个t值的选取数据作为代表。
然后relable patient和control组,按照上述方法继续求t值,relable了1000次。计算出了所有大于第一次t值的次数n,p值就是n/1000。这时候在0.05的情况下有5组基因是显著的。

然后用multiple testing中的修正t值,用FDR求出ajust p值,可是在这个时候在0.05的情况下没有基因是显著了。

现在要改进这个方法,求问还有些什么统计方法可以找出patient和control组的那些基因会影响cancer啊。还有就是关于那个rank 25% 50% 75%的方法 有什么优点啊。我自己感觉可以直接用最简单的two sample test做检验出来p value 在用FDR做adjust p value啊~~~~
求大神指导
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-12-2 05:38:57
用holms-Bonfferroni 普通的adjusted critical value没有power

再fancy一点的话可以用iterative method based on holms-Bonfferroni.

先用一个critical value say 1/n 然后用holms-Bonfferoni 取出没有reject的hypothesis, 然后再在没有reject的上面用Holms-Bonfferoni, 应该是可以的 我没有证过 不过应该和moment selection的原理差不多..

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-2 15:15:49
可以用step-up Hochberg,Step-down minP, Step-down Sidak等。具体的话,你可以看一下综述:
a review of modern multiple hypothesis testing.上面的方法很多。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-10 22:32:02
学习学习,现在对FDR感兴趣中....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-14 22:39:47
hongmi1018 发表于 2013-12-2 04:32
最近在做老师给的一个课程作业,其中遇到一些问题。希望有人能够帮忙解决。
有一组数据一共有128个人,其中 ...
标记一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群