全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
1874 3
2014-08-11
如果我们确定地知道,1万个里面的任意1个是怎样的,我们就能知道这1万中的20个做为新的样本空间会怎样。

接下去,当我们知道了新样本空间中的任意一个的新特性后,我们怎么知道1万个里面的任意一个新特性的?

我们得到的信息可能不及新的小样本空间中的详细,但是我们能知道更粗糙层面上的信息吗?

比如,要想知道新研发的疫苗对于8到9岁孩子预防某种疾病的效果,最好的办法就是,给全部的8到9岁孩子注射新研发的
疫苗?到了一定的时候再全部收集信息就知道效果了。不对的,因为会不知道要是不注射疫苗会怎么样。

那好,把所有的8到9岁孩子随机的分为两组,一组注射,一组不注射。到了一定时候,收集全部的信息就知道疫苗是否有
效。(1)如果注射疫苗的孩子里面健康的比例高,说明疫苗有作用。那么,到药效过后的几年,就给全部8到9岁的孩子
注射疫苗,总是没错的。(2)如果注射疫苗的孩子里面健康的比例比对比组的低,那么,各种纠纷就开始了。

还是不够好。如果用两个维度评价新疫苗:有无副作用;是否预防有效。

如果新疫苗既无副作用也能有效预防,就让它上市。

如果上面前半句话能通过检验,我们就说它成立。

那么,我们通过的标准是什么,为什么要选取这个标准?
-----------------------------------------------------------------------------------------------------------------------------------------------------
概率统计提供了十分丰富的方法,可以在清楚目的和方法适用条件之后,进行组合选择。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-8-11 15:12:17
搬凳子,坐等大神开讲。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-11 15:22:51
看看!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-12 15:18:54
楼主其实讲了几个问题:
1.统计的预测能力。是总体预测个体还是个体预测总体。个体预测群体的话,个人的代表性不足,不足以预测总体,这也就造成了趋群谬误;而反之,以总体特性来预测个体特性,则会有生态学谬误的危险。最典型的就是打地图炮,地图炮就是一种生态学谬误,先给某几个省打上标签,然后就认为来自这个省的某个具体个人具有“该省人口的特性”,这当然不严肃了。
寻求个体对总体的代表性,还要针对总体设计一个合理的抽样方案,抽取适当比例的样本。不过我们仍然不能说这就足够了,抽样同样是一个概率的过程,同样会产生偏差。
2.实验组和对照组的问题。
不知道楼主关注过“选择性偏误(selection bias)”这个问题没有。
你举得第一个例子,没有对照组,缺乏一个比较;第二个例子,有对照组有实验组,但仍然不满意,为什么呢?因为存在样本选择性。我们能比较的,只是实验组和控制组。这两个组的结果,存在诸多干扰因素:参加实验的人如果不参加实验,会不会真的像对照组一样?反过来,对照组的人如果参加试验,那又是怎样一种场景?而且,两组人在分配时候,所谓的随机指派(randomized match)也只是基于每个人同质性的假定,而事实上,每个人的身体素质都不一样。
样本选择性的存在,就会导致模型中的内生性问题。解决这个问题,一般就是用随机化的实验如Fisher对《妇女品茶》的解释;或者就只能在模型上进行纠正,比如倾向值分析(PSA),针对进入“实验(选择)”的每个人都进行一个倾向分值的匹配,这样,就可以在不“分裂”个人的情况下,得知他在两种条件下的情况。
3.假设检验的问题
这个就要看统计标准是怎么制定了,要什么结果,把风险控制在多大水平上。
一般制定政策或者评估的话,大致就是这样吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群