有这样一个案例:校园中一共有N个学生,N很大。现在考虑一个问题,到底有的多少人喜欢红色的衣服,即如果定义事件A={喜欢红色衣服},那么希望知道P(A)。 现在去做调研,某一天,我们观察到校园中有T1个同学穿着红色衣服,即如果定义事件B={穿着红色衣服},那么P(B)是可以度量的,P(B1)=T1/N。又过了几天,再统计一次,这次有T2个同学穿着红衣服,即P(B2)=T2/N。而且还发现,上次穿了红衣服的同学,这次又穿红衣服的人数为X,那么P(B2|B1)=X/T1。假如这里P(B1)=5%,P(B2)=6%,P(B2|B1)=20%.
现在的问题是,能依据这三个统计数值,来估算P(A)和P(A|B)么?或者来确定二者之间的取值关系?
这里有一个隐含逻辑是:喜欢红色衣服的人,不见得每天都穿红色衣服,即P(B|A)<1;而不喜欢红色衣服的人,也不见得一次都不穿红色衣服,即P(B|A^)>0,这里A^表示A的补集。