因为是secondary data,无法自己收集数据,所以不要提用sampling or design的方法解决。
有一个针对罪犯的training program,只有那些表现良好的罪犯才会有机会进入这个training program,而那些不好的罪犯是进不了的。selection bias已经出现。要评估这个training program对找工作的用处有多大,所以dependent variable就1个dichotomous variable: find a job /cannot find a job within six months. 当然,independent variables有50多个。