大家好,我目前在一家P&C保险公司做predictive modelling的实习。我自己学的是数学专业,所以基本统计的东西都要靠自己学。现在我打算用Generalized linear model做模型,但是有几个问题看书的时候不是特别明白,不知道有没有好心人可以指点一下?
1. 书上说response variable y服从exponential family中的一种. 不知道这里说的是y值的分布,还是y值conditioned on X=x的分布?
2. 之前组里的同事看了一下我画的histogram(横轴是y不同的取值,纵轴是frequency),说这个看着像gamma,让我exponential family选gamma. 我的问题是,假如exponential family指的是conditional distribution,那看histogram是不是没有办法决定用具体哪一种?假如是的话,那一般如何判断用哪一种distribution?