本人是统计学初级学者,现在遇到一个问题,不知该用什么样的统计方法,请教各位。
我在计算一个比率,暂叫批复率吧,其定义是,假设申请100块,批复50块,则批复率为50%。
现在我这边有大量的申请数据,我把申请的数据按金额进行了分段,如0——100段,100-200段,200-500段,500-1000段,然后分段计算了每个段的批复率,最后计算一个总的批复率。总的批复率就是所有的批复金额除以对应的所有的申请金额。
领导要求,要算出那个段的批复率对总体批复率影响最大。
我计算了各个金额段申请金额占总申请金额的占比,批复金额占总批复金额的占比,
但是如何观察出那个金额段是影响最大的呢?
不知我说明白问题没有,能不能指导一下,谢谢!!
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
最近怎么这么多人问多元回归的。
你可以检验相关性高低啊,比如0-50这一段批复率增加1,总的批复率怎么变?像弹性差不多的。这就检验出各段批复率对总批复率的影响高低了。初级的统计学书上都有的多元回归,随便对着个例题用Excel做一下就好了。07里的数据-数据分析。
楼主,我的本意是这样
p=(a1+b1+c1+d1)/(a+b+c+d),其中,p1=a1/a,p2=b1/b,p3=c1/c,p4=d1/d
要找出,a\b\c\d哪个对p的影响最大
你的意思是不是这个样子,做一个,p与p1,p2,p3,p4之间的线性回归,根据回归表达式中各个因变量的系数,判断p1\p2\p3\p4的影响大小?
我想问下,可以这样分析吗?因变量实际上是由各个自变量计算出来的,然后做这样的线性回归,我一直担心有问题,但是有什么问题,我又说不上来。
谢谢!
这位同志说的有道理,这就相当于是一个自回归问题了。
你看你的这个“p=(a1+b1+c1+d1)/(a+b+c+d)”,这就相当于你已经假定各个段的权重都是1了,你还要再通过数据来计算你的权重,这不是很矛盾吗?