背景: 这是个关于random assignment的test, 所以"想要的结果"是
不能reject原假设(H_0: 一堆beta==0). [数据: 法庭判决的数据, 每天有好多好多人, 然后fixed effect 变量取作日期]
问题背景:
想要实现如下回归 (case_class by alltoment_date fixed effects 实际上是两组fixed effect, 不做交叉项的. 不晓得说法对不对)
Judge_Harsh on dfdn_traits and case_class by alltoment_date fixed effects, with standard errors clustered at judge level.
问题详述:
想要用xtreg来做Fixed Effect分析(把数量最多的fixed effect的变量设做了panelvar).
对standard error做cluster, 选用judge_code (judge的identifier), 但用如下的方程会报错.
错误代码: "panels are not nested within clusters"
xtreg里面有一个没有在帮助文件里面记录的选项: "nonest", 加在上面回归命令的末尾之后能运行并吐出结果了, 但因为控制"degree of freedom"本就是很需要技巧的事情, 其结果让人无话可说: F-统计量分母的自由度被降到了一个小于judge_code之unique value的整数. (judge_code有53个unique value, nonest 使得方差被约束到47个cluster, i.e. (Std. Err. adjusted for 47 clusters in judge_code))
与此同时, 若是直接用 vce(robust), (F-统计量之分母的)自由度是2389. 这个是小于allotment_date("数量最多的fixed effect")之unique value的一个整数. (后者是 2414 ).
考虑到$Dfdn_traits_important里面有9个变量, case_class里面有4个变量, 这个从vce(robust)里面吐出来的结果, 也不明觉厉.
试问: 要达到最开头提到的回归目的, 这F-test的自由度究竟该是多少? 有没有理论值?
另及, 一个尝试: 若由judge_code生成judge_code_by_year, 这样是视每年的每个judge的方差都不一样, 倒是会相应提高(分母)自由度, 但也是不能理解这个nonest是如何根据已有的cluster变量里面的组数来决定丫最后取cluster的数量. 只知道比cluster里面的组数小, 但小多少没准信儿(恩, 小的数值比被test的变量的个数(9), 要小).
最后-context: 理解到的institution background说, 是每天, 按照案件的组别(case_class)随借分配给Section(里面有judge). 是以, 在检验的时候, Fixed Effect要有"每天", 和"case_class"两组.
谢谢