想把某一省份分为三个部分,在Stata中应该怎么做呢?
由于刚刚才接触到Stata,尚处于朦胧状态,期望哪位大虾能帮小女子这个忙,我将不胜感激
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
the same question!
对三个部分(变量)分别取值:0和1。例如,将江苏分为苏北、苏中和苏南,对于南通的值,则有:苏北(0)、苏中(1)、苏南(0)。你试试看...意见仅供参考!
谢谢,我试试看
试试这个。
在数据编辑窗口给变量region按要求赋值成苏北、苏中和苏南。执行如下命令自动生成虚拟变量:fq1,fq2,fq3。
tabulate region, generate(fq)
其中region和fq是用户设定的。
我想问个问题,如果是把全国所有的省份分为三个部分,即东部、西部与中部,在各个省份表示上应该要设置虚拟变量进行处理吧?那应该怎样设置虚拟变量呢?因为对这个软件也正处于摸索阶段,希望哪位高手指教下。在此先万分感谢了!
不需要吧
如果作回归可以用xi命令
xi: reg y x1 x2 i.region
我是要比较一项投资在这三个部分之间的差别,可不可以不做虚拟变量,直接分别在三个部分中进行回归分析,然后在用这三个回归进行比较呢。
也可以的,
在此,需要提醒的是,在设置虚拟变量时要先拟定基准组。例如,如果将全国分为东部、中部和西部三部分,在设置虚拟变量时,可以拟定任一区域为基准组,余下只要设两个虚拟变量即可。否则,会引起完全多重共线性,容易陷入虚拟变量陷阱(dummy variable trap) 在此帖之前,我所举例的苏北、苏中和苏南问题亦同样需要注意该问题。
最好不要这样,误差自由度是不一样的,会影响估计模型的精度。采用虚拟变量(例如2个)时自由度是n-k-2-1。三个方程时分别是:n1-k-1,n2-k-1,n3-k-1,如果是平衡样本,有n1=n2=n3=n/3。不是是否可以比较的问题。