全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2484 3
2015-03-14
问卷中设计了两道选择题,一道为教育程度,选项为A到H,代表不同的教育程度。另一道为受访者认为登记有没有用,选项为A到C,分别为有用、没有用、无所谓。现在想利用stata进行相关性分析,分析是否教育程度越高,受访者对于登记的认可越强。
不知道利用何种命令,以及能否用regress命令?
求助各位大神,感激不尽。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-14 21:28:38
edu 值为1 2 3 ... 值越高教育水平越高
use 值为1 2 3,1=没用,2=无所谓,3=有用;

corr edu use 就显示相关性系数 了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-15 04:53:12
不需要也不合适。
先说不合适。教育程度不是间距变量,它的不同程度只能代表高低,不包含任何间距的信息,比如说你不能说初中和小学的差距等于初中高中差距,等于大学高中差距……但是如果你把它赋值为1、2、3,那么就默认它们是等间距的。没用、无所谓、有用也是如此,它们之间不是等间距的关系,如果说教育程度可能还勉强可以,那这个态度和间距扯不上一点关系。当然,如果赋值去做,一般不影响结论,但是不严谨,一般也没人这么做。
并且不需要。一般这样的相关性或者分组的趋势性分析是用方差分析或者列联表。
列联表(也有人叫交互标、n维表)适用于变量比较少的情况,多的情况也能做,但是看起来稍微麻烦一些。命令是tabulate,具体可以help)。
方差分析也很好,尤其是变量特别多的时候。不过它不能告诉你趋势,只能告诉你是否有相关性,以及各个解释变量各能解释被解释变量变异的多少。命令是anova,具体看help。它默认解释变量是离散变量(分组),当然连续变量也是可以用的,只需要把该变量写成c.var

往深里讲讲,如果非要用回归,也可以。但不是赋值成连续变量的那种用法。
这种情况下,被解释变量是离散的,那就要用probit/logit回归;解释变量也是离散的,要用虚拟变量(n个取值就要生成n-1个取值(少一个为了避免完全共线性))。关于这两个东西,随便找本计量书里都有,就算不知道原理,看结果也能懂个差不多。但到这还没完——
你知道么,其实这种回归方法(有且仅此一种)和列联表(tabulate)是完全等价的。完全可以在不做回归的情况下从二维联表(例子里是二维)推出这个回归里的所有系数,反着推也可以。这个东西可能在高计里可能会讲,或者看Donald Treiman《量化数据分析》。
(当然stata做方差分析的本质也是做这个回归,但这个是common sense了)
我说这个仅仅是想说不要迷信回归,别太依赖回归,回归不是计量的全部甚至不是多数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-15 04:56:15
o梧桐叶落o 发表于 2015-3-15 04:53
不需要也不合适。
先说不合适。教育程度不是间距变量,它的不同程度只能代表高低,不包含任何间距的信息, ...
列联表出来以后,多看看就好了。我记得初中高中的时候经常看这个啊,有时候语文题都可能出这么个表。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群