全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 LISREL、AMOS等结构方程模型分析软件
17196 13
2010-02-08
论坛上有不少童鞋和我有着同样的问题,那就是关于SEM变量标准化的问题,版主曾在一个贴子下很模糊地说参考Fisher 1946文章, 可是文章不给个标题,非牛人的我就无从参考,遂又将版上其他童鞋已经提过的问题又再次提问,希望有经验的研究者能给我们一些答案或建议:

我的调查问卷的答案设计,有三种方式:1)“有”,“没有”型,以1或0定量
2)程度型,以1,2,3,4分别定量”完全不同意“,”不好说“,”同意“,”完全赞同“
3)让受访者直接填数字,比如,考试分数。

为了使用SEM,我将第3个”考试分数“分类一下,使其成为分类变量,1:90以上,2:80-90,3:70-80, 4:60-70,5:不及格

即使这样,我还有一个担心就是变量的标准化,我需不需要按照0-1变量的标准来定义我的分类变量,即:
1)“有”,“没有”型,以1或0定量
2)1,2,3,4程度型变量以0.25, 0.5  0.75 1 (控制在0-1之间)
3)由高考分数转化的分类变量改为:0.2, 0.4, 0.6, 0.8,1(也和2)一样,控制在0-1之间

这样就可以保证所有的观测变量都在同一个区间0-1之间。需要这样处理吗?还是说0-1虚拟变量可以和1-4或1-5分类变量同时使用在SEM中?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-2-9 23:21:28
本来是想回复前面那个悬赏贴的,但是一则怕有人说我财迷,二则那贴的主题太分散,我想还是一次回答一个问题比较好,
谈一些我个人的观点,不知道对错,别问我要文献依据,自己去网上找。

1.  楼主的这个问题的实质,是 “等级变量和非正态变量”如何分析的问题,0-1变量,只是等级变量的特例

2、在一般的分析中,我们是假设将等级变量(李科特变量就是典型的等级变量)作为连续变量在处理。事实上这样做的统计结果是有偏的。

3、如果你用的是原始数据进行分析,那么你应当知道,在生成 psf 后,需要有一个将等级变量设置为连续变量的过程。

4、有文献分析认为,对于7点尺度以上的等级变量,与连续变量的统计分析结果差别不大。我一直想验证这一结论,但是我没有时间。

5、如果你不想将等级变量连续化,或者你不能将等级变量连续化(如0-1二分变量),那么,你可以按以下步骤来处理,虽然这是SEM方法分析等级数据或高度非正态分布数据时的不得已的方法,但是聊胜于无。

=====================这是传说中的分隔线====================

当观测变量是数值型变量,但是却高度非正态时,用lisrel的默认方法来进行分析,通过计算协方差矩阵或者积差相关矩阵,并且用ML或者GLS方法来拟合,是错误的,因为这会严重歪曲参数估计的值,得到错误的卡方值和标准误。(有文献认为是低估)

较好的方法,是采用等级样本协方差矩阵,用WLS方法进行估计,并采用正确的加权矩阵。同时,样本容量要求尽可能的大,否则有害无益。

仅供参考。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-9 23:23:43
1# yellowriver

补充一下: 你对数据进行标准化之前,需要先了解一下标准化的意义和作用。
对于正态分布(包括很大程度上偏离正态分布的伪正态分布)的数据来说,是否对数据进行标准化,对结果影响不大。
另外:你将连续变量转为 等级变量,实际上损失了很多信息,属于 倒行逆施。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-10 16:48:55
知道了,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-25 13:56:43
学习了,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-9 00:49:49
在lisrel 及mplus中不管是連續或類別變項並存皆可
透過求得特殊矩陣來進行分析
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群