一个老生常谈的问题：虚拟变量与分类变量能否在一个SEM中并存？

17438

收藏 2010-02-08

论坛上有不少童鞋和我有着同样的问题，那就是关于SEM变量标准化的问题，版主曾在一个贴子下很模糊地说参考Fisher 1946文章, 可是文章不给个标题,非牛人的我就无从参考,遂又将版上其他童鞋已经提过的问题又再次提问,希望有经验的研究者能给我们一些答案或建议：

我的调查问卷的答案设计，有三种方式：1）“有”，“没有”型，以1或0定量
2）程度型，以1，2，3，4分别定量”完全不同意“，”不好说“，”同意“，”完全赞同“
3）让受访者直接填数字，比如，考试分数。

为了使用SEM，我将第3个”考试分数“分类一下，使其成为分类变量，1：90以上，2：80-90，3：70-80， 4：60-70，5：不及格

即使这样，我还有一个担心就是变量的标准化，我需不需要按照0-1变量的标准来定义我的分类变量，即：
1）“有”，“没有”型，以1或0定量
2）1，2，3，4程度型变量以0.25， 0.5 0.75 1 (控制在0-1之间）
3）由高考分数转化的分类变量改为：0.2， 0.4， 0.6， 0.8，1（也和2）一样，控制在0-1之间

这样就可以保证所有的观测变量都在同一个区间0-1之间。需要这样处理吗？还是说0-1虚拟变量可以和1-4或1-5分类变量同时使用在SEM中？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

辛勤工作

2010-2-9 23:21:28

本来是想回复前面那个悬赏贴的，但是一则怕有人说我财迷，二则那贴的主题太分散，我想还是一次回答一个问题比较好，
谈一些我个人的观点，不知道对错，别问我要文献依据，自己去网上找。

1. 楼主的这个问题的实质，是 “等级变量和非正态变量”如何分析的问题，0-1变量，只是等级变量的特例

2、在一般的分析中，我们是假设将等级变量（李科特变量就是典型的等级变量）作为连续变量在处理。事实上这样做的统计结果是有偏的。

3、如果你用的是原始数据进行分析，那么你应当知道，在生成 psf 后，需要有一个将等级变量设置为连续变量的过程。

4、有文献分析认为，对于7点尺度以上的等级变量，与连续变量的统计分析结果差别不大。我一直想验证这一结论，但是我没有时间。

5、如果你不想将等级变量连续化，或者你不能将等级变量连续化（如0-1二分变量），那么，你可以按以下步骤来处理，虽然这是SEM方法分析等级数据或高度非正态分布数据时的不得已的方法，但是聊胜于无。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝这是传说中的分隔线＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

当观测变量是数值型变量，但是却高度非正态时，用lisrel的默认方法来进行分析，通过计算协方差矩阵或者积差相关矩阵，并且用ML或者GLS方法来拟合，是错误的，因为这会严重歪曲参数估计的值，得到错误的卡方值和标准误。（有文献认为是低估）

较好的方法，是采用等级样本协方差矩阵，用WLS方法进行估计，并采用正确的加权矩阵。同时，样本容量要求尽可能的大，否则有害无益。

仅供参考。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

辛勤工作

2010-2-9 23:23:43

1# yellowriver

补充一下：你对数据进行标准化之前，需要先了解一下标准化的意义和作用。
对于正态分布（包括很大程度上偏离正态分布的伪正态分布）的数据来说，是否对数据进行标准化，对结果影响不大。
另外：你将连续变量转为等级变量，实际上损失了很多信息，属于倒行逆施。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

lzj5315

2010-5-10 16:48:55

知道了，谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

sunsnow1984

2010-5-25 13:56:43

学习了，谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

人地天道

2010-6-9 00:49:49

在lisrel 及mplus中不管是連續或類別變項並存皆可
透過求得特殊矩陣來進行分析

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

joycechild

2010-6-9 00:52:29

我果真是菜鸟级的。。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

henrykaka

2010-6-23 18:46:41

先对变量做逻辑回归,然后再估计结构方程系数的时候不要选ML,用WLS,加权最小二乘~~  如果类别多的话,可以把它当数值处理,去平均水平就行了~~我可不是瞎说阿,美国人在考虑收入分组的时候就是这么干的
转载：本文来自: 人大经济论坛详细出处参考：http://www.pinggu.org/bbs/viewth ... 1&from^^uid=98225