求教：stata中，如何用主成分分析法把多维指标降维成一个综合指标

phj1565

2018-4-1 10:39:07

akikoyu 发表于 2018-3-13 17:27
是的啊

请问，这个predict f1 出来的f1代表的是缩减后出来的变量吗？是不是可以直接用f1做回归了呢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大壹子

2018-4-10 11:19:27

akikoyu 发表于 2017-2-24 10:27
是这样的，如果你在pca X1 X2 X3 X4 X5 X6 之后，会出现一张表格。
选择所有特征根（Eigenvalue）＞1 的 ...

请问算出来综合指标值是负数怎么处理呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

中山舰7

2018-10-13 13:19:16

小小小小小羊发表于 2017-11-28 10:35
您好，
请问一下1、在做主成分分析时，pca v1-v25,然后进行KMO检验，显示
correlation matrix is singul ...

请问你第一个问题解决了么？我也遇到了这个问题，好着急

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

中山舰7

2018-10-13 13:19:20

小小小小小羊发表于 2017-11-28 10:35
您好，
请问一下1、在做主成分分析时，pca v1-v25,然后进行KMO检验，显示
correlation matrix is singul ...

请问你第一个问题解决了么？我也遇到了这个问题，好着急

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Lu-C

2018-12-11 16:54:20

中山舰7 发表于 2018-10-13 13:19
请问你第一个问题解决了么？我也遇到了这个问题，好着急

如果出现这个，应该是你的变量设定有问题，存在一个变量可以完全代替另一个变量的情况，即，你参与主成分分析的变量定义中，存在重复的现象，或者数据完全成比例的现象，比如，x1的值为（1,2,3,4,5），x2的值为（2,4,6,8,10）。我之前也出现这个问题，然后查出来是我在变量定义的时候，将变量符号直接复制到另一个定义中，忘记改掉，导致生成的两个参与主成分分析的变量完全一样了。改掉，或去掉其中一个应该就可以了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bulerao5

2019-2-17 23:53:52

Lu-C 发表于 2018-12-11 16:54
如果出现这个，应该是你的变量设定有问题，存在一个变量可以完全代替另一个变量的情况，即，你参与主成分 ...

您好，请问面板数据可以用PCA降维吗？求指教

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Lu-C

2019-2-25 17:50:12

bulerao5 发表于 2019-2-17 23:53
您好，请问面板数据可以用PCA降维吗？求指教

这个我也不大清楚，不好意思，因为我学习的时候是用的spass来做主成分和因子分析，一般都是截面数据，但我看论坛上也是有用stata在做面板数据的时候做因子和主成分，所以，应该，大概，也许，是可以的吧

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bulerao5

2019-2-27 14:30:23

Lu-C 发表于 2019-2-25 17:50
这个我也不大清楚，不好意思，因为我学习的时候是用的spass来做主成分和因子分析，一般都是截面数据，但我 ...

谢谢~我已经放弃用这个方法了哈哈

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

th6j6ry

2019-3-5 12:01:36

bulerao5 发表于 2019-2-27 14:30
谢谢~我已经放弃用这个方法了哈哈

请问你想到了怎么对面板数据提取综合指标吗，这个pca我好像会了，但是不能时序只能截面啊，听说时序得用gpca，可是没看到方法介绍

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

th6j6ry

2019-3-5 12:22:17

akikoyu 发表于 2017-2-24 10:27
是这样的，如果你在pca X1 X2 X3 X4 X5 X6 之后，会出现一张表格。
选择所有特征根（Eigenvalue）＞1 的 ...

老师我觉得我已经理解了你用pca得到截面数据的综合指标的方法，我想问如果我想得到面板数据的综合指标呢，我可不可以把每一年的综合index算出来，直接逐年排开呢，也就是很想知道，这样做的话，同一部门生成的综合index是不是逐年可比、反应了变化的

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bulerao5

2019-3-6 15:25:52

th6j6ry 发表于 2019-3-5 12:01
请问你想到了怎么对面板数据提取综合指标吗，这个pca我好像会了，但是不能时序只能截面啊，听说时序得用g ...

我现在使用熵值法赋权重，求出得分。之前看到有帖子说用动态因子分析法做，但是我不会。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

不做闲鱼

2019-3-12 09:17:22

bulerao5 发表于 2019-3-6 15:25
我现在使用熵值法赋权重，求出得分。之前看到有帖子说用动态因子分析法做，但是我不会。

请问你是用熵值法对面板数据赋值吗，程序可以分享一下吗，我在网上找的程序，按每一年跑，这个年分内所有城市的综合值相加等于一，这肯定是不对的，但是我又不知道错在哪里，可以看看你的程序吗。拜托了，谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

特价机票中心e5

2020-2-10 13:44:08

车仔508 发表于 2018-3-13 10:17
如果特征根（Eigenvalue）＞1 的成分（Comp）有1个，其所对应的Proportion值为0.6828，是不是
再用代码： ...

你好，请问proportion怎么弄到数据里啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

特价机票中心e5

2020-2-10 13:48:47

车仔508 发表于 2018-3-13 10:17
如果特征根（Eigenvalue）＞1 的成分（Comp）有1个，其所对应的Proportion值为0.6828，是不是
再用代码： ...

你好，请问用stata求主成分，我看有很多论文里也给出了二级指标的权重，请问权重是用哪个命令出来的啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

早春的树－

2020-3-22 01:16:58

th6j6ry 发表于 2019-3-5 12:01
请问你想到了怎么对面板数据提取综合指标吗，这个pca我好像会了，但是不能时序只能截面啊，听说时序得用g ...

请问你找到方法了吗？最近也在苦恼面板数据的主成分分析怎么做。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

dinga1128

2020-3-31 19:12:39

akikoyu 发表于 2017-2-24 10:27
是这样的，如果你在pca X1 X2 X3 X4 X5 X6 之后，会出现一张表格。
选择所有特征根（Eigenvalue）＞1 的 ...

那么理论上，是不是可以把Eigenvalue值<1的，也视作主成分，进行计算，从而在不损失信息的情况下，得到一个综合指标？
请问，是否可以这么理解？
我的意思是，如果5个指标，爱根值大于1的只有2个。是否可以把剩下那个小于1的Proportion也分别乘以f3、f4和f5。这样，5个指标的所有信息就都保留了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

康利沃普9

2020-6-13 20:27:50

dinga1128 发表于 2020-3-31 19:12
那么理论上，是不是可以把Eigenvalue值

同问！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

康利沃普9

2020-6-13 20:28:36

大壹子发表于 2018-4-10 11:19
请问算出来综合指标值是负数怎么处理呢？

同问，综合值是负数如何解释呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

半夏吹雪

2020-7-15 22:52:08

qjhong 发表于 2013-5-27 21:02
1、首先，需要对变量进行哪些检验？KMO？还有什么？KMO检验结果符合什么条件才能继续进行主成分分析？

...

您好，请问时间序列也可以用这个方法pca进行降维吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

赵安豆

2025-6-3 19:36:23

在Stata中使用主成分分析法（PCA）将多维指标降维为一个综合指标的过程中，确实有一些步骤需要按照特定顺序执行。下面我将尝试详细解释您的问题。

### 1. 需要对变量进行哪些检验？

- **KMO 检验**：Kaiser-Meyer-Olkin Measure of Sampling Adequacy（KMO）是一种度量矩阵的适当性以进行因素分析的方法，较高的 KMO 值（通常认为大于 0.6 或更高为合适）表示变量之间的相关性较强且适合使用因子分析或主成分分析。
- **巴特利特球形检验**：Bartlett's Test of Sphericity 检查变量之间是否存在显著的相关性。如果数据不是随机的，而是存在某种关系，则该测试将拒绝零假设。

### 2. 方差贡献率是权重吗？

方差贡献率是指每个主成分解释了总变异性的多少百分比，并不直接作为权重使用。通常情况下，在PCA后选择前几个累积方差贡献率达到一定比例（如80%或90%）的主成分来构建综合指标。

### 3. 使用 `predict` 命令

- 正确执行 `pca y1 y2 y3 y4 y5` 后，你应当使用如下命令获取得分：`predict pc_y1 pc_y2 ..., score`

这里的`score`参数指示Stata计算并保存每个观测的主成分得分。通常情况下，如果只看到一个变量（例如 `pc_y1`）被创建，这可能是因为默认情况下Stata只会保留第一个主成分。为了获取所有主成分的得分，你需要明确指定你想要保留的主成分数量。

### 4. 如何构建综合指标？

构建综合指标时，并非简单地将每个原始变量乘以其对应的方差贡献率再求和。而是根据得到的得分来计算。假设你决定使用前两个主成分作为综合指标的一部分，那么你可以这样操作：

```stata
predict pc_y1 pc_y2, score
gen composite_Y = pc_y1 * sqrt(eigenvalue[1]) + pc_y2 * sqrt(eigenvalue[2])
```

其中 `eigenvalue` 是在执行PCA后Stata存储的每个主成分的特征值。使用特征值而非方差贡献率是因为这更直接地反映了数据在该方向上的变异。

请注意，对于解释变量X同样适用以上步骤。务必确保对所有数据进行标准化处理（如通过执行 `standardize x1 x2 ...` 或者在PCA命令中加入 `std` 参数），以避免量纲影响结果。

最后，在使用这些综合指标进行回归分析前，请检查它们是否符合线性模型的基本假设，包括但不限于正态分布、独立性和同方差。如果必要，可能需要进一步的转换或调整来满足这些条件。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群