各位高手,本人用stata做一个题,结果让我痛不欲生,数据见附件。
其中:因变量为雇员人数增长率,自变量固定资产投资增长率、注册资本增长率、雇主教育程度和雇主年龄。
其中的雇主的教育程度和年龄的数据是根据统计年鉴上过来的,例如教育程度的未上学、小学、初中、高中、大学及以上5个数据之和为100%。
我要分析自变量和因变量之间的数据关系。
首先,用reg命令进行分析,得到的结果是这样的
Source | SS df MS Number of obs = 5
-------------+------------------------------ F( 4, 0) = .
Model | .009282572 4 .002320643 Prob > F = .
Residual | 0 0 . R-squared = 1.0000
-------------+------------------------------ Adj R-squared = .
Total | .009282572 4 .002320643 Root MSE = 0
------------------------------------------------------------------------------
人数增长率 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
固定资产投资增长率 | -.4640303 . . . . .
注册资本增长率 | -1.168291 . . . . .
未上学 | (dropped)
小学 | 1.218974 . . . . .
初中 | (dropped)
高中 | (dropped)
大学及以上 | (dropped)
16-29 | -2.728219 . . . . .
30-39 | (dropped)
40-49 | (dropped)
50以上 | (dropped)
_cons | .9056238 . . . . .
------------------------------------------------------------------------------
. 进行相关性分析的结果:
| 人数增长率 固定资产增长率 注册资本增长率 未上学 小学 初中 高中 大学及以上
-------------+------------------------------------------------------------------------
人 数增长率 | 1.0000
固定资产投资增长率 | 0.0989 1.0000
注册资本增长率 | -0.3782 -0.8844 1.0000
未上学 | -0.1637 -0.8001 0.5861 1.0000
小学 | -0.0556 -0.4789 0.3126 0.8678 1.0000
初中 | -0.5919 -0.8458 0.8815 0.8022 0.5441 1.0000
高中 | 0.1398 0.6372 -0.4901 -0.9371 -0.9789 -0.6962 1.0000
大学及以上 | 0.5483 0.8321 -0.8197 -0.8773 -0.6604 -0.9876 0.7913 1.0000
16-29 | -0.4296 -0.8000 0.6557 0.9435 0.7110 0.9097 -0.8180 -0.9533
30-39 | 0.0562 -0.9812 0.8289 0.7151 0.3691 0.7336 -0.5262 -0.7122
40-49 | 0.2618 0.8579 -0.6536 -0.9689 -0.7229 -0.8669 0.8288 0.9156
50以上 | 0.2540 0.9596 -0.9530 -0.6438 -0.2728 -0.8614 0.4603 0.8064
| 16-29 30-39 40-49 50以上
-------------+------------------------------------
16-29 | 1.0000
30-39 | 0.6968 1.0000
40-49 | -0.9829 -0.7826 1.0000
50以上 | -0.7170 -0.9390 0.7470 1.0000
求教,我用的数据分析模型是不是错误的?雇主的教育程度和年龄的数据是不是有问题 ?