【SAS代码模板】判别分析_discrim
www.jiayounet.com
感谢数说工作室
(1)简易代码模板
此判别分析适用于具有一个分类变量和若干数值型变量的数据,即类似如下的数据:
| 类别 | 指标1 | 指标2 | …… | 指标m |
1 | 类别1 | | | | |
2 | 类别1 | | | | |
3 | 类别2 | | | | |
..... | | | | | |
n | | | | | |
n+1 | | | | | |
Discrim过程可以判别观测值n和n+1的归类情况,是属于类别1还是类别2。
下面是判别分析的简易代码。
————————————————模板—————————————————
————————————————模板—————————————————
Testdata=指定用于判别分析的数据集,可以缺省,缺省即对输入数据集中分类变量缺失的观测值进行判别。
Outstat=指定一个用于存储有关统计量的输出数据集,其中将包含均数、标准差、相关系数等。
Method=指定判别分析的方法,当数据服从正态分布,用参数法建立判别方差,此时设置method=normal,当数据不服从正态分布,用非参数法,此时设置method=npar。缺省时默认为参数法,即method=normal。
Simple输出全部样本和各类内的简单描述性统计量。
Wcov输出针对每一个类内协方差矩阵。
Distance在结果中输出类均数间的平方马氏距离、F统计量及其对应的概率值。
List在结果中显示训练样本回带的分类结果。
Var语句可以缺省,缺省时判别参考指标为未在其他语句中出现的全部指标。
(2)简例:
现在对如下数据work.a进行判别分析:
代码为:
输出结果可以看到线性判别式:
以及判别结果:
\[{{Y}_{0}}=-236.04+5.14034\times life+0.25167\times rate+0.02533\times gdp\]
${{Y}_{1}}=-323.22+5.79107\times life+0.26498\times rate+0.03407\times gdp$