Scikit-Learn 主成分分析

1694

收藏 2017-06-30

以下内容转自数析学院，只节选了部分，有需要的同学可以直接查看原文

主成分分析是数据科学中常见的降维方法，今天将向大家介绍在 Python 中利用 Scikit-Learn 工具包进行主成分分析的方法与技巧。

首先导入相关的可视化库，并构建示例数据：

复制代码

如上所示，第一组示例数据为一组样本量为200的随机的二维数组。接下来我们导入 Scikit-Learn 中用于主成分分析的 PCA 模块，构建一个主成分分析模型对象，并进行训练。在这次构建中，我们设定 PCA 函数的参数 n_components 为2，这意味这我们将得到特征值最大的两个特征向量：

复制代码

PCA(copy=True, n_components=2, whiten=False)
模型训练完成后， components_ 属性可以查看主成分分解的特征向量：

复制代码

[[ 0.94446029 0.32862557] [ 0.32862557 -0.94446029]]
explained_variance_ 属性可以中查看各个主成分的解释方差：

复制代码

[ 0.75871884 0.01838551]
我们可以通过如下方式将主成分分析中的特征向量描绘出来，下图中向量的起点为样本数据的均值向量：

复制代码

以上内容节选自数析学院，后文还有介绍参数调整、图像降维实例等，内容较多，先搬运到这，有需要的同学可以先直接到数析学院查看原文

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2017-7-1 09:48:15

感谢分享好资源！

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2017-7-3 00:40:06

谢谢分享

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2017-7-4 10:30:44

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享