全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1644 3
2017-06-30



以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文


主成分分析是数据科学中常见的降维方法,今天将向大家介绍在 Python 中利用 Scikit-Learn 工具包进行主成分分析的方法与技巧。


首先导入相关的可视化库,并构建示例数据:


复制代码
复制代码


1.jpg

如上所示,第一组示例数据为一组样本量为200的随机的二维数组。接下来我们导入 Scikit-Learn 中用于主成分分析的 PCA 模块,构建一个主成分分析模型对象,并进行训练。在这次构建中,我们设定 PCA 函数的参数 n_components 为2,这意味这我们将得到特征值最大的两个特征向量:


复制代码
PCA(copy=True, n_components=2, whiten=False)
模型训练完成后, components_ 属性可以查看主成分分解的特征向量:
复制代码
[[ 0.94446029  0.32862557] [ 0.32862557 -0.94446029]]
explained_variance_ 属性可以中查看各个主成分的解释方差:
复制代码
[ 0.75871884  0.01838551]
我们可以通过如下方式将主成分分析中的特征向量描绘出来,下图中向量的起点为样本数据的均值向量:
复制代码
2.jpg

以上内容节选自 数析学院,后文还有介绍 参数调整、图像降维实例等,内容较多,先搬运到这,有需要的同学可以先直接到 数析学院 查看原文
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-7-1 09:48:15
感谢分享好资源!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-7-3 00:40:06
谢谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-7-4 10:30:44
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群