全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 学道会
1446 0
2020-08-20
数据分析Python统计——主成分分析用法

from sklearn.preprocessing import *
raw=data.iloc[:,4:10]
zraw1=StandardScaler(copy=True,with_mean=True, with_std=True).fit_transform(raw)#z变换,with_std=False对中处理
#============主成分分析===============
from sklearn.decomposition import PCA
pca=PCA(n_components=6)
pca.fit(zraw1)
pca.explained_variance_ #主成分特征值,解释方差
pca.explained_variance_ratio_#主成分的解释方差百分比
pca.components_#特征向量

# #-----保存主成分------
pca1 = PCA(n_components=2).fit_transform(zraw1)#累计贡献率
raw[[\"z1\",\"z2\"]]=pd.DataFrame(pca1)
raw
# #-----主成分回归------
x=pd.concat([data.iloc[:,[2,3]],raw[[\"z1\",\"z2\"]]],axis=1)#2:年龄,3:学历
y=pd.DataFrame(data.iloc[:,10])
from sklearn.linear_model import SGDClassifier
sgdLog_clf=SGDClassifier(loss=\'log\',random_state=123)
sgdLog_clf.fit(x,y)#拟合训练集数据
sgdLog_clf.score(x,y)#非监督模型是transform

#============主成分分析===============
from sklearn.decomposition import PCA
pca=PCA(n_components=6)
pca.fit(zraw1)
pca.explained_variance_ #主成分特征值,解释方差
pca.explained_variance_ratio_#主成分的解释方差百分比
pca.components_#特征向量

# #-----保存主成分------
pca1 = PCA(n_components=2).fit_transform(zraw1)#累计贡献率
raw[[\"z1\",\"z2\"]]=pd.DataFrame(pca1)
raw
# #-----主成分回归------
x=pd.concat([data.iloc[:,[2,3]],raw[[\"z1\",\"z2\"]]],axis=1)#2:年龄,3:学历
y=pd.DataFrame(data.iloc[:,10])
from sklearn.linear_model import SGDClassifier
sgdLog_clf=SGDClassifier(loss=\'log\',random_state=123)
sgdLog_clf.fit(x,y)#拟合训练集数据
sgdLog_clf.score(x,y)#非监督模型是transform
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群