全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
883 1
2017-06-06
以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文

下面将向大家介绍 Python 中大名鼎鼎的机器学习工具库 Scikit-Learn。
为了使大家能更加清晰地了解 Scikit-Learn 中的相关功能,我们先对本节要用到的实例数据集 iris 做一个简单的介绍:

复制代码

1.jpg

iris 是机器学习分类研究中常用的一个经典数据集,可以看到,这个数据集包含了鸢尾花萼片与花瓣的长宽信息,并且包含了每一株鸢尾花的种类标记。利用 Seaborn 库,我们可以绘制下列样本特征分布图,来查看样本在不同特征维度下的分布情况:


复制代码

2.jpg

为了更方便地使用 Python 中机器学习的相关工具,我们有必要对样本的特征数据与分类标记进行一下划分,将其分别保存为 X_iris 与 y_iris:


复制代码
(150, 4)
复制代码
(150,)
好了,准备工作已经就绪,现在我们先把这份数据放在一边。为了更好地介绍 Scikit-Learn ,我们先来看一下线性回归模型的构建方法:我们构建了如下示例数据:
复制代码

3.jpg
导入 Scikit-Learn 中的对应模块:
复制代码

模型参数设置:
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
复制代码
(50, 1)
模型拟合:
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
线性回归参数估计结果:
复制代码
array([ 1.9776566])
复制代码
-0.90331072553111458
后文还有介绍 Scikit-Learn 的几个机器学习的常用工具,内容较多,先搬运到这,有需要的同学可以先直接到 数析学院 查看原文

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-7 17:39:20
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群