Scikit-Learn 库简介

958

收藏 2017-06-06

以下内容转自数析学院，只节选了部分，有需要的同学可以直接查看原文

下面将向大家介绍 Python 中大名鼎鼎的机器学习工具库 Scikit-Learn。
为了使大家能更加清晰地了解 Scikit-Learn 中的相关功能，我们先对本节要用到的实例数据集 iris 做一个简单的介绍：

复制代码

iris 是机器学习分类研究中常用的一个经典数据集，可以看到，这个数据集包含了鸢尾花萼片与花瓣的长宽信息，并且包含了每一株鸢尾花的种类标记。利用 Seaborn 库，我们可以绘制下列样本特征分布图，来查看样本在不同特征维度下的分布情况：

复制代码

为了更方便地使用 Python 中机器学习的相关工具，我们有必要对样本的特征数据与分类标记进行一下划分，将其分别保存为 X_iris 与 y_iris：

复制代码

(150, 4)

复制代码

(150,)
好了，准备工作已经就绪，现在我们先把这份数据放在一边。为了更好地介绍 Scikit-Learn ，我们先来看一下线性回归模型的构建方法：我们构建了如下示例数据：

复制代码

导入 Scikit-Learn 中的对应模块：

复制代码

模型参数设置：

复制代码

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

复制代码

(50, 1)
模型拟合：

复制代码

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
线性回归参数估计结果：

复制代码

array([ 1.9776566])

复制代码

-0.90331072553111458
后文还有介绍 Scikit-Learn 的几个机器学习的常用工具，内容较多，先搬运到这，有需要的同学可以先直接到数析学院查看原文

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2017-6-7 17:39:20

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享