Scikit学习分类算法
Scikit-learn是Python生态系统中使用的事实上的官方
机器学习库。如其官方网站所述,Scikit-learn是:
简单高效的数据挖掘和
数据分析工具
每个人都可以访问,并且可以在各种情况下重用
基于NumPy,SciPy和matplotlib构建
开源,可商业使用-BSD许可证
本教程旨在演示几种机器学习分类器,并且{受|启发。参考| 结合了以下出色作品中的技术:
兰德尔·奥尔森(Randal Olson)的示例机器学习笔记本
Analytics Vidhya的常见机器学习算法备忘单
Scikit-learn的官方交叉验证文档
Scikit-learn的官方Iris数据集文档
我最近写的这篇KDnuggets Python机器学习文章中可能包含了各种参考教程的影响
我们将使用著名的Iris和Digits数据集通过以下机器学习分类算法来构建模型:
逻辑回归
决策树
支持向量机
朴素贝叶斯
k近邻
随机森林
我们还使用不同的策略来评估模型:
独立的测试和培训数据集
k折交叉验证
还将采用一些简单的数据调查方法和工具,包括:
用Matplotlib绘制数据
通过熊猫数据框构建和数据
使用Numpy在多维数组和矩阵上进行构造和操作
本教程是简短,非冗长且切合实际的。如果发现不正确之处,请提醒我。另外,如果您发现它很有用,并认为值得这样做,请随时与我分享。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!