全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1164 0
2020-08-06
免费的自定进度的学习路径,可用于#machinelearning和#deeplearning
在各种格式中,我被问到的最常见问题之一是:
“您能为#machinelearning和#deeplearning建议一条免费的自定进度的学习途径吗?”
在这篇文章中,我尝试一个答案
这是基于我主要在牛津大学工作/教书的人,但是我在这里只选择免费资源,即公开可用。
通常免责声明适用,即观点是我自己的
也。如果可以的话,我鼓励您通过购买付费版本的书来支持作者(我愿意)
创建这样的学习路径的挑战是:
它必须要有选择性-因为网络上有很多优秀的内容-但从学习的角度来看-可能会让人不知所措
您需要知道一个序列。我从教学经验中提供以下顺序
您需要一个端点,否则您将没有动力坚持下去,而您会辍学
因此,我的建议是:使用此学习途径作为指导,但可以根据需要缩短它。
尝试进行一系列小旅程–您将完成每个小旅程。
但是总的来说,请尝试维护序列和这些资源(请在它们之间信任我–我认为您不会错过任何东西!)
因此,第一个资源是一本书:Python数据科学手册-Jake VanderPlas撰写
整本书在github上是免费的,并且是一本相对容易阅读的书
涵盖以下主题
1. IPython:超越普通Python
IPython中的帮助和文档
IPython Shell中的键盘快捷键
IPython魔术命令
输入和输出历史
IPython和Shell命令
错误和调试
分析和时序代码
更多IPython资源
2. NumPy简介
了解Python中的数据类型
NumPy数组的基础
NumPy数组上的计算:通用函数
集合:最小,最大以及介于两者之间的所有内容
阵列计算:广播
比较,掩码和布尔逻辑
花式索引
排序数组
结构化数据:NumPy的结构化数组
3.使用熊猫进行数据处理
熊猫对象介绍
数据索引和选择
对熊猫中的数据进行操作
处理丢失的数据
分层索引
合并数据集:Concat和Append
合并数据集:合并和合并
汇总与分组
数据透视表
向量化字符串运算
使用时间序列
高性能熊猫:eval()和query()
更多资源
4.使用Matplotlib可视化
简单线图
简单散点图
可视化错误
密度和轮廓图
直方图,分格和密度
自定义情节图例
自定义颜色条
多个子图
文字和注释
定制刻度
定制Matplotlib:配置和样式表
Matplotlib中的三维绘图
具有底图的地理数据
Seaborn的可视化
更多资源
5.机器学习
什么是机器学习?
Scikit-Learn简介
超参数和模型验证
特征工程
深度:朴素贝叶斯分类
深入探讨:线性回归
深入:支持向量机
深入研究:决策树和随机森林
深入:主成分分析
深入:流形学习
深入探讨:k均值聚类
深入探讨:高斯混合模型
深度:内核密度估计
应用:人脸检测管道
进一步的机器学习资源
读完本书后,您将了解机器学习(但不是深度学习
因此,第二个资源不是一本书,即这本书是一本付费书籍(我建议您购买),但是作者的网站上有大量代码,可以以小型“烹饪书”格式运行
这本书是克里斯·阿尔邦(Chris Albon)撰写的《机器学习与Python食谱》
网站chrisalbon.com和我推荐的代码顺序如下
我喜欢这种格式,因为它适合刻意练习的学习方法,即很多小件事情都是单独练习的
最后,还有两个资源。
最近发布的一组keras示例和
一个免费的书籍参考书上的Python本身(而不是机器学习,但核心语言)。该网站是适用于所有人的Python(提供多语言翻译)
因此,回到网站chrisalbon.com的第二个资源的详细信息,我推荐的代码顺序如下
如果您喜欢这篇文章,请在Ajit Jaokar上关注我
图片来源:jooinn
机器学习
基本
从字典加载特征
加载scikit-learn的Boston Housing数据集
加载scikit-learn的Digits数据集
加载scikit-learn的Iris数据集
进行模拟数据分类
制作用于集群的模拟数据
使模拟数据回归
Scikit中的感知器
保存机器学习模型
向量,矩阵和数组
转置向量或矩阵
选择数组中的元素
重塑数组
反转矩阵
获取矩阵的对角线
展平矩阵
查找矩阵的等级
找到最大和最小
描述一个数组
创建向量
创建一个稀疏矩阵
创建一个矩阵
将字典转换成矩阵
计算矩阵的迹线
计算矩阵的行列式
计算平均值,方差和标准偏差
计算两个向量的点积
将操作应用于元素
加和减矩阵
预处理结构化数据
转换Scikit-Learn的熊猫分类数据
删除具有缺失值的观测值
删除缺失值
检测异常值
离散化特征
编码顺序分类特征
使用降采样处理不平衡的类
通过上采样处理不平衡的类
处理异常值
用均值估算缺失值
插补缺少的班级标签
使用k最近邻插补缺失的类标签
标准化观察
具有多个标签的一键编码功能
一键编码标称分类特征
预处理分类特征
预处理虹膜数据
重新缩放功能
标准化功能
预处理图像
对图像进行二值化
影像模糊
裁剪图像
检测边缘
增强彩色图像的对比度
增强灰度图像的对比度
哈里斯角落探测器
安装OpenCV
隔离颜色
加载图像
删除背景
保存图像
锐化图像
Shi-Tomasi拐角探测器
使用平均颜色作为特征
预处理文字
词袋
解析HTML
删除标点符号
删除停用词
替换字符
词干
带空格
标记词性
词频反向文档频率
标记文字
预处理日期和时间
将日期和时间分解为多个功能
计算日期和时间之间的差异
将字符串转换为日期
转换熊猫列时区
编码星期几
处理时间序列中的缺失值
处理时区
延时功能
滚动时间窗口
选择日期和时间范围
特征工程
稀疏特征矩阵的降维
使用内核PCA降低尺寸
使用PCA降维
使用PCA提取特征
使用K均值聚类的小组观察
为LDA选择最佳数量的组件
为TSVD选择最佳数量的组件
使用线性判别分析进行降维
功能选择
用于特征选择的方差分析F值
Chi-Squared用于特征选择
删除高度相关的功能
递归特征消除
方差阈值二元特征
特征选择的方差阈值
模型评估
准确性
创建基准分类模型
创建基准回归模型
交叉验证管道
使用网格搜索进行参数调整的交叉验证
交叉验证
自定义效果指标
F1分数
生成有关性能的文本报告
嵌套交叉验证
绘制学习曲线
绘制接收工作特性曲线
绘制验证曲线
精确
召回
将数据分为训练和测试集
选型
在模型选择过程中查找最佳预处理步骤
使用网格搜索进行超参数调整
使用随机搜索进行超参数调整
使用网格搜索选择模型
具有参数优化的管道
线性回归
添加交互条件
创建交互功能
Alpha对套索回归的影响
套索回归
线性回归
使用Scikit-Learn进行线性回归
岭回归
选择岭回归中的最佳Alpha值
逻辑回归
快速C超参数调整
处理Logistic回归中的不平衡类
逻辑回归
大数据的Logistic回归
具有L1正则化的Logistic回归
一比。休息逻辑回归
树木和森林
Adaboost分类器
决策树分类器
决策树回归
功能重要性
使用随机森林进行特征选择
处理随机森林中的不平衡类
随机森林分类器
随机森林分类器示例
森林随机回归
选择随机森林中的重要功能
泰坦尼克号与随机森林的竞争
可视化决策树
最近的邻居
确定k的最佳值
K最近邻居分类
基于半径的最近邻分类器
支持向量机
校准SVC中的预测概率
查找最近的邻居
查找支持向量
SVM中的类不平衡
绘制支持向量分类器超平面
使用RBF内核时的SVC参数
支持向量分类器
朴素贝叶斯
Bernoulli天真贝叶斯分类器
校准预测概率
高斯朴素贝叶斯分类器
多项式Lo??gistic回归
多项式朴素贝叶斯分类器
从零开始的朴素贝叶斯分类器
聚类
聚集聚类
DBSCAN群集
评估聚类
均值聚类
迷你批量k均值聚类
k均值聚类
深度学习
凯拉斯
前馈神经网络的二进制分类
前馈神经网络用于多类分类
前馈神经网络回归
添加辍学
卷积神经网络
LSTM递归神经网络
神经网络提前停止
神经网络权重正则化
预处理神经网络数据
保存模型训练进度
调整神经网络超参数
可视化损失历史
可视化神经网络架构师
可视化绩效历史
k折交叉验证神经网络

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群