本书收录了超过100道机器学习算法工程师的面试题目和解答,其中大部分源于Hulu算法研究岗位的真实场景。本书从日常工作、生活中各种有趣的现象出发,不仅囊括了机器学习的基本知识,而且还包含了成为优秀算法工程师的相关技能,更重要的是凝聚了笔者对人工智能领域的一颗热忱之心,旨在培养读者发现问题、解决问题、扩展问题的能力,建立对机器学习的热爱,共绘
人工智能世界的宏伟蓝图
目录
]编辑
推荐序
前言
机器学习算法工程师的自我修养
第1章 特征工程
第1节 特征归一化
第2节 类别型特征
第3节 高维组合特征的处理
第4节 组合特征
第5节 文本表示模型
第6节 Word2Vec
第7节 图像数据不足时的处理方法
第2章 模型评估
第1节 评估指标的局限性
第2节 ROC 曲线
第3节 余弦距离的应用
第4节 A/B 测试的陷阱
第5节 模型评估的方法
第6节 超参数调优
第7节 过拟合与欠拟合
第3章 经典算法
第1节 支持向量机
第2节 逻辑回归
第3节 决策树
第4章 降维
第1节 PCA 最大方差理论
第2节 PCA 最小平方误差理论
第3节 线性判别分析
第4节 线性判别分析与主成分分析
第5章 非监督学习
第1节 K 均值聚类
第2节 高斯混合模型
第3节 自组织映射
神经网络
第4节 非监督学习算法的评估
第6章 概率图模型
第1节 概率图模型的联合概率分布
第2节 概率图表示
第3节 生成式模型与判别式模型
第4节 马尔可夫模型
第5节 主题模型
第7章 优化算法
第1节 有监督学习的损失函数
第2节 机器学习中的优化问题
第3节 经典优化算法
第4节 梯度验证
第5节 随机梯度下降法
第6节 随机梯度下降法的加速
第7节 L1 正则化与稀疏性
第8章 采样
第1节 采样的作用
第2节 均匀分布随机数
第3节 常见的采样方法
第4节 高斯分布的采样
第5节 马尔科夫蒙特卡洛采样法
第6节 贝叶斯网络的采样
第7节 不均衡样本集的重采样
第9章 前向神经网络
第1节 多层感知机与布尔函数
第2节 深度神经网络中的激活函数
第3节 多层感知机的反向传播算法
第4节 神经网络训练技巧
第5节 深度卷积神经网络
第6节 深度残差网络
第10章 循环神经网络
第1节 循环神经网络和卷积神经网络
第2节 循环神经网络的梯度消失问题
第3节 循环神经网络中的激活函数
第4节 长短期记忆网络
第5节 Seq2Seq 模型
第6节 注意力机制
第11章 强化学习
第1节 强化学习基础
第2节 视频游戏里的强化学习
第3节 策略梯度
第4节 探索与利用
第12章 集成学习
第1节 集成学习的种类
第2节 集成学习的步骤和例子
第3节 基分类器
第4节 偏差与方差
第5节 梯度提升决策树的基本原理
第6节 XGBoost 与GBDT 的联系和区别
第13章 生成式对抗网络
第1节 初识GANs 的秘密
第2节 WGAN:抓住低维的幽灵
第3节 DCGAN:当GANs 遇上卷积
第4节 ALI:包揽推断业务
第5节 IRGAN:生成离散样本
第6节 SeqGAN:生成文本序列
第14章 人工智能的热门应用
第1节 计算广告
第2节 游戏中的人工智能
第3节 AI 在自动驾驶中的应用
第4节 机器翻译
第5节 人机交互中的智能计算