立即打开
CAIE人工智能脱产就业班
数智化人才必由之路
主讲老师:赵坚毅、常国珍、张涵诚、李御玺、徐杨、张彦存
【专家讲师】
赵坚毅博士
教育部中国成人教育协会副会长,中国社科院公共政策与经济高等研究院大数据中心副主任,斯坦福大学论坛特邀讲师嘉宾,中国人民大学博士。
在国内顶级期刊《中国社会科学》、《经济研究》、《金融研究》、《管理世界》《经济学家》发表期刊论文多篇,承接国家自然科学基金、国家社会科学基金多项,行政职务为中国社科院公共政策与经济高等研究院大数据中心副主任。2004年创立人大经济论坛(BBS.PINGGU.ORG),现改名为经管之家,用户超过1000万,是经管统计、大数据和AI教育领域最有影响力的站点。
常国珍博士
北京大学会计学博士, 中国大数据产业生态联盟专家委员会委员,北京语言大学金融硕校外导师,中国社会科学院大学等多所院校外聘讲师。15年金融、互联网行业数据科学实施和咨询服务经验。
张涵诚
大数据与互联网运营资深专家,中关村大数据交易产业联盟秘书长,中国大数据与智能计算主任专家,中国高校大数据与人工智能产业联盟专家,北大创新评论顾问专家、中国通信协会顾问专家,北大电子商务总裁班特聘讲师、大数据课题组主任,北京城市学院大数据学院特聘讲师,太原理工大数据大数据专家、中科院大数据特别讲师等,从事参与多家大数据企业的初建工作,并发表过多篇大数据有影响力的文章。
李御玺博士 (Yue-Shi Lee)
台湾大学计算机工程博士,铭传大学计算机工程学系教授兼系主任暨所长,铭传大学数据挖掘中心主任,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问。其研究领域专注于数据仓库、数据挖掘、与文本挖掘。
在其相关研究领域已发表超过300篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、第一银行、永丰银行、远东银行、美商大都会人寿、新光人寿保险公司、台湾微软、零售业如全联、赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如中国工商局、国税局等。
徐杨老师
英国Glasgow大学毕业,师从Hisayuki Yoshimoto。主攻计量模型与算法,研究方向为复杂数据空间的矩阵、参数识别与优化问题,对各种统计模型和机器学习/深度学习模型有深入研究。,主要负责CAIE认证项目以及机器学习/人工智能类课程的研发与授课,有着丰富的一线教学与项目经验。
曾连续两年任中国信息协会大数据分析竞赛首席评委。曾任中国大学生三创大赛大数据分析分赛评委。
在工商银行数据挖掘与算法建模项目,负责算法技术模块的授课与落地。服务过的客户还包括:华夏银行、新华都、龙盈智达、昆山农商银行总行、苏州银行总行、•中国人民银行结算中心、英国影子银行等。
张彦存老师
自动化专业,曾在轨道交通行业做计算机视觉相关应用开发工作。目前担任CAIE讲师,负责Python基础、清洗;NLP;数仓开发;大语言模型应用等课程授课。熟悉数据挖掘、数据分析、人工智能技术,擅长使用各类技术解决商业问题。并参与多家头部车企数据治理与应用项目。负责梳理数据需求,绘制数据资产地图及数据标准的编写、设计ETL方案等。参与多家银行数据赋能项目,负责NLP相关内容培训、落地指导工作。
【课程大纲】
阶段一 Python基础与数据应用
模块一 Python编程基础
1、Python与Anaconda简介
2、Python标准数据类型
3、基本语法规则
4、控制流语句
5、自定义函数
模块二 Python数据清洗与可视化
1、Numpy数组分析
2、Pandas数表分析
3、Pandas数据清洗与可视化
4、Python数据可视化包-Matplotlib介绍
5、Python数据可视化包-Seaborn介绍与图形绘制
6、PythonBI包-Pyecharts介绍与图形绘制
分析案例(4选2):
轮船生存数据分析
天猫白酒销售数据分析
餐厅小费数据分析
拉勾网招聘数据分析
模块三 Python办公自动化
1、SQL数据接入
2、Python连接SQL
3、多表数据自动提取
4、表格数据自动汇总
5、多表数据自动统计
6、Python发送测试邮件
7、Python计算数据指标
8、实现自动风控报表
模块四 ETL数据接入与数仓
1、ETL基本概念与常用工具
2、基于Python的ETL程序开发
3、定时执行Python程序
4、ETL程序连接数仓
5、ETL之Pandas实现
阶段二 人工智能理论
模块一 统计建模
1、数据挖掘基础内容(有/无监督,交叉验证、网格/随机搜索,模型评估方法、过/欠拟合)
2、相关分析
3、线性回归(模型的建立与估计)
4、统计模型的检验
5、逻辑回归(模型的建立与估计)
6、模型评估
7、L1和L2正则化以及这两种正则化下的回归算法应用
8、识别分析-用户支出影响因素分析案例
9、客户成交预测分析-客户成交与否案例分析
模块二 精准营销数据分析报告全流程实战案例
实战案例
1、背景研究与现状描述(现状,痛点,目标,范围)
2、目标拆解与描述
3、文献和案例分析(分析方法的理论依据)
4、数据需求(数据范围,变量的定义与筛选,维度问题)
5、分析方法与模型开发
6、应用分析(模型的产出与应用)
模块三 机器学习
(一)决策树
1、决策树原理
2、信息熵和Gini
3、决策树处理分类型和数值型特征
(二)聚类
1、客户分群业务知识
2、聚类的逻辑
3、Kmeans聚类建模流程
4、Kmeans客户分群应用
(三)集成学习
1、集成算法原理
2、Bagging:随机森林
3、Boosting:GBDT,XGBoost,LightGBM
案例:金融领域用户分群营销、欺诈识别
模块四 深度学习与人工智能
1、深度学习之神经网络
2、AIGC生成式人工智能路线图
3、编码器与迁移学习
4、Transformer架构
5、GPT技术架构与训练方法
6、Openaiapi之python代码实践
7、模型的本地部署代码实践
模块五 机器学习大型案例
实战项目-金融风控大型案例
阶段三 人工智能应用
模块一 人工智能通识及基础应用篇
一、人工智能基本概念
1、什么是人工智能
2、人工智能的主要应用方向
二、提示词技术
1、AI模型的运行逻辑
2、为什么需要提示词
3、提示词的要素:文本、占位符、分隔符等
4、基础的提示词与提示词的常见结构
5、AI模型可以做哪些任务及实践
6、高阶提示词
7、应用场景实践
三、AI商业工具
1、AI工具一览
2、工具选择逻辑
3、AI写文章、细化关键词和调整语言风格
4、AI绘画的基本概念和基本操作
5、AI绘图的通用提示语结构与垫图
6、AI图像风格与细节调整
7、AI制作PPT方法和修改
8、AI制作视频、写脚本和剪辑
模块二 人工智能高级应用篇
一、AI智能体(Assistant/Agent)
1、智能体的基本概念
2、创建智能体的指令与方法
3、构建自己的知识库
4、RAG检索生成
5、国内大模型的智能体操作实践
二、AI数据处理和撰写分析报告
1、AI进行数据分析基本步骤
2、AI进行数据清洗
3、AI做描述性统计
4、AI撰写业务分析报告
三、AI在业务分析中的使用
1、常用业务分析模型和分析方法介绍
2、使用AI进行漏斗分析
3、使用AI进行分组分析
4、使用AI进行用户行为分析
5、使用AI进行帕累托分析
6、AI进行用户留存分析实战案例
四、AI进行算法建模及业务应用
1、常用的数据挖掘方法
2、利用AI实现数据挖掘建模
3、利用AI实现模型代码实现及调优
模块三 人工智能技术篇(大模型方向)
一、大模型的理论基础
1、神经网络基础结构
2、编码器与表示学习
3、人工智能的四大任务方向
4、Transformer架构
5、生成式人工智能
二、大模型的API部署(Python)
1、商业大模型的API使用
2、开源大模型的API使用
3、模型的本地部署与发布
4、其他数据功能的部署
阶段四 人工智能开发
模块一 深度学习与大模型基础
一、深度学习基础
1、感知器及多层感知器
2、神经网络架构
3、循环神经网络
4、编码器与迁移学习
5、Transformer架构基础与注意力机制
6、生成式AI大模型
二、大模型的API调用
1、通过API调用大模型
2、单论对话与多轮对话调用
3、开源模型与闭源模型调用
4、模型的部署与发布
模块二 RAG与LangChain
一、NLP基础从文本向量化开始
1、词向量:onehot到word2vec词嵌入的基本概念
2、文本向量:基于深度神经网络的嵌入模型
二、RAG(检索生成)的基础
1、RAG的必要性及应用场景
2、RAG的应用架构
三、工业场景文本向量的存储-向量数据库
1、向量数据库常见检索算法
2、文档如何存储-文档的切分技巧
四、LangChian的价值及核心模块的使用
1、LangChain的核心价值
2、LangChain的chain
3、LangChain的memory
4、LangChain的Retrieval
模块三 指令微调
一、深度学习与大模型进阶
1、Self-Attention机制
2、Multi-HeadAttention多头注意力
3、PositionalEncoding位置编码
4、Feed-ForwardNetworks
5、LayerNormalization原理
6、残差连接
二、大模型的量化
1、Quantization基础概念与作用
2、常见的Quantization技术
3、Quantization的实践步骤和工具
三、大模型的微调
1、指令微调的基础概念
2、Lora算法解析
3、Lora算法的关键组件与技术实现
4、指令数据的搜集与生成
5、指令数据的预处理
6、实战微调国产大模型
模块四 Agent开发
一、深度学习与大模型进阶
1、Self-Attention机制
2、Multi-HeadAttention多头注意力
3、PositionalEncoding位置编码
4、Feed-ForwardNetworks
5、LayerNormalization原理
6、残差连接
二、大模型的量化
1、Quantization基础概念与作用
2、常见的Quantization技术
3、Quantization的实践步骤和工具
三、大模型的微调
1、指令微调的基础概念
2、Lora算法解析
3、Lora算法的关键组件与技术实现
4、指令数据的搜集与生成
5、指令数据的预处理
6、实战微调国产大模型
模块五 大模型微调进阶
一、优化算法专题
1、损失函数与梯度下降
2、随机/小批量梯度下降
3、动量法与Adam算法
二、强化学习RLHF
1、RLHF算法概述
2、人类反馈的集成
3、PPO算法概述
4、状态、动作和奖励的数据结构
5、强化学习数据的收集与处理
6、策略优化
7、基于开源大模型微调实现PPO算法
三、模型输出优化
1、DPO算法概述
2、排序和偏好
3、数据整理与预处理
4、DPO模型的实现与测试
模块六 基础环境准备
1、成为编程高手的四个技能:数学、编程、统计、算法
2、Python的安装
3、Anaconda的安装
4、PyCharm的安装
5、 JupyterNotebook的使用
6、深度学习框架的搭建
7、GPU的适配安装
8、pip命令的使用介绍
9、conda命令和pip命令的异同点
10、安装一些最常用的工具包
阶段五 计算机视觉
模块一 基础知识
1、图像的基本知识
2、现实生活中的成像
3、什么是计算机视觉
4、计算机视觉的应用
5、计算机视觉任务的预处理
6、功能描述
7、特征匹配
8、特征提取在计算机视觉中的实际应用
模块二 卷积神经网络
1、卷积神经网络简介
2、用于大规模图像识别的超深卷积网络
3、GoogleNet
4、MobileNet
5、ConvNext——面向现代的 ConvNet(2022 年)
6、迁移学习简介
7、进一步探索 MobileNet
8、残差网络ResNet
模块三 视觉转换器(Vision Transformers)
1、用于图像分类的 Vision Transformers
2、Swin Transformer
3、卷积视觉Transformer (CvT)
4、扩张邻域注意力Transformer(DINAT)
5、MobileViT v2
6、用于物体检测的 FineTuning Vision Transformer
7、DEtection TRansformer (DETR)
8、用于图像分割的视觉Transformer
9、OneFormer
10、使用 Vision Transformers 进行知识蒸馏
模块四 多模态模型
1、探索多模态文本和视觉模型 - 联合人工智能中的感官
2、多模态的世界
3、视觉语言模型简介
4、多模态任务和模型
5、CLIP and Relatives
6、损失
7、对比语言-图像预训练(CLIP)
8、多模式文本生成 (BLIP)
9、多模式物体检测(OWL-ViT)
10、多模态模型的迁移学习
模块五 生成模型
1、生成模型介绍
2、变分自动编码器
3、生成对抗网络
4、StyleGAN 及其变体
5、CycleGAN
6、Diffusion Models
7、Stable Diffusion
8、Control over Diffusion Models
9、隐私、偏见和社会担忧
模块六 基本的计算机视觉任务
1、物体检测
2、图像分割
模块七 视频和视频处理
1、视频相关知识介绍
2、视频处理基础
模块八3D 视觉、场景渲染和重建
1、基础知识
2、3D视觉的应用
3、3D 视觉简史
4、Camera models
5、3D 数据的表示
6、立体视觉简介
7、Neural Radiance Fields (NeRFs)
模块九 模型优化与部署
1、部署模型与模型优化简介
2、模型部署的工具和框架
3、模型优化的工具和框架
模块十 合成数据创建
1、合成数据集
2、使用 3D 渲染器生成合成数据
3、使用 DCGAN 生成合成数据
4、使用扩散模型生成合成数据
5、使用合成数据的挑战和机遇
模块十一Zero Shot 计算机视觉
1、Zero Shot基础知识
2、零样本学习
模块十二 前沿方法展望
1、Retention In Vision
2、Overview of Hiera
3、Overview of Hyena
4、Overview of I-JEPA
阶段六 语音识别
模块一 处理音频数据
1、音频数据简介
2、加载并探索音频数据集
3、预处理音频数据
4、流式音频数据
模块二 音频应用程序简介
1、音频相关的应用程序
2、使用pipeline进行音频分类
3、使用pipeline进行自动语音识别
4、使用pipeline生成音频
模块三 音频的 Transformer 架构
1、回顾transformer模型
2、CTC 架构
3、Seq2Seq 架构
4、音频分类任务的常见架构
模块四 实践:音乐流派分类器
1、任务拆解
2、用于音频分类的预训练模型
3、微调音乐分类模型
4、使用 Gradio 构建演示
模块五 实践:自动语音识别
1、任务拆解
2、语音识别的预训练模型
3、选择数据集
4、语音识别的评估和指标
5、如何使用 Trainer API 微调 ASR 系统
6、构建演示
模块六 实践:从文本到语音
1、文本转语音数据集
2、文本转语音的预训练模型
3、微调 SpeechT5
4、评估文本转语音模型
模块七 综合实践
1、语音到语音翻译
2、创建语音助手
3、转录会议
4、动手练习
阶段七 案例实战
(一)进阶机器学习技术(半监督式学习、利润最大化学习、目标类别不平衡学习、集成学习)及实操案例分享
传统模型评估方法与利润最大化评估方法
增益图与利润图
案例一:利润最大化模型实作:以产品营销模型为例(2018/12考题)
目标类别不平衡的问题
目标类别不平衡的处理方式
案例二:目标类别不平衡模型实作:找出有资金需求的中小企业借贷户并销售其贷款产品(2019/12考题)
传统监督学习方法与非监督学习方法
半监督学习方法概述
案例三:半监督学习模型实作:以电信业客户流失模型为例(2019/6考题)
传统学习与集成学习
集成学习的分类:模型融合与机器学习元算法
案例四:集成学习方法实作与比较:从租赁特征、房源特征、房主特征、位置特征、以及声誉特征的信息,预测共享住宿的日租价格(2022/9考题)
(二)英文文本分析技术、HuggingFace经典英文模型使用及实操案例分享
文本分析简介及文本分析流程
英文文本数据预处理方法(词性标注、字根还原、停用词处理、关键词撷取、词袋模型)
案例五:英文文本分析模型实作:从产品的消费者评论中识别此评论的情绪是正评或负评(2021/09)
案例六:英文文本分析模型实作:从评论信息中识别此评论是否为不当的评论(2021/12)
案例七:英文文本分析模型实作:从产品的图片及产品的描述信息中,预测哪些是相同的产品(2023/03)
案例八:英文文本分析模型实作:从文章的描述信息中,预测此文章是否由AI所产生出来的(2023/06)
案例九:英文文本分析模型实作:从两两一组的文章段落中,预测哪些在语义上是具有高度语义相似性(2023/09)
HuggingFace经典英文语言模型使用并与传统机器学习模型比较
(三)中文文本分析技术、HuggingFace经典中文模型使用及实操案例分享
中文文本数据预处理方法(分词、词性标注、停用词处理、关键词撷取、词嵌入模型)
案例十:中文文本分析模型实作:从贴文的信息中预测此贴文是否能获得高响应(2021/3)
案例十一:中文文本分析模型实作:从贴文的短信息中识别此贴文的情绪(2021/6)
案例十二:中文文本分析模型实作:从使用者过去的观影行为、电影名称以及电影剧情描述的信息,预测使用者对电影的评分(2022/06)
案例十三:中文文本分析模型实作:从产品描述的信息中,预测产品类别(2022/12)
HuggingFace经典中文语言模型使用并与传统机器学习模型比较
(四)图像分析技术、HuggingFace及Facenet经典图像嵌入模型使用及实操案例分享
图像处理基础(opencv、人脸侦测、人脸特征撷取、人脸识别)及迁移学习(TransferLearning)
案例十四:图像分析模型实作:从两两一组的植物图像中,预测哪些图像是相同的植物,哪些是不同的植物(2023/12)
案例十五:图像分析模型实作:从给定的汽车图像中,预测汽车的厂牌以及它的颜色(2024/03)
案例十六:图像分析模型实作:从给定的人像中,进行人像聚类,并将相似的人像聚在一同一群中
HuggingFace经典图像嵌入模型模型使用并与传统机器学习模型比较
Facenet人脸定位及嵌入模型使用并与传统机器学习模型比较
【课程目标】
1.掌握数据挖掘与机器学习基本知识
2.了解机器学习所必备数学与统计等基础知识、理解机器学习的算法、原理与实现及机器学习框架
3.掌握深度学习的算法、原理与实现及相关框架
4.熟练掌握深度学习主流框架(tensorfow\pytorch)的原理、搭建和实战应用技巧与注意事项
5.掌握企业热门的知识图谱,语音识别、智能客服、AI机器人等先进技术
6.具备一定的人工智能模型上线部署,进行工程化应用的经验与能力
7.具备人工智能及视觉识别领域1-3年的开发工作经验的技能
8.具备人工智能及NLP自然语言处理领域1-3年的开发工作经验的技能
9.具有1-3年人工智能深度算法开发工作经验的AI算法工程师
【课程特色】
1、大方向好
直击时下热门AI产业,把握未来发展方向,国家政策战略加持,职业发展前途无量
2、全程干货
课程全程围绕机器学习、深度学习算法及项目展开,内容广泛且专业的同时,深度聚焦人工智能就业主线
3、覆盖 10+ AI热点场景应用智能推荐、图像分类、目标检测、图像分割、人脸识别、情感分析、文档智能分类、舆情分析、语音转文字、文字转语音、精准营销、问答机器人等
4、配置深度学习 GPU 服务器
手把手教学生搭建真实的GPU模型训练环境,以适应企业真实开发需求
5、系统全面
九大阶段、十三大人工智能主流技术,紧扣时下热门AI算法技术(文字、图像、语音、视频)
6、含金量高
额外加入大量即将流行的AI前沿技术,另外还额外赠送Python、数学基础、统计学基础、大数据AI技术等选修课,助力学员适应企业更高需求
7、贯穿20+AI实战项目
项目案例丰富且极具代表性,涉及九大行业,包括:零售电商、影音娱乐、国家电网、新闻门户网站、生活百科、智慧医疗、智能小区、银行金融、智能客服等
8、加入AI工程化内容
加入深度学习模型部署、深度学习分布式部署及大数据环境下的AI模型部署及封装Restful接口+flask服务+WebUl调用的工程项目实现案例
9、让学习变得简单实用
为了照顾到0基础学员,课程在设计阶段就尽量避免复杂专业的计算机及数学知识,而是在让学员快速了解基本的数理统计基本概念、术语之后,更多侧重于算法的实现原理、入口参数、实现效果及适用场景等
【课程对象】
零基础,想进入人工智能行业/有基础有Python数据分析或开发行业经验者/想转行人工智能方向
招生标准:学历-本科及以上(统招);专业-理工类最佳,如:数学/物理/计算机/电子/机械/自动化/统计学等专业
【课程周期】三个月
【课程收费】现场班20900元 / 远程班16900元
【课程方式】训练营模式 =视频+实训手册+实训平台+学习计划+班主任督学(发布学习任务)+教员批改学员作业+VIP多对一答疑 +周测评+穿插直播课(项目实战指导与训练)
【授课时间】每周一到周五9:30-12:00;14:00-17:30;晚自习18:00-20:00
【其他福利】
1、实训手册+视频
可以做到 AI大数据环境开箱即用,随时随地随机学习,可以直接在实验沙箱中跑大数据训练模型,无须下载,无须本地搭建环境,不会受到本地电脑配置不够无法进行模型训练的影响,还可以做到边看边学边练,极大提高学习效率,有效提升学习效果。
2、分层教学+分段培养+自动解锁闯关训练营
视频+实训手册+实训平台 +学习计划 +班主任督学(发布学习任务)+教员批改学员作业+VIP多对一答疑+周测评 +穿插直播课(项目实战指导与训练)+面试模拟
3、课程视频有效期为结课后一年
【咨询报名】樊老师
电话: 18611083334
QQ:2881989705
微信:fanyuliangnb
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
栏目导航
热门文章
推荐文章
扫码加好友,拉您进群