在最近几年,人工智能技术经历了显著的进步,尤其是大规模语言模型的兴起,已经成为促进各行业革新与发展的关键动力。这些模型不仅在自然语言处理方面实现了重大突破,还为智能代理的创建、自动任务执行等多方面的应用提供了新的可能性。随着OpenAI的GPT系列模型的不断更新,以及Llama、DeepSeek等开放源代码的大规模语言模型的持续出现,智能代理技术的应用已经广泛渗透到科研、教育、商业等领域,其影响极为深远。
为了协助广大的科研工作者和技术专家抓住这一时代的机会,我们特别推出了《智能体与大语言模型高级实战:开发、本地化部署与优化》高级培训课程。该课程旨在为学员提供从智能体构建、大语言模型开发到本地化部署与优化的全面学习,帮助学员全面掌握智能体的先进科技,深入了解大语言模型的应用与优化技巧,并通过实际操作提高技术水平。
课程内容包括智能体的构建过程与技术重点、大语言模型的原理及其优化应用、开源模型的本地化部署以及如何通过先进的优化方法提升模型性能。课程采用理论讲解与实战操作结合的形式,学员将通过大量的实践练习,深入理解和掌握各种技能,从而在科研活动中更高效、智能地运用大语言模型和智能体技术。
无论您是正在进行人工智能相关研究的科研人员,还是希望提高技术能力的大学教师和行业专家,这门课程都能帮助您紧跟人工智能技术的最新趋势,推动您的研究与实践处于科技前沿。加入我们,共同探索大语言模型和智能体技术的无限潜能,开启一个更加智能化的未来!
【您将获得以下收获】:
- 掌握智能体开发全过程与核心技术,系统学习智能体构建方法、工具链与应用策略,扩展AI在科研与产业中的创新应用场景。
- 深入了解大语言模型(LLM)基本原理与前沿发展,涵盖Transformer、GPT-4等多模态架构,同时跟踪AI Agent技术的最新进展与行业趋势。
- 熟练掌握大语言模型本地化部署与优化,从开源模型选择、私有化部署到RAG、微调、量化技术的实际应用,全面增强模型性能与私有数据的安全性。
- 学会从头开始构建大语言模型,掌握数据集构建、模型训练、参数调整及性能评估全过程,巩固算法开发与工程实践的能力。
第一章、智能体(Agent)入门
- 智能体(Agent)概述(智能体是什么?智能体的种类和应用场景、典型智能体应用,例如:Google Data Science Agent等)
- 智能体(Agent)与大语言模型(LLM)的关系
- 智能体(Agent)的五大能力(记忆、规划、工具使用、自主决策、推理)
- 多智能体(Multi-Agent)合作
- 智能体(Agent)构建的基本步骤
- 案例展示与实践练习
第二章、基于字节Coze 构建智能体(Agent)
- Coze平台简介
- (实践演练)从无到有搭建首个智能体(Agent)
- (实践演练)智能体(Agent)基础配置(多Agent模式、对话流模式、LLM模型配置、提示词编写等)
- (实践演练)为智能体(Agent)增加技能(插件、工作流、触发器、卡片等)
- (实践演练)为智能体(Agent)增加知识(知识库介绍、添加知识库、知识库查询与召回等)
- (实践演练)为智能体(Agent)增加记忆(创建和使用变量、数据库、长期记忆的开启、修改和删除等)
- (实践演练)提升智能体(Agent)的对话体验(设置开场白、快捷命令等)
- (实践演练)智能体(Agent)的预览、调试与发布
- 案例展示与实践练习
第三章、基于其他平台构建智能体(Agent)
- (实践演练)基于百度平台构建智能体
- (实践演练)基于智谱清言平台构建智能体
- (实践演练)基于通义千问平台构建智能体
- (实践演练)基于豆包平台构建智能体
- 案例展示与实践练习
第四章、国内外智能体(Agent)经典案例解析
- 斯坦福小镇:生成式智能体(Generative Agents)
- ByteDance Research发布的论文搜索智能体
- Google Data Science Agent
- AutoGPT:通过自然语言需求描述执行自动化任务
- OpenAI推出的首款智能体(Agent):Operator
- 案例展示与实践练习
第五章、大语言模型应用开发框架LangChain入门
- LangChain平台简介(LangChain框架的主要功能与特性)
- (实践演练)LangChain的安装与使用
- (实践演练)LangChain的核心组成部分:Models(模型)、Prompts(提示词)、Indexes(索引)、Chains(链)、Agents(智能体)、Memory(记忆)
- 案例展示与实践练习
第六章、基于LangChain的大模型API接入
- (实践演练)在LangChain中使用OpenAI大语言模型
- (实践演练)在LangChain中使用文心一言大语言模型
- (实践操作)在LangChain中运用DeepSeek大型语言模型
- (实践操作)在LangChain中运用智谱清言大型语言模型
- (实践操作)在LangChain中运用本地开源大型语言模型
- 案例展示与动手实践
- 第七章、基于LangChain的智能体(Agent)开发
- 利用LangChain构建Agent的操作流程
- (实践操作)LangChain的设置与管理
- (实践操作)LangChain提示词模板(PromptTemplate)的建立与调用
- (实践操作)通过LLMRequestsChain类从网络获取信息(如查询天气等)
- (实践操作)LangChain链式请求的建立与调用
- (实践操作)使LangChain让AI记住你的陈述
- 案例展示与动手实践
- 第八章、开源大型语言模型及其本地部署
- 开源大型语言模型概览(基本概念、开源与闭源大型语言模型的比较)
- (实践操作)开源大型语言模型(如Llama3、Mistral、Phi3、Qwen2、DeepSeek等)的下载与使用
- (实践操作)使用Docker部署开源大型语言模型(Docker基础概念、核心组成部分与功能、安装与配置Docker、在Docker中部署如Llama3等开源大型语言模型)
- (实践操作)使用Open-WebUI构建类似ChatGPT的开源大型语言模型Web可视化交互系统(Open-WebUI的基础概念与功能、下载与安装Open-WebUI、配置用于对话系统的Open-WebUI)
- 案例展示与动手实践
- 第九章、从零开始构建首个大型语言模型
- (实践操作)数据集的创建(数据的搜集与处理、从网络搜集文本数据、数据的清理与标注、常用的数据集格式,例如:CSV、JSON、TXT等)
- (实践操作)大型语言预训练模型的选择(预训练模型的优势、常见的预训练模型,比如:GPT、BERT等、从Hugging Face等平台下载预训练模型)
- (实践操作)大型语言模型的训练(训练的基本步骤、训练过程中的监控与调试)
- (实践操作)大型语言模型的优化(常用的训练参数,比如:学习率、批次大小等、参数调整与优化策略、优化训练参数以提升模型性能)
- (实践操作)大型语言模型的推理(模型推理与训练的区别、加快推理速度的技巧、从输入到输出的完整推理过程)
- (实践操作)大型语言模型的部署与应用(模型部署的基本流程、部署环境的配置与管理)
- 案例展示与动手实践
- 第十章、大型语言模型优化
- 检索增强生成(RAG)技术解析(RAG的基本原理、RAG在大型语言模型中的功能和优点、RAG的系统框架、RAG检索结果与生成结果结合的方式、RAG知识库的构建方式)
- 向量数据库简介与向量检索技术解析(利用向量数据库实现高效检索)
- 文本嵌入(Text Embedding)技术介绍(常用的文本嵌入模型、使用GPT API)
- (实践操作)基于RAG的问答系统设计
- 微调(Fine-Tuning)技术解析(微调的基本原理、微调在大型语言模型中的作用、准备一个用于微调的数据集、常见的微调方法,比如PEFT、LoRA等、针对不同任务的微调策略、微调过程中常见的问题与解决办法)
- (实践操作)微调一个预训练的GPT模型
- 量化技术解析(量化的基础概念、量化在模型优化中的重要性、不同的量化方法,比如:静态量化、动态量化、混合量化等、量化处理的步骤)
- 案例展示与动手实践