课程时长
2天(6小时/天)
课程大纲
模块一:生成式AI大模型基础(上午)
1. 热身活动与背景了解:通过学员自我介绍和互动。
2. 迁移学习与预训练大模型技术:深入解析Transformer模型的架构、预训练技术及其在不同领域的应用。重点介绍开源本地大模型(如LLaMA-3.1、Qwen-2等)的选型和使用场景,帮助学员理解如何选择和应用合适的模型。
3. 生成式AI与大模型技术:探讨生成模型的类型(如文本、图像、视频生成)、工作原理及典型应用场景。强调开源本地模型在不同生成任务中的优势和应用策略。
4. 表示学习技术:介绍多模态嵌入与表示学习(embedding)的核心概念和应用方法,结合不同行业的实际案例,展示embedding技术在提升模型性能中的作用。
互动讨论:学员提问和分享,围绕如何在实际项目中应用这些技术进行讨论,增强理解和实践能力。
模块二:提示语工程技术与检索增强技术(上午)
场景互动:如何让大模型进行思考?
提示语工程原理与实践:
提示词工程的核心概念:反哺知识、注入知识、获取知识。
实操演练:学员使用开源大模型进行提示词设计和优化。
知识库和检索增强技术:
知识库构建与向量检索技术:介绍知识库构建的原理和向量检索技术的模块化组成。
实践演练:在具体行业场景中应用这些技术。
检索增强技术的最新进展:多路召回和重排技术的最新研究进展及其应用效果。
高级思维链技术:详细介绍语义分析、推理、问答等高级思维链技术的实现和应用。
多步推理与流程自动化建模:讨论基于大模型的多步推理技术和流程自动化建模方法,如何在业务中提高效率和安全性。
互动讨论:学员提问与分享,交流在实际项目中应用提示词工程和检索增强技术的经验和挑战。
模块三:大模型训练与微调(下午)
模型训练的基本原理:从基础到进阶,介绍机器学习模型训练的基本原理,兼顾新手和有经验学员的需求。
指令对齐技术:学习预训练、微调、RLHF的原理及其在不同应用场景下的适用性。
价值对齐技术:讲解模型对齐、人类对齐以及目标场景对齐的技术和方法,确保模型在实际应用中与预期价值一致。
大模型安全与价值对齐:分析大模型在实际应用中的潜在安全风险,并探讨相应的价值对齐策略和防范措施。
领域垂直大模型的生产流程体系:介绍如何以低成本和高效能的方式进行领域垂直大模型的训练和部署。
互动讨论:通过自由问答,学员分享和探讨模型训练与微调的实际经验和心得。
模块四:多智能体系统开发(下午)
多智能体系统的设计与规划:讲解如何设计、规划和评估多智能体系统,确保系统的高效和稳定。
模型记忆与工具使用:介绍多智能体系统中的记忆机制和工具使用方法,尤其是如何结合RAG(检索增强生成)技术提高智能体的决策能力。
智能体开发框架:学习主流智能体开发框架和工具的使用方法,提升学员的开发能力。
智能体资源调度系统架构:讨论支持大规模(10,000+)智能体在线调度的技术架构,包括存储、算力、网络等系统资源的管理。
大模型技术的发展路线图:分析大模型技术的发展趋势,指导学员如何跟进和应用最新的技术动态。
互动讨论:通过自由问答环节,学员分享多智能体系统开发中的挑战和解决方案。