4006-998-758
3000+课程任你选择
大模型训练营
研发学院 大模型训练营 开课时间:2024-10-31
Tyler

Ø  阿里任职期间后负责阿里云多部门算法工作,操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作,具备深厚的数据智能系统研究和架构经验,实战经验覆盖包括C端B端的用户和商业化产品;

Ø  负责团队内部的技术招聘和面试工作,累计面试千人。作为阿里云内部“布道师”参与多场内部培训

Ø  全国信息学联赛一等奖保送并毕业于哈尔滨工业大学(C9),已发表多篇国际顶会和期刊发表学术论文;申请并已公开的国家发明专利 18 项,国际专利1项;

Ø  中国计算机学会技术前线委员会数据科学特邀讲者;

Ø  中国计算机学会(CCF)技术前线委员会(TF)委员人工智能与模式识别会员会委员

Ø  中国信通院标准化技术专家编委,作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定,致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情
课程内容

课程时长

4天(6小时/天)

  

课程要求

1、需要带电脑

2、学员需要有python编程基础

3、需要有网络

 

课程大纲 

模块一:生成式AI大模型基础(第一天)

理论(上午):

1.       热身暖场:自我介绍与学员互动

  1. 迁移学习与预训练大模型技术:详细介绍Transformer模型架构、预训练方法及应用案例

  2. 生成式AI与大模型技术:探讨生成模型类型、工作原理及应用场景,如文本、图像、视频生成等。

  3. 表示学习技术:多模态嵌入与表示学习embedding 技术

  4. 互动:自由问答

实践(下午):

  1. 将文字和图像表示成 Embedding。

  2. 将任意结构化数据表示成 Embedding以及将图结构表示成 Embedding。

  3. 实现一个简单的图转文系统。

  4. 快速部署并在本地使用一个开源大模型,并让它跨模态理解指定图片的内容。

模块二:提示语工程技术与检索增强技术(第二天)

理论(上午):

  1. 场景互动:如何让大模型进行思考?(小测试+脑筋急转弯)

  2. 知识库和检索增强技术:讲解知识库构建、向量检索技术原理以及检索增强技术模块化组成。

  3. 检索增强技术的最新进展:多路召回和重排技术

  4. 学习Faiss、Langchain和Llama-Index API

  5. LangServe模型部署组件:学习LangServe部署架构、模型发布和管理

  6. 高级思维链技术:详细介绍语义分析、推理、问答等高级思维链技术的实现和应用。

  7. 互动:自由问答

实践(下午):

  1. 使用Langchain实现高级提示语方法,优化大模型系统生成效果,并进行实际测试。

  2. 使用RAG知识库提高问答系统准确性,构建知识对话机器人,并进行性能评估。

  3. 使用多步推理提示方法的实现一个一致性推理系统。

  4. 使用提示词模板优化方法的实现一个提示词优化系统。

模块三:大模型训练微调(第三天)

理论(上午):

  1. 模型训练的基本原理:为学员提供基础的机器学习模型训练知识兼容。

  2. 指令对齐技术:学习预训练/微调/RLHF的原理,辨析区别。

  3. 价值对齐技术:包括与模型对齐、与人类对齐以及与目标场景对齐。

  4. 大模型安全与价值对齐:分析大模型潜在的安全风险,探讨价值对齐方法 。

  5. 互动:自由问答

实践(下午):

  1. 使用LoRA高效微调开源大模型Llama-2 7B模型,并针对特定任务进行性能优化和验证。

  2. 通过Self-Instruct模型数据对齐技术,实践模型训练的自监督学习方法,以提高模型性能。

  3. 引领学员结合业务场景,收集并清洗目标场景数据,训练一个垂直大模型。

  4. (可选)全量微调 Llama-2 7B 模型以及全量微调Llama-2 70B 模型。

模块四:LangFlow与多智能体系统开发(第四天)

理论(上午):

  1. 模型计划:讲解如何设计、规划和评估多智能体系统。

  2. 模型记忆:介绍多智能体系统中的记忆机制和应用,学习模型使用工具的原理,以及它与RAG的关系。

  1. 智能体框架:学习LangFlow等多智能体开发工具和框架。

  4.  剖析OpenAI 的长远发展路线图,以及跟进大模型最近技术的主要途径和学习方法。

  1. 互动:自由问答

实践(下午):

1.       分组练习:结合自己工作的业务特点进行智能体建模。

2.       基于LangFlow进行ReAct等多种范式的虚拟助手应用开发,实现与其他智能体的协作和交互。

3.       动手实现一个带function_call功能的agent案例。

4.       结合企业实际需求,如nl2sql、内部知识问答助手等案例进行讲解和实践演练。

返回上一级