课程时长
4天(6小时/天)
总体目标
围绕金融行业的典型场景,从基础理论快速过渡到项目实操,并在实践中穿插少量理论要点,帮助学员在最短时间内掌握大模型的端到端应用流程。整个流程将以一个金融场景的大模型项目为主线,持续迭代开发与完善。
1. 从零到项目成型:通过4天以实战为主的“端到端”训练,学员能亲身经历一个金融大模型的构建流程(数据准备、提示词设计、检索增强、微调、系统整合)。
2. 聚焦金融行业:所有实例和数据均来自或模拟真实金融业务,学员能直接在投资/理财/风控等关键场景中体会大模型的应用价值。
3. 输出可演示 Demo:工作坊结束时,每个小组/学员都能产出一个可运行、能回答真实金融问题的Demo,为后续企业内部PoC或业务对接提供基础。
4. 实践能力提升:不仅了解大模型理论,更能动手操作、调参和部署,为在工作中深入挖掘大模型机会并与实际业务场景融合打下坚实基础。
课程大纲
模块一:基础快速入门与需求分析(第一天)
上午(理论+案例分享)
1. 大模型概念快速回顾 & 行业应用趋势:AIGC 的发展背景、国内外主流大模型格局(GPT、Llama、Falcon、Qwen、DeepSeek、Baichuan 等),以及在文本、图像、多模态等方向的代表性应用。
重点:结合金融行业的应用案例(如智能客服、投研分析、风险评估),说明大模型可带来的价值与常见挑战。
2. 金融场景下的大模型项目需求分析:学员所在团队/企业的业务痛点、数据特点和合规要求,确定工作坊要做的“金融大模型”Demo目标。
需求梳理:例如选择“客户理财问答”或“投顾辅助”作为主场景,定义具体需求与成功指标。
下午(实操)
1. 项目环境准备 & 数据采集/清洗:搭建本地或云端环境(Python、PyTorch/TF、向量数据库、基础大模型等),获取并整理金融文本(如FAQ、产品介绍、研报摘要等),进行基础清洗与脱敏。
实践要点:根据金融业务要求,做好数据格式统一、隐私合规检查、标签化或元数据标注。
2. 初步搭建金融行业知识库:在向量数据库(Faiss/Milvus/ElasticSearch 等)中构建金融知识库,对文档进行切分、Embedding 向量化。
实践要点:观察不同切分策略和向量化方式(如OpenAI Embedding、Qwen Embedding、BAAI Embedding等)对检索效果的影响。
模块二:提示词工程与检索增强 - 实战迭代(第二天)
上午(理论+案例分享)
1. 提示词工程要点与金融示例:Few-shot/Zero-shot、思维链(Chain of Thought)、自洽推理(Self-consistency)等,如何在理财问答或合规性判断中运用提示词。
示范:使用一组提示词在某大模型上测试回答质量,了解提示词的影响。
2. 检索增强(RAG)流程在金融场景的落地:从检索到生成(RAG)的组件拆分;如何让模型在回答前查询向量数据库中的金融领域文档。
示范:提供一个基础 RAG Demo,完成从检索知识到回答生成的流程。
下午(实操)
1. 实战:构建金融 RAG Demo:将前一天已构建好的金融知识库与一个开源大模型相结合,实现“检索+生成”的端到端问答。
2. 提示词优化与多轮对话场景练习:设计多轮交互的Prompt,累计上下文以提升问答的连贯性与准确度;针对金融专业术语、风险提示等要点进行Prompt修正。
模块三:大模型微调与场景适配 - 深度实操(第三天)
上午(理论+案例分享)
1. 快速讲解:大模型微调原理与方法:全量微调、LoRA、Prefix Tuning、自监督指令对齐(Self-Instruct)等;金融场景下关注点(专业术语、合规规则、监管条例等)。
重点:如何针对小规模行业数据高效微调,降低算力需求并兼顾效果。
2. 数据准备与指令对齐:收集真实金融对话、FAQ、业务案例;将其整理成对齐数据(问+答或指令+期望回复),辅助模型理解专业知识与合规限制。
下午(实操)
1. 动手实践微调大模型:根据上午生成的对齐数据进行LoRA(或其他轻量微调)训练;可选择某个大模型系列(Qwen、DeepSeek、Llama 等)作为基础模型。
2. 模型测试与性能评估:在“理财问答”、“风险提示”、“专业知识查询”等典型金融场景下测试微调后的模型表现;与未微调模型做对比。
模块四:整合应用案例打磨与演示(第四天)
上午(理论+案例分享)
1. 完整大模型解决方案集成:将提示词工程、检索增强、微调模型等模块整合到一个单一项目架构中;可使用 Web 界面或接口形式便于演示。
实践环节:学员以小组为单位,将前几天的功能拼接起来,实现一个接近真实场景的“金融大模型助理”原型。
2. 功能完善与错误纠偏:对多轮对话逻辑、提示词模板、检索阈值等参数进行针对性调整;处理常见错误或不合规回答(如不合理的投资建议、敏感信息泄露等)。
实战迭代:反复测试、记录问题、优化配置,使最终Demo具备较好的一致性和专业度。
下午(实操)
1. 项目展示与讲解::各小组/个人演示自己完成的“金融大模型应用”Demo,说明开发思路、特色功能、遇到的问题及解决方案。
集中讨论:评估不同团队实现方案的优劣势,互相学习和借鉴。
2. 业务落地与后续规划:从示范Demo走向生产环境,需要考虑的数据规模、弹性部署、合规审批、数据安全等;探讨在金融行业更多可延伸场景(如反洗钱检测、信贷风险评估、智能投顾、客户KYC等)。
启发与展望:结合企业内部资源和战略,讨论如何持续挖掘高价值大模型应用场景,将现有Demo升级为内部PoC或正式项目。