4006-998-758
3000+课程任你选择
大模型驱动的智能运维新实践
研发学院 大模型
杨金全


讲师介绍


杨老师

某有限公司专家团队成员

某大型智能运维科技公司CTO

中国首批商业化APM工具的创始人和实践者

15 年运维工具建设经验。专注于大模型在智能观测性平台和AIOPS产品的研发与商业化运营,深入理解并洞察大模型及智能运维行业的发展趋势。

现正带领团队探索大模型在运维领域的深度应用,推动从传统规则引擎到基于大模型的智能决策系统的转型。擅长将大规模预训练模型与云原生架构、自动化故障诊断、根因分析等技术结合,提升运维效率和预测精度。同时,积极推动大模型在多种场景中的落地,包括智能监控、容量管理和动态优化等。

在金融、电信运营商及高科技等多个行业,凭借丰富的技术方案经验和独到的产品洞察力,帮助企业构建智能化、自动化的运维平台,推动数字化转型。


查看老师详情
课程内容


课程大纲


标题

授课内容

一、大模型基础与智能运维(60分钟)

1.大模型基础

2.变革与复杂度

3.智能运维(AIOPS)概述

4.大模型优化运维生产关系

5.智能运维场景地图

二、大模型应用范式(60分钟)

1.构建大模型应用理论基石及应用形态

(1)ChatBot

(2)CoPilot

(3)Mutil-Agent

2.构建大模型应用的应用范式及实现路径

(1)对话应用

(2)RAG

(3)Agent

3.Mutil-Agent的演进与实现路径

三、运维+大模型所需的数据底座:统一可观测性(60分钟)

1.大模型时代的统一可观测性平台全景

2.使用统一可观测性平台打破数据孤岛

3.构建运维大模型数据底座

(1)运维实体模型

(2)多源数据接入(AutoETL)

(3)数据湖仓

(4)统一查询语言

(5)指标体系

(6)全局拓扑

(7)多维探索

(8)端到端的可观测性

(9)异常检测

(10)根因分析

四、大模型在核心运维场景中的应用实践(120 分钟)

1.大模型的演进给智能运维带来新的机遇

2.各大厂在智能运维中应用大模型的案例

3.基于大模型的智能运维平台体系架构

4.OPS   LLM 落地场景

(1)智能运维助手

(2)异常检测与预测

(3)告警收敛与降噪

(4)根因分析与事件溯源

(5)自然语言访问数据

(6)分布式链路问题推理

(7)代码异常见解

(8)容量预测与资源优化

(9)业务指标驱动的服务保障

5.LLM   OPS

(1)LLM   可观测性建模

(2)LLM   可观测性

五、如何在企业中落地大模型运维(30分钟)

1.数据治理与平台搭建

2.工具与流程整合

六、趋势、挑战与未来发展(30 分钟)

1.大模型驱动智能运维的未来趋势

2.企业落地挑战与对策

3.QA 与总结


返回上一级