课程大纲
第一天:
1. Snowflake介绍
实时数仓
架构组件
关键功能介绍
数据声明周期
生态
2. 命令行
执行命令
使用变量
批量执行
调整输出格式
常见命令
3. 加载数据
数据源位置
数据格式
数据文件限制与最佳实践
路径组织
加载配置
批加载
历史数据记载
元数据加载
JSON数据加载实践
CSV数据加载实践
4. Snowpipe持续加载
架构与原理
构建持续加载任务
Snowpipe一般考虑与实践
云存储持续加载实践
管理Snowpipe
错误排查与通知
5. 数据查询与操作
数据查询语法
JOIN
子查询
查询历史数据
查询半结构数据
使用窗口函数
典型案例
6. 元数据查询与操作
列类型
集群key
列长度
半结构化与平坦结构
观测存储
复制表格、Schema、数据库
表格类型与转换
元数据查询
元数据查询限制
典型案例
7. 数据加载时转换
基本介绍
支持限制
CSV转换操作
典型案例
JSON转换
典型案例
第二天:
8. 开发应用概述
UDF
Snowpark
外部函数
存储过程
脚本
9. UDF
标量函数
表格化函数
Python UDF介绍
设计构建UDF
调用UDF
使用三方库
构建UDTF
排错
10. Snowpark基础
环境构建
构建DF
JOIN DF
列操作
行操作
函数调用
评估DF
保存DF
构建视图
操作文件
执行SQL
11. Snowpark高级
构建SQL UDF
构建SQL UDTF
构建存储过程
调用函数与存储过程
异常与排错
12. 外部函数
外部函数介绍
输入输出规范
格式处理
性能考虑
最佳实践
AWS服务外部函数策略
安全考虑
13. 存储过程
构建存储过程
DDL与命名规范
事务管理
调用
构建最佳实践
14. 脚本
基本介绍
脚本块
变量
返回值
分支
游标
结果集
异常处理
15. 开发安全防护
数据库对象鉴权
对象鉴权修改
UDF安全防护
理解存储过程的鉴权
存储过程鉴权的最佳实践
角色管理
使用Future Grants
16. 数据治理与安全实践
对象依赖
分类
访问历史
用户与角色
对象安全
数据安全
访问控制
认证介绍
网络策略