曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
曾在微博、乐视、新浪负责过多个业务线的PB级数据仓库建设、流式计算服务、AIOps的探索应用。精通Hadoop, Spark, Flink, Kafka, Elasticsearch等大数据技术。在Github上,他领导团队开源了Waterdrop项目,一个支持Spark,Flink引擎的数据计算产品。Waterdrop在字节跳动、360、微博、新浪等生产环境中有持续产生收益。
参与设计、研发PB级面向运维以及用户行为分析的数据仓库,每日数据增量70T+,管理超过200个计算任务。
设计并研发过自助化构建图表、看板的BI系统,基于此系统管理超过100个用户行为分析的数据模型及看板。
剑桥大学博士后,UCAM心理学博士,中欧国际工商学院MBA
国内知名人工智能和大模型算法专家,前百度资深算法工程师,多年搜索、大数据工作经验,专注于自然语言处理与人工智能方向,曾获CCKS中文知识图谱大赛第一名,就职期间输出数十篇专利。 现某头部互联网公司AIGC负责人,带领团队发布并落地行业垂类模型,并通过网信办备案。在多模态内容理解、角色对话、视频生成等多个方向有场景落地,有大量一线实操经验,AIGC业务单日服务用户超百万,并达成盈利。 对市面上大部分大模型基座有比较深入的理解,能判断模型的能力边界。擅长结合行业垂类的实际情况,挖掘大模型可真实赋能的业务场景,并从团队组织、资源分配等完善落地路径。
国内知名的人工智能和大模型算法专家 前亚马逊(世界500强):应用科学家; 前康卡斯特(世界500强):算法专家; 前阿里巴巴集团(世界500强)多部门算法负责人,2019年获评阿里巴巴集团年度“明日之星”员工;