微软MCDBA、MCT(微软认证讲师,数据库方向),BI专家,在数据库、数据仓库、数据挖掘等方面有很深的造诣,负责企业级数据库架构,ETL,数据仓库设计,海量数据的优化处理以及数据分析与数据挖掘等项目实施与实现。负责和参与开发的主要项目有:微软总部MSN数据挖掘项目;微软总部Microsoft Marketing数据分析项目等。对数据库及数据仓库的架构和海量数据的优化处理有丰富的项目经验和处理方法,授课中结合丰富的实际项目案例,使学员轻松掌握数据库、数据仓库、商业智能和数据挖掘等相关技术。
企业级的数据库及数据仓库架构;建模;ETCL过程:包括数据的清洗,抽取,转换,加载等技术,对ETCL有比较深刻的了解和设计思想;搭建OLAP;前端展现和数据挖掘;数据整合与集成;海量数据处理,多次处理开发基于海量数据的项目。
精通工具为:SQL Server,Oracle,DB2,OWB,Informatica,Sysbase等数据库及数据仓库相关工具,熟悉主流BI开发工具,Reporting Servers, Cognos, Brio, BO等前端展现工具等。培训经验丰富,与学员互动,针对性强,强调实际动手能力和解决实际项目能力的培养,讲授效果明显。
项目名称:Search Funnel2004年5月-2004年12月
担任角色:ETL工程师
项目描述:该项目是微软总部的数据分析项目,主要针对微软MSN搜索引擎的数据进行分析,建立数据仓库,找出查询关键词之间的关联关系。该项目的难点是海量数据的处理,完成了MSN一个月的数据处理,数据量为18亿条,针对海量数据做了相当多的优化工作。
开发工具:SQL Server 2000,C# 2003,PD,VSS,Visio
项目名称:Microsoft Marketing Log Data Analysis2005年1月-2005年6月
担任角色:项目负责人,PM
项目描述:该项目是基于微软全球146个国家的数据进行数据分析,建立点击流数据仓库,进行报表分析,数据统计和数据挖掘。
该项目历时半年,由我与微软总部客户Jim Yang高级项目经理每星期沟通一次,中国方面我来负责,包括Extract, Transformation, Cleansing And Loading等工作。
开发工具:SQL Server 2005 Integration Servers,SQL Server 2005 Analysis Servers,SQL Server 2005 Reporting Servers,C# 2005 Beta 3,PD,Visio,VSS,ProClarity,ProClarity Analysis Servers
项目名称:Microsoft Website Search2005年1月-2005年6月
担任角色:项目负责人,PM
项目描述:该项目是基于微软全球网站搜索数据进行数据挖掘。包括词频统计、相似度分析、入口分析等,自行编写分析挖掘软件。
工作内容:带领5人实施该项目。从开始的需求分析,到流程架构,项目实施,作为负责人,完成与客户的英语交流,英文文档,项目前期准备工作,项目源码管理,项目实施等工作。
开发工具:SQL Server 2000,C# 2003,PD,Visio,VSS
项目名称:Keyword Association Graph2006年7月-2006年9月
担任角色:数据仓库负责人
项目描述:该项目是基于微软总部MSN搜索引擎数据进行关键词Association Rule分析。该项目是美国微软总部的演示项目,前端使用了当时先进的Ajax等技术。
工作内容:负责后台所有架构,代码的实现。包括建立处理规则,索引与分区等的实现。
开发工具:SQL Server 2005 Beta 1,C# 2005 Beta 1,PD,VSS,Visio,Ajax等。
项目名称:Microsoft Questions Text Data Mining2005年6月-2005年7月
担任角色:项目负责人,PM
项目描述:文本挖掘项目,该项目是对微软总部的调查数据进行文本挖掘。
工作内容:带领3人实施该项目。从准备工作,到关键词提取,禁用词与同义词的清理,最后到得出最终挖掘结果,时间为3周。
开发工具:SQL Server 2005 Integration Servers,C# 2005,PD,Visio,VSS
信息产业部、Novartis ETL、SQL Server 2005发布会、中科院软件研究所、深圳大鹏、瑞通 、中国海关总署 、TCL王牌 、上海HP 、天津海关、天津易迪斯、中海油、南京三宝集团、中国移动通信公司、中国建设银行厦门分行、俊彩、神华集团、中国航空、中国交通研究中心、中国电信研究院等
在数据库、数据仓库、数据挖掘等方面有很深的造诣,负责企业级数据库架构,ETL,数据仓库设计,海量数据的优化处理以及数据分析与数据挖掘等项目实施与实现。负责和参与开发的主要项目有:微软总部MSN数据挖掘项目;微软总部Microsoft Marketing数据分析项目等。对数据库及数据仓库的架构和海量数据的优化处理有丰富的项目经验和处理方法,授课中结合丰富的实际项目案例,使学员轻松掌握数据库、数据仓库、商业智能和数据挖掘等相关技术。
在数据库、数据仓库、数据挖掘等方面有很深的造诣,负责企业级数据库架构,ETL,数据仓库设计,海量数据的优化处理以及数据分析与数据挖掘等项目实施与实现。负责和参与开发的主要项目有:微软总部MSN数据挖掘项目;微软总部Microsoft Marketing数据分析项目等。对数据库及数据仓库的架构和海量数据的优化处理有丰富的项目经验和处理方法,授课中结合丰富的实际项目案例,使学员轻松掌握数据库、数据仓库、商业智能和数据挖掘等相关技术。
在数据库、数据仓库、数据挖掘等方面有很深的造诣,负责企业级数据库架构,ETL,数据仓库设计,海量数据的优化处理以及数据分析与数据挖掘等项目实施与实现。负责和参与开发的主要项目有:微软总部MSN数据挖掘项目;微软总部Microsoft Marketing数据分析项目等。对数据库及数据仓库的架构和海量数据的优化处理有丰富的项目经验和处理方法,授课中结合丰富的实际项目案例,使学员轻松掌握数据库、数据仓库、商业智能和数据挖掘等相关技术。
项目名称:Search Funnel2004年5月-2004年12月
担任角色:ETL工程师
项目描述:该项目是微软总部的数据分析项目,主要针对微软MSN搜索引擎的数据进行分析,建立数据仓库,找出查询关键词之间的关联关系。该项目的难点是海量数据的处理,完成了MSN一个月的数据处理,数据量为18亿条,针对海量数据做了相当多的优化工作。
开发工具:SQL Server 2000,C# 2003,PD,VSS,Visio
项目名称:Microsoft Marketing Log Data Analysis2005年1月-2005年6月
担任角色:项目负责人,PM
项目描述:该项目是基于微软全球146个国家的数据进行数据分析,建立点击流数据仓库,进行报表分析,数据统计和数据挖掘。
该项目历时半年,由我与微软总部客户Jim Yang高级项目经理每星期沟通一次,中国方面我来负责,包括Extract, Transformation, Cleansing And Loading等工作。
开发工具:SQL Server 2005 Integration Servers,SQL Server 2005 Analysis Servers,SQL Server 2005 Reporting Servers,C# 2005 Beta 3,PD,Visio,VSS,ProClarity,ProClarity Analysis Servers
项目名称:Microsoft Website Search2005年1月-2005年6月
担任角色:项目负责人,PM
项目描述:该项目是基于微软全球网站搜索数据进行数据挖掘。包括词频统计、相似度分析、入口分析等,自行编写分析挖掘软件。
工作内容:带领5人实施该项目。从开始的需求分析,到流程架构,项目实施,作为负责人,完成与客户的英语交流,英文文档,项目前期准备工作,项目源码管理,项目实施等工作。
开发工具:SQL Server 2000,C# 2003,PD,Visio,VSS
项目名称:Keyword Association Graph2006年7月-2006年9月
担任角色:数据仓库负责人
项目描述:该项目是基于微软总部MSN搜索引擎数据进行关键词Association Rule分析。该项目是美国微软总部的演示项目,前端使用了当时先进的Ajax等技术。
工作内容:负责后台所有架构,代码的实现。包括建立处理规则,索引与分区等的实现。
开发工具:SQL Server 2005 Beta 1,C# 2005 Beta 1,PD,VSS,Visio,Ajax等。
项目名称:Microsoft Questions Text Data Mining2005年6月-2005年7月
担任角色:项目负责人,PM
项目描述:文本挖掘项目,该项目是对微软总部的调查数据进行文本挖掘。
工作内容:带领3人实施该项目。从准备工作,到关键词提取,禁用词与同义词的清理,最后到得出最终挖掘结果,时间为3周。
开发工具:SQL Server 2005 Integration Servers,C# 2005,PD,Visio,VSS
国内知名人工智能和大模型算法专家,前百度资深算法工程师,多年搜索、大数据工作经验,专注于自然语言处理与人工智能方向,曾获CCKS中文知识图谱大赛第一名,就职期间输出数十篇专利。 现某头部互联网公司AIGC负责人,带领团队发布并落地行业垂类模型,并通过网信办备案。在多模态内容理解、角色对话、视频生成等多个方向有场景落地,有大量一线实操经验,AIGC业务单日服务用户超百万,并达成盈利。 对市面上大部分大模型基座有比较深入的理解,能判断模型的能力边界。擅长结合行业垂类的实际情况,挖掘大模型可真实赋能的业务场景,并从团队组织、资源分配等完善落地路径。
国内知名的人工智能和大模型算法专家 前亚马逊(世界500强):应用科学家; 前康卡斯特(世界500强):算法专家; 前阿里巴巴集团(世界500强)多部门算法负责人,2019年获评阿里巴巴集团年度“明日之星”员工;
国内知名的人工智能和大模型算法专家,前百度资深算法工程师,多年搜索、大数据工作经验,专注于自然语言处理与人工智能方向,曾获CCKS中文知识图谱大赛第一名,就职期间输出数十篇专利。
新加坡科研局首席AI研究员(Lead Researcher) 前埃森哲新加坡公司资深顾问