华为认证,赢取未来
-
HCIE-Big Data-Data Mining
Huawei Certified ICT Expert-Big Data-Data Mining培训与认证具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题能力的专家
通过认证验证的能力
掌握大数据挖掘主流技术和复杂数据挖掘方法,具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题的能力,实现数据蕴含的商业价值变现
建议掌握的知识
数据挖掘数理知识;数据挖掘平台工具;爬虫技术;ETL技术;常用数据挖掘算法;模型评估;Spark Mllib;华为机器学习服务;FusionInsight Miner;大数据架构和大数据治理等
面向对象
希望向AI和行业大数据领域发展的技能提升人员; 希望成为数据挖掘专家的人员认证前提
建议具备扎实的数理统计知识和计算机知识; 建议5年以上相关工作经验考试科目
考试代码 认证考试
H13-731 HCIE-Big Data-Data Mining(笔试)
H13-732 HCIE-Big Data-Data Mining(实验)
H13-733 HCIE-Big Data-Data Mining(面试)
培训目标
完成该项目培训后,您将能够:
(1)掌握数据挖掘方法
(2)掌握FusionInsight MRS使用方法
(3)掌握Spark MLlib使用方法
培训对象
大数据开发工程师、大数据分析工程师、大数据挖掘工程师
入学要求
了解大数据组件、了解python语言
培训内容
1.数据挖掘介绍
数据挖掘概述;数据挖掘流程;数据、属性和度量;数据挖掘开发工具;数据挖掘学习路径
2.预备知识(Data Mining)2-1
矩阵和线性代数;概率论和数理统计;信息熵与基尼系数;最优化
3.预备知识(Data Mining)2-2
Python语言基础;数据采集与爬虫;数据可视化
4.数据预处理2-1
数据抽取、转换和加载;数据清洗
5.数据预处理2-2
数据清洗;特征处理
6.特征选择与降维-特征选择
特征选择概述、Filter、Wrapper、Embedded、其他方法和特征扩增
7.特征选择与降维-降维
降维导入、PCA、LDA、LLE、SVD
8.有监督学习-理论-2-1
有监督学习的预备知识;线性回归;逻辑回归;KNN
9.有监督学习-理论-2-2
朴素贝叶斯;SVM;决策树;集成算法
10.有监督学习-实验-2-1
随堂实验
11.有监督学习-实验-2-2
随堂实验
12.无监督学习-理论
无监督学习概念与导入;聚类算法;关联算法
13.无监督学习-实验
随堂实验
14.模型评估与优化
模型评估与优化预备知识;最优化模型;模型评估与选择;正则化
15.数据挖掘综合应用-理论
数据挖掘的流程;综合应用的案例分析
16.数据挖掘综合应用-实验
随堂实验
17.Spark MLlib数据挖掘-2-1
Spark MLlib基础入门;Spark MLlib基础统计分析;Spark MLlib特征提取和转换
18.Spark MLlib数据挖掘-2-2
Spark MLlib分类与回归;Spark MLlib聚类与降维;Spark MLlib关联规则与推荐算法;Spark MLlib评估矩;随堂实验
19.华为云机器学习服务MLS
华为MLS服务介绍;申请华为MLS服务;创建华为MLS工作流;典型算法的应用;机器学习平台FusionInsight Miner
20.大数据挖掘思路和案例&大数据架构和大数据治理
大数据挖掘通用思路;数据挖掘案例;什么是大数据架构;大数据架构在大数据中的重要性;大数据架构师所具备的能力;如何构建大数据架构平台;大数据治理系统整体架构;大数据治理关键要素;如何规划企业数据;企业大数据治理模型;大数据治理案例
21.大数据挖掘综合实验-1
房价售价预测
22.大数据挖掘综合实验-2
信用违约预测;使用Logistic Regression建模;使用RandomForest建模
23.大数据挖掘综合实验-3
犯罪类型预测;使用GBTD算法;使用随机森林算法
24.大数据挖掘综合实验-4
分类模型;使用决策树;使用随机森林;使用梯度提升