• HCIE-Big Data-Data Mining
    Huawei Certified ICT Expert-Big Data-Data Mining

     

    培训与认证具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题能力的专家
     

    通过认证验证的能力
    掌握大数据挖掘主流技术和复杂数据挖掘方法,具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题的能力,实现数据蕴含的商业价值变现

     

    建议掌握的知识
    数据挖掘数理知识;数据挖掘平台工具;爬虫技术;ETL技术;常用数据挖掘算法;模型评估;Spark Mllib;华为机器学习服务;FusionInsight Miner;大数据架构和大数据治理等

     

    面向对象
    希望向AI和行业大数据领域发展的技能提升人员; 希望成为数据挖掘专家的人员

    认证前提
    建议具备扎实的数理统计知识和计算机知识; 建议5年以上相关工作经验

    考试科目
    考试代码    认证考试
    H13-731    HCIE-Big Data-Data Mining(笔试)
    H13-732    HCIE-Big Data-Data Mining(实验)
    H13-733    HCIE-Big Data-Data Mining(面试)

     

    培训目标

    完成该项目培训后,您将能够:
    (1)掌握数据挖掘方法
    (2)掌握FusionInsight MRS使用方法
    (3)掌握Spark MLlib使用方法

     

    培训对象

    大数据开发工程师、大数据分析工程师、大数据挖掘工程师
     

    入学要求

    了解大数据组件、了解python语言
     

    培训内容

    1.数据挖掘介绍
    数据挖掘概述;数据挖掘流程;数据、属性和度量;数据挖掘开发工具;数据挖掘学习路径
    2.预备知识(Data Mining)2-1
    矩阵和线性代数;概率论和数理统计;信息熵与基尼系数;最优化
    3.预备知识(Data Mining)2-2
    Python语言基础;数据采集与爬虫;数据可视化
    4.数据预处理2-1
    数据抽取、转换和加载;数据清洗
    5.数据预处理2-2
    数据清洗;特征处理
    6.特征选择与降维-特征选择
    特征选择概述、Filter、Wrapper、Embedded、其他方法和特征扩增
    7.特征选择与降维-降维
    降维导入、PCA、LDA、LLE、SVD
    8.有监督学习-理论-2-1
    有监督学习的预备知识;线性回归;逻辑回归;KNN
    9.有监督学习-理论-2-2
    朴素贝叶斯;SVM;决策树;集成算法
    10.有监督学习-实验-2-1
    随堂实验
    11.有监督学习-实验-2-2
    随堂实验
    12.无监督学习-理论
    无监督学习概念与导入;聚类算法;关联算法
    13.无监督学习-实验
    随堂实验
    14.模型评估与优化
    模型评估与优化预备知识;最优化模型;模型评估与选择;正则化
    15.数据挖掘综合应用-理论
    数据挖掘的流程;综合应用的案例分析
    16.数据挖掘综合应用-实验
    随堂实验
    17.Spark MLlib数据挖掘-2-1
    Spark MLlib基础入门;Spark MLlib基础统计分析;Spark MLlib特征提取和转换
    18.Spark MLlib数据挖掘-2-2
    Spark MLlib分类与回归;Spark MLlib聚类与降维;Spark MLlib关联规则与推荐算法;Spark MLlib评估矩;随堂实验
    19.华为云机器学习服务MLS
    华为MLS服务介绍;申请华为MLS服务;创建华为MLS工作流;典型算法的应用;机器学习平台FusionInsight Miner
    20.大数据挖掘思路和案例&大数据架构和大数据治理
    大数据挖掘通用思路;数据挖掘案例;什么是大数据架构;大数据架构在大数据中的重要性;大数据架构师所具备的能力;如何构建大数据架构平台;大数据治理系统整体架构;大数据治理关键要素;如何规划企业数据;企业大数据治理模型;大数据治理案例
    21.大数据挖掘综合实验-1
    房价售价预测
    22.大数据挖掘综合实验-2
    信用违约预测;使用Logistic Regression建模;使用RandomForest建模
    23.大数据挖掘综合实验-3
    犯罪类型预测;使用GBTD算法;使用随机森林算法
    24.大数据挖掘综合实验-4
    分类模型;使用决策树;使用随机森林;使用梯度提升