HCIE-Big Data 课程简介一、课程简介Huawei Certified ICT Expert-Big Data-Data Mining培训与认证具备通过华为云MRS平台以及开源技术平台进行大数据端到端建模,解决数据挖掘业务相关实际问题能力的专家华为认证三大体系二、培训目标完成该项目培训后,您将能够:✔ 掌握常用的大数据挖掘流程(包括数据预处理、特征工程、建模、模型评估与优化)。✔ 熟悉使用PySpark进行大数据挖掘的流程。✔ 掌握数据湖的基本概念和数据入湖操作技能。✔ 掌握数据治理方法论,以及华为数据治理中心DataArts Studio的特点。三、适用人群1. 希望成为大数据挖掘专家/工程师的人员2. 希望获得HCIE-Big Data-Data Mining V3.0认证的人员四、认证收益掌握常用的大数据挖掘流程(包括数据预处理、特征工程、建模、模型评估与优化);熟悉使用PySpark进行大数据挖掘的流程;掌握数据湖的基本概念和数据入湖操作技能;掌握数据治理方法论,以及华为数据治理中心DataArts Studio的特点。适合职位:大数据开发工程师、数据治理工程师、售前工程师等。五、上课内容上课周期时间课程模块课程内容重点项目案例第1天上午数据挖掘介绍数据挖掘概述数据挖掘的流程实战案例01:缺失值处理实战案例02:异常值处理实战案例03:特征缩放实战案例04:数值离散化 下午数据预处理与特征工程1第2天上午数据预处理与特征工程数据预处理与特征工程2实战案例01:特征编码实战案例02:偏态处理实战案例03:特征选择实战案例03:逻辑回归实战案例04:K近邻算法实战案例05:朴素贝叶斯下午分类问题建模第3天上午回归与分类问题建模2分类问题建模回归问题建模实战案例01:决策树算法实战案例02:支持向量机实战案例03:线性回归实战案例04:决策树回归实战案例05:支持向量回归集成算法 下午回归问题建模第4天上午聚类与降维回归问题建模实战案例01:Kmeans实战案例02:Kmedia实战案例03:GMM实战案例04:DBSCAN实战案例05:OPTICS实战案例06:谱聚类 下午聚类算法第5天上午关联分析与推荐问题建模关联算法实战案例01:Apriori算法实战案例02:FP-growth算法实战案例03:PrefixSpan算法下午推荐算法实战案例01:基于项目推荐算法实战案例02:基于用户推荐算法实战案例03:基于内容推荐算法第6天上午模型评估与优化最优化模型下午模型选择第7天上午Python数据挖掘案例分类综合实验实战案例01:数据挖掘综合实验1下午回归综合实验实战案例01:数据挖掘综合实验2第8天上午Pyspark mlibPyspark mlib基础入门统计分析实战案例01:统计分析实战案例02:数据处理 下午Pyspark mlib实验实战案例01:房价预测实战案例02:客户流失预测实战案例03:降维聚类第9天上午Pyspark mlib实验实战案例01:购物篮数据分析实战案例02:协同过滤下午华为大数据治理第10天上午综合大实验综合大实验1实战案例01:鱼的重量回归预测 下午综合大实验2实战案例01:森林覆盖类型分类预测第11天上午综合大实验3实战案例01:音乐流派聚类分析实战案例02:在线零售数据关联分析下午综合大实验4实战案例01:书籍推荐协同过滤实战案例02:广告推荐系统一对一HCIE考前辅导 六、认证信息■ 认证模板 ■ 考证信息考试科目考试代码考试题型考试时间及格分/总成绩考试地点HCIA-Big Data笔试H13-731单选、多选、判断、填空、拖拽题90min600/1000VUE考试科目考试代码考试题型考试时间及格分/总成绩考试地点HCIA-Big Data实验H13-736操作题、论述题480min80/100VUE