- 发帖
- 53390
- 今日发帖
- 最后登录
- 2024-11-14
|
Cloud Academy时长 :1小时26分钟 视频:h264 1920x1080 | 音频:AAC 44kHz 2Ch | 1.1 GB 类型:电子学习| 语言:英语| 难度:中级描述 概述本培训课程首先介绍分布式机器学习的概念。我们将讨论为什么以及何时应该考虑在分布式环境中培训机器学习模型的原因。Apache Spark我们将向您介绍Apache Spark以及它如何用于在规模和速度上执行机器学习。Apache Spark是一个开源的集群计算框架。亚马逊弹性地图减少我们将向您介绍亚马逊的Elastic MapReduce服务,简称EMR。EMR提供了一个托管的Hadoop框架,可以轻松,快速,经济高效地处理大量数据。EMR可以轻松配置为托管Apache Spark。Spark MLlib我们将向您介绍Spark的机器学习模块MLlib。我们将讨论MLlib如何用于执行各种机器学习任务。对于本课程,我们将把注意力集中在决策树上,作为MLlib模块支持的机器学习方法。决策树是一种经常用于分类问题的监督机器学习算法。AWS胶水我们将向您介绍AWS Glue。AWS Glue是一个完全托管的提取,转换和加载服务,简称ETL。我们将向您展示如何使用AWS Glue来准备我们的数据集,然后再将它们用于训练我们的机器学习模型。示范最后,我们将向您展示如何一起使用上述每个服务来启动配置和预安装Apache Spark的EMR集群,以便使用决策树来训练机器学习模型。该演示将提供端到端解决方案,提供机器学习预测功能。目标受众本课程的目标读者包括:数据科学家和/或数据分析师 任何对学习和执行分布式机器学习或大规模机器学习 感兴趣的人对Apache Spark和/或Amazon Elastic MapReduce 学习目标感兴趣的任何人完成本课程后,您将:了解分布式机器学习是什么以及提供什么 了解Apache Spark和Elastic MapReduce的优势 了解Spark MLlib作为机器学习框架 创建自己的分布式机器学习环境,包括Apache Spark,MLlib和Elastic MapReduce。 了解如何使用AWS Glue在数据集上执行ETL以准备培训机器学习模型 了解如何操作和执行Zeppelin笔记本,从而将作业提交到Spark集群 了解机器学习决策树的内容以及如何代码一使用MLlib 先决条件以下先决条件对本课程有用且有用:统计或概率背景 基本理解数据分析 一般开发和编码经验 AWS VPC网络和IAM安全体验(用于演示) 课程议程本课程其余部分的议程如下:我们将讨论分布式机器学习是什么以及何时以及为什么考虑使用它 我们将回顾Apache Spark应用程序及其MLlib机器学习模块 我们将回顾Elastic MapReduce服务 我们将提供对决策的理解树是 - 以及它适合哪种类型的分析问题 我们将回顾使用Apache Zeppelin笔记本的基础知识 - 可用于交互式机器学习会议 我们将审查AWS Glue。我们将向您展示如何使用AWS Glue执行ETL来准备我们的数据集,以便将其提取到机器学习管道中。 最后 - 我们将演示使用在EMR集群上运行的Spark实现的全功能分布式机器学习环境
本部分内容设定了隐藏,需要回复后才能看到
|