论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 1687阅读
  • 2回复

[教程资料]使用分布式机器学习 [复制链接]

上一主题 下一主题
离线pony8000
 

发帖
53287
今日发帖
最后登录
2024-06-28
只看楼主 倒序阅读 使用道具 楼主  发表于: 2019-09-09 10:53:46
Cloud Academy时长
:1小时26分钟 视频:h264 1920x1080 | 音频:AAC 44kHz 2Ch | 1.1 GB
类型:电子学习| 语言:英语| 难度:中级

描述
概述

本培训课程首先介绍分布式机器学习的概念。我们将讨论为什么以及何时应该考虑在分布式环境中培训机器学习模型的原因。
Apache Spark
我们将向您介绍Apache Spark以及它如何用于在规模和速度上执行机器学习。Apache Spark是一个开源的集群计算框架。
亚马逊弹性地图减少
我们将向您介绍亚马逊的Elastic MapReduce服务,简称EMR。EMR提供了一个托管的Hadoop框架,可以轻松,快速,经济高效地处理大量数据。EMR可以轻松配置为托管Apache Spark。
Spark MLlib
我们将向您介绍Spark的机器学习模块MLlib。我们将讨论MLlib如何用于执行各种机器学习任务。对于本课程,我们将把注意力集中在决策树上,作为MLlib模块支持的机器学习方法。决策树是一种经常用于分类问题的监督机器学习算法。
AWS胶水
我们将向您介绍AWS Glue。AWS Glue是一个完全托管的提取,转换和加载服务,简称ETL。我们将向您展示如何使用AWS Glue来准备我们的数据集,然后再将它们用于训练我们的机器学习模型。
示范
最后,我们将向您展示如何一起使用上述每个服务来启动配置和预安装Apache Spark的EMR集群,以便使用决策树来训练机器学习模型。该演示将提供端到端解决方案,提供机器学习预测功能。
目标受众
本课程的目标读者包括:
数据科学家和/或数据分析师
任何对学习和执行分布式机器学习或大规模机器学习
感兴趣的人对Apache Spark和/或Amazon Elastic MapReduce
学习目标感兴趣的任何人

完成本课程后,您将:
了解分布式机器学习是什么以及提供什么
了解Apache Spark和Elastic MapReduce的优势
了解Spark MLlib作为机器学习框架
创建自己的分布式机器学习环境,包括Apache Spark,MLlib和Elastic MapReduce。
了解如何使用AWS Glue在数据集上执行ETL以准备培训机器学习模型
了解如何操作和执行Zeppelin笔记本,从而将作业提交到Spark集群
了解机器学习决策树的内容以及如何代码一使用MLlib
先决条件

以下先决条件对本课程有用且有用:
统计或概率背景
基本理解数据分析
一般开发和编码经验
AWS VPC网络和IAM安全体验(用于演示)
课程议程

本课程其余部分的议程如下:
我们将讨论分布式机器学习是什么以及何时以及为什么考虑使用它
我们将回顾Apache Spark应用程序及其MLlib机器学习模块
我们将回顾Elastic MapReduce服务
我们将提供对决策的理解树是 - 以及它适合哪种类型的分析问题
我们将回顾使用Apache Zeppelin笔记本的基础知识 - 可用于交互式机器学习会议
我们将审查AWS Glue。我们将向您展示如何使用AWS Glue执行ETL来准备我们的数据集,以便将其提取到机器学习管道中。
最后 - 我们将演示使用在EMR集群上运行的Spark实现的全功能分布式机器学习环境




本部分内容设定了隐藏,需要回复后才能看到


精品软件:百度搜闪电软件园  最新软件百度搜:闪电下载吧
有问题联系 sdbeta@qq.com
离线power3

发帖
1469
今日发帖
最后登录
2024-06-29
只看该作者 沙发  发表于: 2021-08-24 13:15:58
先收蒧下,谢谢分享。
离线tflying

发帖
1568
今日发帖
最后登录
2024-06-24
只看该作者 板凳  发表于: 2021-08-25 16:13:53
分布式计算,学习了。