论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 2005阅读
  • 2回复

[教程资料]使用Apache Spark PySpark进行大数据分析:动手使用Python [复制链接]

上一主题 下一主题
离线pony8000
 

发帖
53391
今日发帖
最后登录
2024-11-19
只看楼主 倒序阅读 使用道具 楼主  发表于: 2019-09-01 17:30:39

你会学到什么
Spark技术的基本概述
端到端在Windows机器上安装Apache spark
端到端在Linux机器上安装Apache spark
在Microsoft azure HDInsight上设置Apache Spark Cluster
学习Spark SQL
学习Spark DataFrame API
Spark结构化流媒体
要求
编程经验
描述
欢迎来到Apache Spark:PySpark课程。
您有没有想过Google,微软,Facebook,Apple或亚马逊等大公司如何在数千台机器上处理数PB。
本课程的起点是了解内存大数据分析工具Apache Spark。
==============================================
以前的学生有什么他说:
“非常好的介绍。非常适合初学者以大局为出发点。课程应该进一步发展,并辅以更多实际例子。但总的来说,我强烈推荐。”
“我喜欢教练的步伐。我喜欢他很快就潜入实用的事实。对我而言,这有助于将后续学习放到一个视角。他往往会有很多错别字,但我可以忽略那些并且仍然给他5星的评价。我还很早。希望在我继续时更新我的​​评论。“
“很棒的课程,知识渊博的作家。”
“Curso excelente para quem deseja aprender sobre Big Data e Spache Spark com PySpark。”
==================================================
Apache Spark的执行速度比Hadoop MapReduce数据处理框架快100倍,这使得apache成为最需要的技能之一。
谷歌,Facebook,微软,亚马逊,Airbnb等顶级公司使用Apache Spark来解决他们的大数据问题!对大量数据进行数据分析是现在最有价值的技能之一,本课程将教授在大数据就业市场中完成的这类技能。
本课程将教授\ n
大数据和Apache火花
入门数据库入门
详细安装步骤ubuntu - linux机器
Python新手入门
Apache Spark数据帧API
Apache火花结构化流媒体端到端示例
机器学习和特征工程基础知识Apache火花。
本课程尚未完成,将添加与Spark ML相关的新内容。
注意:本课程仅教授基于Spark 2.0 Dataframe的API,而不是基于RDD的API。基于Dataframe的API是spark的未来。
关心
Ankit Mistry
\ n
\ n
\ n

本课程适合谁:
任何想要学习提升大数据技能的
人任何了解Hadoop并希望在更快的数据处理
方面取得进步的人任何人都想成为数据工程师,数据分析师,机器学习工程师,有
兴趣学习Apache spark和pyspark进行大数据分析
任何人都想要学习数据处理领域的尖端技术



19.99美元| 由Ankit Mistry创建| 上次更新
时间:10月18日持续时间:6.5小时| 视频:h264,1280x720 | 音频:AAC,44 KHz,2 Ch | 1.4 GB
类型:电子学习| 语言:英语+子语| 62讲座




本部分内容设定了隐藏,需要回复后才能看到


精品软件:百度搜闪电软件园  最新软件百度搜:闪电下载吧
有问题联系 sdbeta@qq.com
离线power3

发帖
1469
今日发帖
最后登录
2024-11-22
只看该作者 沙发  发表于: 2021-08-27 09:40:49
先收蒧下,谢谢分享。
离线tflying

发帖
1567
今日发帖
最后登录
2024-06-24
只看该作者 板凳  发表于: 2021-09-26 16:06:11
回复所见,谢谢分享。