论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 2431阅读
  • 4回复

[教程资料]Apache Spark 2.4适用于大数据应用程序 [复制链接]

上一主题 下一主题
离线pony8000
 

发帖
53391
今日发帖
最后登录
2024-11-19
只看楼主 倒序阅读 使用道具 楼主  发表于: 2019-08-13 10:53:43
MP4 | 视频:h264,1280x720 | 音频:AAC,48 KHz,2 Ch
类型:电子学习| 语言:英语+ .VTT | 持续时间:3小时| 大小:1.75 GB
使用真实示例学习Apache Spark的关键概念

你会学到什么
如何创建RDD,数据帧和数据集
如何正确使用Map,Reduce和Filter
如何在分布式系统中分区RDD
在内存中缓存数据集以减少计算
如何调整Spark程序
如何在集群上运行迭代算法
GroupByKey和ReduceByKey之间的区别

要求
熟悉Ubuntu
熟悉Scala

描述
使用真实示例学习Apache Spark的关键概念。本课程介绍了开始使用Spark时需要了解的所有内容。我们从弹性分布式数据集开始,以及可以对它们执行的主要转换和操作。然后我们转到Advanced Spark概念,例如Partitioning和Persistence。最后,课程以Spark的SQL API结束,其中包括两个名为Dataframes和Datasets的数据抽象,它们位于Spark RDD之上。它们允许新的优化级别和SQL查询功能。
本课程适合谁:
初学scala开发人员对数据科学充满好奇



本部分内容设定了隐藏,需要回复后才能看到


精品软件:百度搜闪电软件园  最新软件百度搜:闪电下载吧
有问题联系 sdbeta@qq.com
离线fpaoli

发帖
159
今日发帖
最后登录
2024-11-23
只看该作者 沙发  发表于: 2021-03-03 14:27:58
挺不错的,希望越来越好!
离线破解文件

发帖
169
今日发帖
最后登录
2022-04-03
只看该作者 板凳  发表于: 2021-04-03 18:58:46
我是认真过来挣钱的,当闪电首富。
离线luogang1221

发帖
204
今日发帖
最后登录
2024-04-14
只看该作者 地板  发表于: 2021-04-07 10:30:31
学习一下,顺便赚点儿电魂
离线power3

发帖
1469
今日发帖
最后登录
2024-11-22
只看该作者 地下室  发表于: 2021-08-12 11:04:20
好资料,先收蒧下,谢谢分享。