- 发帖
- 53392
- 今日发帖
- 最后登录
- 2024-11-24
|
MP4 | 视频:h264,1280x720 | 音频:AAC,48 KHz,2 Ch 类型:电子学习| 语言:英语+ .VTT | 持续时间:3小时| 大小:1.75 GB 使用真实示例学习Apache Spark的关键概念你会学到什么如何创建RDD,数据帧和数据集 如何正确使用Map,Reduce和Filter 如何在分布式系统中分区RDD 在内存中缓存数据集以减少计算 如何调整Spark程序 如何在集群上运行迭代算法 GroupByKey和ReduceByKey之间的区别要求熟悉Ubuntu 熟悉Scala描述使用真实示例学习Apache Spark的关键概念。本课程介绍了开始使用Spark时需要了解的所有内容。我们从弹性分布式数据集开始,以及可以对它们执行的主要转换和操作。然后我们转到Advanced Spark概念,例如Partitioning和Persistence。最后,课程以Spark的SQL API结束,其中包括两个名为Dataframes和Datasets的数据抽象,它们位于Spark RDD之上。它们允许新的优化级别和SQL查询功能。本课程适合谁:初学scala开发人员对数据科学充满好奇
本部分内容设定了隐藏,需要回复后才能看到
|