Spark DataFrame 课程

数据挖掘 阿帕奇火花 教育 pyspark
2022-03-01 14:39:13

如果我正确理解 Databricks 的哲学,Spark 很快就会大量转向数据帧,即远离 RDD 上通常的 map/reduce。我想知道对于从数据框的角度介绍 Spark 的在线课程或书籍是否有任何好的建议?我知道 Databricks 有很多关于数据框的资源,但我真的很想看到一些更详细的课程。

2个回答

Alex,您可以在 Coursera 大数据课程中查看“第 5 周”中有关 Spark DataFrames 的一章,这是一个介绍,但它解释了如何为 DataFrames 设置 PySpark,可能适合您的情况,这将是一个好的开始。

大数据分析

问候