如果我正确理解 Databricks 的哲学,Spark 很快就会大量转向数据帧,即远离 RDD 上通常的 map/reduce。我想知道对于从数据框的角度介绍 Spark 的在线课程或书籍是否有任何好的建议?我知道 Databricks 有很多关于数据框的资源,但我真的很想看到一些更详细的课程。
Spark DataFrame 课程
数据挖掘
阿帕奇火花
教育
pyspark
2022-03-01 14:39:13
2个回答
edX 提供一些火花课程。尝试以下操作:
我相信这是通过与 Databricks 的合作
Alex,您可以在 Coursera 大数据课程中查看“第 5 周”中有关 Spark DataFrames 的一章,这是一个介绍,但它解释了如何为 DataFrames 设置 PySpark,可能适合您的情况,这将是一个好的开始。
问候
其它你可能感兴趣的问题