3.5 RDD的分区

 

     RDD的分区原则是分区的个数尽量等于集群中的CPU核心(Core)数目。对于不同的Spark部署模式而言,都可以通过设置spark.default.parallelism这个参数值来配置默认的分区数目。

Last modified: Friday, 29 October 2021, 9:19 AM