3.4 RDD的处理过程_行动算子

行动算子:

主要是将在数据集上运行计算后的数值返回到驱动程序,从而触发真正的计算。下面,通过一张表来列举一些常用行动算子操作的API,具体如下。

转换算子

相关说明

count()

返回数据集中的元素个数

first()

返回数组的第一个元素

take否

以数组的形式返回数组集中的前n个元素

reduce(func)

通过函数func(输入两个参数并返回一个值)聚合数据集中的元素

collect()

以数组的形式返回数据集中的所有元素

foreach(func)

将数据集中的每个元素传递到函数func中运行

最后修改: 2021年10月29日 星期五 09:18