3.4 RDD的处理过程_行动算子
行动算子:
主要是将在数据集上运行计算后的数值返回到驱动程序,从而触发真正的计算。下面,通过一张表来列举一些常用行动算子操作的API,具体如下。
转换算子 |
相关说明 |
count() |
返回数据集中的元素个数 |
first() |
返回数组的第一个元素 |
take |
以数组的形式返回数组集中的前n个元素 |
reduce(func) |
通过函数func(输入两个参数并返回一个值)聚合数据集中的元素 |
collect() |
以数组的形式返回数据集中的所有元素 |
foreach(func) |
将数据集中的每个元素传递到函数func中运行 |
最后修改: 2021年10月29日 星期五 09:18