8.5本地向量

1.密集向量(Dense) 

密集向量是由Double类型的数组支持,例如,向量(1.0,0.0,3.0)的密集向量表示的格式为[1.0,0.0,3.0]。

# 创建一个密集本地向量

val dv:Vector = Vectors.dense(1.0,0.0,3.0)

dv: org.apache.spark.mllib.linalg.Vector = [1.0,0.0,3.0]

2.稀疏向量(Sparse)

稀疏向量是由两个并列的数组支持,例如向量(1.0,0.0,3.0)的稀疏向量表示的格式为(3,[0,2],[1.0,3.0]),其中3是向量(1.0,0.0,3.0)的长度,[0,2]是向量中非0维度的索引值,即向量索引0和2的位置为非0元素,[1.0,3.0]是按索引排列的数组元素值。

# 创建一个稀疏本地向量

val sv1: Vector = Vectors.sparse(3, Array(0, 2), Array(1.0, 3.0))

sv1: org.apache.spark.mllib.linalg.Vector = (3,[0,2],[1.0,3.0])

最后修改: 2021年10月29日 星期五 14:30