如何使用Spark MLlib 构建分类模型

2025年03月22日 12:06
有1个网友回答
网友(1):

1.1 LDA实例 实例步骤: 1)加载数据 返回的数据格式为:documents: RDD[(Long, Vector)],其中:Long为文章ID,Vector为文章分词后的词向量;用户可以读取指定目录下的数据,通过分词以及数据格式的转换,转换成RDD[(Long, Vector)]即可。