从导入的数据可以看出,user_id共有943个,item_id共有1682个,与数据对于的user_id及item_id的编号刚好是1~943和1~1682,可见数据已经清洗好的,不需要重新处理 然后将数据集拆分为训练集和测试集,分别进行处理 且user_id与item_id均不存在重复的情况,数据可以直接使用。 3.3 数据检查 3.3.1 查看每个物品对应用户...
1、使用movielens数据集(943个用户,1682部电影,80000条评分数据); 2、输入用户id(1-943); 3、创建用户-电影评分矩阵; 4、canopy聚类算法根据用户评分对用户聚类; 5、将canopy聚类结果作为kmeans聚类初始点,进行kmeans聚类; 6、根据聚类结果进行协同过滤推荐; 7、计算推荐算法测评指标mae值; 8、本文描述项目实现详...
1、使用movielens数据集(943个用户,1682部电影,80000条评分数据); 2、输入用户id(1-943); 3、创建用户-电影评分矩阵; 4、canopy聚类算法根据用户评分对用户聚类; 5、将canopy聚类结果作为kmeans聚类初始点,进行kmeans聚类; 6、根据聚类结果进行协同过滤推荐; 7、计算推荐算法测评指标mae值; 8、本文描述项目实现详...