__4.1.1 Basic Item-based CF __4.1.2 Implicit Feedback Problem Solution __4.1.3 Scalable Incremental Update __4.1.4 Real-time Pruning 本文主要介绍腾讯提出的推荐系统平台——TencentRec,以及基于该平台实现的一个具体算法——实时的Item-based协同过滤。 论文里由于篇幅限制只介绍了这一个算法,其实他们还...
目前用的比较多、比较成熟的推荐算法是协同过滤(Collaborative Filtering,简称CF)推荐算法,CF的基本思想是根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品。 如图1所示,在CF中,用m×n的矩阵表示用户对物品的喜好情况,一般用打分表示用户对物品的喜好程度,分数越高表示越喜欢这个物品,0表示没有买过该...
协同过滤(collaborative filtering,CF)是推荐系统最常使用的推荐算法,在推荐领域有着极其重要的地位。其中,让我们来把这个词拆开分析一下: 协同,基于用户之间或物品之间的相似性或关联性来进行推荐,让多种信息源进行协作; 过滤,从大量的用户-物品评分数据中筛选或过滤出最相关的推荐结果; 为了更直观一点,下图就是一...
CF算法分为两大类,一类为基于memory的(Memory-based),另一类为基于Model的(Model-based),User-based和Item-based算法均属于Memory-based类型,具体的User-based的内容请参见我的前一篇博文,下面主要介绍Item-based算法 Item-based算法主要分为两步:即item similarity computation和prediction computation (1)item similari...
原始item-based CF 我们首先来回顾下基于项目的基本CF算法。Item-based CF的基本思想是认为用户会喜欢和他以前所喜欢的物品相似的物品,其计算分为相似物品计算和用户喜好预测两部分,相似物品计算是整个算法的关键部分,用户喜好预测根据物品相似度加权预测用户对新物品的评分。项目相似度计算是通过计算每对项目的相似度得...
协同过滤user-based CF算法与item-based CF算法对比 CF算法分为两大类,一类为基于memory的(Memory-based),也叫基于用户的(User-based), 另一类为基于Model的(Model-based),也叫基于物品的(Item-based)。 User-based的基本思想是如果用户A喜欢物品a,用户B喜欢物品a、b、c,用户C喜欢a和c,...
前面的两篇文章分别使用Spark mllib ALS实现了Model-based协同过滤推荐系统和使用Mahout实现了User-based的协同过滤推荐系统。 我们再来回顾一下item-base CF算法的特点: 物品数明显小于用户数的场合,否则物品相似度矩阵计算代价很大 适合长尾物品丰富,用户个性化需求强的领域 ...
item) ,而 user 看过的视频数一般不会太多,所以不会有数据倾斜的问题。所以这里引出来的结论是如果用户数量巨大而物品数量较少,或者物品马太效应严重的话,适合用 item-based CF,而如果 item 数量巨大而用户数据较少,或者用户马太效应严重(想不出例子?)的话,适合于用 user-based CF。
user-based适用于社交网络的产品推荐(如微信),item-based适用于非社交网络的应用场景(如豆瓣)。 计算量: UserCF需要维护一个用户相似度的矩阵,而ItemCF需要维护一个物品相似度矩阵 相似度计算 cos距离:AB向量内积除以AB模相乘 【参考文献】 协同过滤user-based CF算法与item-based CF算法对比...
一种优化的Item-based协同过滤推荐算法