ItemCF算法是目前业界使用最广泛的算法之一,亚马逊、Netflix、YouTube的推荐算法的基础都是基于ItemCF。 不知道大家平时在网上购物的时候有没有这样的体验,比如你在网上商城下单了一个手机,在订单完成的界面,网页会给你推荐同款手机的手机壳,你此时很可能就会点进去浏览一下,顺便买一个手机壳。 其实这就是ItemCF算法...
,也是“物以类聚”的概念,如果理解了“行为特征”与“内容特征”,则ItemCF就很好理解了。可参看以下两种定义。 (1)基于物品的普通推荐:给目标用户推荐与他喜爱的物品内容相似的物品。(2)基于物品的协同过滤推荐:给目标用户推荐与他喜爱物品行为相似的物品。
,也是推荐系统入门最好的机器学习算法。协同过滤算法主要可以分为两类:基于用户相似的UserCF算法以及基于物品相似的ItemCF算法。简明地解释这两类的基本思想:如果user1和user2相似度高,那么user1买了一款物品item,就可以把这款物品也推荐给user2,这是UserCF的基本思想;如果item1和item2相似度高,那么一个用户user买...
ItemCF,基于物品的协同过滤方法。主要依据物品之间的相似度,寻找目标用户喜爱物品的相似物,然后据此为用户推荐。推荐重点在于找到与目标用户喜爱物品相似的物品,并将其推荐给用户。适用于电商、网站等场景,用户数量远大于物品数量,计算用户相似度成本巨大。不同用户的喜好难以完全匹配,需要提供个性化推荐,...
ItemCF算法分为计算物品间相似度和生成推荐列表两步:首先,它不直接基于物品属性,而是通过用户行为找出物品之间的关联。例如,即使手机和手机壳在属性上看似不相关,但如果大量用户购买手机后也购买了手机壳,它们在用户行为中的相关性就高。计算物品间的相似度时,会统计共同出现的用户数,形成一个用户-...
ItemCF:ItemCollaborationFilter,基于物品的协同过滤 算法核心思想:给用户推荐那些和他们之前喜欢的物品相似的物品。 比如,用户A之前买过《数据挖掘导论》,该算法会根据此行为给你推荐《》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。
ItemCF需要维护一张物品相关度的表,当物品量更新速度太快时,此表的维护在技术上有难度。新闻类网站对于新用户可直接推荐热门新闻即可 对于电商、音乐、图书等网站而言,ItemCF的优势更大: 用户的兴趣比较固定和持久; 不需要太过考虑流行度,只需要帮用户发现他研究领域相关物品即可 ...
基于用户的协同过滤(UserCF):当要给目标用户进行推荐时,先找出与他相似的其他用户,再从那些用户喜欢的项目中找出目标用户没有看过的项目推荐给他。 基于项目的协同过滤(ItemCF):先找出目标用户历史观看列表里与之相似的其他项目,再对这些相似项目进行排序并生成最后的推荐列表。
publicclassItemCFHadoop { publicstaticvoidmain(String[] args)throwsException { JobConf conf =newJobConf(ItemCFHadoop.class); GenericOptionsParser optionParser =newGenericOptionsParser(conf, args); String[] remainingArgs = optionParser.getRemainingArgs(); ...
译者批:英文中常用 the xxx来表示xxx的地位,例如乔丹在98年总决赛中的绝杀被称为the shot,本文这部分的标题叫做 the algorithm,虽然作者本意并非如此,但译者觉得用这种方式来表示 ItemCF 算法在推荐系统中的地位也不为过。 如我们在2003年所描述的,ItemCF算法是很直观的。在90年代中期,协同过滤算法主要还是基于用...