在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算 法通过使用二维向量记录频繁度仅需遍历一次事务集,从而省略FP-Growth算法在生成新条件FP树时对条件模式基的第一 次遍历,大大缩短了建立FP树的时间。实验结果表明,该算法的改进优于经典算法。 关键词:数据挖掘;关联规则;频繁模式...
技术应用 一种改进的FP_growth算法王景中任虎北方工业大学信息工程学院北京100144 摘要:FP_growth算法是一种不产生候选项集的关联分析算法,克服了Apriori算法需要产生候选项集的缺点,提高了效率。但是在挖掘FP树时,没有按长度对条件模式基排序,再按条件模式基中各项的长度判断各项之间的子集关系从而快速挖掘频繁项集。
(北京邮电大学网络与交换技术国家重点实验室,北京 100876) 摘要:本文在分析 mahout 中并发 FP-Growth 关联挖掘算法源码基础上,结合 B2C 领域中某大型电子商务网站的实际交易数据特点和具体适配场景, 对 FP-Growth 算法存在的事务区分度差和“长尾”商品的推荐结果缺失进行了改进,以提高 FP-Growth 算法在推荐引擎应用...
FP—Growth算法是关联规则挖掘的一个经典算法。本文提出一种基于事务一项矩阵的挖掘算法MFP—Growth算法,利用向量矩阵表示事务数据库,整个挖掘过程只扫描一遍数据库,通过构造各个频繁项的条件矩阵,利用条件矩阵的向量运算来进行频繁模式的挖掘,减少了算法占用的内存空间,提高了挖掘效率.实验结果表明,MFP—Growth算法是有效...
1 NFP-growth 算法的设计与实现 1.1 对 FP-Tree 头表结点数据结构的改进 在 FP-Tree 算法中,当每次要插入一个新的树节点时,需 要在 FP-tree 中找与头表有相同的 item_name 的项, 必须回到头 表中,一个一个找出最后一个同名节点的 node_link 域后,再将 新节点加入。 这种做法每次有一个新的树节点...
对FPgrowth算法一种改进算法.doc,对FPgrowth算法一种改进算法 摘要:FP-growth算法是关联规则挖掘算法中的经典算法,用于挖掘频繁项目集。 但它的时间和空间效率还不足够高。提出了一种新的频繁模式树构造方法,性能得以提高。 关键词:FP-tree;频繁项集;频繁模式树 中图
下它生成大量的条件FP树,造成挖掘效率低下的问题.在提出算法中,我们设计了一种新技术,它挖掘出所有的频繁项集,而不产生条件FP树.与传统FP-growth算法不同,它仅扫描数据库一次,这降低了算法的时间效率.并且找出频繁项集合的频率,以获取所需的关联规则.实验证明,改进FP-growth算法的效率较传统FP-growth算法有很大...
一种改进的FP-Growth算法及其在业务关联中的应用 ?フ?要:基于FP?彩鞯?FPGrowth算法在挖掘频繁模式过程中需要递归地产生大量的条件FP?彩?,效率不高,并且不太适合应用在移动通信业务交叉销售等具有业务约束的关联规则挖掘中。因此,提出了基于项目约束的频繁模式树ICFP?彩骱椭苯釉诖耸魃辖?行挖掘的新算法――ICFP...
基于时间权重的FP-Growth算法改进 数据挖掘关联规则时间权重算法改进本文在FP-Growth算法 的基础上,提出了一种基于时间权重的FP-Growth改进算法.该改进算法把不同时间段的记录赋予不同的权重,使不同... 王英,徐慧 - 《运城学院学报》 被引量: 5发表: 2005年 ...
FP.Growth算法的改进 杨 云, 罗艳霞 (1.陕西科技大学电气与信息工程学院,陕西西安710021;2.莆田学院电子信息工程系,福建莆田35l100) 摘 要:基于FP树的FP—Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而 且给数据库服务器带来负担。在原有经典FP.Growth算法的基础上,提...