# -*- coding: utf-8 -*-importnumpyasnpimportpandasaspd## 方法一:defapriori(data_set):"""创建初始候选集,候选项1项集"""print('创建初始候选项1项集')c1=set()foritemsindata_set:foriteminitems:# frozenset()返回一个冻结的集合,冻结后集合不能再添加或删除任何元素item_set=frozenset([item])...
结果程序运行超过半小时仍未出结果,这是由于Apriori算法使用多重嵌套for循环进行计算,每次更新频繁项集都需要扫描一次整个数据集,当数据量过大时效率不高。这里由于Apriori算法的性能限制,所以考虑用FP-Growth算法寻找频繁项集。 (二) FP-growth算法 1、FP-growth算法基本原理 FP-growth算法基于Apriori构建,但采用了...