Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。Apriori算法学习数据的关联规则(associationrules),适用于包含大量事务(transcation)的数据库。关联规则学习是学习数据库中不同变量中的相互关系的一种数据挖掘技术。 Apriori算法核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布...
多项式模型:最常见,要求特征是离散数据 伯努利模型:要求特征是离散的,且为布尔类型,即true和false,或者1和0 代码实现 基于多项式模型的朴素贝叶斯算法(在github获取) 测试数据集为MNIST数据集,获取地址train.csv 运行结果
《数据挖掘十大算法》是2014年清华大学出版社出版的图书,作者是(美)吴信东、库玛尔。内容简介 数据挖掘这一学科近年来发展十分迅速,不仅产生了大量不同类型的挖掘算法,而且也表现出与机器学习等学科深度融合的态势。无论是从事研究的专家学者还是从事应用的开发人员都十分希望能一窥其大略,从而比较准确地把握数据...