《基于遗传算法的文本分类及聚类研究》是2008年科学出版社出版的图书,作者是戴文华。内容简介 文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题。文本分类和聚类问题中的特征选择和抽取技术、文本特征表示、聚类方法的选择和实现以及分类方法的选择和实现,都将对文本分类和聚类结果产生极大...
《面向大规模XML文档集的文本分类与聚类技术研究》是依托北京大学,由杨建武担任负责人的面上项目。项目摘要 随着XML标准被普遍采用,XML文档数量迅速增长,面向XML文档集的自动分类聚类等分析挖掘技术的研究逐渐受到关注。结构链接向量模型(SLVM)是我们提出的一种综合考虑结构信息与内容信息的XML文档模型,其在小规模XML...