(I abeled— LDA ). 基于该 模型 可 以在各类别上协同” 一算 隐含主题的分配量, 从而克服了传统 LDA 模型用于分类时强 制分配隐含主题的缺陷. 与 传统 L DA 模型的实验对 比表明 :基于 L abeled— I DA 模型的文本分类新算法可以有效改进 文本分类的性能 ,在 复旦 大学 中文语料库上 micro— F ...
基于Labeled_LDA模型的文本分类新算法
通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷.与传统LDA模型的实验对比表明:基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能,在复旦大学中文语料库上...
专利摘要显示,本发明涉及文本分类技术领域,具体为一种基于大模型和 Labeled‑LDA 的文本分类方法及系统,数据收集、数据预处理,特征提取,训练模型,特征融合,基于融合特征训练分类模型,并通过交叉验证方法评估模型性能,根据评估结果调整模型参数、进行特征选择和模型调优,最终部署至生产环境,实现文本的自动化分类;...
通过在传统LDA模型中融入文本类别信息,本文提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以计算出隐含主题在各类别上的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷.与传统LDA模型的实验对比表明,基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能:在复且中文语料库上micro...
基于改进Labeled LDA模型的科技视频文本分类
基于Labeled-LDA 模型的文本分类新算法 李文波;孙乐;张大鲲 【期刊名称】《计算机学报》 【年(卷),期】2008(031)004 【摘要】LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取 文本隐含主题的非监督学习模型.通过在传统 LDA 模型中融入文本类别信息,文 中提出了一种附加类别标签的 LDA 模型(...
文本分类一直是自然语言处理中的基础、热点和难点。主题模型LDA作为无监督的概率统计模型在文本语义挖掘上取得良好的效果,而它的拓展标签主题模型Labeled-LDA基于标签这个强而有力的监督信息,使得词的主题分布更加准确可控。深度学习在近几年得到前所未有的发展,神经网络在各个领域大展身手。图像的像素矩阵形式以及自身固有...
金融界2025年1月15日报道,浪潮云信息技术股份公司日前向国家知识产权局申请了一项颇具前瞻性的专利,名为‘一种基于大模型和Labeled-LDA的文本分类方法及系统’(公开号CN119293247A),申请日期为2024年9月。这项创新旨在提升文本分类任务的性能,标志着在人工智能技术领域的一次重大进展。
本发明所述的基于labeledlda模型的歌手分类方法,具有如下特点: 1、综合运用机器学习模型和人工标注模型,同时解决了机器学习模型分类可解释性差与人工模型覆盖率低的问题; 2、创造性地以用户行为为基础数据,将其转化为类文本形式,然后使用labeledlda进行半监督分类学习,解决了文本数据精准度低、代表性差等问题; ...