浪潮云申请基于大模型和 Labeled-LDA 的文本分类专利,能提高文本分类任务性能 金融界 2025 年 1 月 15 日消息,国家知识产权局信息显示,浪潮云信息技术股份公司申请一项名为“一种基于大模型和 Labeled-LDA 的文本分类方法及系统”的专利,公开号 CN 119293247 A,申请日期为 2024 年 9 月。专利摘要显示,本发...
主要是针对有层次结构的数据来说的,子节点是父节点的一个分类。模型是两个过程,上面是传统LDA,得到文档d的主题分布z,然后根据主题分布和已知的一些标签y还有参数η来进行宽度优先搜索,确定辅助变量a,并据此判断一个label是否属于这个文档。(标签的膨胀) 结构如图所示,β是全局的主题分布,θ是每篇文章的主题分布,φ...
专利摘要显示,本发明涉及文本分类技术领域,具体为一种基于大模型和 Labeled‑LDA 的文本分类方法及系统,数据收集、数据预处理,特征提取,训练模型,特征融合,基于融合特征训练分类模型,并通过交叉验证方法评估模型性能,根据评估结果调整模型参数、进行特征选择和模型调优,最终部署至生产环境,实现文本的自动化分类;有益效果...
Latent Dirichlet Allocation(LDA)模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。通过在传统LDA模型中融入文本类别信息,本文提出了一种附加类别标签的LDA模型(Labeled-LDA)。基于该模型可以计算出隐含主题在各类别上的分配量,从而克服了传统LDA模型用于分类时强制分配隐含...
用Python实现L-LDA模型(标签潜在Dirichlet分配模型) 参考: 标记的LDA:多标签语料库中信用归因的受监管主题模型Daniel Ramage ... 文本分析的参数估计,Gregor Heinrich。 潜在的Dirichlet分配,David M. Blei,Andrew Y. Ng ... 基于Gibbs采样的有效实现 以下描述来自标签LDA:多标签语料库中信用归因的受监督主题模型...
基于Labeled_LDA模型的文本分类新算法
(I abeled— LDA ). 基于该 模型 可 以在各类别上协同” 一算 隐含主题的分配量, 从而克服了传统 LDA 模型用于分类时强 制分配隐含主题的缺陷. 与 传统 L DA 模型的实验对 比表明 :基于 L abeled— I DA 模型的文本分类新算法可以有效改进 文本分类的性能 ,在 复旦 大学 中文语料库上 micro— F ...
2025年1月15日,浪潮云信息技术股份公司(以下简称浪潮云)申请了一项名为“一种基于大模型和Labeled-LDA的文本分类方法及系统”的专利。这一创新的文本分类技术,旨在通过融合大模型与Labeled-LDA的优点,显著提高复杂主题和语义文本的分类性能,预示着人工智能在自然语言处理领域的又一次突破。
DA模型的文本分类新算法 621 AdaBoost等高效的分类模型,在分类性能和可用性生成模型,因此具有清晰的内在结构,并且可以利用 方面都比之前的知识工程范式有了显著的进步,使 高效的概率推断算法进行计算;再者LDA模型参 得文本分类进入基本可以实用的阶段.与分类模型方 数空间的规模与训练文档数量无关,因此更适合处 面的...
网络释义 1. 模型 通过在传统 LDA 模型中融入文本类别信息,本文提出了一种附加类别标签的 LDA模型(Labeled-LDA)。基于该模型可以计算出 … cpfd.cnki.com.cn|基于4个网页