如果用字,按照我数据集的格式来格式化你的数据。 如果用词,提前分好词,词之间用空格隔开,python run.py --model TextCNN --word True 使用预训练词向量:utils.py的main函数可以提取词表对应的预训练词向量。 数据集、词表及对应的预训练词向量,已经打包好,详见THUCNews文件夹。 效果 完整项目和数据集代码获取地...
这就需要Dataset出场了,用户个人定义dataset的话最基本要实现三个方法:__init__ __getitem__ __len__ (其余还有什么我暂时不知道,但这三个是必须要的). __init__就不用说了,len这个方法用于返回元素个数,getitem则是告诉机器怎么去读数据。再编写完dataset以后,把它传给dataloader,dataloader就知道怎么去读数...
https://github.com/JackHCC/Chinese-Text-Classification-PyTorchgithub.com/JackHCC/Chinese-Text-Classification-PyTorch 中文文本分类,基于pytorch,开箱即用。 神经网络模型:TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer 预训练模型:Bert,ERNIE 介绍 神经网络模型 模型介绍、数据流动过...
如果用字,按照我数据集的格式来格式化你的数据。 如果用词,提前分好词,词之间用空格隔开,python run.py --model TextCNN --word True 使用预训练词向量:utils.py的main函数可以提取词表对应的预训练词向量。 数据集、词表及对应的预训练词向量,已经打包好,详见THUCNews文件夹。 效果 完整项目和数据集代码获取地...
Chinese-Text-Classification Github项目地址:https://github.com/JackHCC/Chinese-Text-Classification-PyTorch 中文文本分类,基于pytorch,开箱即用。 神经网络模型:TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer 预训练模型:Bert,ERNIE ...