古诗词语料库古诗词语料库 1.古诗词语料库可真是个宝藏啊!就像一个装满奇珍异宝的箱子,随便一打开都能让人眼前一亮。比如“两个黄鹂鸣翠柳,一行白鹭上青天”,这句诗多美呀,那鲜活的画面就像在眼前一样! 2.哇塞,古诗词语料库绝对能让你大开眼界!想想看,“大漠沙如雪,燕山月似钩”,这般壮观而独特的景象,...
辅助古诗词研究的唐诗语料库的构建 第1章引言 (1) 1.1研究背景及意义 (1) 1.2国内外研究现状 (1) 1.3主要研究内容及工作 (5) 1.4论文组织结构 (5) 第2章全唐诗二字词表和相关知识库的构建 (7) 2.1全唐诗二字词表的构建 (7) 2.1.1全唐诗语料库抽词中―词‖的界定 (7) 2.1.2典型词的提取方法 (7...
NotificationsYou must be signed in to change notification settings Code Issues1 Pull requests Actions Projects Security Insights Additional navigation options AncientPoetry 古诗词语料 自己爬的,不解释 Releases No releases published Packages No packages published...
本发明公开了一种基于语料库和格律规则的汉语古诗词自动生成方法,主要是根据诗词的特点和诗句对应关系筛选并生成新的诗句,组成新的诗词,具体步骤如下:1)利用分词工具对诗集进行划分;2)根据原诗句的标点符号将分词结果按照对句的形式录入一诗句语料库中;3)汉语古诗词自动生成的初始设置,包括:根据用户选择所要生成的诗词...
1.一种基于语料库和格律规则的汉语古诗词自动生成方法,是根据诗词的特点和诗句对应关系筛选并生成新的诗句,从而组成新的诗词,具体步骤如下:步骤一、利用中文分词工具IKAnanlyzer对诗集中的所有诗词的诗句按照标点符号作为句子之间的划分,从而对句子进行分词;步骤二、将步骤一分词后的结果和原诗句的标点符号录入一诗句语...
有鉴于此,本研究拟提出一种融合数据增强、预训练模型以及条件随机场方法的古诗词地名识别模型,简称DA-BERT-CRF模型,开展古诗词地名识别实验。 2古诗词地名实体库构建 2.1 古诗词原始语料采集与处理 古诗词是我国宝贵的历史文化遗产,种类复杂,按照内容可分为送别诗、借景抒情诗、托物言志诗等,数量多达百万首以上。
中文ULMFiT-情感分析-文本分类-语料及模型、一个拍照做题程序、世界各国大规模人名库、一个利用有趣中文语料库 qingyun 训练出来的中文聊天机器人、中文聊天机器人seqGAN、省市区镇行政区划数据带拼音标注、教育行业新闻语料库包含自动文摘功能、开放了对话机器人-知识图谱-语义理解-自然语言处理工具及数据、中文知识图谱:...
基于此,本研究从翻译美学视域切入,运用语料库语言学的 研究方法,对霍译本和杨译本中《红楼梦》古诗词中的“红”系颜色的翻译进行研究。本研究 主要试图探讨以下两个方面的问题:1.《红楼梦》中“红”系颜色在古诗词中的使用情况如 何?2.《红楼梦》两个译本中古诗词中“红”系颜色词的英译策略有何差异?研究...
维基大规模平行文本语料 85种语言、1620种语言对、135M对照句 github 古诗词库 github repo 更全的古诗词库 低内存加载维基百科数据 用新版nlp库加载17GB+英文维基语料只占用9MB内存遍历速度2-3 Gbit/s github 对联数据 700,000 couplets, 超过70万对对联 github 《配色辞典》数据集 github 42GB的JD客服对话数...
语料生成工具:从具有音频/字幕的在线视频创建自动语音识别(ASR)语料库、构建医疗实体识别的模型(包含词典和语料标注)、单文档非监督的关键词抽取、Kashgari中使用gpt-2语言模型、开源的金融投资数据提取工具、文本自动摘要库TextTeaser: 仅支持英文、人民日报语料处理工具集、一些关于自然语言的基本模型、基于14W歌曲知识库...