术语库建设模块整合TF-IDF与潜在语义分析技术,自动识别领域核心术语,如医学文本中"冠状动脉"(coronaryartery)的共现网络显示其与"支架植入术"(stentimplantation)、"血管成形术"(angioplasty)存在强关联。 语言对比研究方面,语料库支持基于依存语法的句法复杂度分析。统计显示中文法律文本平均依存距离为2.8,显著高于
( ̄▽ ̄)~*中文语料库我使用较多的是北京大学中国语言学研究中心的CCL语料库(Center for Chinese Lin...
1.清华大学中英平行语料库 由清华大学自然语言处理与社会人文计算实验室在国家“863 计划” 项目“ 互联...
本文将详细介绍中科院自动化所中英文新闻语料库的特点、应用领域以及在我国的现实意义与价值。 【中英文新闻语料库的特点与优势】 1.数据来源与采集方式:中英文新闻语料库主要来源于国内外知名新闻网站、报纸、杂志等,采用自动化爬虫技术与人工筛选相结合的方式进行数据采集。这保证了数据的权威性和准确性。 2.数据...
BYU Corpora(美国杨百翰大学语料库)🔹 汉语单语语料库: 北京大学 CCL 语料库 北语BCC 汉语语料库 语料库在线🔹 英汉双语语料库: 中国法律法规汉英平行语料库 Linguee Glosbe🔹 包含单语或多语语料资源的网站: Tmxmall 专利翻译网 句酷 Linggle Justtheword这些资源不仅能帮助我们提高翻译的准确性,还能拓宽我们的...
好用的中文、英文和中英的语料库推荐如下:一、英文语料库 英国国家语料库:这是一个由牛津大学出版社推出的语料库,汇集了1亿字的丰富文本,涵盖小说、杂志、报纸和学术期刊等多元领域。其书面语与口语的比例达到9:1,且可在线实时检索,非常适合深入学习英文。二、英文语料库 美国当代英语语料库:作为...
三、探索汉语的奥秘:北京大学汉语语料库(CCL)⭐对中国语言学家而言,北京大学汉语语料库堪称全面。它由北京大学汉语语言学研究中心精心打造,分为古代与现代汉语两个部分,涵括文学、戏剧、报刊、翻译作品和网络语料,细致入微地揭示中文用语的丰富多样。以上只是冰山一角,每个语料库都有其独特...
该语料库由中科院自动化所的研究人员经过多年努力,从大量的中英文新闻报道中筛选、整理和标注而成,旨在为学术界和产业界提供一份高质量的中英文新闻语料库,以推动我国自然语言处理技术的发展和应用。 中英文新闻语料库的作用和意义主要体现在以下几个方面:首先,该语料库可以为研究人员提供丰富的数据资源,帮助他们更好...
手动查找中文网址,注意中英网址的排版格局相似,可以通过布局和发布时间找到相同位置的超链接文件。📂 找到PDF文档在英文网站上的位置: 即使是PDF文档,也一定在某网站上。将浏览器地址栏上最后一根/后的PDF文件后缀及其文件名去掉,即可跳转至该文档所在的超链接位置。🏗️ 搭建语料库: ...
#中英语料库 1.北京语言大学BCC语料库 专门针对汉语语言进行采集、标注和存储的大型语料库,它涵盖了各种...