语料库指经科学取样和加工的大规模电子文本库,其中存放的是在语言的实际使用中真实出现过的语言材料。信息简介 语料库 名词(corpus,复数corpora)指经科学取样和加工的大规模电子文本库。借助计算机分析工具,研究者可开展相关的语言理论及应用研究。corpus n. (pl. corpora)refers to a large collection of well-...
一、英文语料库介绍 顾名思义,语料库就是集合了英语书面和口语等各类英文表述方式的语言材料集合。它收集的英语词汇包罗万象,亘古棉今。是英文词汇的一个大全集合。 下面是目前主流的一些语料库列表: 图片来源:billions of words of data: free online access 下面主要介绍有:GBC,BNC, COCA 这三个语料库。 GBC,...
01国家语委现代汉语通用平衡语料库 该语料库是由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育以及语言文字的社会应用,总体规模达1 亿字,语料时间跨度为1919-2002年,收录了人文与社会科学、自然科学及综合三个...
🌍国外语料库: 英国国家语料库(BNC) 美国国家语料库(ANC) 美国当代英语语料库(COCA) 美国近当代英语语料库(COHA) 兰开斯特汉语语料库(LCMC) 💡小贴士:国内语料库全部免费,亲测有效! 🔎网络引擎搜索技巧: 使用加号或空格,要求结果包含两个或更多关键词,例如:北外 翻译。 使用引号,进行精准匹配,例如:“英语口...
利用语料库,译者不仅能学习语言知识,还能确定单词/短语的译法、进行核实查证。 今天,一起来盘点10个实用的语料库吧! 1. BCC现代汉语语料库 BCC是北京语言大学建立的现代汉语语料库,包括:报刊、文学、微博、科技、综合和古汉语等多领域语料。BCC的语料经过了分词、词性标...
美国当代英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库,它由包含5.2亿词的文本构成,这些文本由口语、小说、流行杂… 你一定要收藏的语料库资源 一者科技 行业专业的智能翻译与写作解决方案提供商 、提及语料库,学语言的童鞋们一定不陌生。这些语言材料的大集合不仅能帮助我...
语料对齐一般指的是双语或多语文本的平行对齐,一般以“一对一”对齐为主,也存在“一对二”或“一对多”平行文本的对齐,目前应用最为广泛的语料对齐是句级语料对齐。 常见的语料对齐工具包含两类:一类是CAT软件自带的工具,包括Trados的对齐文档、memoQ的Livedocs等,另一类是独立的工具,包括ABBYY Aligner、Tmxmall等。
1国家语委现代汉语语料库http://www.cncorpus.org/ 现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料。 2古代汉语语料库http://www.cncorpus.org/login.aspx 网站现在还增加了一亿字的...
英语语料库 English Corpora English-Corpora 是全球最广泛使用的英语语料网站,该网站每个月使用人数超13万人,并为全球上百家高校所使用。网站首页展示了所有收集的各领域英语用语,这些语料不仅对学生在学术论文的写作上有很大帮助,还能帮大家了解单词的历史形式、一些俗语和习语表达,包括英式英语和美式英语一些表达差别...
什么是人工智能语料库?学过拉丁语的人都知道,“corpus”的意思是“身体”,现代英语中的“corpse”被译为“尸体”,源自拉丁语“corpus”。 其他人可能也认识到“corpus”这个词,因为它至今仍在现有的法律机制中应用,翻译为:人身保护令。 这句话的字面意思是“你有自由的权利”,它确保任何被捕的人都有权...