HanLP是一个面向生产环境的多语种自然语言处理工具包,它基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术 无论您是专家还是初学者,HanLP都可以让您能够轻松快速的构建、处理和“理解”大量文本的AI应用程序 功能完善 轻松构建 语料时新 借助世界上最大的多语种语料库,HanLP2.1支持包括简繁中英日俄
示例配置文件:hanlp.properties 在GitHub的发布页中,hanlp.properties一般和jar打包在同一个zip包中。 配置文件的作用是告诉HanLP数据包的位置,只需修改第一行 root=usr/home/HanLP/ 为data的父目录即可,比如data目录是/Users/hankcs/Documents/data,那么root=/Users/hankcs/Documents/。 如果选用mini词典的话,则...
elasticsearch-analysis-hanlp HanLP Analyzer for ElasticSearch 此分词器基于,提供了HanLP中大部分的分词方式。 今年一年都在忙其他事,所以插件更新基本一年没有更新,年底更新一波。今年学习了一下ES向量插件(亚马逊设计的那个方式还挺有意思的,重新设计向量索引文件,但文件管理依托于lucene),搞了搞知识图谱(JanusGraph...