👮♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。内置支持单词标签分类分级。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能...
sensitive-word 是一个 Java 编写的敏感词过滤工具包,可以用于对文本中的敏感词进行过滤。该工具包提供了多种敏感词匹配算法,并支持自定义敏感词库和替换策略。使用该工具包可以有效地保护用户隐私,防止不良信息的传播。具体来说,sensitive-word 工具包提供了以下功能: 多种敏感词匹配算法,包括 DFA、AC 自动机等,可...
sensitive word工具是一个快速的敏感词过滤工具,基于 DFA 算法实现的高性能敏感词工具。优点1.DFA算法是相比于其他算发性能更高,所读更改快 2.其中包含默认的敏感词共6W 3.支持自定替换,支持手动扩展敏感词词库,也可以放行敏感词,方形掉相对于使用方不敏感的词语 3.支持运行时加载敏感词词库,无需进行重新部署...
默认的 wordTag 是空的。 StringfilePath="dict_tag_test.txt";IWordTagwordTag=WordTags.file(filePath);SensitiveWordBssensitiveWordBs=SensitiveWordBs.newInstance().wordTag(wordTag).init();Assert.assertEquals("[政治, 国家]",sensitiveWordBs.tags("五星红旗").toString());; 后续会考虑引入一个内置的...
constTrie=require('sensitive-word-filtering');consttrie=newTrie();// 添加敏感词trie.insert('敏感词1');trie.insert('敏感词12');// 过滤文本constinputText='敏 感词1 和其他内容。';constfilteredText=trie.filter({text:inputText,ignoreCase:true,// 忽略大小写ignoreSpaces:true,// 忽略空格});con...
sensitive-word-admin 敏感词控台 v1.2.0 版本开源 sensitive-word 基于 DFA 算法实现的高性能敏感词工具介绍 更多技术交流 业务背景 如果我们的敏感词部署之后,不会变化,那么其实不用考虑这个问题。 但是实际业务,敏感词总是随着时间不断变化的,所以我们需要支持敏感词的动态修改。
考虑到后续 sensitive-word 可能做精确的单个单词变化处理,我们最好可以知道每一次词内容的具体变化。 word 敏感词主题 word_before 变更前的单词 word_after 变更后的单词 调整后的建表语句: drop table word_log; create table word_log ( id int unsigned auto_increment comment '应用自增主键' primary key,...
sensitive-word基于 DFA 算法实现的高性能敏感词工具。工具使用 java 实现,帮助我们解决常见的问题。 特性 6W+ 词库,且不断优化更新 基于DFA 算法,性能较好 基于fluent-api 实现,使用优雅简洁 支持敏感词的判断、返回、脱敏等常见操作 支持全角半角互换
https://github.com/houbb/sensitive-word/issues/53 字典资源的释放 说明 支持版本:v0.16.1 我们在初始化引导类之后,如果不再使用,可以直接调用 destroy 释放掉字典资源。 释放方式 SensitiveWordBs wordBs = SensitiveWordBs.newInstance() .init(); // 后续因为一些原因移除了对应信息,希望释放内存。 wordBs....
考虑到后续 sensitive-word 可能做精确的单个单词变化处理,我们最好可以知道每一次词内容的具体变化。 word 敏感词主题 word_before 变更前的单词 word_after 变更后的单词 调整后的建表语句: droptableword_log;createtableword_log ( idintunsigned auto_increment comment'应用自增主键'primarykey, ...