Sensitive-words 是一个基于Python的敏感词过滤工具,其核心算法采用了Aho-Corasick算法,可以在O(n+k)的时间复杂度内完成大量关键词的搜索工作。该工具提供了多种敏感词匹配算法,并支持自定义敏感词库和替换策略。Sensitive-words 还具有开源免费、易于使用的特点,可以快速准确地对文本中的敏感词进行过滤,保护用户的隐私...
sensitive-words 基于DFA算法实现的敏感词过滤算法 在实现文字过滤的算法中,DFA是唯一比较好的实现算法。 DFA 全称为:Deterministic Finite Automaton,即确定有穷自动机。其特征为:有一个有限状态集合和一些从一个状态通向另一个状态的边,每条边上标记有一个符号,其中一个状态是初态,某些状态是终态。但不同于不确...
Dictionaries,Databases,Production,Information filters,Information management,Monitoring,PythonTaking Chongqing Three Gorges Medical College as the research object, we design and implement a website group data monitoring system based on sensitive words filtering. The monitoring target of the system is the ...
v2.6 更新Python版本到Python3.6,修正Github页面爬虫 Sensitive info scan tool of Github Function introduction and design GitPrey is a tool for searching sensitive information or data according to company name or key word something.The design mind is from searching sensitive data leakling in Github: ...
SensitiveWords 是一个基于 DFA (Deterministic Finite Automaton) 算法的敏感词查找/替换工具。它通过将文本中的敏感词与预定义的敏感词列表进行比较,以实现敏感词的查找和替换功能。 SensitiveWords 的主要工作原理是使用一个有限状态自动机(DFA)来匹配文本中的敏感词。这个有限状态自动机由一系列状态、转移函数和初始...
ChatSensitiveWords是一个基于机器学习的敏感词库,用于自动判别文本中是否涉及敏感词。它使用LLM(Language Model)模型来训练一个敏感词检测器,通过对大量文本数据进行训练,学习到不同敏感词的特征和模式,以便在新的文本数据上进行快速准确的敏感词检测。 具体来说,ChatSensitiveWords通过以下步骤实现敏感词检测: 1. 收集...
v2.6 更新Python版本到Python3.6,修正GitHub页面爬虫 Sensitive info scan tool of GitHub Function introduction and design GitPrey is a tool for searching sensitive information or data according to company name or key word something.The design mind is from searching sensitive data leakling in GitHub: ...
链网盘 极易离线加速下载 对象存储 极易网盘 精品笑话 优质资源搜索 文库 搜图 搜软件 搜文档 搜视频 极易资源 搜资源 码农集市 文档 源码 极易生活 有极易生活搜尽天下资源 搜视频、漫画、音乐、电子书看极易生活 极易生活搜尽天下真题 电子书 视频 c源码 php源码 java源码 c++源码 美图啦 淘资源 python...