def contains_sensitive_word(text, sensitive_words): for word in sensitive_words: if word in text: return True return False 3. 对输入的文本使用编写的函数进行敏感词过滤 我们可以编写另一个函数,该函数将接收文本和敏感词列表作为输入,并返回经过过滤的文本。 python def filter_sensitive_words(text, ...
sensitive_words = ['敏感词1', '敏感词2'] def filter_sensitive_words(text): # 使用正则表达式检测并替换敏感词 for word in sensitive_words: pattern = re.compile(rf'\b{re.escape(word)}\b', re.IGNORECASE) text = pattern.sub('*' * len(word), text) return text # 示例 text = "这段...
replace_word)returntext# 测试敏感词过滤程序text='这是一段包含敏感词的文本,敏感词1和敏感词2应该被替换'filtered_text=filter_sensitive_words(text)print(filtered_text)
class ArticleFilter(object): # 实现文章敏感词过滤 def filter_replace(self, string): # string = string.decode(“gbk”) # 存放敏感词的列表 filtered_words = [] # 打开敏感词库读取敏感字 with open(sensitive_word_stock_path) as filtered_words_txt: lines = filtered_words_txt.readlines() for l...
importreclassSensitiveWordFilter:def__init__(self,sensitive_words):self.sensitive_words=sensitive_wordsdefreplace_sensitive_words(self,text):forword,replacementinself.sensitive_words.items():text=re.sub(r'\b'+re.escape(word)+r'\b',replacement,text,flags=re.IGNORECASE)returntext# 示例的敏感词列表...
对于前端的搜索内容进行控制,比如敏感词过滤,同样使用socket,这里使用Python语言做一个demo。这里不得不感叹一句,socket真是太神奇了,可以跨语言把功能封装,为前端提供服务。 下面就是一个Python通过socket提供敏感词过滤的demo:https://github.com/1049451037/sensitive_word_filter_socket_server ...
node = self.rootforcharinword:ifcharnotinnode.children: node.children[char] = TrieNode() node = node.children[char] node.is_end_of_word =Truedefbuild_trie(filter_word_list): trie = Trie()forwordinfilter_word_list: trie.insert(word)returntriedefreplace_sensitive_words_with_trie(content,...
(curr_dir,'sensitive_word_stock.txt')# 获取存放敏感字库的路径# print(sensitive_word_stock_path)classArticleFilter(object):# 实现文章敏感词过滤deffilter_replace(self, string):# string = string.decode("gbk")# 存放敏感词的列表filtered_words = []# 打开敏感词库读取敏感字withopen(sensitive_word_...
replace(i,replace_str) return word print filterwords('filtered_words.txt') 再例如反黄系列: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 开发敏感词语过滤程序,提示用户输入评论内容,如果用户输入的内容中包含特殊的字符:敏感词列表 li = ["苍老师","东京热",”武藤兰”,”波多野结衣”] 则将...
def filterwords(x): with open(x,'r') as f: text=f.read() print text.split('\n') userinput=raw_input('myinput:') for i in text.split('\n'): if i in userinput: replace_str='*'*len(i.decode('utf-8')) word=userinput.replace(i,replace_str) ...