Kaggle 文本多标签分类赛题恶意评论分类top 1%方案和一些思考 jigsaw-toxic-comment-classification-challenge 赛题描述 给定来自维基百科的评论,完成6个类别的多标签分类(每条样本可能属于多个类别),大概就是toxic(恶意),severetoxic(穷凶极恶),obscene(猥琐),threat(恐吓),insult(侮辱),identityhate(种族歧视)其中几个...
https://www.kaggle.com/eikedehling/feature-engineering 一般word2vec就仅仅对word,而加上char做deeplearning效果会更好,就像char tf-idf:https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge/discussion/52702 15th 通过使用BPEmb和Spell Correction来尽可能解决oov的问题:https://www.kaggle.co...
这个是关于FE的kernel(受其启发,加入一些统计feature):https://www.kaggle.com/eikedehling/feature-engineering 一般word2vec就仅仅对word,而加上char做deeplearning效果会更好,就像char tf-idf:https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge/discussion/52702 15th 通过使用BPEmb和Spell Co...
我看到的第一个 NLP 比赛是 Toxic Comment Classifcation Competition(恶意评论分类),包括一个数据集,其中大量数据来自维基百科讨论页面的评论,通过评论在等级上的得分,来区分是侮辱、淫秽,还是恶意评论等。参与者面临的挑战是预测给定评论的恶意标签。 我选择用于分析的 EDA 是 Jagan 的 Stop the S@#$ - Toxic ...
https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge 赛题描述:给定指定的评论完成6个类别的多标签分类(每条样本可能属于多个类别),大概就是toxic(恶意),severe_toxic(穷凶极恶),obscene(猥琐),threat(恐吓),insult(侮辱),identity_hate(种族歧视)其中几个,评论数据来自于维基百科,数据比较脏,...
我看到的第一个 NLP 比赛是 Toxic Comment Classifcation Competition(恶意评论分类),包括一个数据集,其中大量数据来自维基百科讨论页面的评论,通过评论在等级上的得分,来区分是侮辱、淫秽,还是恶意评论等。参与者面临的挑战是预测给定评论的恶意标签。 我选择用于分析的 EDA 是 Jagan 的 Stop the S@#$ - Toxic ...
我看到的第一个 NLP 比赛是 Toxic Comment Classifcation Competition(恶意评论分类),包括一个数据集,其中大量数据来自维基百科讨论页面的评论,通过评论在等级上的得分,来区分是侮辱、淫秽,还是恶意评论等。参与者面临的挑战是预测给定评论的恶意标签。 我选择用于分析的 EDA 是 Jagan 的 Stop the S@#$ - Toxic ...
链接:https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge 这场比赛中,你需要建立一个“多头”模型,用来自维基百科的讨论页编辑的评论数据集,检测不同类型的有害评论,如威胁,淫秽,人身攻击和地域攻击。 在这次比赛中,注意关注各种预处理技术,你可以将这些技术应用于原始数据,以适应你的分类算法...
第6名:https://www.kaggle.com/c/jigsaw-multilingual-toxic-comment-classification/discussion/161095 Google QUEST Q&A 标签:提高对复杂问答内容的自动化理解 比赛时间:2019.11-2020.2 项目背景:人类更擅长解决需要对上下文进行更深入、多维理解的主观问题——计算机没有经过训练才能做得很好……但是……问题可以有多种...
【Kaggle恶意评论分类比赛第一名方案】《1st place solution overview - Toxic Comment Classification Challenge | Kaggle》by Chun Ming Lee http://t.cn/RngJyE5