今天给大家带来一篇性别偏见探索和缓解的中文数据集-CORGI-PM,全名《CORGI-PM: A Chinese Corpus For Gender Bias Probing and Mitigation》,共包含32900个高质量标签的句子,是第一个用于性别偏见探测和缓解的句子级中文数据集,共包含3种任务:偏见检测、偏见分类和偏见缓解。 paper:
基于此,我们设计了一系列步骤构建了一个句子级的性别无偏中文数据集SlguSet(Sentence-Level Gender-Unbiased Data Set),并在该数据集上对不同的预训练语言模型中的性别偏见进行评价,如Figure 1所示。 2 相关工作 自然语言处理中性别偏见的产生和分类 导致自然语言处理模型产生性别偏见的最主要原因是数据本身。含有不...
aSave configuration changes exit now 现在保存配置变化出口 [translate] aSection I discusses the database and its relation to other survivor-bias corrected data sets. 第I部分谈论数据库和它的联系对其他幸存者偏心校正的数据集。 [translate] 英语翻译 日语翻译 韩语翻译 德语翻译 法语翻译 俄语翻译 阿拉伯...
SAEM算法或一阶条件估计这些数据得到的结果集(FOCE)算法(nlme R软件功能的实现)进行了比较:偏见和根均方误差几乎所有的SAEM估计小于FOCE的。最后,我们应用扩展SAEM算法分析上,一种新的蛋白酶抑制剂阿扎那韦替诺福韦的药代动力学的相互作用,从国家的通讯社 - RECHERCHE SUR LE思达107拼图2研究。的阿扎曲线下面积显着...
今天给大家带来一篇性别偏见探索和缓解的中文数据集-CORGI-PM,全名《CORGI-PM: A Chinese Corpus For Gender Bias Probing and Mitigation》,共包含32900个高质量标签的句子,是第一个用于性别偏见探测和缓解的句子级中文数据集,共包含3种任务:偏见检测、偏见分类和偏见缓解。
因此,该论文提出了第一个用于性别偏见探测和缓解的句子级中文语料库,采用一种自动方法(如图1所示,对含有性别偏见得分高的词的样本进行召回,然后根据其句子级性别偏见概率对样本进行重新排序和过滤),从现有的大规模中文语料库中构建可能存在性别偏见的句子集,再通过精心设计的标注方案,对候选数据集进行进一步的标注,构建...
基于此,我们设计了一系列步骤构建了一个句子级的性别无偏中文数据集SlguSet(Sentence-Level Gender-Unbiased Data Set),并在该数据集上对不同的预训练语言模型中的性别偏见进行评价,如Figure 1所示。 2 相关工作 自然语言处理中性别偏见的产生和分类 导致自然语言处理模型产生性别偏见的最主要原因是数据本身。含有不...