lcqmc数据集,哈工大发表的一个中文问答匹配数据集总样本数为:260068,其中,匹配样本个数为:149226,不匹配样本个数为:110842 中文SNLI数据集:中文自然语言推理数据集(A large-scale Chinese Nature language inference and Semantic similarity calculation Dataset) 本数据及通过翻译加部分人工修正的方法,从英文原数据集生...
这个数据集上BERT对参数极其敏感,结果波动很大。可以用小一点的learning rate,多试一些种子。我Dev大概...