GLUE数据集包含九项英文的自然语言理解任务,是该领域学术论文的通用benchmark数据集。其中斯坦福情感树库(SST2)包含67349个句子及其情感标签,适用于情感分析任务。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 https://gluebenchmark.com/
(2) SST-2 (3) MRPC (4) STSB (5) QQP (6) MNLI (7) QNLI (8) RTE (9) WNLI 3. 榜单排名 4. 数据集下载 1. 简介 自然语言处理(NLP)主要自然语言理解(NLU)和自然语言生成(NLG)。为了让NLU任务发挥最大的作用,来自纽约大学、华盛顿大学等机构创建了一个多任务的自然语言理解基准和分析平台,...
1.UCI 数据集介绍 UCI数据集网址如下 http://archive.ics.uci.edu/ml/index.php 例如点开iris数据集,会出现以下信息 图片: 在下面的Data Set Information介绍了数据集的详细信息,下面的Attri... KITTI数据集介绍 目录1、KITTI数据集概述 2、kitti数据采集平台 3、Kitti数据集标注格式 参考文献: 1、KITTI数据集...
本文的目的在于针对GLUE的九个任务分别做一个相对详细的说明,给出一些样例,有一个相对整体确切的感受,同时提供一个可以方便下载GLUE数据集的链接,供读者使用。 二、任务介绍 GLUE共有九个任务,分别是CoLA、SST-2、MRPC、STS-B、QQP、MNLI、QNLI、RTE、WNLI。如下图图2所示,可以分为三类,分别是单句任务,相似...
数据集 | GLUE斯坦福情感数据集 GLUE数据集包含九项英文的自然语言理解任务,是该领域学术论文的通用benchmark数据集。其中斯坦福情感树库(SST2)包含67349个句子及其情感标签,适用于情感分析任务。 1. 字段描述 2. 数据预览 3. 字段诊断信息
SST(The Stanford Sentiment Treebank),是斯坦福大学发布的一个情感分析数据集,主要针对电影评论来做情感分类,因此SST属于单个句子的文本分类任务(其中SST-2是二分类,SST-5是五分类,SST-5的情感极性区分的更细致); MRPC(Microsoft Research Paraphrase Corpus),由微软发布,判断两个给定句子,是否具有相同的语义,属于句...
一、简介 GLUE(General Language Understanding Evaluation)由来自纽约大学、华盛顿大学等机构创建的一个多任务的自然语言理解基准和分析平台。 GLUE共有九个任务,分别是CoLA、SST-2、MRPC、STS-B、QQP、MNLI、QNLI、RTE、WNLI
2.2 SST-2 (The Stanford Sentiment Treebank,斯坦福情感树库), 单句子分类任务,包含电影评论中的句子和它们情感的人类注释。这项任务是给定句子的情感,类别分为两类正面情感(positive,样本标签对应为1)和负面情感(negative,样本标签对应为0),并且只用句子级别的标签。也就是,本任务也是一个二分类任务,针对句子级别...
百度ERNIE此次登顶,成为首个突破90大关的模型,并在CoLA、SST-2、QQP、WNLI等数据集上达到SOTA。相对BERT的80.5的成绩,提升近10个点,取得了显著的效果突破。 ERNIE 2.0持续学习的语义理解框架,支持增量引入不同角度的自定义预训练任务,通过多任务学习对模型进行训练更新,每当引入新任务时,该框架可在学习该任务的同时...
Glue基准中包含了9个不同的任务,每个任务都有自己的数据集和评估指标。这些任务分别是: 1. CoLA(语言可接受性判断):给定一个句子,判断它是否为合法的英语句子。 2. SST-2(情感分析):给定一个句子,判断它所表达的情感是正面还是负面。 3. MRPC(文本匹配):给定两个句子,判断它们是否具有相似的意思。 4. STS...