数据集:VCTK(109人)与LibriSpeech(460人) 模型结构:WaveNet风格的VQ-VAE,压缩比高达64x 语义学习:可从语音中学习到接近音素级的离散编码(未使用任何标注) 。重要特征往往横跨输入数据空间的多个维度。 语者转换:图6展示同一内容在不同语者之间的转换效果一致 ...
将GCN的全图训练方法改为小批量训练方式,使大规模图数据的分布式训练成为可能 对聚合邻居的操作进行拓展,提出了替换原有聚合操作的几种新方式 二、简介 截止目前(2017年),图卷积网络(GCN)仅应用于固定的图与transductive任务。 本文将GCN扩展到可归纳的(inductive)无监督学习的任务,并提出了一个框架。 该框架将GCN...
将GCN的全图训练方法改为小批量训练方式,使大规模图数据的分布式训练成为可能 对聚合邻居的操作进行拓展,提出了替换原有聚合操作的几种新方式 二、简介 截止目前(2017年),图卷积网络(GCN)仅应用于固定的图与transductive任务。 本文将GCN扩展到可归纳的(inductive)无监督学习的任务,并提出了一个框架。 该框架将GCN...
因此竞赛举办方选择了图像分类问题作为本次竞赛的任务,并构建了与 ImageNet 兼容的全新数据集。举办方首先选择了一批从来没有用在公开数据集的图像,使用预训练的 ImageNet 分类器进行分类,之后人工验证这些分类器的分类结果是否正确。 这个全新的数据集被分为两部分: DEV 数据集,在比赛开始提供给参赛者,用来开发参赛...
为了加速对对抗性示例的研究,Google Brain正在NIPS 2017竞赛轨道内组织对抗性示例和防御竞赛。该数据集包含该比赛的发展图像。 对抗示例和防御竞赛包括三个子竞赛: 非目标对抗攻击。非目标攻击的目标是对源图像进行轻微修改,以使图像通常被未知的机器学习分类器错误分类。
为了实现这一点,需要推理出连接给定集合的概念,然后根据它们与所推断概念的相关性来检索单词。由于潜在的应用范围很广,因此这是一项重要的任务,包括个性化信息检索,计算广告,标记大量未标记或标记较弱的数据集。 4.2.1 文本概念集合检索 4.2.2 图像标签 4.3 设置异常检测...
很容易想到,场景认知有许多可能的应用领域,上面提到的这个人和 AI 互动的例子就是一种简单的情况。IBM 和 UIUC 联合开发的算法在两个广泛使用的数据集中都刷新了当前的最好成绩:在 Flickr 30K 实体数据集上达到了 53.97% 准确率,超过此前最佳的 50.89%;然后在 ReferItGame 数据集上获得了 34.7% 的准确...
他们进行了大量的实验来评估结构化生成对抗网络。实验表明 SGAN 能够学习出一个高度可控的条件生成器,以及数据的解耦和的表示。SGAN 在半监督分类任务的多个数据集上都取得了很好的实验结果。得益于对 y 和 z 的分开建模,SGAN 能够生成高质量并且严格遵循指定语义的样本。此外,SGAN 还能被扩展来进行一些有趣的...
我们将最后一层的输出直接限制为二进制编码,而这种做法在基于深度学习哈希算法中很少被研究。由于哈希编码的离散性质,我们使用交替优化方法来求解目标函数。实验结果表明,我们的方法在基准数据集上的表现要好过目前最好的哈希方法。戳「阅读原文」,查看机器之心NIPS 2017专题策划并参与其中。
他们进行了大量的实验来评估结构化生成对抗网络。实验表明 SGAN 能够学习出一个高度可控的条件生成器,以及数据的解耦和的表示。 SGAN 在半监督分类任务的多个数据集上都取得了很好的实验结果。得益于对 y 和 z 的分开建模,SGAN 能够生成高质量并且严格遵循指定语义的样本。此外,SGAN 还能被扩展来进行一些有趣的...