GitHub is where people build software. More than 150 million people use GitHub to discover, fork, and contribute to over 420 million projects.
官方TensorFlow实现。主要代码都写在一个notebook里。 官方实现的PyTorch复现。 苏剑林的TensorFlow实现。用的生成模型不是PixelCNN而是Transformer。
The official implementation of "COMPOSER STYLE-SPECIFIC SYMBOLIC MUSIC GENERATION USING VECTOR QUANTIZED DISCRETE DIFFUSION MODELS" Overview We propose to combine a vector quantized variational autoencoder (VQVAE) and discrete diffusion models for the generation of symbolic music with desired composer styles... 最后论文: ArXiv. /abs/1711.00937 编辑:于腾凯 校对:林亦霖 关于我们 数据派THU作为数据科学类公众号,背靠清华大...
论文代码: 1 背景知识 Auto-encoder auto-encoder是一种无监督的算法,自编码器是一个输入和学习目标相同的神经网络,其结构分为编码器和解码器两部分。其思想是输入x经过encoder生成hidden layer特征z,再将z经过decoder重新预测生成x′ ...
github: github page: 知乎专栏: 计算机视觉/计算机图形理论与应用 微信公众号:机器学习杂货铺3号店 (二维码自动识别) ...
GitHub is where people build software. More than 100 million people use GitHub to discover, fork, and contribute to over 420 million projects.
我们以MNIST数据集为例,用一百来行实现一个简单的 encoder采用卷积层,输入x,输出为z_e(x)。decoder采用反卷积层,输入z_q(x),输出x。向量量化z_e(x)\rightarrow z_q(x)及embedding loss,commitment loss由类VectorQuantizer实现: class VectorQuantizer(nn.Module): def __ini...
本文主要做的就是VQ-VAE模型的pytorch复现,其中介绍 VQ-VAE的主要结构,模型优化的损失函数,codebook离散化结构,以及pixelCNN的相关结构。末尾还会给出利用mini-imagenet数据复现实验的结果。 代码地址: VQ-VAE模型结构 ...
BSQ代码,来自vector_quantize_pytorch的github LFQ和BSQ的原文链接给在下面,方便直接访问 简单说一下 LFQ 的原理,假设我们输入的audio经过encoder之后得到的 Z_e 的shape是(B, T, D);假设在 quantize 之前使用 Factorize 技巧,把 D 这一维下采样到 10,LFQ作者认为,在一个codebook中一个个查找维度为 10 的向...