帮朋友推荐一下工作,TextDiffuser解决Stable Diffusion无法生成文字图片的痛点,可以任意生成输入文字的图片。 同时也新建了一个AI工作推荐的专栏,欢迎大佬们自荐工作! arXiv: arxiv.org/abs/2305.1085 Code: github.com/microsoft/un Demo: huggingface.co/spaces/m Homepage: jingyechen.github.io/te 最近几年是AIGC...
框架还是UNet,主要用到了3个损失函数 score-matching损失,如果不知道可以参考songyang博士的论文arxiv.org/pdf/1907.0560 其中模型的三个输入 加噪图片 Binary Mask Map 挖掉text区域的图像。 这一步本质上是做text region inpainting 2. 其中A是attention map,G是高斯模糊,作者说加这一步是为了做低通滤...
论文链接: https://arxiv.org/abs/2305.10855 项目链接: https://jingyechen.github.io/textdiffuser/ 代码链接: https://github.com/microsoft/unilm/tree/master/textdiffuser demo链接: https://huggingface.co/spaces/microsoft/TextDiffuser ▲ TextDiffuser 的三个功能 本文提出了 TextDiffuser 模型,该模型包含...
论文地址:https://arxiv.org/abs/2305.10855 项目地址:https://jingyechen.github.io/textdiffuser/ 代码地址:https://github.com/microsoft/unilm/tree/master/textdiffuser Demo地址:https://huggingface.co/spaces/microsoft/TextDiffuser TextDiffuser 的三个功能 本文提出了 TextDiffuser 模型,该模型包含两个阶段,...
论文地址:https://arxiv.org/abs/2305.10855 项目地址:https://jingyechen.github.io/textdiffuser/ 代码地址:https://github.com/microsoft/unilm/tree/master/textdiffuser Demo地址:https://huggingface.co/spaces/microsoft/TextDiffuser TextDiffuser 的三个功能 ...
论文地址:https://arxiv.org/abs/2305.10855 项目地址:https://jingyechen.github.io/textdiffuser/ 代码地址:https://github.com/microsoft/unilm/tree/master/textdiffuser Demo地址:https://huggingface.co/spaces/microsoft/TextDiffuser TextDiffuser 的三个功能 ...
论文地址:https://arxiv.org/abs/2305.10855 项目地址:https://jingyechen.github.io/textdiffuser/ 代码地址:https://github.com/microsoft/unilm/tree/master/textdiffuser Demo地址:https://huggingface.co/spaces/microsoft/TextDiffuser TextDiffuser 的三个功能 ...
论文地址:https://arxiv.org/abs/2305.10855 项目地址:https://jingyechen.github.io/textdiffuser/ 代码地址:https://github.com/microsoft/unilm/tree/master/textdiffuser Demo地址:https://huggingface.co/spaces/microsoft/TextDiffuser TextDiffuser 的三个功能 ...
https://arxiv.org/abs/2305.10855 项目链接: https://jingyechen.github.io/textdiffuser/ 代码链接: https://github.com/microsoft/unilm/tree/master/textdiffuser demo链接: https://huggingface.co/spaces/microsoft/TextDiffuser ▲ TextDiffuser 的三个功能 ...
arxiv.org/abs/2311.1646代码链接:github.com/microsoft/un Talk·嘉宾介绍 陈竞晔 香港科技大学在读博士生 我是香港科技大学二年级博士生,师从陈启峰教授。我主要研究方向为扩散模型,文本渲染,与大语言模型。相关研究工作曾以第一作者身份发表于NeurIPS, CVPR, AAAI, IJCAI等国际会议。TextDiffuser-1曾于2023年6...