在 Stable Diffusion 的案例中,Stability AI 使用了 LAION-5B 图像集的一个子集,这基本上抓取了互联网上 50 亿张可公开访问的图像。最近对数据集的分析显示,许多图像来自 Pinterest、DeviantArt 甚至 Getty images 等网站。因此,“Stable Diffusion”吸收了许多在世艺术家的风格——这也遭到了其中一些艺术家的强烈反...
2022年可谓是AIGC(AI Generated Content)元年,上半年有文生图大模型DALL-E2和Stable Diffusion,下半年有OpenAI的文本对话大模型ChatGPT问世,这让冷却的AI又沸腾起来了,因为AIGC能让更多的人真真切切感受到AI的力量。这篇文章将介绍比较火的文生图模型Stable Diffusion(简称SD),Stable Diffusion不仅是一个完全开源的模...
前言发现大佬博主 Jay Alammar 科普了 Stable Diffusion 的原理,相信我们看完这篇文章后能彻底搞懂相关知识。 AI 图像生成技术 是近期以来最震撼人心的 AI 能力。通过文本描述生成生动图像所体现的能力,具有一种…
其实,这个团队在2021年底才开源了第一个Stable Diffusion模型。这个模型基于扩散模型和OpenAI的CLIP模型,能够根据文本提示生成高质量的图像,而且还能实现图像到图像的转换,比如把一张照片变成油画或漫画风格。在2022年初推出了Stable Diffusion 2.0版本,进一步提升了模型的性能和功能。这个版本使用了谷歌的T5-XXL模型作...
在Stable Diffusion发表之前,来自德国的学者和初创公司Runway,共同推出了一个名为Latent Diffusion的开源图像生成器。 而Mostaque拿了别人的作品,把自己的名字写在上面——这就是Stable Diffusion的由来。 而在「窃取」了别人的成果之后,Emad Mostaque凭借自己过人的口头本领,让Stability AI摇身一变成为估值10亿美元的初...
对于一般大众而言,AIGC的热议热潮,应当溯源至去年年底2022年,即Stable Diffusion的开源公布,以及随之而来的一系列借助Stable Diffusion为基础的工作。这些成果使得人工智能绘画领域呈现出前所未有的高品质创作与创意,而开源工具Stable Diffusion WebUI和ComfyUI与商业化产品Midjourney的问世,则大幅降低了普罗大众使用此类...
潜在扩散模型 | AIGC| Diffusion Model 图片感知压缩 | GAN | Stable Diffusion 随着生成型AI技术的能力提升,越来越多的注意力放在了通过AI模型提升研发效率上。业内比较火的AI模型有很多,比如画图神器Midjourney、用途多样的Stable Diffusion,以及OpenAI此前刚刚迭代的DALL-E 2。对于研发团队而言,尽管Midjourney...
这一切,都得益于Stable Diffusion团队的创新和开源。他们近日发布了最新AI绘画模型——DeepFloyd IF,一个强大的文本到图像的绘画模型,可以智能地将文字融入到图片中,实现像素级的图像生成。 DeepFloyd IF和之前的模型比又有哪些进步呢? 首先,它可以准确绘制文字,这是之前的AI绘画模型很难做到的。比如你想让它画一个...
最近尝试了一下Stable diffusion,直接发现新大陆,虽然一开始生图品质没有MidJourney好,但自由度直接打开,而且网络上很多开源模型可以组合,甚至到现在已经可以控制生图姿势,品质完全不输MidJourney。 先来说说AIGC是什么呢? AIGC全名为 AI Generated Content,即人工智能生成内容,所以AI绘图,AI作曲,AI回答问题都算是AIGC...
报道中提到AI图像生成器已经开始暴露出它们学到的偏见。比如将非洲人刻板地视为原始,将领导者默认为男性,将囚犯一般视为黑人。 为了探究真相! “奶茶”我用Stable Diffusion试着生成了一些图片: 相信大家都发现了! Stable Diffusion生成的四张科学家照片全都是西方白人男性!