目前AI绘画最火的当属Midjorney和Stable Diffusion,但是由于Midjourney没有开源,因此我们主要分享下Stable Diffusion,后面我们会补充介绍下Midjourney。 公开资料显示,Stable Diffusion是StabilityAI公司于2022年提出的,论文和代码都已开源。StabilityAI在10月28日完成了1.01亿美元的融资,目前估值已经超过10亿美元。 大家可以...
在Stable Diffusion发布几天内,Stability AI就从两家名叫Coatue和Lightspeed的公司获得了1亿美元的投资。这笔投资,是Mostaque早先筹得资金的8倍。而这轮融资,直接让Stability AI的估值冲破了10亿美元,尽管此时公司尚未盈利。随后的新闻稿中,都只说了Stable Diffusion背后的公司是Stability AI,丝毫未提德国团队以及R...
业界普遍认为,Stability AI的迅速崛起给OpenAI造成了不小压力,John Carmack(AGI初创公司Keen Technologies创始人,前Oculus CTO)表示「Stable Diffusion是一个开源炸弹。OpenAI虽然资金充裕,但从商业化以及产品化的角度很难与其匹敌。」 在AI研究...
6月份Stability AI发布第一个开源模型Stable Diffusion 3 Medium,但是未能满足社交媒体期望,像是生成的人物身形怪异、手指变形、或是未能按照提示生成图像等,迫使该公司为此致歉。原因可能出于开源版本只有20亿参数,效果远不如付费版本。为此Stability AI决定重新开发一个版本,而非以修补方式强化原来的Stable Diffusion 3...
2022年10月17日,AIGC (AI Gererative Content)领域的知名项目 Stable Diffusion —— 背后的公司 Stability AI 宣布获得了来自 Coatue、光速资本 以及 O'Shaughnessy 总计 1.01 亿美元的种子轮投资,资金将用来面向图像、语言、音频、视频以及 3D 领域的 AI 模型开发,投后估值达到 10 亿美元。
Stability AI 的应用机器学习主管 Joe Penna 在接受采访时指出,Stable Diffusion XL 1.0 包含 35 亿个参数,可以在"几秒钟内"生成多种长宽比的 100 万像素分辨率的完整图像。"参数"是模型从训练数据中学到的部分,基本上定义了模型处理问题的技能,这里指的是生成图像。上一代稳定扩散模型 Stable Diffusion XL ...
懂的都懂。Stability AI最后强调、表示,该公司将根据用户反馈不断改进Stable Diffusion 3 Medium,不断地扩展新功能,提高性能。目标是为人工智能生成艺术创造一个新的标准,致力于使Stable Diffusion 3 Medium成为广大专业人士和爱好者的创作利器,期待能和用户共同打造生成式人工智能的未来。#深度好文计划# ...
Stable Diffusion 其实并不是 Stability AI 开发的产品,这款模型最初是由项目负责人 Robin Rombach 攻读博士学位的慕尼黑大学和另一个 AI 视频创企 runway 共同开发的开源模型项目 Latent Diffusion。 而Stability AI 最初只是为项目提供了计算资源,才取得了冠名权。而 2022 年,Stability AI 说服了负责人 Robin Rom...
1.【Stable Diffusion 3论文发布:MMDiT架构革新图像与语言处理】 继宣布Stable Diffusion 3 的早期预览版之后,Stability AI于3月5日发布了新模型的研究论文,深入探讨该版本大模型的底层技术基础和技术细节。论文中提出了MMDiT这一新的多模态扩散变压器 (MMDiT) 架构,该架构对图像和语言表示使用单独的权重集,与以前版...
Stability AI的首席执行官Emad Mostaque表示——「Stable Diffusion 3 采用了Diffusion Transformer架构,这是一种新型的架构设计,与OpenAI最近推出的Sora模型采用的架构相似。」在以前的Stable Diffusion版本中,并未采用Transformer技术。而Stable Diffusion 3.0采用了一种全新的方法,引入了Diffusion Transformer 技术。如果...