tensorrt模型地址:stabilityai/stable-diffusion-3-medium-tensorrt · Hugging Face diffusers模型地址:stabilityai/stable-diffusion-3-medium-diffusers · Hugging Face 效果图: 二、特点 Stable Diffusion 3 Medium 架构采用的是Multimodal Diffusion Transformer (MMDiT) ,其在图像质量、排版、复杂提示理解和资源效率方...
Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):拥有 26 亿参数,针对消费级硬件进行了优化,可在 0.25 到 2 兆像素分辨率下表现出色。 这些模型在 Stability AI 社区许可下免费供商业和非商业使用。 模型下载地址 国内可以通过modelscope下载 Stable Diffusion 3.5 Large下载:modelscope.cn/models/AI Stable ...
为此,Anthropic 发布了 MCP 协议 (Model Context Protocol),方便大模型连接数据和应用等局部和在线资源,从而可以构建起以大模型为核心、Agent 为应用的生态系统,人工智能操作系统的雏形也已经显现。阿里巴巴通义大模型也在此深耕,通义完整的基础模型系列、一站式大模型服务平台百炼、模型开源平台 ModelScope 和互连...
自然语言处理领域的自回归模型、擅长视觉任务的扩散模型和常用于 AI for Science 方向的图神经网络模型,都呈现了逐步收敛到 Transformer 架构之上的发展趋势。 在过去的一年,Sora 的出现不仅仅是视频生成的突破,也改变了视觉方向的底层架构设计,DiT (Diffusion Transformer) 迅速成为视觉方向业界公认的基础架构,算法的设计...
model card 模型卡(仅仅翻译了有关禁止使用的节选) (模型卡不是使用条款,相当于模型使用说明书) https://github.com/CompVis/stable-diffusion/blob/main/Stable_Diffusion_v1_Model_Card.md The model should not be used to intentionally create or disseminate images that create hostile or alienating environm...
用这个迷你的小盒子跑 Stable Diffusion 在这台设备上,跑一张 512x512 的图,生成时间不到 1s,跑一张 512x768 的图,时间也不过 1s 出头。要知道不论是价格还是功耗,它可比“显卡”便宜多了。而且,它应该不光能做图片生成使用,还能折腾一些其他的事情,这些后面有机会我们再来展开。
[CVPR2024 (Highlight)] RichDreamer: A Generalizable Normal-Depth Diffusion Model for Detail Richness in Text-to-3D. Live Demo:https://modelscope.cn/studios/Damo_XR_Lab/3D_AIGC - modelscope/richdreamer
Tripo 和 Rodin 三维生成模型也展现了令人鼓舞的前景。科学方向基于扩散模型的 RFDiffusion 和 Chroma 算法可以用于蛋白质设计。微软发布了可以快速生成不同类型无机材料的基础模型 MatterGen。医疗方向也在用生成模型解决医疗数据稀缺的问题。随着各个模态生成基础模型性能的成熟,其它方向也会如此。
在过去的一年,Sora的出现不仅仅是视频生成的突破,也改变了视觉方向的底层架构设计,DiT(Diffusion Transformer)迅速成为视觉方向业界公认的基础架构,算法的设计都往这种架构收敛,这就是算法发展的不可预料性和强大活力。Transformer问世于2017年,当时在NLP领域只用了两三年时间迅速替代当时的主流框架LSTM。在Transformer没有诞...
Midjourney可以理解为AI绘画界的苹果手机,闭源,但是绘图效果好、质量高;Stable Diffusion则相当于AI绘画...