PixArt-α是一款基于Transformer的文本到图像生成模型,其竞争力的图像生成质量和显著降低的训练成本使其媲美Midjourney和SDXL。采用训练策略分解、高效的T2I Transformer和高信息密度数据训练,PixArt-α在高分辨率图像合成和复杂文本提示下表现出色,训练速度仅为Stable Diffusion v1.5的10.8%。PixArt支持高达1024像素的高分辨...