新闻资讯
Stable Diffusion XL Turbo 实时生成 AI 图像
00 分钟
2023-11-30
2024-3-14
type
status
date
slug
summary
tags
category
icon
password
URL

Stability AI 推出了 SDXL Turbo,这是一种新的文本到图像模型,可以实时生成高质量的 AI 图像。

SDXL Turbo 建立在 SDXL 1.0 的基础上,并为文本到图像模型实现了一种新的蒸馏技术:对抗性蒸馏 (ADD)。
该技术将图像生成步骤从 50 个减少到单个步骤,同时保持高图像质量。
与其他蒸馏技术一样,ADD 使用先前训练的大型扩散图像模型作为教师网络。 SDXL Turbo 研究论文详细介绍了该模型的新蒸馏技术,可在此处获取。
Stability AI 写道,通过集成 ADD,SDXL Turbo 提供了 GAN(生成对抗网络)中也有的许多优势,例如输出单步图像,同时避免其他蒸馏方法经常观察到的伪影或模糊。
同时,它可以一步生成更高的质量。据称,SDXL Turbo 只需 4 个步骤即可达到 SDXL 50 个步骤的图像质量。

SDXL Turbo 仅用四步就击败了 SDXL

Stability AI 通过使用相同的提示生成图像来比较几种不同的模型变体(StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL)。
然后向人类评估人员展示两个随机输出,并要求选择最接近提示的输出。然后使用相同的方法进行另一次图像质量测试。
在这些盲测中,SDXL Turbo 仅用一步即可击败 LCM-XL 的 4 步配置,仅用 4 步即可击败 SDXL 的 50 步配置。
图片:稳定性人工智能
图片:稳定性人工智能
特别是后者的测试表明,SDXL Turbo 在速度方面可以明显优于计算要求明显较低的计算密集型多步模型,甚至在图像质量方面表现略好。
此外,SDXL Turbo 还显着提高了推理速度。在 Nvidia A100 上,SDXL Turbo 只需 207 毫秒即可生成 512x512 图像(快速编码 + 单个降噪步骤 + 解码,fp16)。
如果您想测试 Stable Diffusion XL Turbo 的免费演示,可以在 Clipdrop 上进行。该演示不用于商业目的。任何对商业用途感兴趣的人都应该直接联系 Stability AI。

总结

  • Stability AI 推出了 SDXL Turbo,这是一种文本到图像模型,可使用对抗扩散蒸馏 (ADD) 技术实时生成高质量的 AI 图像。
  • SDXL Turbo 将图像生成步骤数从 50 个减少到最多 1 个步骤。只需四步即可达到SDXL的品质。
  • 在盲测中,SDXL Turbo 在速度和图像质量方面优于计算密集型多步模型。 Clipdrop 上提供免费演示版本;商业应用程序应直接向 Stability AI 请求。

评论
  • Twikoo