Stable Diffusion XL Turbo 实时生成 AI 图像

type

status

date

slug

summary

SDXL Turbo 建立在 SDXL 1.0 的基础上，并为文本到图像模型实现了一种新的蒸馏技术：对抗性蒸馏 (ADD)。

该技术将图像生成步骤从 50 个减少到单个步骤，同时保持高图像质量。

与其他蒸馏技术一样，ADD 使用先前训练的大型扩散图像模型作为教师网络。 SDXL Turbo 研究论文详细介绍了该模型的新蒸馏技术，可在此处获取。

Stability AI 写道，通过集成 ADD，SDXL Turbo 提供了 GAN（生成对抗网络）中也有的许多优势，例如输出单步图像，同时避免其他蒸馏方法经常观察到的伪影或模糊。

同时，它可以一步生成更高的质量。据称，SDXL Turbo 只需 4 个步骤即可达到 SDXL 50 个步骤的图像质量。

Stability AI 通过使用相同的提示生成图像来比较几种不同的模型变体（StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL）。

然后向人类评估人员展示两个随机输出，并要求选择最接近提示的输出。然后使用相同的方法进行另一次图像质量测试。

在这些盲测中，SDXL Turbo 仅用一步即可击败 LCM-XL 的 4 步配置，仅用 4 步即可击败 SDXL 的 50 步配置。

特别是后者的测试表明，SDXL Turbo 在速度方面可以明显优于计算要求明显较低的计算密集型多步模型，甚至在图像质量方面表现略好。

此外，SDXL Turbo 还显着提高了推理速度。在 Nvidia A100 上，SDXL Turbo 只需 207 毫秒即可生成 512x512 图像（快速编码 + 单个降噪步骤 + 解码，fp16）。

如果您想测试 Stable Diffusion XL Turbo 的免费演示，可以在 Clipdrop 上进行。该演示不用于商业目的。任何对商业用途感兴趣的人都应该直接联系 Stability AI。

在盲测中，SDXL Turbo 在速度和图像质量方面优于计算密集型多步模型。 Clipdrop 上提供免费演示版本；商业应用程序应直接向 Stability AI 请求。

Ai-皇帝