如何优化Stable Diffusion WebUI以提高性能和内存利用率

在使用Stable Diffusion WebUI生成图像时,你可能会遇到性能不佳或内存占用过高的问题。本教程将介绍一些命令行参数优化选项,以帮助你提高性能,同时降低内存使用。

优化选项总览

以下是一些可用的优化选项和它们的说明:

命令行参数/优化选项 说明
--opt-sdp-attention 在某些系统上可能提高速度,但需要更多VRAM。
--opt-sdp-no-mem-attention 与上一个选项类似,但更可靠,性能稍差。
--xformers 启用xFormers库,显著降低内存消耗和提高速度,仅支持Nvidia GPU。
--force-enable-xformers 强制启用xFormers,不考虑系统支持情况,潜在不稳定。
--opt-split-attention 交叉注意力层优化,显著减少内存使用,几乎没有性能损失。
--disable-opt-split-attention 禁用上述优化。
--opt-sub-quad-attention 子二次注意力,内存高效的交叉注意力层优化,可显著降低内存使用。
--opt-split-attention-v1 使用较旧版本的交叉注意力优化,内存占用较低,但对生成较大图像有限制。
--medvram 减少Stable Diffusion模型的VRAM使用,性能略有下降,适用于节省VRAM。
--lowvram 更彻底的优化,分割unet模块以降低VRAM占用,性能显著下降,但节省内存。
--do-not-batch-cond-uncond 禁止批处理正面和负面提示,节省内存,性能下降(仅1.6.0之前版本)。
--always-batch-cond-uncond 禁用上述优化(仅1.6.0之前版本)。
--opt-channelslast 更改Stable Diffusion的内存类型,效果未详细研究。
--upcast-sampling 对通常需要--no-half参数的Nvidia和AMD卡启用,提高生成速度。

优化性能与内存占用测试

下表展示了不同优化选项在特定硬件和配置下的性能和内存占用情况。请注意,实际性能可能因硬件和配置而异。

优化选项 内存占用(批量大小1/2/4/8/16) 初始迭代速度 峰值迭代速度 备注
None 4.1 / 6.2 / OOM / OOM / OOM 4.2 4.6 性能较慢,容易内存不足
v1 2.8 / 2.8 / 2.8 / 3.1 / 4.1 4.1 4.7 性能较慢,内存占用最低,不需要xFormers
InvokeAI 3.1 / 4.2 / 6.3 / 6.6 / 7.0 5.5 6.6 与默认优化器几乎相同
Doggetx (默认) 3.1 / 4.2 / 6.3 / 6.6 / 7.1 5.4 6.6 默认优化器
Doggetx (medvram) 2.2 / 2.7 / 3.8 / 5.9 / 6.2 4.1 6.3 使用medvram预设可节省内存但性能尚可
Doggetx (lowvram) 0.9 / 1.1 / 2.2 / 4.3 / 6.4 1.0 6.3 使用lowvram预设性能极低,但内存节省较多
xFormers 2.8 / 2.8 / 2.8 / 3.1 / 4.1 6.5 7.5 性能快,内存占用低(需要启用xFormers)
xFormers (channelslast) 2.9 / 2.9 / 2.9 / 3.6 / 4.1 6.4 7.6 使用cuda_alloc_conf和opt-channelslast

请注意,性能在批量大小为1时约为峰值性能的70%左右,峰值性能通常在批量大小为8左右。性能在较大批量大小下可能会有所提高,但也可能因内存占用增加而下降。

额外优化提示(Windows)

  • 禁用硬件GPU调度。
  • 禁用浏览器硬件加速。
  • 在Nvidia控制面板中,将电源配置更改为“最大性能”。

结论

通过选择合适的优化选项,你可以在Stable Diffusion WebUI中提高性能并降低内存占用。请根据你的硬件和需求进行测试和优化,以获得最佳结果。

注意:本教程中的性能数据基于特定硬件和配置,实际结果可能会有所不同。请根据你的系统进行优化和测试。

本文由作者 王大神 原创发布于 大神网的AI博客。

转载请注明作者:王大神

原文出处:如何优化Stable Diffusion WebUI以提高性能和内存利用率

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2023年9月13日
下一篇 2023年9月13日

相关推荐

  • Python PEP 703:摆脱全局解释器锁的新篇章

    Python的指导委员会最近宣布接受了PEP 703(Making the Global Interpreter Lock Optional,让全局解释器锁成为可选),并公布了一份详细的路线图,计划让Python迈向自由线程的未来。这一决定引起了广泛的关注和讨…

    2023年10月27日
    00
  • 从Ventura到Sonoma:macOS升级体验

    近日,Apple发布了最新的macOS版本,Sonoma,带来了一系列新功能和改进。作为一名热爱技术的CEO,我急切地进行了升级,并希望与大家分享我的体验。在本文中,我将回顾我的升级之旅,谈谈Sonoma相对于Ventura的变化…

    2023年10月6日
    00
  • 如何选择适合你的MacBook:M1 Pro还是M2?

    在这个数字化时代,一台强大的电脑已经成为了许多人工作和娱乐的必需品。特别是在双十一大促期间,购买一台新的MacBook成为了许多人的计划之一。然而,在选择新电脑时,很多人都陷入了一个难题:是选择搭载M1 Pro芯…

    2023年10月23日
    00
  • 优化 VS Code:通过名称混淆缩减代码大小

    大家好!你有没有使用过 Visual Studio Code(简称 VS Code)?如果你是一名开发人员,那么你很可能使用过这款流行的开源代码编辑器。在这篇文章中,我将分享 VS Code 团队如何通过名称混淆技术将其 JavaScript 代…

    2023年9月19日
    00
  • 解决 Stable Diffusion 中的 AssertionError: extension access disabled because of commandline flags 错误

    如果你在使用 Stable Diffusion 时遇到了 AssertionError: extension access disabled because of commandline flags 错误,不要担心,这篇文章将帮助你解决这个问题。 这个错误通常是由于命令行标志禁用了扩展访问…

    2023年5月13日
    00
  • Gentoo Linux:源代码与二进制并存的新时代

    Gentoo Linux一直以来都是源代码发行版的代表,以其高度可定制性和技术挑战而闻名。然而,最近的一项决定将为用户带来一场变革:Gentoo宣布将提供二进制软件包,以满足不同需求的用户,这标志着Gentoo进入了源代码…

    2024年1月7日
    00
  • 极摩客 K1 6800H 小主机讨论

    极摩客 K1 6800H 小主机最近引起了广泛关注,其高性能配置和合理的价格吸引了众多潜在购买者。然而,对于是否值得投资这款小主机,存在着一些疑虑和讨论。在本文中,我们将深入探讨这款小主机的性能、系统、退货政…

    2023年4月16日
    00
  • 一加 Ace 2 Pro 极光绿与钛空灰:一场极致性能与设计的盛宴

    一加手机一直以来都以其卓越的性能、流畅的用户体验和独特的设计风格而备受消费者喜爱。今年,一加再次推出了一款备受期待的新机型——一加 Ace 2 Pro,它以其卓越的性能和独特的外观设计再次吸引了众多手机爱好者的…

    2023年10月28日
    00
  • 英特尔发布酷睿第14代桌面处理器:引领台式机性能新时代

    在计算机科技领域,新的硬件发布总是备受期待的时刻。今天,我们将带您深入了解英特尔最新发布的酷睿第14代桌面处理器,也被称为Raptor Lake Refresh。这款处理器的推出将为PC发烧友们带来怎样的性能提升和台式机体…

    2023年10月17日
    00
  • 三星 S23 是否值得购买?

    近年来,手机市场竞争激烈,各种品牌的手机琳琅满目,给消费者带来了更多的选择。其中,三星 S23备受关注,但是是否值得购买呢?在本教程中,我们将深入探讨这个问题,帮助你做出明智的购买决策。 起初的困惑 你可…

    2023年4月9日
    00