提示权重和新文本解析器(测试版)
新重量解析器,已更新
6 月 11 日更新,增加了更清晰的示例、练习和小型测验
权重是我们的 Web UI 和 Telegram 机器人的一项新功能,由一个名为 "文本解析器"(Text Parser)的子系统实现。旧的文本分析器不支持权重,新的则支持。你可以在两者之间切换。
网络用户界面: 点击 "高级选项",然后切换此开关将其打开:
电报:在渲染时添加此命令:
/render /parser:new 您的提示在这里 (dog:2) 等
除非调用其中之一,否则权重将被忽略。当我们的 Beta 阶段结束后,解析器命令就会消失。
重量简介
You’ve probably seen an Stable Diffusion prompt that looks like thing like this: <yae-miko:0.7>. This is a way of adding or subtracting its effect from a prompt, where the default value is 1, too much is 2, and a negative number is bad news. It is similar to negative guidance, where things get eerie.
Side note about syntax: In our system, pointed brackets like <this> means AI model, like a LoRA and round parenthesis (like this) are used for words, also called Tokens. This guide teaches both kinds.
重量范围和安全默认值
大于 0 的数字,即使是小数,仍然是正权重。因此,尽管 0.7 看起来小于整 1,但 (dog:0.7) 这样的表达式仍然意味着会 有狗的图像出现。小于 0 是负数,而负数通常是坏消息。
在加权中,负数的作用与负数提示不同。你可能指的是零,而不是负数。负权重是 "阴阳魔界"(Twilight Zone),事情会变得阴森恐怖,比如负Guidance 。有可能,但很奇怪。
最常用的重量是 0.7
尤其是 LoRA。许多人认为 0.7 是最安全的起点,因为它提供了路权,使基础模型可以设置美术style ,但仍然可以完成其工作。尤其是在使用 LoRA 时,除非您想要非常大胆的效果,否则很少使用 1 或更大的权重。
图 1:权重与正面提示
有三种方法可以表达对 "狗 "这个字的格外关注:
(dog:1.1)、(dog) 和 ((dog:1.1)) ,但一般不建议使用最后一种,因为它会增加control 的难度,并可能导致不好的结果。
砝码为何有用
加权提示有助于表达相对的想法。例如,要render 狗的形象具有猫的一些特征,可以这样提示:
/render /parser:new a (cat:2,dog:0.5)
请注意,它的鼻子和爪子有点像狗,但主要还是猫。
题外话:请记住,词序也很重要,比权重更重要。 如果我们将这两个简单单词的顺序调换一下,尽管权重不变,图像却会变得不同。在混合两种动物的情况下,很难辨别这种想法,所以接下来让我们blend ,concepts 。
值得记住的良好范围
- 中间是 1
- 积极的提示是这样的
- (good:0.7) <– weaker positive
- (good:1.3) <–stronger positive
- 像这样的负提示[(事情:1),(事情:1.3),事情:0.7)]
- 仅在 LoRA 中使用负重量(风险自担!)。
狗 - 中性
(dog) - 狗的重要性为 1.1x
(dog:1) - 中性
(dog:1.1) - 狗的重要性为 1.1 倍
将正向语法与正向权重混合使用是可行的(但不建议这样做)
((dog:0.5)) - dog is 0.5x 通过(正)语法得到加强
((dog:2.0)) - dog is 2x 通过(正)语法得到加强,很可能会破坏您的render ,因为它使这一单一提示过于强烈
但负面提示就不一样了
狗 - 中性
狗标准的否定提示,即 1.1x 不鼓励
[dog:2]- 2x 被忽略,这仅作为 1.1x 否定提示处理
[[dog:2]]- 2x 也被忽略,取而代之的是[否定]语法
你拿到了吗?自我测试
问)能否使用不带()的权重?例如,good:1.6 是否有效,还是必须使用 (good:1.6)?
A) 您必须使用 (good:1.2)
问:底片如何处理?方式一样吗?[坏:1.6]?
A) 必须使用 [(bad:1.2)] 才能正常工作。另外,不用担心 [] 内的()会增加权重,因为它的影响是不存在的。
精确度
至于小数,一到两度就足够了。 在我们的测试中,当所有其他值都锁定时,(dog:0.55) 和 (dog:0.55348567) 并没有太大区别。
在测试相对权重时,请记住我们的系统会为seed、 guidance 和sampler 分配随机值。如果不设置这些值,每次得到的图片都会大相径庭。让我们做一些这些值始终相同的练习,并进行比较。
运动:红、蓝、狗、猫
这里有几只长得像狗的猫,有些是蓝色的,有些是红色的。 利用您所学的知识,尝试从图像中消除一种颜色或一种动物特征,您能做到吗? 除了权重,Guidance 也很重要,您可以输入任何提示,但如果guidance 较低,人工智能无论如何都会忽略您的大部分订单。 因此,请将guidance 设置为 13,这样它就会很听您的话了。
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog] <dreamshaper6>
让我们从control 图片开始。没有权重。 现在让我们尝试去除红色。
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, (red dog:2)] <dreamshaper6>
我们提高了 "红狗 "的负权重,去掉了 "狗 "和 "红 "的标记,因此现在这些标记更明显地像猫,而且图像中没有红色动物。
我们来做另一个练习:你能赶走所有的猫吗?
一个可行的解决方案是
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 (blue cat:0.1), (red dog:2), [(blue cat:2), (red dog:0.1)] <dreamshaper6>
蓝猫比较难摆脱,可能是因为它在提示顺序中排在第一位。因此,为了摆脱它们,很多砝码都被转移了。
练习 1:为什么该提示生成的图像与第一个control 图像几乎相同?
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog:2] <dreamshaper6>
请回答:因为否定提示中缺少一个括号。被处理的不是权重,而是一个弱[否定提示]权重 2 否定被忽略。如果没有括号,字面意思就是 "2 号"。
现在让我们试试用双方括号来代替括号,效果会和负标签内的括号一样吗?
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, [red dog:2]] <dreamshaper6>
这里处理的是双强负数[[像这样]],权重也被忽略。现在我们知道这行不通了,它需要括号。但是,如果我们只想把狗赶走,用否定词代替权重也是一种有效的策略。看到了吗?由于负数更强,狗的特征就消失了。如果这就是我们想要的,那就不需要权重了。一个简单的负数就可以了。
练习 2:找出错误
这个提示符是否能正常工作?
Figure 1 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres:2, blurry:2, worst quality:2, pixelated:2] <sushimix>
或者这一次会?
Figure 2 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres;2, blurry;2, worst quality;2, pixelated;2] <sushimix>
正确答案是它们都不能正常工作、 它们都错了。 两者都缺少(砝码括号),因此没有砝码。此外,图 2 中的分号是故意打错的,以证明一个观点--两者的结果基本相同。结果如下所示,由于将错误的;处理为单词的标记不同,所以变化非常小。它们导致的细微阴影差异是任意的,这并不是什么问题。
我们可以把同样的seed ,让这些砝码起火,同样的提示就会突然变成一幅截然不同的图画。
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2), (blurry:2), (worst quality:2), (pixelated:2)] <sushimix>
是将它们单独放在括号中,还是在一个长括号中使用权重和逗号,这取决于您。这两种方法都可以使用,而且相对于其他方法,结果也差不多,但权重在这两种方法中都起作用。
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2, blurry:2, worst quality:2, pixelated:2)] <sushimix>
当然,这两张照片都很美,所以细微差别更难发现。如果你完全迷失了方向,可以回到红/蓝、狗/猫的策略上,确保你的提示语与你所想的一致。
在网络用户界面中使用权重
如果你知道自己在做什么,只需键入它们,它们就会像在 PC 版的 Stable Diffusion 中一样工作。在 Web UI 中打开 "新解析器":
- 单击高级(左下角)
- 点击屏幕右上方的重量按钮(如图所示)
然后,权重mode 将显示滑块,让您可以更轻松地设置文字和堆叠其他类型的视觉concepts ,以创建独特的构图。
让我们回顾一下您可以在此页面上使用的所有元素:
- 右上角:权重选项卡已激活,因此您可以输入单个单词,并使用滑块为每个单词分别添加权重。 点击灰色的 "添加加权词 "按钮可以添加更多的词,如果所有词的权重相同,也可以在这里输入整个正向提示。
- 蓝色滑块显示权重为 1.0。 如果向左滑动,方框将变为红色,表示会产生负面影响。
- 您还可以选择recipe 。食谱是一种提示模板,可以创建与所示照片类似的视觉效果。食谱有自己的基本模式,但您可以覆盖它。
- Base art style, or base model, is the over-arching visual style and contents model. The base model has the biggest visual impact over the image. Here the model <revani> aka Rev Animated is selected. Base models do not have weights, they are the foundation that everything else sits on top of.
在这里,我们添加了一个新关键词,并赋予其 0.49 的负权重
点击 "AddConcept" 按钮,我们可以更改基本模型,或堆叠额外的视觉concepts ,如角色、特效、姿势等。
我正在创建一种奇特的幻想动物,所以我进入了生物类别并挑选了一种。请参阅下面的 "最佳实践和故障排除",了解如何充分利用这一功能。
如果您犯了错误,可以点击 "历史记录 "按钮重新编辑。
底部还有一个Brew 按钮,可让您回到简单的非权重mode ,以及guidance (CFG)、长宽比和Steps vs.Images 的下拉菜单。每个值都需要相同的时间来render 。
组装
我们还增加了一个重量为 1.0 的罗拉。 为了安全起见,也许应该调整为 0.7,啧啧。 因此,视觉concept "中国龙 "将成为图片的主题,提示模板为 "无壳幻想",其中可能添加了 "杰作 "和 "高品质 "等代币,同时还添加了 "未变异 "等常见的负面提示。
这是我的七成龙猫。公平地说,大部分是龙猫。我想,亚洲艺术中对猫和龙的更强烈联想打败了我那只更肥胖的狗,所以我可以回去进一步减少猫的比例,或者添加更多关于狗长什么样的文字来改变我的结果。
如果您发现images 不太合适,可以点击 "我的存档",回溯您的提示历史,清除您不想要的提示。
在 Telegram 中工作时,您还可以使用 /delete命令,通过回复图片将图片从历史记录和存档中删除。
最佳实践与故障排除
大多数问题都是在权重过高或concepts 冲突时出现的。如果将所有参数设置在 0.5 至 0.7 之间,就可以避免大多数问题。
有些型号非常敏感。如果出现故障,可以尝试低至 0.1。我们单独撰写了一个章节来解决常见的 LoRA 问题,并附有示例。
多少视觉concepts 才算多?
您可以放心地在图像中添加 2-3 个权重较低的 LoRA,但要仔细考虑它们的重叠方式。如果图像没有返回,说明服务器内存不足,图像无法完成。 请尝试减少图像数量。
在质量settings 中选择 "草稿",以测试您的想法。 如果concepts 存在冲突,再等下去就没有意义了,最好是慢慢建立自己的想法,并对想法进行迭代。
蓝色工艺品很常见
在使用 LoRA 和权重时,难免会遇到冲突。例如,在添加僵尸的 LoRA 的同时也添加骑士头盔的 LoRA,这意味着两者都会对面部产生影响,从而出现蓝色伪影。如果出现这种情况,请降低权重,或选择不同的视觉concept 。 保持简单,慢慢构建。
图像显示为彩色正方形,无主体
有一些(极少数)模型与我们的系统不兼容,但一般来说,当 LoRA 的权重较低时,这种情况应该不会发生。如果出现红色方块,请降低权重。如果您得到的仍然是绿山或噪音,请告诉我们。
与您在互联网上看到的结果不同
我们与您同在。并不是每个人都会公布自己的秘诀,包括使用inpaint和 Lightroom 花 3 个小时修复自己的images 。在稳定扩散community 中,创建最佳images 的竞争非常激烈。其中不乏作弊行为。千万别上当。
在流行的 Civitai 网站上,请查看评论中其他用户的意见,确保您使用的都是相同的concepts 。如果我们遗漏了您需要的型号,请告诉我们,我们会及时添加。
与本地电脑截然不同的结果
在这种情况下,我们非常想知道--请联系我们。这可能是由于人工智能模型的版本不同造成的,在这种情况下,我们可以立即进行更新。
由于硬件、驱动程序和其他网络组件的不同,我们系统的校准也略有不同,但总体图像质量应该不相上下。
如果您认为遇到了错误,请告诉我们。