Poids des invites et nouvel analyseur de texte (beta)
Nouvel analyseur de poids, mis à jour
Mise à jour le 11 juin avec des exemples plus clairs, des exercices et un mini quiz.
Les poids sont une nouvelle fonctionnalité de notre interface Web et de notre robot Telegram, rendue possible par un sous-système appelé analyseur de texte, littéralement un morceau de code qui essaie de comprendre quels mots sont les plus importants pour vous. L'ancien analyseur de texte ne prenait pas en charge les poids, le nouveau le fait. Vous pouvez passer de l'un à l'autre.
Interface Web : Accédez aux options avancées et activez cette option :
Télégramme : Ajouter cette commande lorsque vous êtes en train de rendre :
/render /parser:new your prompt goes here (dog:2) etc
À moins que l'une de ces commandes ne soit invoquée, les poids sont ignorés. La commande "parser" disparaît lorsque la période Beta est terminée.
Introduction aux poids
You’ve probably seen an Stable Diffusion prompt that looks like thing like this: <yae-miko:0.7>. This is a way of adding or subtracting its effect from a prompt, where the default value is 1, too much is 2, and a negative number is bad news. It is similar to negative guidance, where things get eerie.
Side note about syntax: In our system, pointed brackets like <this> means AI model, like a LoRA and round parenthesis (like this) are used for words, also called Tokens. This guide teaches both kinds.
Plages de poids et valeurs par défaut sûres
Un nombre supérieur à 0, même fractionnaire, a toujours un poids positif. Ainsi, même si 0,7 look est inférieur à un 1 entier, une expression telle que (dog:0,7) signifie toujours qu' une image de chien entrera dans l'image. Une valeur inférieure à 0 est négative, et les valeurs négatives sont généralement de mauvaises nouvelles.
Dans les poids, les négatifs ne fonctionnent pas comme les invites négatives. Vous voulez probablement dire zéro, et non pas négatif. Le poids négatif, c'est la Twilight Zone, les choses deviennent étranges comme Negative Guidance. Possible, mais étrange.
Le poids le plus utilisé est 0,7
Particulièrement pour les LOD. Beaucoup considèrent que 0,7 est le point de départ le plus sûr, parce qu'il permet à un modèle de base de définir l'art style, mais il est toujours présent pour faire son travail. En particulier dans le cas des LoRA, il est rare d'utiliser un poids de 1 ou plus, sauf si l'on souhaite obtenir un effet très audacieux.
Figure 1 : Pondération par rapport aux messages positifs
Voici trois façons d'accorder une attention particulière au mot "chien" :
(dog:1.1), (dog) et ((dog:1.1)), mais la dernière n'est généralement pas conseillée car elle rend les choses plus difficiles à control et peut conduire à de mauvais résultats.
Pourquoi les poids sont-ils utiles ?
Les invites pondérées sont utiles pour exprimer des idées relatives. Par exemple, pour render l'image d'un chien qui a quelques traits d'un chat, vous pouvez demander :
/render /parser:new a (cat:2,dog:0.5)
Remarquez que le nez et les pattes ressemblent un peu à ceux d'un chien, mais qu'il s'agit avant tout d'un chat.
Remarque complémentaire : n'oubliez pas que l'ordre des mots a également de l'importance, plus que les poids. Si nous intervertissons l'ordre de ces deux mots simples, l'image devient différente, bien que les poids restent les mêmes. Dans le cas du mélange de deux animaux, il est difficile de discerner cette idée, c'est pourquoi nous allons maintenant nous rendre sur le site blend , à l'adresse suivante : concepts .
Les bonnes fourchettes à retenir
- Le milieu est à 1
- Les messages positifs sont les suivants
- (good:0.7) <– weaker positive
- (good:1.3) <–stronger positive
- Les messages négatifs comme celui-ci [(chose:1), (chose:1.3), chose:0.7)]
- Utiliser des poids négatifs avec LoRA uniquement (à vos risques et périls !)
chien - neutre
(chien) - le chien est 1.1x important
(chien:1) - neutre
(dog:1.1) - le chien est 1.1x important
Mélanger la syntaxe positive et les poids positifs fonctionne (mais n'est pas conseillé)
((dog:0.5)) - dog is 0.5x est renforcé par la syntaxe (positive)
((dog:2.0)) - dog is 2x est renforcé par la syntaxe (positive) et brisera probablement votre render car il rend cette simple invite trop forte.
Mais il n'en va pas de même pour les messages négatifs
chien - neutre
[chien] - une invite négative standard, ce qui signifie qu'elle est 1.1x découragée
[dog:2] - 2x est ignoré, il s'agit seulement d'une incitation négative de 1,1x.
[[chien:2]] - 2x est également ignoré, et la syntaxe [négative] prend le relais.
Avez-vous compris ? Testez-vous
Q) Peut-on utiliser des poids sans () ? Par exemple, good:1.6 est-il valide, ou faut-il utiliser (good:1.6) ?
A) Vous devez utiliser (bon:1.2)
Q) Comment cela fonctionne-t-il avec les négatifs ? De la même manière ? [bad:1.6] ?
A) Vous devez utiliser [(bad:1.2)] pour que cela fonctionne correctement. Ne vous préoccupez pas non plus du () à l'intérieur de [] avec un poids supplémentaire, car son influence est inexistante.
Degrés de précision
En ce qui concerne les décimales, un ou deux degrés suffisent amplement. Dans nos tests, (dog:0.55) n'est pas si différent de (dog:0.55348567) lorsque toutes les autres valeurs sont verrouillées.
Lorsque vous testez les poids relatifs, n'oubliez pas que notre système attribue des valeurs aléatoires à seed, guidance et sampler. Si ces valeurs ne sont pas définies, vous obtiendrez des images très différentes à chaque fois. Faisons quelques exercices où ces valeurs sont toujours les mêmes et comparons-les.
Exercice : Rouge, bleu, chien, chat
Ici, nous avons des chats qui ressemblent à des chiens, certains sont bleus et d'autres sont rouges. Utilisez ce que vous avez appris pour essayer d'éliminer une couleur ou une caractéristique animale de l'image. Les poids mis à part, Guidance est également important, vous pouvez mettre toutes les invites que vous voulez mais avec un faible guidance , l'IA ignorera de toute façon la plupart de vos commandes. Réglez donc votre guidance à 13 pour qu'il vous écoute bien.
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog] <dreamshaper6>
Commençons par une image control . Pas de poids. Essayons maintenant de supprimer le rouge.
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, (red dog:2)] <dreamshaper6>
Nous avons augmenté le poids négatif de "chien rouge" et nous nous sommes débarrassés du jeton "chien" et du jeton "rouge", de sorte qu'ils ressemblent plus clairement à des chats et qu'il n'y a pas d'animal rouge dans l'image.
Essayons un autre exercice : Pouvez-vous vous débarrasser de tous les chats ?
Une solution possible est la suivante :
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 (blue cat:0.1), (red dog:2), [(blue cat:2), (red dog:0.1)] <dreamshaper6>
Le chat bleu a été plus difficile à éliminer, peut-être parce qu'il était le premier dans l'ordre de passage. On a donc déplacé beaucoup de poids pour s'en débarrasser.
Exercice 1 : Pourquoi cette invite produit-elle pratiquement la même image que la toute première image control ?
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog:2] <dreamshaper6>
Réponse : Parce qu'il manque une parenthèse à l'intérieur de l'invite négative. Ce qui a été traité n'était pas des poids, mais un faible [invite négative] poids 2 négatif a été ignoré. Sans la parenthèse, cela signifie littéralement "numéro 2".
Essayons maintenant de remplacer les parenthèses par des doubles crochets. Cela fonctionnera-t-il de la même manière que les parenthèses à l'intérieur d'une balise négative ?
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, [red dog:2]] <dreamshaper6>
Ici, ce qui est traité est une double négation forte [[comme ceci]] et les poids ont également été ignorés. Nous savons maintenant que cela ne fonctionne pas et qu'il faut des parenthèses. Mais si nous voulions simplement nous débarrasser des chiens, l'utilisation de négations au lieu de poids est également une stratégie valable. Vous voyez ? Les caractéristiques des chiens sont éliminées grâce à l'utilisation d'une valeur négative plus forte. Si c'est tout ce que nous voulons, il n'y a pas besoin de poids. Une simple négation suffit.
Exercice 2 : repérer l'erreur
Ce message fonctionnera-t-il comme prévu ?
Figure 1 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres:2, blurry:2, worst quality:2, pixelated:2] <sushimix>
Ou peut-être que celui-ci le fera ?
Figure 2 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres;2, blurry;2, worst quality;2, pixelated;2] <sushimix>
La bonne réponse est qu'aucun des deux ne fonctionnera correctement, elles sont toutes deux erronées. Dans les deux cas, il manque la parenthèse ("poids"), de sorte qu'aucun poids ne s'est fixé. En outre, la figure 2 comporte une faute de frappe intentionnelle dans les points-virgules pour prouver un point - elles donnent toutes deux la même image. Les résultats sont présentés ci-dessous, les modifications sont très mineures en raison de la différence de jeton des erreurs ; traitées comme des mots. Le fait qu'ils aboutissent à des différences d'ombrage mineures est arbitraire, ce n'est pas un problème.
Nous pouvons prendre le même site seed et faire en sorte que les poids s'enflamment, et le même message devient soudain une image très différente.
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2), (blurry:2), (worst quality:2), (pixelated:2)] <sushimix>
C'est à vous de décider si vous les mettez individuellement entre parenthèses ou si vous utilisez les poids et les virgules dans une longue parenthèse. Les deux méthodes fonctionnent et donnent une image similaire l'une par rapport à l'autre, mais les poids fonctionnent dans les deux cas.
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2, blurry:2, worst quality:2, pixelated:2)] <sushimix>
Il est vrai que ces deux images sont magnifiques et que les nuances sont plus difficiles à percevoir. Si vous êtes complètement perdu, revenez à la stratégie rouge/bleu, chien/chat pour vous assurer que votre message fait bien ce que vous pensez qu'il fait.
Utilisation de poids dans l'interface Web
Si vous savez ce que vous faites, tapez-les simplement et ils fonctionneront comme dans la version PC de Stable Diffusion. Pour activer le nouvel analyseur dans l'interface Web :
- Cliquez sur Avancé (en bas à gauche)
- Cliquez sur le bouton "Poids" en haut à droite de l'écran (photo).
Les poids mode révèlent alors des curseurs qui vous permettent de définir plus facilement des mots et d'empiler d'autres types d'éléments visuels concepts pour créer une composition unique.
Passons en revue tous les éléments avec lesquels vous pouvez jouer sur cette page :
- En haut à droite : l'onglet "Poids" est activé, ce qui vous permet de saisir des mots individuels et d'ajouter un poids à chacun d'entre eux à l'aide d'un curseur. Cliquez sur le bouton gris "Ajouter un mot pondéré" pour en ajouter d'autres, ou tapez votre message positif complet à cet endroit si tous ces mots doivent avoir le même poids.
- Le curseur bleu indique un poids de 1,0. Si vous le faites glisser vers la gauche, la boîte devient rouge, ce qui indique un effet négatif.
- En option, vous pouvez sélectionner une adresse recipe. Les recettes sont des modèles d'invite qui créent un résultat visuel similaire à la photo présentée. Les recettes ont leur propre modèle de base, mais vous pouvez le remplacer.
- Base art style, or base model, is the over-arching visual style and contents model. The base model has the biggest visual impact over the image. Here the model <revani> aka Rev Animated is selected. Base models do not have weights, they are the foundation that everything else sits on top of.
Ici, nous avons ajouté un nouveau mot-clé et lui avons attribué une pondération négative de 0,49.
En cliquant sur le bouton "Add Concept", vous pouvez modifier le modèle de base ou ajouter des éléments visuels supplémentaires concepts, tels que des personnages, des effets, des poses, etc.
Je crée un animal fantastique étrange, alors je suis allé dans la catégorie des créatures et j'en ai choisi une. Reportez-vous à la section "Meilleures pratiques et dépannage" ci-dessous pour savoir comment tirer le meilleur parti de cette fonctionnalité.
Si vous faites une erreur, vous pouvez appuyer sur le bouton "Historique" et modifier à nouveau.
En bas, vous trouverez également un bouton Brew , qui vous ramène à l'option facile sans poids mode, ainsi que des menus déroulants pour guidance (CFG), le rapport d'aspect et Steps vs. le nombre de Images. Chaque valeur prend le même temps pour render.
La mise en place
Nous avons également ajouté une Lora avec un poids de 1,0. Ce poids devrait probablement être ajusté à 0,7 pour être sûr, tsk tsk. Le visuel concept "dragon chinois" deviendra donc le sujet de l'image, avec le modèle d'incitation "Uncased Fantasy" qui ajoute probablement des jetons comme "chef-d'œuvre" et "haute qualité" tout en ajoutant des incitations négatives communes comme "non muté", etc.
Et voici mon chien-chat dragon à 70%. Surtout dragon-chat, pour être honnête. Je suppose que les associations plus fortes avec les chats et les dragons dans l'art asiatique l'ont emporté sur mon chien plus musclé, donc je peux revenir en arrière et réduire encore le chat, ou ajouter plus de mots sur ce à quoi ressemble un chien pour changer mon résultat.
Lorsque vous vous retrouvez avec images qui ne vous convient pas, vous pouvez cliquer sur Mes archives pour revenir sur l'historique de vos invites et effacer celles que vous ne voulez pas.
Lorsque vous travaillez sur Telegram, vous pouvez également utiliser la commande /delete pour effacer une image de votre historique et de vos archives en répondant à l'image.
Meilleures pratiques et dépannage
La plupart des problèmes surviennent lorsque les poids sont trop élevés ou lorsque concepts est en conflit. En réglant tous les paramètres entre 0,5 et 0,7, vous éviterez la plupart des problèmes.
Certains modèles sont très sensibles. Essayez de descendre jusqu'à 0,1 s'ils ont des problèmes. Nous avons rédigé une section distincte sur la résolution des problèmes courants de LoRA, avec des exemples.
Combien d'images concepts sont-elles trop nombreuses ?
Vous pouvez sans risque ajouter 2 ou 3 LoRA de faible poids à une image, mais réfléchissez bien à la manière dont ils se chevauchent. Si l'image ne revient pas, c'est que le serveur a manqué de mémoire et que l'image n'a pas pu être complétée. Essayez de réduire le nombre d'images.
Choisissez Brouillon dans la rubrique Qualité settings, pour tester votre idée. Il ne sert à rien d'attendre plus longtemps s'il y a des conflits concepts, il vaut mieux construire votre idée lentement et itérer sur votre idée.
Les artefacts bleus sont courants
Lorsque vous travaillez avec des LoRA et des poids, vous rencontrez inévitablement des conflits. Par exemple, si vous ajoutez un LoRA d'un zombie et un LoRA d'un casque de chevalier, les deux se battront pour influencer le visage et des artefacts bleus apparaîtront. Dans ce cas, diminuez vos poids ou choisissez un autre visuel concept. Gardez les choses simples et construisez lentement.
L'image revient sous la forme d'un carré coloré, sans sujet.
Certains modèles (très peu nombreux) ne sont pas compatibles avec notre système, mais en règle générale, lorsque les poids de la LoRA sont faibles, cela ne devrait pas se produire. Si vous obtenez un carré rouge, diminuez vos poids. Si vous obtenez toujours quelque chose qui ressemble à des montagnes vertes ou à du bruit, veuillez nous en informer.
Des résultats différents de ce que vous avez vu sur Internet
Nous sommes tout à fait d'accord avec vous. Tout le monde ne publie pas ses secrets les mieux gardés, y compris la fixation de son site images pendant 3 heures à l'aide de inpaint et de Lightroom. La compétition au sein de Stable Diffusion community pour créer le meilleur images est féroce. Il y a un peu de tricherie. Ne vous y laissez pas prendre.
Dans le cas du populaire site web Civitai, voyez ce que disent les autres utilisateurs dans les commentaires et assurez-vous que vous utilisez tous les mêmes concepts. S'il manque un modèle dont vous avez besoin, faites-le nous savoir et nous l'ajouterons.
Des résultats très différents de ceux de votre PC local
Dans ce cas, nous tenons vraiment à le savoir - veuillez nous contacter. Cela peut être dû à des versions différentes des modèles d'IA, auquel cas nous pouvons les mettre à jour immédiatement.
Notre système est également calibré de manière légèrement différente en raison du matériel, des pilotes et d'autres composants Web, mais la qualité générale de l'image devrait être comparable.
Si vous pensez avoir rencontré un bogue, n'hésitez pas à nous en faire part.