Pesos de aviso y nuevo analizador de texto (beta)
Nuevo parser de pesos, actualizado
Actualizado el 11 de junio con ejemplos más claros, ejercicios y un minicuestionario.
Los pesos son una nueva característica de nuestra interfaz web y del bot de Telegram, posible gracias a un subsistema llamado analizador de texto, literalmente un trozo de código que intenta entender qué palabras son más importantes para ti. El antiguo analizador de texto no soportaba ponderaciones, el nuevo sí. Puedes alternar entre ambos.
Interfaz web: Pulsa en opciones avanzadas y activa esta opción:
Telegrama: Añade este comando cuando estés renderizando:
/render /parser: new tu prompt va aquí (perro:2) etc
A menos que se invoque alguno de ellos, los pesos se ignoran. El comando parser desaparece cuando termina nuestro periodo Beta.
Introducción a las pesas
You’ve probably seen an Stable Diffusion prompt that looks like thing like this: <yae-miko:0.7>. This is a way of adding or subtracting its effect from a prompt, where the default value is 1, too much is 2, and a negative number is bad news. It is similar to negative guidance, where things get eerie.
Side note about syntax: In our system, pointed brackets like <this> means AI model, like a LoRA and round parenthesis (like this) are used for words, also called Tokens. This guide teaches both kinds.
Rangos de peso y valores por defecto seguros
Un número mayor que 0, incluso fraccionario, sigue siendo un peso positivo. Así, aunque 0,7 parezca menos que un 1 entero, una expresión como (perro:0,7) sigue significando que aparecerá la imagen de un perro. Menos de 0 es negativo, y los negativos suelen ser malas noticias.
En las pesas, los negativos no funcionan como las indicaciones negativas. Probablemente quieres decir cero, no negativo. El peso negativo es la Dimensión Desconocida, las cosas se ponen espeluznantes como Negativo Guidance. Posible, pero extraño.
El peso más utilizado es 0,7
Especialmente para los LoRA. Muchos consideran que 0,7 es el lugar más seguro para empezar, porque da el derecho de paso para que un modelo base pueda establecer el arte style, pero sigue estando presente para hacer su trabajo. Cuando se utilizan LoRAs especialmente, rara vez se desea utilizar un peso de 1 o más, a menos que desee un efecto muy audaz.
Figura 1: Pesos frente a estímulos positivos
Tres formas de expresar atención extra a la palabra perro son:
(perro:1.1), (perro) y ((perro:1.1)), pero el último no suele aconsejarse, ya que dificulta la búsqueda en control y puede dar lugar a malos resultados.
Por qué son útiles las pesas
Las instrucciones ponderadas son útiles para expresar ideas relativas. Por ejemplo, para que render muestre la imagen de un perro que tiene algunos rasgos de un gato, puede indicarlo:
/render /parser:new a (cat:2,dog:0.5)
Fíjate en que la nariz y las patas se parecen un poco a las de un perro, pero es principalmente un gato.
Nota al margen: recuerda que el orden de las palabras también importa, más que los pesos. Si cambiamos el orden de esas dos simples palabras, se convierte en una imagen diferente, a pesar de que los pesos sigan siendo los mismos. En el caso de la mezcla de dos animales, es difícil discernir esta idea, así que vamos a blend más concepts siguiente.
Rangos que conviene recordar
- El medio es 1
- los impulsos positivos son así
- (good:0.7) <– weaker positive
- (good:1.3) <–stronger positive
- Indicaciones negativas como ésta [(cosa:1), (cosa:1,3), cosa:0,7)].
- Utilice pesos negativos sólo con LoRA (¡bajo su propia responsabilidad!)
perro - neutral
(perro) - el perro es 1,1x importante
(perro:1) - neutral
(perro:1.1) - el perro es 1.1x importante
Mezclar sintaxis positiva con pesos positivos funciona (pero no es aconsejable)
((dog:0.5)) - dog is 0.5x está reforzado por la sintaxis (positiva)
((dog:2.0)) - dog is 2x se ve reforzado por la sintaxis (positiva) y es muy probable que rompa su render , ya que hace que esta indicación sea demasiado fuerte.
Pero no puede decirse lo mismo de las indicaciones negativas
perro - neutral
[perro] - un indicador negativo estándar, lo que significa que está 1,1x desaconsejado
[perro:2] - 2x se ignora, esto sólo se procesa como un indicador negativo 1.1x
[perro:2 - 2x también se ignora, y se utiliza la sintaxis [negativa
¿Lo has conseguido? Ponte a prueba
P) ¿Se pueden utilizar pesos sin ()? Por ejemplo, ¿es válido good:1.6 o hay que utilizar (good:1.6)?
A) Debe utilizar (bien:1.2)
P) ¿Cómo funciona con los negativos? ¿De la misma manera? ¿[mal:1.6]?
A) Tienes que usar [(bad:1.2)] para que funcione correctamente. Tampoco te preocupes por () dentro de [] con peso añadido, ya que su influencia es inexistente.
Grados de precisión
En cuanto a los decimales, uno o dos grados son más que suficientes. En nuestras pruebas, (perro:0,55) no es tan diferente de (perro:0,55348567) cuando todos los demás valores están bloqueados.
Cuando esté probando pesos relativos, recuerde que nuestro sistema asigna valores aleatorios para seed, guidance, y sampler. Si esos valores no están fijados, va a obtener imágenes muy diferentes cada vez por diseño. Hagamos algunos ejercicios en los que esos valores sean siempre los mismos y comparemos.
Ejercicio: Rojo, Azul, Perro, Gato
Aquí tenemos unos gatos con aspecto de perro, unos son azules y otros rojos. Utiliza lo que has aprendido para intentar eliminar un color o un rasgo animal de la imagen, ¿puedes hacerlo? Pesos aparte, Guidance también es importante, puedes poner las indicaciones que quieras pero con un guidance bajo la IA ignorará la mayoría de tus órdenes de todas formas. Así que pon tu guidance a 13 para que te escuche bien.
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog] <dreamshaper6>
Empecemos con una imagen de control . Sin pesos. Ahora vamos a tratar de eliminar el rojo.
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, (red dog:2)] <dreamshaper6>
Hemos aumentado el peso negativo de "perro rojo" nos hemos deshecho del token "perro" y del token "rojo", por lo que ahora son más claramente felinos y no hay ningún animal rojo en la imagen.
Intentemos otro ejercicio: ¿Puedes deshacerte de todos los gatos?
Una posible solución es:
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 (blue cat:0.1), (red dog:2), [(blue cat:2), (red dog:0.1)] <dreamshaper6>
El gato azul fue más difícil de eliminar, posiblemente porque era el primero en orden de llegada. Así que muchos de los pesos se desplazaron para deshacerse de ellos.
Ejercicio 1: ¿Por qué este mensaje produce casi la misma imagen que la primera imagen de control ?
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog:2] <dreamshaper6>
Respuesta: Porque falta un paréntesis dentro del prompt negativo. Lo que se procesó no fueron pesos, sino un débil [negative prompt] peso 2 negativo fue ignorado. Sin el paréntesis, significa literalmente "número 2".
Ahora probemos con dobles corchetes como sustituto de los paréntesis, ¿funcionará igual que los paréntesis dentro de una etiqueta negativa?
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, [red dog:2]] <dreamshaper6>
Aquí, lo que se procesa es un doble negativo fuerte [[así]] y también se ignoraron los pesos. Así que ahora sabemos que eso no funciona, necesita paréntesis. Pero si sólo quisiéramos deshacernos de los perros, usar negativos en lugar de pesos también es una estrategia válida. ¿Lo veis? Los rasgos de perro desaparecen debido al negativo más fuerte. Si eso es todo lo que queríamos, no hay necesidad de pesos. Un simple negativo funciona.
Ejercicio 2: Detectar el error
¿Funcionará este aviso según lo previsto?
Figure 1 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres:2, blurry:2, worst quality:2, pixelated:2] <sushimix>
¿O tal vez lo haga éste?
Figure 2 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres;2, blurry;2, worst quality;2, pixelated;2] <sushimix>
La respuesta correcta es que ninguno de ellos funcionará correctamente, ambos están equivocados. A ambas les falta el ( paréntesis de pesos ) por lo que no hay pesos. Además, la figura 2 tiene un error intencional de punto y coma para demostrar un punto - ambos resultan en básicamente la misma imagen. Los resultados se muestran a continuación, los cambios son muy menores debido a la diferencia de token de la errónea ; procesado como palabras. Que resultaron en diferencias menores de sombreado es arbitrario, esto no es una cosa.
Podemos tomar el mismo seed y hacer que esos pesos se disparen, y la misma indicación es de repente una imagen muy diferente.
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2), (blurry:2), (worst quality:2), (pixelated:2)] <sushimix>
Tú decides si los pones individualmente entre paréntesis o si usas pesos y comas en un paréntesis largo. Ambos funcionan y dan como resultado una imagen similar entre sí, pero los pesos funcionan en ambos.
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2, blurry:2, worst quality:2, pixelated:2)] <sushimix>
Es cierto que se trata de imágenes muy bonitas, por lo que los matices son más difíciles de detectar. Si alguna vez estás completamente perdido, vuelve a la estrategia de rojo/azul, perro/gato para asegurarte de que tu estímulo está haciendo lo que crees que está haciendo.
Uso de pesos en la interfaz web
Si sabe lo que está haciendo, simplemente escríbalos y funcionarán como en la versión PC de Stable Diffusion. Para activar el Nuevo Parser en Web UI:
- Haga clic en Avanzado (abajo a la izquierda)
- Haga clic en el botón Pesos de la parte superior derecha de la pantalla (en la imagen)
Los pesos mode mostrarán entonces controles deslizantes, para que puedas fijar palabras y apilar otros tipos de visuales concepts con mayor facilidad para crear una composición única.
Repasemos todos los elementos con los que puedes jugar en esta página:
- Arriba a la derecha: la pestaña de pesos está activada, por lo que puede escribir palabras individuales y añadir peso a cada palabra por separado, utilizando un control deslizante. Haga clic en el botón gris "añadir palabra ponderada" para añadir más, o escriba toda la indicación positiva ahí si todas esas palabras deben tener el mismo peso.
- El deslizador azul muestra un peso de 1,0. Si lo deslizas hacia la izquierda, la casilla se volverá roja, lo que indica que tendrá un efecto negativo.
- Opcionalmente, puede seleccionar una recipe. Las recetas son plantillas de avisos que crean un resultado visual similar al de la foto mostrada. Las recetas tienen su propio modelo base, pero usted puede anularlo.
- Base art style, or base model, is the over-arching visual style and contents model. The base model has the biggest visual impact over the image. Here the model <revani> aka Rev Animated is selected. Base models do not have weights, they are the foundation that everything else sits on top of.
Aquí hemos añadido una nueva palabra clave y le hemos dado un peso negativo de 0,49
Haciendo clic en el botón "Añadir Concept" podemos cambiar el Modelo Base, o apilar visuales adicionales concepts, como personajes, efectos, poses, y mucho más.
Estoy creando un extraño animal de fantasía, así que entré en la categoría de criaturas y elegí una. Consulta "Prácticas recomendadas y resolución de problemas" más abajo para aprender a sacar el máximo partido a esta función.
Si comete un error, puede pulsar el botón Historial y volver a editar.
En la parte inferior, también encontrará un botón Brew , que le lleva de vuelta a la sencilla opción sin pesos mode, así como desplegables para guidance (CFG), Relación de aspecto y Steps vs. Número de Images. Cada valor tarda el mismo tiempo en render.
Montaje
También hemos añadido una Lora con un peso de 1,0. Eso probablemente debería ajustarse a 0,7 para estar seguros, tsk tsk. Así que el visual concept "dragón chino" se convertirá en el tema de la imagen, con la plantilla de prompt "Fantasía sin caja" que probablemente añade tokens como "obra maestra" y "alta calidad" mientras que también añade prompts negativos comunes como "no mutado", etc.
Y aquí está mi 70% dragón perro-gato. Mayormente dragón-gato, para ser justos. Supongo que las asociaciones más fuertes con gatos y dragones en el arte asiático vencieron a mi perro más carnoso, así que puedo volver atrás y reducir aún más gato, o añadir más palabras sobre cómo es un perro para cambiar mi resultado.
Si te encuentras con images que no te satisface, puedes hacer clic en Mi archivo para volver atrás en tu historial de avisos y borrar los que no quieras.
Cuando trabajes en Telegram, también puedes hacer el /delete para borrar una imagen de tu historial y archivo respondiendo a la imagen.
Buenas prácticas y resolución de problemas
La mayoría de los problemas surgen cuando los pesos son demasiado altos o cuando concepts entra en conflicto. Si tienes todo ajustado entre 0,5 y 0,7 puedes evitar la mayoría de los problemas.
Algunos modelos son muy sensibles. Pruebe hasta 0,1 si están fallando. Hemos escrito una sección separada sobre la fijación de los problemas comunes LoRA con ejemplos.
¿Cuántos visuales concepts son demasiados?
Puede añadir con seguridad 2-3 LoRAs con pesos bajos a una imagen, aunque piense cuidadosamente cómo se solapan. Si la imagen no vuelve, el servidor se quedó sin memoria y la imagen no pudo completarse. Pruebe con un número menor de imágenes.
Elige Borrador en la página de calidad settings, para poner a prueba tu idea. No tiene sentido esperar más si hay conflictos concepts, es mejor construir su idea lentamente e iterar sobre su idea.
Los artefactos azules son comunes
Cuando trabajes con LoRAs y Pesos, inevitablemente te encontrarás con conflictos. Por ejemplo, añadir un LoRA de un Zombie y también añadir un LoRA de un Casco de Caballero significa que ambos lucharán por influir en la cara, y se producirán artefactos azules. Si esto ocurre, reduzca los pesos o elija un visual diferente concept. Mantén las cosas sencillas y construye poco a poco.
La imagen aparece como un cuadrado de colores, sin sujeto.
Hay algunos modelos (muy pocos) que no son compatibles con nuestro sistema, pero en general, cuando los LoRA tienen pesos bajos, esto no debería ocurrir. Si obtienes un cuadrado rojo, baja los pesos. Si sigues obteniendo algo parecido a montañas verdes o ruido, por favor háznoslo saber.
Resultados diferentes de algo que vio en Internet
Estamos contigo. No todo el mundo publica sus secretos mejor guardados, como arreglar su images durante 3 horas usando inpaint y Lightroom. La competencia dentro de la Difusión Estable community para crear el mejor images es feroz. Hay un poco de trampa. No te dejes atrapar por ella.
En el caso del popular sitio web Civitai, mira lo que dicen otros usuarios en los comentarios y asegúrate de que estás utilizando todos los mismos concepts. Si nos falta algún modelo que necesites, dínoslo y lo añadiremos.
Resultados muy diferentes a los de su PC local
En este caso, nos gustaría saberlo: póngase en contacto con nosotros. Puede deberse a diferentes versiones de los modelos de IA, en cuyo caso podemos actualizarlos de inmediato.
Nuestro sistema también está calibrado de forma un poco diferente debido al hardware, los controladores y otros componentes de la web, pero la calidad general de la imagen debería ser comparable.
Si crees que has encontrado un error, háznoslo saber.