Resultados deseados complicados = Prompts complejos con mezcla de lenguaje natural y etiquetas

Estructura y orden del prompt complejo:

conteo de caracteres (1chica, 2chicas), nombres de los personajes (si es un personaje existente como Hatsune Miku)
lenguaje natural describiendo la salida, con puntos separando las oraciones
lista de etiquetas
etiquetas de calidad al final (generalmente solo "obra maestra")

Ejemplo de Prompt Simple:

1chica, hatsune miku, ángel, obra maestra, general

Resultado: Interpretación básica, pero creativa

Prompt Complejo/Aumentado (usando TIPO):

1chica, hatsune miku.

Una ilustración de una chica con cabello largo y blanco y alas. Ella lleva un uniforme escolar con un lazo rojo en la cabeza y un par de auriculares en las orejas. Las alas están extendidas detrás de ella, creando una sensación de movimiento y energía. El estilo general de la ilustración está inspirado en el anime.

solo, falda, alas emplumadas, corbata, sonrisa, cabello muy largo, camisa con cuello, cabello largo, auriculares, ojos azules, corbata aqua, mirando al espectador, calzado negro, falda negra, coletas, camisa gris, hombros descubiertos, mangas separadas, cuerpo completo, zettai ryouiki, boca cerrada, minifalda, sin mangas, botas, medias altas, camisa, de pie, cuello de alas, cabello aqua, camiseta sin mangas, falda plisada, alas de ángel, cabello absurdamente largo, alas, medias negras altas,

obra maestra, general.

Resultado: Resultados más detallados y consistentes con elementos específicos (alas, detalles del uniforme, etc.) siendo renderizados de manera más precisa

con este prompt negativo:

peor calidad, cómic, múltiples vistas, mala calidad, baja calidad, baja resolución, desagradable, muy desagradable, mala anatomía, malas manos, artefactos de escaneo, monocromo, escala de grises, nombre de usuario de twitter, artefactos jpeg, 2koma, 4koma, guro, dígitos extra, menos dígitos, líneas irregulares, poco claro

ACTUALIZACIÓN 11/2: posible ayuda al principio (¡o tal vez al final!) de tu prompt!

(obra maestra, x, y, z, obra maestra, mejor calidad, hiper-detallado, 8k uhd::1.4),

x = tipo de imagen, es decir, boceto, foto, retrato, página de manga, etc.

y = nombre(s) del personaje

z = artista (si se especifica)

(seguido del conteo de personajes (1chica, 2chicas), descripción del personaje, ubicación, acción, otros detalles)

Ejemplo:

(obra maestra, retrato, princesa midna, fan no hitori, premiado, obra maestra, mejor calidad, hiper-detallado, 8k uhd::1.4), 1chica, senos grandes, ojos azules, delgada, sexy, demacrada, sonrisa, traje de cuerpo texturizado azul, escote, borde de piel, al aire libre, castillo, mirando al espectador, coloración de anime, piel brillante, Luz Cinemática,

Prompt negativo: baja resolución, peor calidad, mala calidad, mala anatomía, boceto, artefactos jpeg, firma, marca de agua, nombre del artista, viejo, más viejo

Pasos: 26, modelo base: SDXL, cantidad: 4, ancho: 832, alto: 1216, Semilla: 2455922073, borrador: falso, nsfw: verdadero, flujo de trabajo: txt2img, Clip skip: 2, escala CFG: 6, Muestreador: Euler a, modo de flujo: indefinido

Está bien, así que, Illustrious XL.

He estado experimentando mucho con esto últimamente y pensé en compartir algunas cosas que he aprendido.

Resumen

Mis pruebas han revelado varias diferencias clave con respecto a otros tipos de modelos como Pony:

La generación de texto suele ser más limpia
los fondos muestran mejor coherencia
reconocimiento de conceptos = sorprendentemente robusto
reducción significativa de marcas de agua
importante, los prompts negativos tienen un comportamiento mejor
- aunque, como compensación, son mucho más necesarios
además, puedo confirmar, como otros han encontrado, que tanto el estilo como el entrenamiento de personajes parecen producir resultados más confiables

En una nota subjetiva, he encontrado que simplemente tiendo a gustar más de las imágenes producidas en comparación con algo como Pony. Además, encuentro que es más fácil trabajar con esto y obtener mejores imágenes rápidamente.

Configuraciones Óptimas

Basado tanto en pruebas como en documentación oficial:

Rango CFG: 4.5-7.5 (punto dulce alrededor de 5.5)
Muestreador Recomendado: Euler A
Pasos: 20+ (24 recomendados)

Estructura de Prompt Funcional

Como mencioné anteriormente, definitivamente necesitas ajustar el prompt un poco más que la mayoría de los otros modelos, al menos en este momento (Illustrious XL v0.1). Como resultado, necesitas tener etiquetas de calidad en tu prompt positivo y un prompt negativo bastante extenso para que funcione bien.

Estructura del Prompt

Estructura Central

Conteo de personajes (1chica, 2chicas, etc.)
Nombres de los personajes (si los hay)
Etiquetas de calidad
Características físicas y ropa
Pose y detalles anatómicos
Entorno/fondo
Etiquetas adicionales de calidad/estilo

Etiquetas de prompt positivo (colocar al final o al principio)

Según el documento, sus ejemplos reales de etiquetas de calidad son mucho más simples:

“obra maestra”
“general” (como una etiqueta opcional para imágenes seguras para el trabajo)
“absurdres”
“más nuevo”

Técnicamente, estas son todas las que necesitas para producir una buena imagen, según el documento de Illustrious. También he corroborado esto en mis propias pruebas.

Sin embargo, he encontrado que estas etiquetas de prompt pueden producir resultados bastante consistentes cuando se utilizan en combinación con esas etiquetas anteriores:

calidad perfecta, mejor calidad, absolutamente llamativa,

y con imágenes más realistas/detalladas:

calidad perfecta, mejor calidad, absolutamente llamativa, oclusión ambiental, trazado de rayos,

la oclusión ambiental/trazado de rayos ayudan especialmente con el estilo 2.5d/semi-real

Prompt Negativo

Después de mucho experimento, encontré que esto funciona mejor, en promedio, casi cada vez:

baja resolución, (malo), mala anatomía, malas manos, dígitos extra, múltiples vistas, menos, extra, faltante, texto, error, peor calidad, artefactos jpeg, baja calidad, marca de agua, sin terminar, desagradable, más viejo, temprano, aberración cromática, firma, error artístico, nombre de usuario, escaneo

o como una alternativa más corta:

baja resolución, peor calidad, mala calidad, mala anatomía, boceto, artefactos jpeg, firma, marca de agua, nombre del artista, viejo, más viejo

Ejemplos completos de prompt/datos gen

Aquí hay un par de ejemplos para mostrar cómo se ven el 90% de mis prompts:

Gata Negra / Felicia Hardy (Spiderman) Ejemplo de uso de Lora:

1chica, felici4, anatómicamente correcta, proporciones adecuadas,
cabello largo y blanco, senos grandes, máscara de dominó, labios negros, figura atlética,
pose de pie bien definida, pose dinámica,
entorno urbano detallado, escena nocturna, luces de la ciudad,
cabello rubio brillante, ojos azules, mirando al espectador, piel brillante,
ángulo desde abajo, iluminación profesional,
obra maestra, mejor calidad, absurdres, más nuevo

-o-

calidad perfecta, alta calidad, obra maestra, absolutamente llamativa, oclusión ambiental, trazado de rayos, felici4, 1chica, cabello largo, cabello blanco, senos grandes, (máscara), máscara de dominó, ojos azules, labios negros, delgada, cabello rubio brillante, cabello interior arcoíris, mirando al espectador, piel brillante y brillante, senos perfectos, (piel de gallina:1.1), sola, sudor excesivo, ((desde abajo)) 

baja resolución, (malo), mala anatomía, malas manos, dígitos extra, múltiples vistas, menos, extra, faltante, error, peor calidad, artefactos jpeg, baja calidad, marca de agua, sin terminar, desagradable, más viejo, temprano, aberración cromática, firma, error artístico, nombre de usuario, escaneo

Pasos: 24, modelo base: SDXL, cantidad: 4, ancho: 832, alto: 1216, Semilla: 1934634232, borrador: falso, nsfw: verdadero, flujo de trabajo: txt2img, Clip skip: 2, escala CFG: 5.5, Muestreador: Euler a,

Ashley Graham (Resident Evil 4 Remake) Ejemplo de uso de Lora:

1chica, ashley_grah4m, anatómicamente correcta, proporciones adecuadas,
iluminación de neón, cabello rubio brillante, cabello interior arcoíris, ojos azules,
pose bien definida, pose de pie, pose equilibrada,
entorno detallado, iluminación profesional, composición clara,
mirando al espectador, expresión seductora,
obra maestra, mejor calidad, absurdres, más nuevo 

-o-

obra maestra, mejor calidad, ashley_grah4m, 1chica, neón, cabello rubio brillante, cabello interior arcoíris, ojos azules, mirando al espectador, seductora

baja resolución, (malo), mala anatomía, malas manos, dígitos extra, múltiples vistas, menos, extra, faltante, texto, error, peor calidad, artefactos jpeg, baja calidad, marca de agua, sin terminar, desagradable, más viejo, temprano, aberración cromática, firma, error artístico, nombre de usuario, escaneo

Pasos: 24, modelo base: SDXL, cantidad: 4, ancho: 832, alto: 1216, Semilla: 1115576560, borrador: falso, nsfw: verdadero, flujo de trabajo: txt2img, Clip skip: 2, escala CFG: 5.5, Muestreador: Euler a,

Creando Fondos Efectivos

Basado en hallazgos del documento y pruebas, los fondos requieren atención específica:

Estructura para Prompts de Fondo:

Base del Entorno:

entorno detallado, [tipo de ubicación], composición clara

Elementos Arquitectónicos:

[tipos de material], [elementos estructurales], [elementos decorativos]

Iluminación y Atmósfera:

[hora del día], [tipo de iluminación], [efectos atmosféricos]

Ejemplos de Combinaciones de Fondo:

Escenas Interiores:

habitación lujosa, arquitectura detallada, suelo de mármol, muebles ornamentados,
candelabros de cristal, ventanas altas, columnas decorativas,
iluminación ambiental cálida, sombras suaves, iluminación volumétrica

Urbano Exterior:

paisaje urbano detallado, arquitectura moderna, edificios de vidrio,
calles de la ciudad, detalles urbanos, escaparates,
escena nocturna, iluminación de neón, farolas, oclusión ambiental

Entornos Naturales:

paisaje detallado, colinas onduladas, bosque denso,
afloramientos rocosos, agua fluyendo, follaje detallado,
iluminación de la hora dorada, neblina atmosférica, nubes dinámicas

Ejemplo Completo:

1chica, sprThja, anatómicamente correcta, proporciones adecuadas, cuerpo completo, figura tonificada, senos grandes, cabello negro, cabello largo y fluido, orejas de conejo, ojos oscuros y seductores, sonrisa confiada, pose de pie, pose bien definida, pose equilibrada, mirando al espectador, leotardo púrpura, escote profundo, mallas púrpuras, guantes púrpuras, capa amarilla, cuello separado, habitación lujosa y detallada, suelo de mármol, muebles ornamentados, arquitectura detallada, escena nocturna, iluminación profesional, iluminación ambiental cálida, sombras suaves, composición clara, obra maestra, mejor calidad, absurdres, más nuevo

Mejores Prácticas para Fondos:

Comienza con una definición amplia del entorno
Agrega elementos arquitectónicos o naturales específicos
Incluye descripciones de materiales
Define la iluminación y la atmósfera
Mantén la consistencia con la iluminación del personaje
Usa etiquetas de calidad ambiental

Consejos para Mejores Fondos:

Agrega indicadores de profundidad (primer plano, plano medio, fondo)
Incluye efectos atmosféricos
Especifica fuentes de iluminación claras
Usa detalles arquitectónicos para escenas interiores
Agrega contexto ambiental
Mantén la perspectiva consistente con la pose del personaje

Problemas Comunes de Fondo:

Iluminación inconsistente entre el personaje y el fondo
Desajustes de perspectiva
Falta de detalle en el plano medio
Pobre integración con el personaje
Falta de contexto ambiental

Soluciones:

Usa descriptores de iluminación consistentes
Agrega etiquetas de perspectiva específicas
Incluye marcadores de profundidad y distancia
Especifica detalles de materiales y texturas
Usa elementos de anclaje arquitectónicos o naturales

Problemas Conocidos

Múltiples etiquetas de estilo en competencia tienden a producir resultados inconsistentes
Necesita un prompting específico para funcionar bien

Mejores Prácticas

¡Usa esos prompts de arriba!
Comienza con parámetros mínimos
P presta especial atención a los descriptores de iluminación
Monitorea el impacto de CFG en la calidad de salida

Mis Propios Ejemplos de Entrenamiento

Si quieres probarlos, aquí tienes algunos de mis propios modelos que he entrenado en varias fusiones de Illustrious así como Illustrious en sí:

CicaLust: Una implementación de estilo enfocada en anime/piel brillante, muy similar a mi estilo Lora CicaStyle para Pony
Ashley Graham (Resident Evil 4 Remake)
Kallen Kozuki / Kallen Stadtfeld (Code Geass)
Gata Negra / Felicia Hardy (Spiderman)

Ayuda Adicional re: Ángulos/Iluminación

ángulos, usa/mezcla estos después de las etiquetas de calidad al principio del prompt:

desde arriba,
desde abajo,
primer plano,
retrato,
POV,
vista de pájaro,
toma amplia,
isométrica,
(+ vista, dependiendo)

iluminación, después de las etiquetas de ángulo, al principio o al final del prompt:

Luz Cinemática,
Iluminación de Hollywood,
Contraluz,
Iluminación de contorno,
Iluminación suave,
iluminación dura,
Luz dramática,
contraste estilo película,
sombras suaves,
sombras duras,

Guía para crear prompts con modelos Illustrious