Entrenamiento de LoRA NSFW para Flux en RunPod en 2026
Tutorial completo de RunPod para entrenar un LoRA NSFW de personaje para Flux. 15 imagenes, FluxGym, preparacion del dataset, captioning, parametros de entrenamiento y desglose real de costos.
Montar tu propio pipeline de entrenamiento de LoRA NSFW para Flux en RunPod es mas practico de lo que la mayoria de los tutoriales hace parecer. Hemos entrenado mas de 30 LoRAs NSFW de personajes en Flux usando RunPod y FluxGym, y el flujo de trabajo real es directo una vez que sabes que omitir y en que invertir. Los tutoriales en linea sobrecomplican la preparacion del dataset y subestiman el captioning. Esta guia invierte eso.
- El costo total suele quedar entre $2 y $5 por LoRA en la RTX 4090 de la nube comunitaria de RunPod.
- De 15 a 30 imagenes de alta calidad le gana a 100 imagenes mediocres siempre.
- El captioning es la variable con mas impacto en la calidad del resultado.
- FluxGym es la interfaz de entrenamiento mas simple para LoRAs de Flux en 2026.
- Prueba el LoRA en al menos 3 checkpoints distintos para verificar que generaliza.
Por Que Entrenar Un LoRA NSFW Personalizado Para Flux
Sinceramente, la pregunta que mas nos hacen es si vale la pena entrenar un LoRA personalizado cuando ya existen miles de LoRAs en Civitai. La respuesta depende de lo que intentes hacer. Para estilos genericos o personajes populares, simplemente descarga un LoRA existente. Para un personaje especifico que estas construyendo, un modelo privado, o un estilo aun no publicado que tu mismo disenaste, entrenar el tuyo es el unico camino.
Hemos entrenado LoRAs para nuestro propio trabajo de personajes con IA, para proyectos de clientes, y como experimentos para aprender como responde el comportamiento del entrenamiento a los cambios en el dataset. Los LoRAs de personaje que construimos nosotros mismos superan a cualquier LoRA generico sobre el personaje que entrenamos porque capturan detalles especificos de identidad que ningun LoRA publico apunta. Esa es toda la propuesta de valor. Tu dataset de entrenamiento se convierte en el conocimiento del modelo.
El ecosistema de Flux tambien tiene dinamicas de entrenamiento distintas a las de SDXL. Los LoRAs de Flux entrenan mas rapido, necesitan menos imagenes, y generalizan mejor que los LoRAs de SDXL segun nuestra experiencia. Hemos visto LoRAs de Flux entrenados con 12 a 15 imagenes producir un resultado de personaje mas consistente que LoRAs de SDXL entrenados con 50 imagenes. El modelo base de Flux simplemente es mejor extrayendo rasgos de identidad. Eso hace que entrenar LoRAs NSFW para Flux sea sorprendentemente eficiente.
La otra cosa que vale la pena decir es que el entrenamiento de LoRA NSFW tiene sus propias particularidades. El modelo base de Flux resiste el contenido explicito por defecto, asi que tu dataset de entrenamiento necesita incluir suficiente material de referencia explicito para superar esa resistencia. Si tu dataset es 80% SFW y 20% NSFW, el LoRA tendra dificultades con los prompts explicitos incluso despues de entrenar. Lo aprendimos de la manera dificil. El equilibrio del dataset importa.
Curacion Del Dataset, De 15 A 30 Imagenes
Aqui es donde la mayoria de los tutoriales se equivoca. Te dicen que uses de 50 a 100 imagenes para "mejores resultados". La verdad es que eso es excesivo para LoRAs de personaje y activamente danino si tu dataset no esta curado. Obtenemos nuestros mejores resultados con 15 a 30 imagenes elegidas especificamente. Mas no es mejor si mas significa agregar imagenes mediocres o que no representan al personaje.
Como luce un gran dataset para entrenamiento NSFW de personaje?
- De 8 a 12 tomas de rostro de alta calidad desde angulos variados
- De 5 a 8 tomas de cuerpo completo con composicion limpia
- De 3 a 5 imagenes de referencia explicitas que muestren al personaje en contexto NSFW
- De 2 a 4 tomas de variedad, distintos atuendos, expresiones, iluminacion
La resolucion importa. Apuntamos a 1024x1024 o mayor en las imagenes fuente. Las resoluciones mas pequenas obligan al modelo a aprender de artefactos escalados. Si tus imagenes de referencia son de 512x512, escalalas con un modelo de calidad como R-ESRGAN 4x+ antes de entrenar, no entrenes simplemente sobre baja resolucion.
La decision de dataset con mayor impacto es la variedad. El modelo aprende lo que es consistente entre tus imagenes de referencia. Si cada toma de rostro usa la misma iluminacion y el mismo angulo, el modelo solo generara esa iluminacion y ese angulo. Varia las condiciones. Distintos momentos del dia, distintos entornos, distintas expresiones. El modelo extrae la identidad de la variacion.
Nuestra guia de preparacion del dataset de LoRA para Flux cubre el lado del dataset con mas detalle. Los principios tambien aplican al entrenamiento NSFW, con la adicion de material de referencia explicito en la proporcion adecuada.
Estrategia De Captioning Para NSFW
El captioning es la variable que mas afecta la calidad del resultado y la variable que la mayoria de los tutoriales maneja mal. Las descripciones que escribes para tus imagenes de entrenamiento literalmente le dicen al modelo que representa cada imagen. Las descripciones malas producen un LoRA malo sin importar la calidad del dataset.
Nuestro enfoque de captioning para LoRAs NSFW de Flux:
Comienza cada descripcion con tu token disparador. Elige algo unico que no entre en conflicto con el vocabulario existente de Flux. Usamos combinaciones como "ohwx_woman" o "char_alex" para evitar colisiones con palabras reales.
Describe lo que hay en la imagen de forma objetiva. "ohwx_woman, brown hair, green eyes, sitting on bed, soft lighting, photoreal." No describas lo que NO esta en la imagen. No describas lo que quieres que el modelo aprenda de forma implicita.
Para imagenes NSFW especificamente, describe los elementos NSFW de forma explicita. "ohwx_woman, lying on back, nude, anatomically detailed, soft skin texture, intimate composition." Las descripciones vagas en imagenes NSFW producen respuestas NSFW vagas del LoRA.
Varia las descripciones a lo largo del dataset. No uses exactamente la misma plantilla de descripcion para cada imagen. La variacion le ensena al modelo que el token disparador representa la identidad consistente mientras todo lo demas varia.
En cuanto a longitud, apunta a 15 a 30 tokens por descripcion. Demasiado corta y el modelo no tiene suficiente contexto. Demasiado larga y diluyes la senal del token disparador.
Las herramientas de captioning automatico como BLIP-2 o Florence-2 sirven para descripciones de primer borrador, pero tendras que editarlas manualmente para las imagenes NSFW. Los captioners automaticos estan entrenados para evitar terminos explicitos, asi que describen las imagenes NSFW con eufemismos u omiten el contenido explicito por completo. La edicion manual de las descripciones NSFW es obligatoria.
Configuracion Del Pod Y Plantilla En RunPod
RunPod es nuestra opcion preferida para entrenar porque el precio de las GPU es honesto y las plantillas hacen rapida la configuracion. Aqui esta el proceso real de configuracion.
Registrate en RunPod si aun no lo has hecho. Agrega un metodo de pago. Carga de $10 a $20 de credito. Gastaras de $2 a $5 por corrida de entrenamiento de LoRA.
Flujos de ComfyUI Gratuitos
Encuentra flujos de ComfyUI gratuitos y de código abierto para las técnicas de este artículo. El código abierto es poderoso.
Elige una GPU. La RTX 4090 en la nube comunitaria es el punto ideal, alrededor de $0.34 a $0.44/hora. La RTX A5000 con 24GB de VRAM tambien funciona a un costo ligeramente menor. La RTX 3090 funciona pero es mas lenta. No te molestes con nada que tenga menos de 24GB de VRAM para el entrenamiento de LoRA de Flux, el modelo es demasiado grande.
Elige una plantilla. Busca "FluxGym" en la seccion de plantillas. Las plantillas de FluxGym construidas por la comunidad incluyen todas las dependencias preinstaladas. Usamos la mantenida por contribuidores de la comunidad que monta automaticamente el volumen del workspace. El repositorio de FluxGym en GitHub documenta los scripts de entrenamiento subyacentes y te permite verificar que se esta ejecutando realmente en el pod.
Define el tamano del pod. Un volumen de workspace de 30GB es mas que suficiente para entrenar. 50GB si quieres conservar varias corridas de entrenamiento en el mismo pod. La creacion del pod toma de 1 a 3 minutos.
Conectate por SSH o usa la terminal web una vez que el pod este corriendo. Abre la interfaz de JupyterLab que provee RunPod. La interfaz web de FluxGym suele correr en el puerto 7860 con proxy HTTP a traves del enrutamiento de URL de RunPod. La pagina del pod muestra la URL.
Para detalles operativos mas profundos de RunPod, nuestra guia de configuracion de ComfyUI con Docker que simplemente funciona en RunPod cubre el ecosistema mas amplio de plantillas de RunPod y como construir plantillas personalizadas si las de la comunidad no se ajustan a tu flujo de trabajo.
Recorrido Por La Configuracion De FluxGym
FluxGym presenta una interfaz limpia para el entrenamiento de LoRA de Flux. Los valores por defecto son en su mayoria sensatos, pero el caso de uso NSFW necesita unos cuantos ajustes especificos.
Sube tu dataset. La interfaz te permite arrastrar y soltar tu carpeta de imagenes. Las descripciones deben estar en archivos .txt coincidentes junto a cada imagen, con el mismo nombre de archivo. Asi "image_001.png" se empareja con "image_001.txt". FluxGym lee los archivos txt automaticamente.
Define el modelo base. Usa Flux Dev para el resultado de mayor calidad. Flux Schnell entrena mas rapido pero produce LoRAs de menor calidad. Para trabajo NSFW donde la calidad del resultado importa mas que la velocidad de entrenamiento, Flux Dev es la eleccion. Si andas justo de tiempo o presupuesto, el entrenamiento basado en Schnell reduce el tiempo de entrenamiento aproximadamente a la mitad.
Resolucion. Define 1024 tanto en ancho como en alto. No bajes de 1024, la caida de calidad es significativa. No subas de 1024, los costos de VRAM y tiempo no valen la pena para la mayoria de los LoRAs de personaje.
¿Quieres evitar la complejidad? Lewdly te ofrece resultados profesionales de IA al instante sin configuración técnica.
Batch size. Define 1 en la RTX 4090. Los batch sizes mas altos necesitan mas VRAM de la que tiene la 4090 para el entrenamiento de LoRA de Flux. Algunas tarjetas de 48GB pueden manejar batch size 2, pero para tarjetas de 24GB, batch size 1 es lo que funciona.
Learning rate. 1e-4 es el punto ideal para la mayoria de los LoRAs NSFW de personaje. Mas bajo (1e-5) entrena mas lento y arriesga que el modelo no aprenda la identidad por completo. Mas alto (1e-3) sobreajusta rapido y produce un LoRA demasiado agresivo.
Dimensiones de red. Para LoRAs de personaje, network_dim 32 con network_alpha 16 es nuestro valor por defecto. Los LoRAs de estilo pueden subir hasta network_dim 64. Los LoRAs de concepto NSFW funcionan bien con 16. El dim controla la capacidad de representacion del LoRA. Mas alto es mas flexible pero con mayor tamano de archivo.
Pasos de entrenamiento. De 1500 a 2500 pasos para LoRAs NSFW de personaje. Corre las epocas en "auto" y deja que FluxGym calcule. Para un dataset de 20 imagenes con 100 pasos por epoca, eso son aproximadamente 20 a 25 epocas.
Guardar cada N pasos. Define 250 a 500. Vas a querer checkpoints intermedios para probar que etapa del entrenamiento produjo el mejor resultado. A veces el paso 1500 es el punto ideal, a veces el paso 2000 gana.
Corrida De Entrenamiento Y Monitoreo
Inicia el entrenamiento. FluxGym muestra el progreso en tiempo real. Los logs de la terminal muestran los valores de loss y los contadores de pasos. El loss inicial suele estar alrededor de 0.4 a 0.5 y deberia caer a 0.1 a 0.15 al final del entrenamiento. Si el loss se mantiene alto (por encima de 0.3 tras 1000 pasos), algo anda mal con el dataset o las descripciones.
El entrenamiento en RTX 4090 a resolucion 1024, batch size 1, toma aproximadamente:
- 1500 pasos en cerca de 2.5 horas
- 2000 pasos en cerca de 3.3 horas
- 2500 pasos en cerca de 4.1 horas
A $0.34/hora, eso son de $0.85 a $1.40 por corrida de entrenamiento dependiendo de la cantidad de pasos. Suma el tiempo de configuracion del pod y estaras viendo de $1 a $2 por LoRA. Varias iteraciones a traves del refinamiento del dataset podrian costar de $5 a $10 en total. Aun barato comparado con lo que pagarias por un servicio equivalente.
Monitorea el sobreajuste. Si tus imagenes de muestra durante el entrenamiento empiezan a mostrar repetidamente la pose exacta de una de tus imagenes de referencia, estas sobreajustando. Deten el entrenamiento y usa un checkpoint anterior. El sobreajuste en LoRAs de personaje se manifiesta cuando el modelo solo genera al personaje en la composicion exacta de las imagenes de entrenamiento.
Gana Hasta $1,250+/Mes Creando Contenido
Únete a nuestro programa exclusivo de creadores afiliados. Cobra por video viral según rendimiento. Crea contenido a tu estilo con total libertad creativa.
Guarda salidas cada 250 a 500 pasos como checkpoints intermedios. Normalmente terminamos usando un checkpoint de algun punto intermedio del entrenamiento en lugar del final. El paso 1750 o el paso 2000 a menudo supera al paso 2500 para LoRAs de personaje.
Probando El LoRA En Distintos Checkpoints
Un LoRA no esta terminado cuando finaliza el entrenamiento. Esta terminado cuando has verificado que funciona en los checkpoints con los que realmente lo vas a usar. Pruebalo en al menos tres checkpoints distintos de Flux.
Prueba 1, Flux Dev base. El LoRA deberia producir tu personaje de forma limpia en el modelo base Flux Dev, ya que es contra el que entrenaste.
Prueba 2, un finetune comunitario de Flux como Chroma. El LoRA deberia seguir produciendo una version reconocible de tu personaje, posiblemente con variaciones de calidad.
Prueba 3, con otro LoRA apilado. Empareja tu LoRA de personaje con un LoRA de desbloqueo o un LoRA de anatomia. El personaje deberia seguir siendo reconocible pero podria desplazarse ligeramente en proporcion o detalle.
Hemos descubierto que los LoRAs usados a un peso de 0.6 a 0.8 en uso real producen el mejor equilibrio entre fidelidad del personaje y flexibilidad del prompt. A peso 1.0, el LoRA domina todo y pierdes la capacidad de variar la escena. A 0.4 o menos, el personaje empieza a desviarse.
Si el LoRA falla en cualquiera de estas pruebas, la solucion suele ser el dataset, no los parametros de entrenamiento. Agrega de 3 a 5 imagenes de referencia mas que apunten al caso de fallo. Vuelve a entrenar. Intenta de nuevo.
Para un contexto mas amplio de entrenamiento de LoRA, la guia de entrenamiento de LoRA de Flux en ComfyUI cubre el entrenamiento dentro de ComfyUI mismo si prefieres ese flujo de trabajo en lugar del enfoque alojado de RunPod. Mismos principios, herramienta distinta.
Desglose De Costos Y Tiempo Hasta Terminar
Numeros reales de nuestras ultimas 5 corridas de entrenamiento de LoRA NSFW de Flux en RunPod:
- LoRA 1, trabajo de personaje, 20 imagenes, 1750 pasos, $2.10 GPU + $0.30 almacenamiento = $2.40 total
- LoRA 2, trabajo de personaje, 25 imagenes, 2000 pasos, $2.85 GPU + $0.35 almacenamiento = $3.20 total
- LoRA 3, transferencia de estilo, 30 imagenes, 2500 pasos, $3.40 GPU + $0.40 almacenamiento = $3.80 total
- LoRA 4, LoRA de concepto, 18 imagenes, 1500 pasos, $1.95 GPU + $0.30 almacenamiento = $2.25 total
- LoRA 5, trabajo de personaje, 22 imagenes, 1800 pasos, $2.55 GPU + $0.35 almacenamiento = $2.90 total
Promedio de alrededor de $2.91 por LoRA. En cuanto a tiempo, el tiempo de ejecucion de la GPU es de 2 a 4 horas pero no tienes que estar pendiente. Inicia el entrenamiento, vuelve al final. El tiempo real de reloj para ti es de 30 a 60 minutos de preparacion del dataset mas 5 minutos de prueba del resultado.
El costo total para alguien que arma 10 LoRAs de personaje es de unos $30. Eso es sustancialmente menos que comprar acceso a servicios comerciales de entrenamiento y eres dueno absoluto de los archivos de LoRA resultantes. Para comparar, nuestra comparacion entre entrenamiento de DreamBooth y LoRA cubre cuando tiene sentido un DreamBooth completo sobre el entrenamiento de LoRA. Para la mayoria del trabajo NSFW de personaje, el LoRA gana en costo y flexibilidad. Hemos llevado LoRAs entrenados de esta manera a lewdly.ai para nuestros propios personajes, asi que podemos dar fe de que el flujo de trabajo desde el entrenamiento en RunPod hasta el despliegue en produccion es real y no teorico.
Si no quieres correr el entrenamiento de RunPod por tu cuenta, plataformas alojadas como lewdly.ai manejan el pipeline de entrenamiento como servicio. Para ser transparentes, nosotros ayudamos a construirlo. La ventaja es no tener configuracion ni gestion tecnica. La desventaja es menos control sobre los parametros de entrenamiento. Para creadores de alto volumen que producen muchos LoRAs de personaje, el camino directo de RunPod ahorra dinero. Para usuarios casuales que entrenan uno o dos LoRAs, la ruta alojada es mas simple.
Preguntas Frecuentes
Cuantas imagenes necesito para entrenar un LoRA NSFW de Flux?
De 15 a 30 imagenes curadas de alta calidad superan a 50 o 100 imagenes mediocres. Para LoRAs de personaje especificamente, de 15 a 20 imagenes bien elegidas a menudo producen mejores resultados que datasets mas grandes y ruidosos.
Cual es la GPU mas barata en RunPod para entrenar LoRA de Flux?
La RTX A5000 de 24GB a alrededor de $0.30/hora es la opcion viable mas barata. La RTX 4090 a $0.34/hora es ligeramente mas cara pero entrena mas rapido, asi que el costo total termina siendo aproximadamente equivalente.
Puedo entrenar LoRAs de Flux en tarjetas de 16GB de VRAM?
No de forma realista. El entrenamiento de LoRA de Flux necesita alrededor de 22 a 24GB de VRAM a resolucion 1024 con batch size 1. Podrias intentar entrenamiento a resolucion 512 en 16GB pero la calidad del resultado cae significativamente. Mejor renta una 4090 en RunPod.
Cuanto tarda el entrenamiento?
En RTX 4090 a resolucion 1024, 1500 pasos toman cerca de 2.5 horas. 2000 pasos toman cerca de 3.3 horas. 2500 pasos toman cerca de 4.1 horas. El tamano de tu dataset afecta esto ligeramente a traves del tiempo por paso, pero la variable principal es la cantidad total de pasos.
Que learning rate deberia usar?
1e-4 es el valor por defecto seguro para la mayoria de los LoRAs NSFW de personaje en Flux Dev. Los LoRAs de estilo a veces pueden beneficiarse de 5e-5. Los LoRAs de concepto funcionan de 1e-4 a 2e-4. No subas de 5e-4 a menos que sepas lo que haces.
Funcionara mi LoRA de Flux en SDXL?
No. Los LoRAs de Flux y los LoRAs de SDXL son completamente incompatibles. Distintas arquitecturas, distintos pipelines de entrenamiento, distintas estructuras de archivo. Tendrias que entrenar por separado para cada modelo base.
Puedo vender LoRAs que entreno yo mismo?
Si, si estas entrenando sobre Chroma (licencia Apache 2.0). Para Flux Dev, la licencia es mas restrictiva en cuanto al uso comercial de derivados. Lee la licencia de Flux Dev con cuidado si los vas a comercializar.
Que relacion tiene FluxGym con Kohya?
FluxGym es una envoltura de interfaz alrededor de los scripts de entrenamiento de Kohya. Kohya provee la logica de entrenamiento real. FluxGym lo hace utilizable sin trabajo de linea de comandos. El mismo motor por debajo que la mayoria de las demas herramientas de entrenamiento de Flux.
¿Listo para Crear Tu Influencer IA?
Únete a 115 estudiantes dominando ComfyUI y marketing de influencers IA en nuestro curso completo de 51 lecciones.
Artículos Relacionados
Cómo Construir un Personaje de Novia IA en ComfyUI: Flujo de Trabajo para Consistencia Visual
Flujo de trabajo completo en ComfyUI para crear personajes de novia IA visualmente consistentes usando IPAdapter y FaceID. Guía técnica paso a paso con configuraciones óptimas y ajustes de nodos.
Flujo de trabajo Face Detailer de ComfyUI para rostros NSFW
Corrige rostros generados por IA en imagenes NSFW. Configuracion del nodo face detailer de Impact Pack, modelos YOLO, ajustes de denoise, restauracion en varias pasadas.
Flujo de Inpainting NSFW en ComfyUI para Editar Ropa
Flujo de inpainting en ComfyUI paso a paso para cambiar ropa y hacer ediciones NSFW. Segmentacion SAM, Flux Fill, desenfoque de mascara, fuerza de denoise.