Flujo Inpainting NSFW en ComfyUI para Ropa | Lewdly Blog
/ ComfyUI / Flujo de Inpainting NSFW en ComfyUI para Editar Ropa
ComfyUI 16 min de lectura

Flujo de Inpainting NSFW en ComfyUI para Editar Ropa

Flujo de inpainting en ComfyUI paso a paso para cambiar ropa y hacer ediciones NSFW. Segmentacion SAM, Flux Fill, desenfoque de mascara, fuerza de denoise.

Flujo de Inpainting NSFW en ComfyUI para Editar Ropa

Un flujo de inpainting NSFW en ComfyUI que de verdad produzca ediciones de ropa limpias o modificaciones NSFW explicitas es mas dificil de armar de lo que sugieren los tutoriales en linea. La mayoria de las guias de YouTube te muestran el camino feliz con una imagen de origen perfecta y se saltan las partes que fallan a gran escala. Nosotros construimos y refinamos este flujo durante meses de uso en produccion y la version de abajo maneja los modos de falla que las guias faciles ignoran.

Respuesta rapida: El flujo confiable de inpainting de ropa NSFW combina Grounding DINO para deteccion de objetos guiada por texto, SAM (Segment Anything) para generar mascaras precisas, y Flux Fill o un checkpoint de inpainting SDXL para el renderizado real. Pon el desenfoque de mascara en 8 a 15 pixeles, la fuerza de denoise en 0.65 a 0.85 segun el tipo de edicion, y agrega Face Detailer como un paso posterior para corregir artefactos de rostro mas adelante. VRAM total cercana a 12 a 16GB.
Puntos clave:
  • Grounding DINO mas SAM supera al enmascarado manual en velocidad de produccion.
  • Flux Fill produce ediciones mas limpias que los checkpoints de inpaint SDXL para cambios de ropa.
  • Un desenfoque de mascara de 8 a 15 pixeles evita costuras visibles alrededor del borde de la edicion.
  • Denoise 0.7 a 0.8 para cambios de ropa. Denoise 0.5 a 0.65 para ediciones sutiles de anatomia.
  • Siempre ejecuta Face Detailer despues de pasos de inpaint que toquen el area del rostro.

Que Hace Realmente el Inpainting

Hablando claro, la mayoria de los usuarios malinterpreta el inpainting. Creen que es un borrador magico. No lo es. El inpainting es regeneracion. El modelo recibe la region enmascarada como un espacio reservado y genera contenido nuevo para esa region mientras intenta fusionarlo con los pixeles circundantes sin enmascarar. La calidad depende de que tan limpia este tu mascara y que tan bien ajustada este tu fuerza de denoise.

Para ediciones de ropa NSFW en concreto, el inpainting resuelve un problema especifico. Tienes una imagen base con la composicion que quieres pero la ropa o la anatomia necesita ser diferente. Quiza generaste una base SFW y quieres convertir elementos especificos a NSFW. Quiza quieres cambiar el atuendo de un personaje existente. Quiza quieres corregir problemas de anatomia sin regenerar toda la imagen. El inpainting maneja los tres casos con el mismo flujo.

La razon por la que la gente termina frustrada con el inpainting es que lo tratan como una herramienta de un solo disparo. Generar, enmascarar, regenerar, listo. En produccion, el inpainting es iterativo. Con frecuencia ejecutaras varios pasos de inpainting con distintas fuerzas de denoise y distintos prompts para lograr un resultado limpio. El flujo que estamos armando aqui hace que esas iteraciones sean rapidas.

La otra cosa que nadie menciona es que la calidad del inpainting depende muchisimo de la calidad de la imagen base. Enmascara una region en una imagen de baja calidad y la region pintada no la va a salvar. La regeneracion del modelo toma contexto de los pixeles circundantes. Contexto basura produce inpaint basura. Empieza con una base limpia, incluso si la vas a modificar.

Dos Enfoques, Mascara Manual contra Segmentacion Automatica

Las dos formas de construir mascaras de inpainting se dividen en enmascarado manual y segmentacion automatica. Ambas funcionan. Ambas tienen ventajas y desventajas.

El enmascarado manual en ComfyUI usa el nodo Mask Editor. Pintas la mascara directamente sobre la imagen de origen con una herramienta de pincel. Control preciso. Lento por imagen. Excelente para ediciones puntuales donde necesitas exactamente la forma de mascara que tienes en mente. Malo para produccion donde procesas muchas imagenes.

La segmentacion automatica usa SAM (Segment Anything Model) mas Grounding DINO para detectar objetos a partir de prompts de texto y generar mascaras automaticamente. Escribes "shirt" y el flujo detecta la camisa y la enmascara. Menos preciso en casos limite. Rapido y reproducible. Excelente para produccion. Peor para trabajo puntual de precision.

Para ediciones de ropa NSFW a cualquier volumen, la segmentacion automatica gana. La calidad de la mascara suele quedar dentro de un 5 a 10 por ciento de lo que produce el enmascarado manual, pero la generacion toma 30 segundos contra 3 a 5 minutos. En 50 imagenes eso son horas de tiempo ahorrado.

El enfoque hibrido usa la segmentacion automatica como punto de partida y te deja refinar la mascara a mano si hace falta. La guia de tecnicas avanzadas de inpainting en ComfyUI cubre el patron hibrido con mas detalle. Para la mayoria del trabajo NSFW de produccion, la segmentacion automatica pura es suficiente.

Configurando SAM y Grounding DINO

Instalando los nodos. En ComfyUI Manager, busca "ComfyUI Impact Pack" e instalalo. Luego instala "ComfyUI Inspire Pack" para nodos adicionales de inpainting. Por ultimo instala "ComfyUI segment anything" o "ComfyUI Grounding Dino" segun cual paquete haya actualizado mas recientemente el mantenedor. El repositorio de Grounded SAM en GitHub es el paper de origen que envuelven estos nodos de ComfyUI si quieres entender la tecnica subyacente.

Despues de instalar, reinicia ComfyUI. Los nodos nuevos aparecen bajo "Add Node, Impact, Detector" y rutas similares en el menu del clic derecho.

Descarga los archivos de modelo. SAM necesita un checkpoint. El archivo sam_vit_h_4b8939.pth es el modelo SAM estandar de alta calidad, de aproximadamente 2.5GB. Grounding DINO necesita un archivo de modelo mas pequeno. Ambos se descargan en ComfyUI/models/sams/ y ComfyUI/models/grounding-dino/ respectivamente. La primera vez que ejecutes el flujo, los nodos cargadores de modelo los descargaran automaticamente si faltan.

Configuracion de nodos del flujo. La cadena se ve asi. Load Image alimenta a los nodos SAMModelLoader y GroundingDinoModelLoader. Ambos alimentan al nodo GroundingDinoSAMSegment, que toma tu prompt de texto sobre que segmentar. La salida es una mascara que alimenta tu flujo de inpainting.

El prompt de texto del nodo de segmentacion es la parte magica. "shirt" detecta la camisa. "underwear" detecta la ropa interior. "hair" detecta el cabello. Para trabajo NSFW, puedes ser especifico. "bra" detecta sostenes. "clothing on torso" detecta la ropa del torso. El modelo Grounding DINO es impresionantemente flexible para entender que quieres enmascarar.

Los ajustes de umbral importan. El umbral por defecto de Grounding DINO es 0.3, que cubre la mayoria de los casos. Un valor mas bajo (0.2) captura coincidencias mas agresivas incluyendo falsos positivos. Un valor mas alto (0.4 a 0.5) es mas conservador y podria perder casos limite. Usamos 0.3 como valor por defecto y lo ajustamos por flujo.

Desenfoque de Mascara y Denoise para Ediciones Limpias

Una vez que tienes una mascara, los parametros de inpainting determinan la calidad de salida. Dos ajustes importan mas que los demas, el desenfoque de mascara y la fuerza de denoise.

El desenfoque de mascara suaviza los bordes de la mascara para que el inpaint se fusione con los pixeles circundantes. Los bordes de mascara duros producen costuras visibles. Demasiado desenfoque suaviza la edicion mas alla de lo que quieres. Para ediciones de ropa NSFW, de 8 a 15 pixeles de desenfoque de mascara es el punto ideal. Mas bajo (4 a 6 pixeles) para ediciones ajustadas donde importa la precision. Mas alto (15 a 20 pixeles) para ediciones mas suaves donde la fusion importa mas que la precision.

La fuerza de denoise controla cuanto regenera el modelo contra cuanto preserva. Con denoise 1.0, el modelo genera contenido completamente nuevo para la region enmascarada. Con denoise 0.5, el modelo solo modifica la region enmascarada a la mitad, preservando algunos de los pixeles originales. Con denoise 0.0, no ocurre regeneracion alguna.

Flujos de ComfyUI Gratuitos

Encuentra flujos de ComfyUI gratuitos y de código abierto para las técnicas de este artículo. El código abierto es poderoso.

100% Gratis Licencia MIT Listo para Producción Dar Estrella y Probar

Para trabajo NSFW de cambio de ropa, denoise 0.75 a 0.85 es el rango estandar. Por debajo de 0.7 el modelo suele preservar demasiado del color o el patron de la ropa original. Por encima de 0.9 el modelo regenera de forma tan completa que a veces las proporciones del cuerpo se desplazan en la region enmascarada.

Para ediciones sutiles de anatomia, denoise 0.5 a 0.65 funciona mejor. Quieres modificar la anatomia existente ligeramente sin regenerar desde cero. El denoise mas bajo preserva mas de la composicion original mientras aun produce la edicion.

Hemos comprobado que ejecutar dos pasos de inpaint con distintas fuerzas de denoise a menudo supera a un solo paso de denoise alto. El paso 1 con denoise 0.85 genera el contenido nuevo. El paso 2 con denoise 0.4 y una mascara un poco mas grande suaviza la transicion entre las regiones editadas y sin editar. Este enfoque de dos pasos maneja la mayoria de los casos limite.

Para mas sobre el manejo de mascaras en concreto, la guia de difuminado de mascara y fusion de costuras en inpainting cubre los trucos de fusion de costuras que producen ediciones invisibles.

Flux Fill contra el Checkpoint de Inpaint SDXL

La eleccion del modelo de inpainting afecta de forma material la calidad de salida. Existen dos opciones principales en 2026, Flux Fill y los checkpoints de inpaint SDXL.

Flux Fill es el modelo de inpainting hecho a proposito por Black Forest Labs, basado en Flux. Maneja tanto inpainting como outpainting en el mismo modelo. La calidad de generacion es excelente. La version cuantizada Q5 usa solo 8GB de VRAM, lo cual es alcanzable para la mayoria de los usuarios. Nuestra guia completa de Flux Fill cubre el modelo en detalle.

Los checkpoints de inpaint SDXL son finetunes de SDXL optimizados para inpainting. Manejan bien el NSFW cuando se combinan con bases capaces de NSFW como Lustify o Juggernaut. La calidad es buena pero normalmente queda un poco por debajo de Flux Fill en ediciones complejas.

Para ediciones de ropa NSFW en concreto, Flux Fill gana por dos razones. Primero, la adherencia al prompt es mejor. Cuando describes la ropa nueva que quieres, Flux Fill la produce con mas precision que las variantes de inpaint SDXL. Segundo, la calidad de costura es mas limpia. Flux Fill produce ediciones que se fusionan con el entorno sin limites visibles con mas frecuencia. La ficha del modelo Flux Fill en Hugging Face cubre las especificaciones tecnicas y los patrones de uso recomendados.

¿Quieres evitar la complejidad? Lewdly te ofrece resultados profesionales de IA al instante sin configuración técnica.

Sin configuración Misma calidad Empieza en 30 segundos Probar Lewdly Gratis
No se requiere tarjeta de crédito

El detalle es la licencia. Flux Fill se distribuye bajo la licencia Flux Dev, que restringe el uso comercial. Para trabajo NSFW comercial, te conviene usar checkpoints de inpaint SDXL basados en bases con licencia libre o usar inpainting basado en Chroma, que cubrimos en nuestra comparacion entre Chroma y Flux Dev.

Recomendacion practica para la mayoria de los usuarios, usa Flux Fill para proyectos personales donde la licencia no importa. Usa checkpoints de inpaint SDXL basados en Lustify, Juggernaut o Pony para trabajo comercial. Ambos producen salida de calidad de produccion con los ajustes correctos. Tambien conectamos todo este pipeline a lewdly.ai (con total transparencia, nosotros ayudamos a construirlo), asi que los usuarios que quieren ediciones de ropa sin manejar el grafo de ComfyUI obtienen la misma salida con una entrada mas simple. La eleccion entre local y alojado se reduce a cuanta personalizacion del flujo necesitas en realidad.

Face Detailer Despues del Paso de Inpaint

Este es el paso que la mayoria de los tutoriales se salta y es la diferencia entre una salida profesional y una amateur. Despues de cualquier paso de inpaint que toque la region del rostro o que desplace las proporciones del cuerpo, ejecuta Face Detailer como un paso posterior.

Face Detailer en ComfyUI usa deteccion de rostros YOLO para encontrar caras en tu imagen, luego ejecuta un pequeno paso de inpaint sobre cada rostro detectado con tu modelo de generacion. El rostro se regenera a mayor resolucion con mejor detalle que el rostro de la imagen base. El resultado son rasgos faciales mas limpios sin cambiar la composicion general.

Para trabajo NSFW en concreto, Face Detailer evita el problema comun de "buen cuerpo, rostro raro" que ocurre al hacer inpaint en regiones del cuerpo. El inpaint del cuerpo puede desplazar sutilmente las proporciones del rostro a traves del comportamiento del modelo mas adelante. Face Detailer corrige esto de forma automatica.

Nuestro flujo NSFW de Face Detailer en ComfyUI cubre el pipeline dedicado de face detailer. Para el flujo de inpainting que estamos armando aqui, solo agrega un nodo de face detailer al final de la cadena, despues del paso principal de inpaint.

Ajustes para Face Detailer:

  • Modelo de deteccion, bbox/face_yolov8m.pt (estandar) o un modelo YOLO de rostro especifico para NSFW de Civitai
  • Denoise 0.4 a 0.55 para restauracion del rostro
  • Resolucion de inpaint del rostro 1024 aunque la imagen base sea menor
  • Dilatacion de mascara 5 a 10 pixeles para capturar toda la region del rostro

El rostro despues del detailer deberia verse notablemente mas nitido que la salida base sin cambiar la identidad del personaje. Si la identidad se desvia, baja el denoise. Si la mejora no es visible, sube el denoise.

Programa de Creadores

Gana Hasta $1,250+/Mes Creando Contenido

Únete a nuestro programa exclusivo de creadores afiliados. Cobra por video viral según rendimiento. Crea contenido a tu estilo con total libertad creativa.

$100
300K+ views
$300
1M+ views
$500
5M+ views
Pagos semanales
Sin costos iniciales
Libertad creativa total

Fallas Comunes y Soluciones

Falla comun 1, los limites de la mascara se ven como costuras. La solucion es aumentar el desenfoque de mascara. Prueba 12 a 15 pixeles. Si la costura sigue mostrandose, ejecuta el inpaint de dos pasos que describimos arriba. Con frecuencia un segundo paso suave elimina la costura por completo.

Falla comun 2, la region pintada no coincide con el prompt. La solucion es aumentar la fuerza de denoise hacia 0.85 a 0.95 para que el modelo tenga mas libertad de regenerar. Si eso no funciona, el prompt quiza no coincida con el vocabulario del modelo. Reformula el prompt de inpaint con un lenguaje descriptivo mas simple.

Falla comun 3, las proporciones del cuerpo se desplazan en la region enmascarada. La solucion es usar un denoise mas conservador (0.6 a 0.7) y ser explicito en el prompt sobre las proporciones del cuerpo que quieres preservar. "same body shape, natural proportions, [tu edicion especifica de ropa]" suele funcionar.

Falla comun 4, la iluminacion no coincide entre las regiones editadas y sin editar. La solucion es incluir una descripcion de la iluminacion en el prompt de inpaint. "soft daylight, matching ambient lighting" guia al modelo a producir una iluminacion consistente. El enfoque de dos pasos tambien ayuda aqui.

Falla comun 5, Grounding DINO no detecta lo que quieres enmascarar. La solucion es probar distintos prompts de texto. "shirt" podria perder cosas que "clothing" captura. "underwear" podria perder cosas que "lingerie" captura. A veces "all clothing" es el prompt correcto cuando los elementos especificos no disparan la deteccion.

Falla comun 6, la mascara es demasiado grande e incluye el cuerpo, no solo la ropa. La solucion es bajar el umbral de Grounding DINO o usar prompts de texto mas especificos. A veces necesitas refinar la mascara a mano despues de la segmentacion automatica. El nodo Mask Editor de ComfyUI te deja entrar en la mascara y borrar las regiones que no quieres incluir.

Para mas sobre edicion de mascaras en concreto, la guia de dominio del editor de mascaras de ComfyUI cubre el flujo de refinamiento manual si la segmentacion automatica necesita limpieza.

Descarga el Flujo Completo

El flujo completo que usamos vive como un JSON de flujo de ComfyUI. La cadena basica es:

  1. Load Image (tu imagen base)
  2. Grounding DINO mas SAM (segmentacion automatica basada en prompt de texto)
  3. Mask Blur (8 a 15 pixeles)
  4. KSampler con Flux Fill o un checkpoint de inpaint SDXL
  5. Condicion de inpaint mas prompt positivo
  6. Paso posterior de Face Detailer
  7. Save Image

El archivo JSON es portable entre instalaciones de ComfyUI. Sueltalo en cualquier instancia de ComfyUI y el flujo se carga. Los nodos personalizados requeridos estan listados en la parte superior del flujo para que ComfyUI Manager pueda instalar las dependencias faltantes.

Para plataformas que no quieren ejecutar este flujo localmente, los servicios alojados manejan el mismo pipeline. Lewdly.ai ejecuta este mismo patron de flujo en el back-end. La plataforma existe porque la mayoria de los usuarios quieren ediciones de ropa o inpainting NSFW sin manejar 7 nodos personalizados y la descarga de un checkpoint de 12GB. Si no quieres la complejidad de ComfyUI, la ruta alojada ahorra tiempo real. El flujo de inpainting de lewdly.ai usa estos mismos componentes de SAM y Grounding DINO que cubrimos arriba, solo que abstraidos en una interfaz de usuario mas simple.

Para una cobertura mas profunda de enfoques alternativos de inpainting, la guia de tecnicas avanzadas de inpainting y outpainting cubre patrones mas alla de las ediciones de ropa, incluyendo outpainting, correccion de anatomia y ediciones de multiples regiones.

Preguntas Frecuentes

Cuanta VRAM Necesito para Este Flujo de Inpainting?

12GB minimo para inpainting basado en SDXL, 16GB recomendados para Flux Fill. Puedes ejecutar Flux Fill Q4 en 8GB pero la calidad baja de forma notable. El modelo SAM por si solo necesita unos 2.5GB. Grounding DINO necesita unos 700MB.

Puedo Usar Este Flujo con Pony Diffusion?

Si. Usa Pony V6 XL como tu checkpoint de inpaint SDXL. La estructura del flujo es identica, solo cambia el cargador de checkpoint a Pony. Ten en cuenta que Pony necesita etiquetas de score en tu prompt de inpaint igual que en la generacion base.

Por Que Grounding DINO Pierde Algunos Objetos?

Ajuste de umbral. El valor por defecto es 0.3. Bajalo a 0.2 a 0.25 para una deteccion mas agresiva. El modelo Grounding DINO esta entrenado con objetos comunes, asi que los elementos inusuales o estilizados a veces no se detectan con los umbrales por defecto.

Deberia Usar Flux Fill o Inpaint SDXL para NSFW?

Depende de la licencia. Flux Fill es de mayor calidad pero esta restringido por una licencia de investigacion. El inpaint SDXL con bases capaces de NSFW (Lustify, Juggernaut, Pony) es de uso comercial ilimitado. Para la mayoria de los usuarios, el inpaint SDXL es la opcion practica.

Como Corrijo la Costura Entre las Regiones Pintadas y la Original?

Aumenta el desenfoque de mascara a 12 a 15 pixeles. Si la costura sigue mostrandose, ejecuta un segundo paso con denoise bajo (0.3 a 0.4) sobre la region del limite. El paso suave fusiona los pixeles editados y sin editar sin cambiar la edicion de forma significativa.

Cual Es la Diferencia Entre SAM y SAM2?

SAM es el Segment Anything Model original de Meta. SAM2 es la version actualizada con mejor calidad de segmentacion e inferencia mas rapida. Para los flujos de inpainting de ComfyUI en 2026, SAM2 suele ser preferible pero SAM aun funciona si SAM2 no esta instalado. Nuestra guia de la mejor herramienta de segmentacion de video SAM2 cubre SAM2 con mas detalle.

Puedo Procesar Muchas Imagenes por Lotes con Este Flujo?

Si. ComfyUI admite el procesamiento por lotes mediante modificaciones del flujo. Reemplaza Load Image por Load Images from Directory y el flujo procesara cada imagen de la carpeta. Cada imagen recibe el mismo prompt de Grounding DINO y los mismos ajustes de inpaint.

Funciona con Fotogramas de Video?

Mas o menos. El flujo maneja bien los fotogramas individuales, pero mantener la consistencia temporal entre fotogramas requiere nodos adicionales como AnimateDiff o flujos de inpainting especificos para video. Para ediciones por fotograma sin continuidad temporal, este flujo funciona tal cual sobre los fotogramas extraidos.

¿Listo para Crear Tu Influencer IA?

Únete a 115 estudiantes dominando ComfyUI y marketing de influencers IA en nuestro curso completo de 51 lecciones.

El precio promocional termina en:
--
Días
:
--
Horas
:
--
Minutos
:
--
Segundos
Reclama Tu Lugar - $199
Ahorra $200 - El Precio Aumenta a $399 Para Siempre