Entraînement LoRA Flux NSFW sur RunPod 2026 | Lewdly Blog
/ ComfyUI / Entraînement de LoRA Flux NSFW sur RunPod en 2026
ComfyUI 17 min de lecture

Entraînement de LoRA Flux NSFW sur RunPod en 2026

Tutoriel RunPod complet pour entraîner un LoRA Flux NSFW de personnage. 15 images, FluxGym, préparation du dataset, légendage, paramètres d'entraînement, coût réel détaillé.

Entraînement de LoRA Flux NSFW sur RunPod en 2026

Mettre en place votre propre pipeline d'entraînement de LoRA Flux NSFW sur RunPod est plus accessible que ne le laissent croire la plupart des tutoriels. Nous avons entraîné plus de 30 LoRA NSFW de personnages sur Flux avec RunPod et FluxGym, et le workflow réel est simple une fois que vous savez ce qu'il faut zapper et ce sur quoi il faut investir. Les tutoriels en ligne compliquent à l'excès la préparation du dataset et bâclent le légendage. Ce guide inverse la tendance.

Réponse rapide : Un LoRA Flux NSFW de personnage nécessite 15 à 30 images soigneusement sélectionnées, un légendage correct avec un jeton déclencheur, et environ 2 à 4 heures d'entraînement sur une RTX 4090 RunPod à environ 0,34 $/heure. Le coût total se situe généralement entre 2 $ et 5 $ par LoRA. Utilisez FluxGym pour l'interface, entraînez en résolution 1024x1024, 1500 à 2500 étapes, taille de lot 1, taux d'apprentissage 1e-4. Le dataset compte plus que les paramètres.
Points clés à retenir :
  • Le coût total se situe généralement entre 2 $ et 5 $ par LoRA sur le community cloud RTX 4090 de RunPod.
  • 15 à 30 images de haute qualité battent à chaque fois 100 images médiocres.
  • Le légendage est la variable qui a le plus d'impact sur la qualité du rendu.
  • FluxGym est l'interface d'entraînement la plus simple pour les LoRA Flux en 2026.
  • Testez le LoRA sur au moins 3 checkpoints différents pour vérifier qu'il généralise bien.

Pourquoi Entraîner un LoRA Flux NSFW Personnalisé

Honnêtement, la question qui revient le plus souvent est de savoir s'il vaut même la peine d'entraîner un LoRA personnalisé alors qu'il existe des milliers de LoRA déjà disponibles sur Civitai. La réponse dépend de ce que vous cherchez à faire. Pour des styles génériques ou des personnages populaires, contentez-vous de télécharger un LoRA existant. Pour un personnage précis que vous construisez, un modèle privé, ou un style inédit que vous avez conçu vous-même, entraîner le vôtre est la seule voie possible.

Nous avons entraîné des LoRA pour nos propres personnages IA, pour des projets clients, et comme expériences pour comprendre comment le comportement de l'entraînement réagit aux changements de dataset. Les LoRA de personnages que nous avons construits nous-mêmes surpassent n'importe quel LoRA générique sur le personnage entraîné, car ils captent des détails d'identité spécifiques qu'aucun LoRA public ne vise. C'est toute la proposition de valeur. Votre dataset d'entraînement devient la connaissance du modèle.

L'écosystème Flux possède aussi des dynamiques d'entraînement différentes de SDXL. D'après notre expérience, les LoRA Flux s'entraînent plus vite, nécessitent moins d'images et généralisent mieux que les LoRA SDXL. Nous avons vu des LoRA Flux entraînés sur 12 à 15 images produire un rendu de personnage plus cohérent que des LoRA SDXL entraînés sur 50 images. Le modèle de base Flux est tout simplement meilleur pour extraire les traits d'identité. Cela rend l'entraînement de LoRA Flux NSFW étonnamment efficace.

L'autre chose à dire, c'est que l'entraînement de LoRA NSFW a ses propres particularités. Le modèle de base Flux résiste par défaut au contenu explicite, donc votre dataset d'entraînement doit inclure suffisamment de références explicites pour vaincre cette résistance. Si votre dataset est composé à 80 % de SFW et 20 % de NSFW, le LoRA aura du mal avec les prompts explicites même après l'entraînement. Nous l'avons appris à nos dépens. L'équilibre du dataset compte.

Constitution du Dataset, 15 à 30 Images

C'est là que la plupart des tutoriels se trompent. Ils vous disent d'utiliser 50 à 100 images pour des "résultats optimaux". Soyons clairs, c'est excessif pour des LoRA de personnages et carrément néfaste si votre dataset n'est pas soigné. Nous obtenons nos meilleurs résultats avec 15 à 30 images choisies spécifiquement. Plus n'est pas mieux si "plus" signifie ajouter des images médiocres ou hors personnage.

À quoi ressemble un bon dataset pour un entraînement NSFW de personnage ?

  • 8 à 12 portraits de haute qualité sous des angles variés
  • 5 à 8 plans en pied avec une composition nette
  • 3 à 5 images de référence explicites montrant le personnage dans un contexte NSFW
  • 2 à 4 plans de variété, tenues, expressions et éclairages différents

La résolution compte. Nous visons du 1024x1024 ou plus sur les images sources. Des résolutions plus petites forcent le modèle à apprendre à partir d'artefacts agrandis. Si vos images de référence font 512x512, agrandissez-les avec un modèle de qualité comme R-ESRGAN 4x+ avant l'entraînement, n'entraînez pas directement sur du basse résolution.

Le choix de dataset le plus déterminant est la variété. Le modèle apprend ce qui reste constant à travers vos images de référence. Si tous vos portraits utilisent le même éclairage et le même angle, le modèle ne générera que cet éclairage et cet angle. Variez les conditions. Différents moments de la journée, différents décors, différentes expressions. Le modèle extrait l'identité à partir de la variation.

Notre guide de préparation de dataset pour LoRA Flux couvre le volet dataset plus en détail. Les principes s'appliquent aussi à l'entraînement NSFW, avec en plus des références explicites au bon ratio.

Stratégie de Légendage pour le NSFW

Le légendage est la variable qui affecte le plus la qualité du rendu, et celle que la plupart des tutoriels gèrent le plus mal. Les légendes que vous écrivez pour vos images d'entraînement disent littéralement au modèle ce que chaque image représente. De mauvaises légendes produisent un mauvais LoRA, quelle que soit la qualité du dataset.

Notre approche du légendage pour les LoRA Flux NSFW :

  1. Commencez chaque légende par votre jeton déclencheur. Choisissez quelque chose d'unique qui n'entre pas en conflit avec le vocabulaire existant de Flux. Nous utilisons des combinaisons comme "ohwx_woman" ou "char_alex" pour éviter toute collision avec des mots réels.

  2. Décrivez ce qui se trouve dans l'image de façon objective. "ohwx_woman, brown hair, green eyes, sitting on bed, soft lighting, photoreal." Ne décrivez pas ce qui N'EST PAS dans l'image. Ne décrivez pas ce que vous voulez que le modèle apprenne implicitement.

  3. Pour les images NSFW en particulier, décrivez les éléments NSFW explicitement. "ohwx_woman, lying on back, nude, anatomically detailed, soft skin texture, intimate composition." Des légendes vagues sur des images NSFW produisent des réponses NSFW vagues du LoRA.

  4. Variez les légendes à travers le dataset. N'utilisez pas exactement le même modèle de légende pour chaque image. La variation apprend au modèle que le jeton déclencheur représente l'identité constante, tandis que tout le reste varie.

  5. Côté longueur, visez 15 à 30 jetons par légende. Trop court, et le modèle manque de contexte. Trop long, et vous diluez le signal du jeton déclencheur.

Les outils de légendage automatique comme BLIP-2 ou Florence-2 conviennent pour un premier jet de légendes, mais vous devrez les corriger manuellement pour les images NSFW. Les auto-légendeurs sont entraînés à éviter les termes explicites, donc ils décrivent les images NSFW avec des euphémismes ou omettent complètement le contenu explicite. La correction manuelle des légendes NSFW est indispensable.

Configuration du Pod RunPod et du Template

RunPod est notre référence pour l'entraînement, car les tarifs GPU sont honnêtes et les templates rendent l'installation rapide. Voici le processus de configuration concret.

Inscrivez-vous sur RunPod si ce n'est pas déjà fait. Ajoutez un moyen de paiement. Chargez 10 à 20 $ de crédit. Vous dépenserez 2 à 5 $ par session d'entraînement de LoRA.

Workflows ComfyUI Gratuits

Trouvez des workflows ComfyUI gratuits et open source pour les techniques de cet article. L'open source est puissant.

100% Gratuit Licence MIT Prêt pour la Production Étoiler et Essayer

Choisissez un GPU. La RTX 4090 sur le community cloud est le meilleur compromis à environ 0,34 à 0,44 $/heure. La RTX A5000 avec 24 Go de VRAM fonctionne aussi à un coût légèrement inférieur. La RTX 3090 fonctionne mais est plus lente. Ne vous embêtez pas avec moins de 24 Go de VRAM pour l'entraînement de LoRA Flux, le modèle est trop gros.

Choisissez un template. Cherchez "FluxGym" dans la section des templates. Les templates FluxGym créés par la communauté incluent toutes les dépendances préinstallées. Nous utilisons celui maintenu par des contributeurs de la communauté qui monte automatiquement le volume de workspace. Le dépôt GitHub de FluxGym documente les scripts d'entraînement sous-jacents et vous permet de vérifier ce qui tourne réellement sur le pod.

Définissez la taille du pod. Un volume de workspace de 30 Go est largement suffisant pour l'entraînement. 50 Go si vous voulez conserver plusieurs sessions d'entraînement sur le même pod. La création du pod prend 1 à 3 minutes.

Connectez-vous en SSH ou utilisez le terminal web une fois le pod en marche. Ouvrez l'interface JupyterLab fournie par RunPod. L'interface web de FluxGym tourne généralement sur le port 7860 avec un proxy HTTP via le routage d'URL de RunPod. La page du pod affiche l'URL.

Pour des détails opérationnels plus poussés sur RunPod, notre article installation Docker ComfyUI qui marche sur RunPod couvre l'écosystème plus large des templates RunPod et comment construire des templates personnalisés si ceux de la communauté ne correspondent pas à votre workflow.

Présentation de la Configuration FluxGym

FluxGym propose une interface épurée pour l'entraînement de LoRA Flux. Les valeurs par défaut sont pour la plupart pertinentes, mais le cas d'usage NSFW demande quelques ajustements spécifiques.

Importez votre dataset. L'interface permet de glisser-déposer votre dossier d'images. Les légendes doivent figurer dans des fichiers .txt correspondants aux côtés de chaque image, avec le même nom de fichier. Ainsi "image_001.png" est associé à "image_001.txt." FluxGym lit les fichiers txt automatiquement.

Définissez le modèle de base. Utilisez Flux Dev pour le rendu de la plus haute qualité. Flux Schnell s'entraîne plus vite mais produit des LoRA de qualité inférieure. Pour le travail NSFW où la qualité du rendu compte plus que la vitesse d'entraînement, Flux Dev est le bon choix. Si vous êtes à court de temps ou de budget, l'entraînement basé sur Schnell réduit le temps d'entraînement de moitié environ.

Résolution. Réglez sur 1024 pour la largeur et la hauteur. Ne descendez pas en dessous de 1024, la baisse de qualité est significative. Ne montez pas au-dessus de 1024, les coûts en VRAM et en temps n'en valent pas la peine pour la plupart des LoRA de personnages.

Envie d'éviter la complexité? Lewdly vous offre des résultats IA professionnels instantanément sans configuration technique.

Aucune configuration Même qualité Démarrer en 30 secondes Essayer Lewdly Gratuit
Aucune carte de crédit requise

Taille de lot. Réglez sur 1 sur une RTX 4090. Des tailles de lot supérieures demandent plus de VRAM que n'en a la 4090 pour l'entraînement de LoRA Flux. Certaines cartes 48 Go peuvent gérer une taille de lot de 2, mais pour les cartes 24 Go, la taille de lot 1 est ce qui fonctionne.

Taux d'apprentissage. 1e-4 est le meilleur réglage pour la plupart des LoRA NSFW de personnages. Plus bas (1e-5) s'entraîne plus lentement et risque que le modèle n'apprenne pas pleinement l'identité. Plus haut (1e-3) surapprend rapidement et produit un LoRA trop agressif.

Dimensions du réseau. Pour les LoRA de personnages, network_dim 32 avec network_alpha 16 est notre valeur par défaut. Les LoRA de style peuvent monter plus haut à network_dim 64. Les LoRA de concept NSFW fonctionnent très bien à 16. La dimension contrôle la capacité de représentation du LoRA. Plus elle est élevée, plus c'est flexible mais plus la taille du fichier augmente.

Étapes d'entraînement. 1500 à 2500 étapes pour les LoRA NSFW de personnages. Réglez les époques sur "auto" et laissez FluxGym calculer. Pour un dataset de 20 images avec 100 étapes par époque, cela fait environ 20 à 25 époques.

Sauvegarde toutes les N étapes. Réglez sur 250 à 500. Vous aurez besoin de checkpoints intermédiaires pour tester quel stade d'entraînement a produit le meilleur rendu. Parfois l'étape 1500 est le sommet, parfois l'étape 2000 l'emporte.

Lancement de l'Entraînement et Suivi

Lancez l'entraînement. FluxGym affiche la progression en temps réel. Les journaux du terminal montrent les valeurs de perte et les compteurs d'étapes. La perte initiale est généralement autour de 0,4 à 0,5 et devrait descendre à 0,1 à 0,15 à la fin de l'entraînement. Si la perte reste élevée (au-dessus de 0,3 après 1000 étapes), quelque chose cloche dans le dataset ou les légendes.

L'entraînement sur RTX 4090 en résolution 1024, taille de lot 1, prend environ :

  • 1500 étapes en environ 2,5 heures
  • 2000 étapes en environ 3,3 heures
  • 2500 étapes en environ 4,1 heures

À 0,34 $/heure, cela fait de 0,85 $ à 1,40 $ par session d'entraînement selon le nombre d'étapes. Ajoutez le temps de mise en place du pod et vous êtes autour de 1 à 2 $ par LoRA. Plusieurs itérations à travers l'affinage du dataset peuvent coûter 5 à 10 $ au total. Toujours bon marché comparé à ce que vous paieriez pour un service équivalent.

Surveillez le surapprentissage. Si vos images d'échantillon pendant l'entraînement commencent à montrer de façon répétée la pose exacte de l'une de vos images de référence, vous surapprenez. Arrêtez l'entraînement et utilisez un checkpoint antérieur. Le surapprentissage sur les LoRA de personnages se manifeste par un modèle qui ne génère le personnage que dans la composition exacte des images d'entraînement.

Programme Créateurs

Gagnez Jusqu'à 1 250 $+/Mois en Créant du Contenu

Rejoignez notre programme exclusif d'affiliés créateurs. Soyez payé par vidéo virale selon la performance. Créez du contenu à votre style avec une totale liberté créative.

$100
300K+ views
$300
1M+ views
$500
5M+ views
Paiements hebdomadaires
Aucun coût initial
Liberté créative totale

Sauvegardez les sorties toutes les 250 à 500 étapes en tant que checkpoints intermédiaires. Nous finissons généralement par utiliser un checkpoint situé quelque part au milieu de l'entraînement plutôt que le dernier. L'étape 1750 ou l'étape 2000 surpasse souvent l'étape 2500 pour les LoRA de personnages.

Tester le LoRA sur Plusieurs Checkpoints

Un LoRA n'est pas terminé quand l'entraînement s'achève. Il est terminé quand vous avez vérifié qu'il fonctionne sur les checkpoints avec lesquels vous l'utiliserez réellement. Testez sur au moins trois checkpoints Flux différents.

Test 1, Flux Dev de base. Le LoRA devrait produire votre personnage proprement sur le modèle Flux Dev de base, puisque c'est ce sur quoi vous l'avez entraîné.

Test 2, un finetune Flux de la communauté comme Chroma. Le LoRA devrait toujours produire une version reconnaissable de votre personnage, possiblement avec des variations de qualité.

Test 3, avec un autre LoRA empilé. Associez votre LoRA de personnage à un LoRA de déverrouillage ou un LoRA d'anatomie. Le personnage devrait rester reconnaissable mais peut légèrement varier en proportion ou en détail.

Nous avons constaté que les LoRA utilisés à un poids de 0,6 à 0,8 en usage réel produisent le meilleur équilibre entre fidélité du personnage et flexibilité des prompts. À un poids de 1,0, le LoRA domine tout et vous perdez la capacité de varier la scène. À 0,4 ou moins, le personnage commence à dériver.

Si le LoRA échoue à l'un de ces tests, la solution est généralement le dataset, pas les paramètres d'entraînement. Ajoutez 3 à 5 images de référence supplémentaires qui ciblent le cas d'échec. Réentraînez. Réessayez.

Pour un contexte plus large sur l'entraînement de LoRA, le guide d'entraînement de LoRA Flux dans ComfyUI couvre l'entraînement directement dans ComfyUI si vous préférez ce workflow à l'approche hébergée de RunPod. Mêmes principes, outil différent.

Coût Détaillé et Temps de Réalisation

Chiffres réels de nos 5 dernières sessions d'entraînement de LoRA Flux NSFW sur RunPod :

  • LoRA 1, travail de personnage, 20 images, 1750 étapes, 2,10 $ GPU + 0,30 $ stockage = 2,40 $ au total
  • LoRA 2, travail de personnage, 25 images, 2000 étapes, 2,85 $ GPU + 0,35 $ stockage = 3,20 $ au total
  • LoRA 3, transfert de style, 30 images, 2500 étapes, 3,40 $ GPU + 0,40 $ stockage = 3,80 $ au total
  • LoRA 4, LoRA de concept, 18 images, 1500 étapes, 1,95 $ GPU + 0,30 $ stockage = 2,25 $ au total
  • LoRA 5, travail de personnage, 22 images, 1800 étapes, 2,55 $ GPU + 0,35 $ stockage = 2,90 $ au total

En moyenne autour de 2,91 $ par LoRA. Côté temps, le temps d'exécution GPU est de 2 à 4 heures mais vous n'avez pas à le surveiller. Lancez l'entraînement, revenez à la fin. Le temps réel pour vous est de 30 à 60 minutes de préparation du dataset plus 5 minutes de test du résultat.

Le coût total pour quelqu'un qui construit 10 LoRA de personnages tourne autour de 30 $. C'est nettement moins que d'acheter un accès à des services d'entraînement commerciaux, et vous possédez les fichiers LoRA résultants en pleine propriété. À titre de comparaison, notre comparaison DreamBooth contre entraînement LoRA couvre les cas où le DreamBooth complet a plus de sens que l'entraînement LoRA. Pour la plupart des travaux NSFW de personnages, le LoRA gagne sur le coût et la flexibilité. Nous avons déployé des LoRA entraînés de cette façon dans lewdly.ai pour nos propres personnages, donc nous pouvons garantir que le workflow de l'entraînement sur RunPod au déploiement en production est réel et pas théorique.

Si vous ne voulez pas gérer l'entraînement RunPod vous-même, des plateformes hébergées comme lewdly.ai prennent en charge le pipeline d'entraînement en tant que service. Pour être transparents, nous participons à sa construction. L'avantage, c'est qu'il n'y a ni installation ni gestion technique. L'inconvénient, c'est moins de contrôle sur les paramètres d'entraînement. Pour les créateurs à fort volume produisant de nombreux LoRA de personnages, la voie directe RunPod fait économiser de l'argent. Pour les utilisateurs occasionnels entraînant un ou deux LoRA, la voie hébergée est plus simple.

FAQ

Combien d'images me faut-il pour entraîner un LoRA Flux NSFW ?

15 à 30 images de haute qualité soigneusement sélectionnées surpassent 50 à 100 images médiocres. Pour les LoRA de personnages en particulier, 15 à 20 images bien choisies produisent souvent de meilleurs résultats que des datasets plus grands et bruités.

Quel est le GPU le moins cher sur RunPod pour l'entraînement de LoRA Flux ?

La RTX A5000 24 Go à environ 0,30 $/heure est l'option viable la moins chère. La RTX 4090 à 0,34 $/heure est légèrement plus chère mais s'entraîne plus vite, donc le coût total finit par être à peu près équivalent.

Puis-je entraîner des LoRA Flux sur des cartes 16 Go de VRAM ?

Pas vraiment. L'entraînement de LoRA Flux nécessite environ 22 à 24 Go de VRAM en résolution 1024 avec une taille de lot de 1. Vous pourriez tenter un entraînement en résolution 512 sur 16 Go, mais la qualité du rendu chute fortement. Louez plutôt une 4090 sur RunPod.

Combien de temps prend l'entraînement ?

Sur RTX 4090 en résolution 1024, 1500 étapes prennent environ 2,5 heures. 2000 étapes prennent environ 3,3 heures. 2500 étapes prennent environ 4,1 heures. La taille de votre dataset influe légèrement sur ce temps via la durée par étape, mais la variable principale est le nombre total d'étapes.

Quel taux d'apprentissage devrais-je utiliser ?

1e-4 est la valeur par défaut sûre pour la plupart des LoRA NSFW de personnages sur Flux Dev. Les LoRA de style peuvent parfois bénéficier de 5e-5. Les LoRA de concept fonctionnent à 1e-4 jusqu'à 2e-4. Ne montez pas au-dessus de 5e-4 à moins de savoir ce que vous faites.

Mon LoRA Flux fonctionnera-t-il sur SDXL ?

Non. Les LoRA Flux et les LoRA SDXL sont totalement incompatibles. Architectures différentes, pipelines d'entraînement différents, structures de fichiers différentes. Vous devriez entraîner séparément pour chaque modèle de base.

Puis-je vendre des LoRA que j'entraîne moi-même ?

Oui, si vous entraînez sur Chroma (licence Apache 2.0). Pour Flux Dev, la licence est plus restrictive sur l'usage commercial des dérivés. Lisez attentivement la licence Flux Dev si vous comptez commercialiser.

Quel est le rapport de FluxGym avec Kohya ?

FluxGym est une surcouche d'interface autour des scripts d'entraînement de Kohya. Kohya fournit la logique d'entraînement proprement dite. FluxGym la rend utilisable sans travail en ligne de commande. Même moteur sous le capot que la plupart des autres outils d'entraînement Flux.

Prêt à Créer Votre Influenceur IA?

Rejoignez 115 étudiants maîtrisant ComfyUI et le marketing d'influenceurs IA dans notre cours complet de 51 leçons.

La tarification anticipée se termine dans :
--
Jours
:
--
Heures
:
--
Minutes
:
--
Secondes
Réservez Votre Place - 199 $
Économisez 200 $ - Prix Augmente à 399 $ Pour Toujours