2026 में RunPod पर NSFW Flux LoRA ट्रेनिंग
एक कैरेक्टर NSFW Flux LoRA ट्रेन करने के लिए पूरा RunPod ट्यूटोरियल। 15 इमेज, FluxGym, डेटासेट तैयारी, कैप्शनिंग, ट्रेनिंग पैरामीटर, असली लागत का ब्योरा।
RunPod पर अपनी खुद की nsfw flux lora training पाइपलाइन ट्रेन करना ज़्यादातर ट्यूटोरियल जितना मुश्किल बताते हैं, उससे कहीं ज़्यादा व्यावहारिक है। हमने RunPod और FluxGym का इस्तेमाल करके Flux पर 30 से ज़्यादा NSFW कैरेक्टर LoRA ट्रेन किए हैं, और असली वर्कफ़्लो तब सीधा-साधा हो जाता है जब आपको पता हो कि क्या छोड़ना है और किसमें निवेश करना है। ऑनलाइन मौजूद ट्यूटोरियल डेटासेट तैयारी को ज़रूरत से ज़्यादा जटिल बना देते हैं और कैप्शनिंग को बहुत हल्के में लेते हैं। यह गाइड इसे उलट देती है।
- RunPod RTX 4090 कम्युनिटी क्लाउड पर कुल लागत आमतौर पर प्रति LoRA $2 से $5 के बीच रहती है।
- 15 से 30 उच्च गुणवत्ता वाली इमेज हर बार 100 औसत दर्जे की इमेज से बेहतर साबित होती हैं।
- आउटपुट गुणवत्ता पर सबसे ज़्यादा असर डालने वाला एकल कारक कैप्शनिंग है।
- 2026 में Flux LoRA के लिए FluxGym सबसे सरल ट्रेनिंग UI है।
- यह पुष्टि करने के लिए कि LoRA सामान्यीकृत होता है, इसे कम से कम 3 अलग-अलग चेकपॉइंट पर टेस्ट करें।
एक कस्टम NSFW Flux LoRA क्यों ट्रेन करें
ईमानदारी से कहें तो हमसे सबसे ज़्यादा यही सवाल पूछा जाता है कि जब Civitai पर पहले से हज़ारों LoRA मौजूद हैं तो क्या कस्टम LoRA ट्रेन करना सार्थक भी है। इसका जवाब इस बात पर निर्भर करता है कि आप करना क्या चाहते हैं। आम स्टाइल या लोकप्रिय कैरेक्टर के लिए, बस कोई मौजूदा LoRA डाउनलोड कर लें। किसी खास कैरेक्टर के लिए जिसे आप बना रहे हैं, किसी निजी मॉडल के लिए, या किसी अप्रकाशित स्टाइल के लिए जिसे आपने खुद डिज़ाइन किया है, अपना खुद का ट्रेन करना ही एकमात्र रास्ता है।
हमने अपने खुद के AI कैरेक्टर काम के लिए, क्लाइंट प्रोजेक्ट के लिए, और यह सीखने के लिए प्रयोग के तौर पर LoRA ट्रेन किए हैं कि डेटासेट में बदलाव पर ट्रेनिंग का व्यवहार कैसे प्रतिक्रिया देता है। जिस कैरेक्टर को हमने ट्रेन किया, उस पर हमारे खुद बनाए कैरेक्टर LoRA किसी भी आम LoRA से बेहतर प्रदर्शन करते हैं क्योंकि वे विशिष्ट पहचान की बारीकियों को पकड़ते हैं जिन्हें कोई सार्वजनिक LoRA लक्षित नहीं करता। यही पूरा मूल्य प्रस्ताव है। आपका ट्रेनिंग डेटासेट मॉडल का ज्ञान बन जाता है।
Flux इकोसिस्टम में SDXL से अलग ट्रेनिंग गतिकी भी है। हमारे अनुभव में Flux LoRA तेज़ी से ट्रेन होते हैं, कम इमेज की ज़रूरत होती है, और SDXL LoRA से बेहतर सामान्यीकृत होते हैं। हमने देखा है कि 12 से 15 इमेज पर ट्रेन किए गए Flux LoRA, 50 इमेज पर ट्रेन किए गए SDXL LoRA से ज़्यादा एकरूप कैरेक्टर आउटपुट देते हैं। बेस Flux मॉडल पहचान की विशेषताएं निकालने में बस बेहतर है। इससे NSFW Flux LoRA ट्रेन करना हैरानी की हद तक कुशल बन जाता है।
एक और बात कहने लायक है कि NSFW LoRA ट्रेनिंग की अपनी खासियतें होती हैं। Flux बेस मॉडल डिफ़ॉल्ट रूप से स्पष्ट कंटेंट का प्रतिरोध करता है, इसलिए आपके ट्रेनिंग डेटासेट में इस प्रतिरोध को पार करने के लिए पर्याप्त स्पष्ट संदर्भ सामग्री होनी चाहिए। अगर आपका डेटासेट 80% SFW और 20% NSFW है, तो ट्रेनिंग के बाद भी LoRA स्पष्ट प्रॉम्प्ट के साथ संघर्ष करेगा। हमने यह कठिन तरीके से सीखा। डेटासेट का संतुलन मायने रखता है।
डेटासेट क्यूरेशन, 15 से 30 इमेज
यहीं ज़्यादातर ट्यूटोरियल गलत हो जाते हैं। वे आपको "बेहतरीन नतीजों" के लिए 50 से 100 इमेज इस्तेमाल करने को कहते हैं। सच कहें तो कैरेक्टर LoRA के लिए यह ज़रूरत से ज़्यादा है और अगर आपका डेटासेट चुना हुआ न हो तो यह सक्रिय रूप से नुकसानदेह है। हमें खासतौर पर चुनी गई 15 से 30 इमेज के साथ सबसे अच्छे नतीजे मिलते हैं। अगर ज़्यादा का मतलब औसत दर्जे की या कैरेक्टर से हटकर इमेज जोड़ना है, तो ज़्यादा बेहतर नहीं है।
कैरेक्टर NSFW ट्रेनिंग के लिए एक बढ़िया डेटासेट कैसा दिखता है?
- अलग-अलग कोणों से 8 से 12 उच्च गुणवत्ता वाली चेहरे की इमेज
- साफ़ कंपोज़िशन के साथ 5 से 8 पूरी बॉडी की इमेज
- 3 से 5 स्पष्ट संदर्भ इमेज जो कैरेक्टर को NSFW संदर्भ में दिखाती हों
- 2 से 4 विविधता वाली इमेज, अलग-अलग पोशाक, हाव-भाव, रोशनी
रेज़ोल्यूशन मायने रखता है। हम सोर्स इमेज पर 1024x1024 या उससे बड़ा रखने की कोशिश करते हैं। छोटे रेज़ोल्यूशन मॉडल को अपस्केल किए गए दोषों से सीखने पर मजबूर कर देते हैं। अगर आपकी संदर्भ इमेज 512x512 हैं, तो ट्रेनिंग से पहले उन्हें R-ESRGAN 4x+ जैसे गुणवत्ता वाले मॉडल से अपस्केल करें, सीधे लो-रेज़ पर ट्रेन न करें।
सबसे ज़्यादा असर डालने वाला एकल डेटासेट विकल्प विविधता है। मॉडल सीखता है कि आपकी संदर्भ इमेज में क्या एकरूप है। अगर हर चेहरे की इमेज में एक ही रोशनी और कोण इस्तेमाल हो, तो मॉडल सिर्फ़ वही रोशनी और कोण ही बनाएगा। स्थितियों को बदलें। दिन के अलग-अलग समय, अलग-अलग सेटिंग, अलग-अलग हाव-भाव। मॉडल विविधता से पहचान निकालता है।
हमारी Flux LoRA डेटासेट तैयारी गाइड डेटासेट पक्ष को और गहराई से कवर करती है। ये सिद्धांत NSFW ट्रेनिंग पर भी लागू होते हैं, बस सही अनुपात में स्पष्ट संदर्भ सामग्री जोड़ने के साथ।
NSFW के लिए कैप्शनिंग रणनीति
कैप्शनिंग वह कारक है जो आउटपुट गुणवत्ता पर सबसे ज़्यादा असर डालता है और जिसे ज़्यादातर ट्यूटोरियल खराब तरीके से संभालते हैं। आप अपनी ट्रेनिंग इमेज के लिए जो कैप्शन लिखते हैं, वे सचमुच मॉडल को बताते हैं कि हर इमेज क्या दर्शाती है। खराब कैप्शन, डेटासेट की गुणवत्ता चाहे जो हो, खराब LoRA बनाते हैं।
NSFW Flux LoRA के लिए हमारा कैप्शनिंग तरीका:
हर कैप्शन की शुरुआत अपने ट्रिगर टोकन से करें। कोई ऐसा अनोखा शब्द चुनें जो Flux की मौजूदा शब्दावली से न टकराए। हम असली शब्दों से टकराव बचाने के लिए "ohwx_woman" या "char_alex" जैसे संयोजन इस्तेमाल करते हैं।
इमेज में जो है उसका वस्तुनिष्ठ रूप से वर्णन करें। "ohwx_woman, brown hair, green eyes, sitting on bed, soft lighting, photoreal।" यह वर्णन न करें कि इमेज में क्या नहीं है। यह वर्णन न करें कि आप मॉडल को परोक्ष रूप से क्या सिखाना चाहते हैं।
खासतौर पर NSFW इमेज के लिए, NSFW तत्वों का स्पष्ट रूप से वर्णन करें। "ohwx_woman, lying on back, nude, anatomically detailed, soft skin texture, intimate composition।" NSFW इमेज पर अस्पष्ट कैप्शन अस्पष्ट LoRA NSFW प्रतिक्रियाएं पैदा करते हैं।
पूरे डेटासेट में कैप्शन को बदलते रहें। हर इमेज के लिए बिल्कुल एक ही कैप्शन टेम्पलेट इस्तेमाल न करें। यह विविधता मॉडल को सिखाती है कि ट्रिगर टोकन एकरूप पहचान का प्रतिनिधित्व करता है जबकि बाकी सब कुछ बदलता रहता है।
लंबाई के लिहाज़ से, प्रति कैप्शन 15 से 30 टोकन का लक्ष्य रखें। बहुत छोटा हो तो मॉडल के पास पर्याप्त संदर्भ नहीं होता। बहुत लंबा हो तो आप ट्रिगर टोकन के संकेत को कमज़ोर कर देते हैं।
BLIP-2 या Florence-2 जैसे ऑटो-कैप्शनिंग टूल पहले मसौदे के कैप्शन के लिए ठीक हैं, लेकिन NSFW इमेज के लिए आपको उन्हें मैन्युअली एडिट करना होगा। ऑटो-कैप्शनर स्पष्ट शब्दों से बचने के लिए ट्रेन किए जाते हैं, इसलिए वे NSFW इमेज का वर्णन घुमा-फिराकर करते हैं या स्पष्ट कंटेंट को पूरी तरह छोड़ देते हैं। NSFW कैप्शन का मैन्युअल संपादन ज़रूरी है।
RunPod पॉड सेटअप और टेम्पलेट
RunPod ट्रेनिंग के लिए हमारी पहली पसंद है क्योंकि GPU की कीमत ईमानदार है और टेम्पलेट सेटअप को तेज़ बना देते हैं। यहां असली सेटअप प्रक्रिया है।
अगर अभी तक नहीं किया है तो RunPod पर साइन अप करें। एक पेमेंट तरीका जोड़ें। $10 से $20 का क्रेडिट लोड करें। आप प्रति LoRA ट्रेनिंग रन पर $2 से $5 खर्च करेंगे।
मुफ़्त ComfyUI वर्कफ़्लो
इस लेख में तकनीकों के लिए मुफ़्त ओपन-सोर्स ComfyUI वर्कफ़्लो खोजें। ओपन सोर्स शक्तिशाली है।
एक GPU चुनें। कम्युनिटी क्लाउड पर RTX 4090 लगभग $0.34 से $0.44/घंटा पर सबसे अच्छा विकल्प है। 24GB VRAM वाला RTX A5000 भी थोड़ी कम लागत पर काम करता है। RTX 3090 काम तो करता है पर धीमा है। Flux LoRA ट्रेनिंग के लिए 24GB VRAM से कम किसी भी चीज़ की चिंता न करें, मॉडल बहुत बड़ा है।
एक टेम्पलेट चुनें। टेम्पलेट सेक्शन में "FluxGym" खोजें। कम्युनिटी द्वारा बनाए गए FluxGym टेम्पलेट में सभी डिपेंडेंसी पहले से इंस्टॉल आती हैं। हम कम्युनिटी योगदानकर्ताओं द्वारा रखरखाव किया जाने वाला वह टेम्पलेट इस्तेमाल करते हैं जो वर्कस्पेस वॉल्यूम अपने आप माउंट कर देता है। FluxGym GitHub रिपॉज़िटरी अंतर्निहित ट्रेनिंग स्क्रिप्ट का दस्तावेज़ीकरण करती है और आपको यह सत्यापित करने देती है कि पॉड पर असल में क्या चल रहा है।
पॉड साइज़ सेट करें। ट्रेनिंग के लिए 30GB वर्कस्पेस वॉल्यूम काफ़ी है। अगर आप एक ही पॉड पर कई ट्रेनिंग रन रखना चाहते हैं तो 50GB। पॉड बनने में 1 से 3 मिनट लगते हैं।
पॉड चलने के बाद SSH करें या वेब टर्मिनल इस्तेमाल करें। RunPod द्वारा दिया गया JupyterLab इंटरफ़ेस खोलें। FluxGym का वेब UI आमतौर पर पोर्ट 7860 पर चलता है और RunPod की URL रूटिंग के ज़रिए HTTP प्रॉक्सी से होकर आता है। पॉड पेज URL दिखाता है।
RunPod के संचालन से जुड़ी और गहरी जानकारी के लिए, हमारी ComfyUI Docker सेटअप जो RunPod पर बस काम करता है गाइड व्यापक RunPod टेम्पलेट इकोसिस्टम को कवर करती है और यह भी कि अगर कम्युनिटी टेम्पलेट आपके वर्कफ़्लो में फ़िट न बैठें तो कस्टम टेम्पलेट कैसे बनाएं।
FluxGym कॉन्फ़िग का विस्तृत विवरण
FluxGym Flux LoRA ट्रेनिंग के लिए एक साफ़-सुथरा UI पेश करता है। डिफ़ॉल्ट ज़्यादातर समझदारी भरे हैं पर NSFW उपयोग के मामले में कुछ खास बदलाव चाहिए होते हैं।
अपना डेटासेट अपलोड करें। इंटरफ़ेस आपको अपना इमेज फ़ोल्डर ड्रैग-एंड-ड्रॉप करने देता है। कैप्शन हर इमेज के साथ मिलती-जुलती .txt फ़ाइलों में होने चाहिए, वही फ़ाइलनाम। यानी "image_001.png" का जोड़ा "image_001.txt" के साथ बनता है। FluxGym txt फ़ाइलें अपने आप पढ़ता है।
बेस मॉडल सेट करें। सबसे उच्च गुणवत्ता वाले आउटपुट के लिए Flux Dev इस्तेमाल करें। Flux Schnell तेज़ी से ट्रेन होता है पर कम गुणवत्ता वाले LoRA बनाता है। NSFW काम के लिए जहां आउटपुट गुणवत्ता ट्रेनिंग गति से ज़्यादा मायने रखती है, Flux Dev सही फ़ैसला है। अगर समय या बजट तंग है, तो Schnell-आधारित ट्रेनिंग ट्रेनिंग समय को करीब आधा कर देती है।
रेज़ोल्यूशन। चौड़ाई और ऊंचाई दोनों के लिए 1024 सेट करें। 1024 से नीचे न जाएं, गुणवत्ता में गिरावट मायने रखती है। 1024 से ऊपर न जाएं, ज़्यादातर कैरेक्टर LoRA के लिए VRAM और समय की लागत इसके लायक नहीं है।
जटिलता को छोड़ना चाहते हैं? Lewdly बिना किसी तकनीकी सेटअप के तुरंत पेशेवर AI परिणाम देता है।
बैच साइज़। RTX 4090 पर 1 सेट करें। Flux LoRA ट्रेनिंग के लिए ऊंचे बैच साइज़ को 4090 के पास मौजूद VRAM से ज़्यादा की ज़रूरत होती है। कुछ 48GB कार्ड बैच साइज़ 2 संभाल सकते हैं, पर 24GB कार्ड के लिए बैच साइज़ 1 ही काम करता है।
लर्निंग रेट। ज़्यादातर NSFW कैरेक्टर LoRA के लिए 1e-4 सबसे अच्छा बिंदु है। कम (1e-5) धीमी ट्रेनिंग करता है और इसका जोखिम है कि मॉडल पहचान को पूरी तरह न सीखे। ज़्यादा (1e-3) तेज़ी से ओवरफ़िट होता है और ऐसा LoRA बनाता है जो ज़रूरत से ज़्यादा आक्रामक होता है।
नेटवर्क डाइमेंशन। कैरेक्टर LoRA के लिए, network_dim 32 के साथ network_alpha 16 हमारा डिफ़ॉल्ट है। स्टाइल LoRA network_dim 64 तक ऊंचे जा सकते हैं। NSFW कॉन्सेप्ट LoRA 16 पर ठीक काम करते हैं। dim LoRA की प्रतिनिधित्व क्षमता को नियंत्रित करता है। ज़्यादा = ज़्यादा लचीला पर बड़ी फ़ाइल साइज़।
ट्रेनिंग स्टेप्स। कैरेक्टर NSFW LoRA के लिए 1500 से 2500 स्टेप्स। एपोक "ऑटो" पर चलाएं और FluxGym को गणना करने दें। प्रति एपोक 100 स्टेप्स वाले 20-इमेज डेटासेट के लिए, यह करीब 20 से 25 एपोक है।
हर N स्टेप्स पर सेव करें। 250 से 500 सेट करें। आप यह टेस्ट करने के लिए बीच के चेकपॉइंट चाहेंगे कि ट्रेनिंग के किस चरण ने सबसे अच्छा आउटपुट दिया। कभी-कभी स्टेप 1500 सबसे अच्छा बिंदु होता है, कभी-कभी स्टेप 2000 जीतता है।
ट्रेनिंग रन और निगरानी
ट्रेनिंग शुरू करें। FluxGym वास्तविक समय में प्रगति दिखाता है। टर्मिनल लॉग loss वैल्यू और स्टेप काउंटर दिखाते हैं। शुरुआती loss आमतौर पर 0.4 से 0.5 के आसपास होता है और ट्रेनिंग के अंत तक 0.1 से 0.15 तक गिर जाना चाहिए। अगर loss ऊंचा बना रहता है (1000 स्टेप्स के बाद 0.3 से ऊपर), तो डेटासेट या कैप्शन में कुछ गड़बड़ है।
RTX 4090 पर 1024 रेज़ोल्यूशन, बैच साइज़ 1 पर ट्रेनिंग में लगभग इतना समय लगता है:
- 1500 स्टेप्स में करीब 2.5 घंटे
- 2000 स्टेप्स में करीब 3.3 घंटे
- 2500 स्टेप्स में करीब 4.1 घंटे
$0.34/घंटा पर, यह स्टेप संख्या के हिसाब से प्रति ट्रेनिंग रन $0.85 से $1.40 है। पॉड सेटअप का समय जोड़ें तो आप प्रति LoRA $1 से $2 देख रहे हैं। डेटासेट परिष्करण के दौरान कई बार दोहराव में कुल $5 से $10 लग सकते हैं। फिर भी इसके मुकाबले सस्ता है जो आप किसी तुलनीय सेवा के लिए चुकाते।
ओवरफ़िटिंग की निगरानी करें। अगर ट्रेनिंग के दौरान आपकी सैंपल इमेज बार-बार आपकी किसी संदर्भ इमेज का बिल्कुल वही पोज़ दिखाने लगें, तो आप ओवरफ़िट कर रहे हैं। ट्रेनिंग रोकें और कोई पहले का चेकपॉइंट इस्तेमाल करें। कैरेक्टर LoRA पर ओवरफ़िटिंग इस रूप में दिखती है कि मॉडल कैरेक्टर को सिर्फ़ ट्रेनिंग इमेज के बिल्कुल वही कंपोज़िशन में ही बनाता है।
कंटेंट बनाकर $1,250+/महीना कमाएं
हमारे विशेष क्रिएटर एफिलिएट प्रोग्राम में शामिल हों। वायरल वीडियो प्रदर्शन के आधार पर भुगतान पाएं। पूर्ण रचनात्मक स्वतंत्रता के साथ अपनी शैली में कंटेंट बनाएं।
बीच के चेकपॉइंट के रूप में हर 250 से 500 स्टेप्स पर आउटपुट सेव करें। हम आमतौर पर अंतिम के बजाय ट्रेनिंग के बीच कहीं का चेकपॉइंट इस्तेमाल करते हैं। कैरेक्टर LoRA के लिए स्टेप 1750 या स्टेप 2000 अक्सर स्टेप 2500 से बेहतर प्रदर्शन करता है।
चेकपॉइंट के पार LoRA को टेस्ट करना
LoRA तब पूरा नहीं होता जब ट्रेनिंग खत्म हो जाती है। यह तब पूरा होता है जब आपने यह सत्यापित कर लिया हो कि यह उन चेकपॉइंट के साथ काम करता है जिनके साथ आप वास्तव में इसे इस्तेमाल करेंगे। कम से कम तीन अलग-अलग Flux चेकपॉइंट पर टेस्ट करें।
टेस्ट 1, Flux Dev बेस। LoRA को बेस Flux Dev मॉडल पर आपका कैरेक्टर साफ़-सुथरे ढंग से बनाना चाहिए क्योंकि आपने उसी के सापेक्ष ट्रेन किया है।
टेस्ट 2, Chroma जैसा कोई कम्युनिटी Flux फ़ाइनट्यून। LoRA को फिर भी आपके कैरेक्टर का एक पहचान योग्य संस्करण बनाना चाहिए, संभवतः कुछ गुणवत्ता भिन्नता के साथ।
टेस्ट 3, किसी और LoRA को स्टैक करके। अपने कैरेक्टर LoRA को किसी अनलॉक LoRA या एनाटॉमी LoRA के साथ जोड़ें। कैरेक्टर फिर भी पहचान योग्य होना चाहिए पर अनुपात या ब्योरे में थोड़ा बदल सकता है।
हमने पाया है कि वास्तविक उपयोग में 0.6 से 0.8 वेट पर इस्तेमाल किए गए LoRA, कैरेक्टर की निष्ठा और प्रॉम्प्ट लचीलेपन का सबसे अच्छा संतुलन देते हैं। 1.0 वेट पर, LoRA हर चीज़ पर हावी हो जाता है और आप दृश्य को बदलने की क्षमता खो देते हैं। 0.4 या उससे कम पर, कैरेक्टर भटकने लगता है।
अगर इनमें से किसी भी टेस्ट में LoRA विफल होता है, तो समाधान आमतौर पर डेटासेट है, ट्रेनिंग पैरामीटर नहीं। विफलता वाले मामले को लक्षित करने वाली 3 से 5 और संदर्भ इमेज जोड़ें। दोबारा ट्रेन करें। फिर से कोशिश करें।
व्यापक LoRA ट्रेनिंग संदर्भ के लिए, ComfyUI में Flux LoRA ट्रेनिंग गाइड ComfyUI के भीतर ही ट्रेनिंग को कवर करती है, अगर आप RunPod के होस्टेड तरीके के बजाय उस वर्कफ़्लो को पसंद करते हैं। वही सिद्धांत, अलग टूल।
लागत का ब्योरा और पूरा होने में लगने वाला समय
RunPod पर हमारे पिछले 5 NSFW Flux LoRA ट्रेनिंग रन के असली आंकड़े:
- LoRA 1, कैरेक्टर काम, 20 इमेज, 1750 स्टेप्स, $2.10 GPU + $0.30 स्टोरेज = $2.40 कुल
- LoRA 2, कैरेक्टर काम, 25 इमेज, 2000 स्टेप्स, $2.85 GPU + $0.35 स्टोरेज = $3.20 कुल
- LoRA 3, स्टाइल ट्रांसफ़र, 30 इमेज, 2500 स्टेप्स, $3.40 GPU + $0.40 स्टोरेज = $3.80 कुल
- LoRA 4, कॉन्सेप्ट LoRA, 18 इमेज, 1500 स्टेप्स, $1.95 GPU + $0.30 स्टोरेज = $2.25 कुल
- LoRA 5, कैरेक्टर काम, 22 इमेज, 1800 स्टेप्स, $2.55 GPU + $0.35 स्टोरेज = $2.90 कुल
औसतन प्रति LoRA करीब $2.91। समय के लिहाज़ से, GPU रनटाइम 2 से 4 घंटे है पर आपको इसकी देखभाल करते रहने की ज़रूरत नहीं। ट्रेनिंग शुरू करें, अंत में आकर देख लें। आपके लिए असली घड़ी का समय 30 से 60 मिनट की डेटासेट तैयारी और नतीजे को टेस्ट करने के 5 मिनट है।
10 कैरेक्टर LoRA बनाने वाले किसी व्यक्ति के लिए कुल लागत करीब $30 है। यह वाणिज्यिक ट्रेनिंग सेवाओं तक पहुंच खरीदने से काफ़ी कम है और परिणामी LoRA फ़ाइलें पूरी तरह आपकी अपनी होती हैं। तुलना के लिए, हमारी DreamBooth बनाम LoRA ट्रेनिंग तुलना यह कवर करती है कि कब पूरा DreamBooth, LoRA ट्रेनिंग से ज़्यादा समझदारी भरा होता है। ज़्यादातर NSFW कैरेक्टर काम के लिए, लागत और लचीलेपन में LoRA जीतता है। हमने इसी तरह ट्रेन किए गए LoRA अपने खुद के कैरेक्टर के लिए lewdly.ai में भेजे हैं, इसलिए हम भरोसे के साथ कह सकते हैं कि RunPod-ट्रेनिंग से प्रोडक्शन-डिप्लॉयमेंट तक का वर्कफ़्लो असली है, सैद्धांतिक नहीं।
अगर आप खुद RunPod ट्रेनिंग नहीं चलाना चाहते, तो lewdly.ai जैसे होस्टेड प्लेटफ़ॉर्म ट्रेनिंग पाइपलाइन को एक सेवा के रूप में संभालते हैं। पूरी ईमानदारी से, हम इसे बनाने में मदद करते हैं। फ़ायदा यह है कि कोई सेटअप या तकनीकी प्रबंधन नहीं। नुकसान यह है कि ट्रेनिंग पैरामीटर पर कम नियंत्रण। कई कैरेक्टर LoRA बनाने वाले ज़्यादा मात्रा वाले निर्माताओं के लिए, सीधा RunPod रास्ता पैसे बचाता है। एक या दो LoRA ट्रेन करने वाले आम उपयोगकर्ताओं के लिए, होस्टेड रास्ता ज़्यादा सरल है।
अक्सर पूछे जाने वाले सवाल
एक Flux NSFW LoRA ट्रेन करने के लिए मुझे कितनी इमेज चाहिए?
15 से 30 उच्च गुणवत्ता वाली चुनी हुई इमेज, 50 से 100 औसत दर्जे की इमेज से बेहतर प्रदर्शन करती हैं। खासतौर पर कैरेक्टर LoRA के लिए, 15 से 20 अच्छी तरह चुनी गई इमेज अक्सर बड़े शोर भरे डेटासेट से बेहतर नतीजे देती हैं।
Flux LoRA ट्रेनिंग के लिए RunPod पर सबसे सस्ता GPU कौन सा है?
करीब $0.30/घंटा पर RTX A5000 24GB सबसे सस्ता व्यवहार्य विकल्प है। $0.34/घंटा पर RTX 4090 थोड़ा महंगा है पर तेज़ी से ट्रेन होता है, इसलिए कुल लागत करीब बराबर ही पड़ती है।
क्या मैं 16GB VRAM कार्ड पर Flux LoRA ट्रेन कर सकता हूं?
व्यावहारिक रूप से नहीं। Flux LoRA ट्रेनिंग को बैच साइज़ 1 के साथ 1024 रेज़ोल्यूशन पर करीब 22 से 24GB VRAM चाहिए। आप 16GB पर 512 रेज़ोल्यूशन ट्रेनिंग आज़मा सकते हैं पर आउटपुट गुणवत्ता काफ़ी गिर जाती है। इसके बजाय RunPod पर एक 4090 किराए पर लें।
ट्रेनिंग में कितना समय लगता है?
RTX 4090 पर 1024 रेज़ोल्यूशन पर, 1500 स्टेप्स में करीब 2.5 घंटे लगते हैं। 2000 स्टेप्स में करीब 3.3 घंटे लगते हैं। 2500 स्टेप्स में करीब 4.1 घंटे लगते हैं। आपके डेटासेट का आकार प्रति-स्टेप समय के ज़रिए इस पर थोड़ा असर डालता है पर मुख्य कारक कुल स्टेप संख्या है।
मुझे कौन सा लर्निंग रेट इस्तेमाल करना चाहिए?
Flux Dev पर ज़्यादातर NSFW कैरेक्टर LoRA के लिए 1e-4 सुरक्षित डिफ़ॉल्ट है। स्टाइल LoRA को कभी-कभी 5e-5 से फ़ायदा हो सकता है। कॉन्सेप्ट LoRA 1e-4 से 2e-4 पर काम करते हैं। 5e-4 से ऊपर तब तक न जाएं जब तक आपको पता न हो कि आप क्या कर रहे हैं।
क्या मेरा Flux LoRA SDXL पर काम करेगा?
नहीं। Flux LoRA और SDXL LoRA पूरी तरह असंगत हैं। अलग आर्किटेक्चर, अलग ट्रेनिंग पाइपलाइन, अलग फ़ाइल संरचनाएं। आपको हर बेस मॉडल के लिए अलग से ट्रेन करना होगा।
क्या मैं खुद ट्रेन किए गए LoRA बेच सकता हूं?
हां, अगर आप Chroma (Apache 2.0 लाइसेंस) पर ट्रेन कर रहे हैं। Flux Dev के लिए, व्युत्पन्न के वाणिज्यिक उपयोग पर लाइसेंस ज़्यादा प्रतिबंधात्मक है। अगर आप इसका व्यवसायीकरण कर रहे हैं तो Flux Dev लाइसेंस ध्यान से पढ़ें।
FluxGym का Kohya से क्या रिश्ता है?
FluxGym, Kohya की ट्रेनिंग स्क्रिप्ट के इर्द-गिर्द एक UI रैपर है। Kohya असली ट्रेनिंग तर्क देता है। FluxGym इसे कमांड-लाइन काम के बिना उपयोग योग्य बनाता है। बाकी ज़्यादातर Flux ट्रेनिंग टूल जैसा ही इंजन भीतर लगा है।
अपना AI इन्फ्लुएंसर बनाने के लिए तैयार हैं?
115 छात्रों के साथ शामिल हों जो हमारे पूर्ण 51-पाठ पाठ्यक्रम में ComfyUI और AI इन्फ्लुएंसर मार्केटिंग में महारत हासिल कर रहे हैं।
संबंधित लेख
ComfyUI में एक AI गर्लफ्रेंड कैरेक्टर बनाना: विज़ुअल कंसिस्टेंसी वर्कफ़्लो
IPAdapter और FaceID का उपयोग करके दृश्य रूप से सुसंगत AI गर्लफ्रेंड कैरेक्टर बनाने के लिए संपूर्ण ComfyUI वर्कफ़्लो। इष्टतम सेटिंग्स और नोड कॉन्फ़िगरेशन के साथ चरण-दर-चरण तकनीकी गाइड।
NSFW चेहरों के लिए ComfyUI Face Detailer वर्कफ़्लो
AI से बने NSFW इमेज में चेहरे ठीक करें। Impact Pack face detailer नोड सेटअप, YOLO मॉडल, denoise सेटिंग्स, मल्टी-पास रिस्टोरेशन।
कपड़ों के एडिट के लिए ComfyUI NSFW इनपेंटिंग वर्कफ्लो
कपड़े बदलने और NSFW एडिट के लिए स्टेप बाय स्टेप ComfyUI इनपेंटिंग वर्कफ्लो। SAM सेगमेंटेशन, Flux Fill, मास्क ब्लर, डीनॉइज़ स्ट्रेंथ।