衣装向けComfyUI NSFWインペインティングワークフロー | Lewdly Blog
/ ComfyUI / 衣装編集のためのComfyUI NSFWインペインティングワークフロー
ComfyUI 2 分で読めます

衣装編集のためのComfyUI NSFWインペインティングワークフロー

衣装変更とNSFW編集のためのComfyUIインペインティングワークフローを段階的に解説します。SAMセグメンテーション、Flux Fill、マスクぼかし、ノイズ除去の強度を扱います。

衣装編集のためのComfyUI NSFWインペインティングワークフロー

きれいな衣装編集や明示的なNSFW修正を実際に生み出せるcomfyui nsfwインペインティングワークフローは、ネット上のチュートリアルが示すよりも構築が難しいものです。ほとんどのYouTubeガイドは、完璧なソース画像を使った理想的な流れだけを見せ、規模が大きくなると破綻する部分を飛ばします。私たちは数か月にわたる実運用を通してこのワークフローを構築し改良してきました。以下のバージョンは、簡単なガイドが無視する失敗モードにも対応します。

手早い答え: 信頼できるNSFW衣装インペインティングワークフローは、テキストプロンプトによる物体検出のためのGrounding DINO、精密なマスク生成のためのSAM (Segment Anything)、そして実際のレンダリングのためのFlux FillまたはSDXLインペインティングチェックポイントを組み合わせます。マスクぼかしは8から15ピクセル、ノイズ除去の強度は編集タイプに応じて0.65から0.85に設定し、後段の顔のアーティファクトを修正するために後処理パスとしてFace Detailerを追加します。総VRAMはおよそ12から16GBです。
要点:
  • Grounding DINOとSAMの組み合わせは、実運用の速度で手動マスキングに勝ります。
  • 衣装変更ではFlux FillがSDXLインペイントチェックポイントよりきれいな編集を生み出します。
  • マスクぼかし8から15ピクセルは編集境界周辺の目に見える継ぎ目を防ぎます。
  • 衣装の入れ替えにはノイズ除去0.7から0.8。微妙な解剖学的編集にはノイズ除去0.5から0.65。
  • 顔の領域に触れるインペイントパスの後は必ずFace Detailerを実行してください。

インペインティングが実際に行うこと

正直に言うと、ほとんどのユーザーはインペインティングを誤解しています。魔法の消しゴムだと思っているのです。違います。インペインティングは再生成です。モデルはマスクされた領域をプレースホルダーとして受け取り、その領域に新しい内容を生成しながら、マスクされていない周囲のピクセルとなじませようとします。品質は、マスクがどれだけきれいか、そしてノイズ除去の強度がどれだけ適切に調整されているかに左右されます。

NSFWの衣装編集に限って言えば、インペインティングは特定の問題を解決します。望む構図を持つベース画像があるけれど、衣装や解剖学的な部分を変える必要がある、という場合です。SFWのベースを生成して特定の要素をNSFWに変換したい場合もあるでしょう。既存のキャラクターの衣装を入れ替えたい場合もあるでしょう。画像全体を再生成せずに解剖学的な問題を修正したい場合もあるでしょう。インペインティングはこの三つすべてを同じワークフローで扱います。

人々がインペインティングに不満を抱く理由は、それを一発勝負のツールとして扱うからです。生成し、マスクし、再生成して、終わり。実運用では、インペインティングは反復作業です。きれいな結果を得るために、異なるノイズ除去の強度とプロンプトで複数のインペインティングパスを実行することがよくあります。ここで構築するワークフローは、その反復を高速にします。

もう一つ誰も触れないのは、インペインティングの品質がベース画像の品質に大きく依存するということです。低品質の画像で領域をマスクしても、インペイントされた領域はそれを救えません。モデルの再生成は周囲のピクセルから文脈を引き出します。ゴミのような文脈はゴミのようなインペイントを生みます。たとえ後から修正するつもりでも、きれいなベースから始めてください。

二つのアプローチ、手動マスクと自動セグメント

インペインティングのマスクを作る二つの方法は、手動マスキングと自動セグメンテーションに分かれます。どちらも機能します。どちらにもトレードオフがあります。

ComfyUIでの手動マスキングはMask Editorノードを使います。ブラシツールでソース画像に直接マスクを描きます。精密な制御。1画像あたりが遅い。思い描いた通りのマスク形状が必要な一回限りの編集には最適です。多くの画像を処理する実運用には不向きです。

自動セグメンテーションはSAM (Segment Anything Model) とGrounding DINOを使い、テキストプロンプトから物体を検出してマスクを自動生成します。「shirt」と入力すると、ワークフローがシャツを検出してマスクします。エッジケースでは精度が落ちます。高速で再現性があります。実運用には最適です。一回限りの精密作業には劣ります。

ある程度の量のNSFW衣装編集では、自動セグメンテーションが勝ります。マスク品質は通常、手動マスキングが生み出すものの5から10パーセント以内に収まりますが、生成は3から5分ではなく30秒です。50枚を超えると、それは何時間もの節約になります。

ハイブリッドのアプローチは自動セグメンテーションを出発点として使い、必要に応じてマスクを手動で調整できるようにします。ComfyUIの高度なインペインティング技法ガイドでは、ハイブリッドのパターンをより詳しく解説しています。ほとんどの実運用NSFW作業では、純粋な自動セグメンテーションで十分です。

SAMとGrounding DINOのセットアップ

ノードのインストール。ComfyUI Managerで「ComfyUI Impact Pack」を検索してインストールします。次に追加のインペインティングノードのために「ComfyUI Inspire Pack」をインストールします。最後に、メンテナーがより最近更新したパッケージに応じて「ComfyUI segment anything」または「ComfyUI Grounding Dino」をインストールします。GitHubのGrounded SAMリポジトリは、基盤となる技術を理解したい場合に、これらのComfyUIノードがラップしている元の論文です。

インストール後、ComfyUIを再起動します。新しいノードは右クリックメニューの「Add Node, Impact, Detector」や類似のパスの下に表示されます。

モデルファイルのダウンロード。SAMにはチェックポイントが必要です。sam_vit_h_4b8939.pthファイルはおよそ2.5GBの標準的な高品質SAMモデルです。Grounding DINOにはより小さなモデルファイルが必要です。両方はそれぞれComfyUI/models/sams/とComfyUI/models/grounding-dino/にダウンロードされます。ワークフローを初めて実行するとき、モデルローダーノードが不足している場合は自動的にこれらをダウンロードします。

ワークフローノードのセットアップ。チェーンは次のようになります。Load ImageがSAMModelLoaderノードとGroundingDinoModelLoaderノードに供給されます。両方がGroundingDinoSAMSegmentノードに供給され、このノードがセグメント化する対象のテキストプロンプトを受け取ります。出力はマスクで、これがインペインティングワークフローに供給されます。

セグメントノードのテキストプロンプトが鍵です。「shirt」はシャツを検出します。「underwear」は下着を検出します。「hair」は髪を検出します。NSFW作業では、具体的に指定できます。「bra」はブラを検出します。「clothing on torso」は胴体の衣装を検出します。Grounding DINOモデルは、何をマスクしたいかを理解する点で驚くほど柔軟です。

しきい値の設定は重要です。Grounding DINOのデフォルトしきい値は0.3で、ほとんどのケースをカバーします。低くする (0.2) と、誤検出を含めてより積極的な一致を拾います。高くする (0.4から0.5) とより保守的になり、エッジケースを見逃すことがあります。私たちはデフォルトとして0.3を使い、ワークフローごとに調整します。

きれいな編集のためのマスクぼかしとノイズ除去

マスクができたら、インペインティングのパラメータが出力品質を決定します。最も重要な二つの設定は、マスクぼかしとノイズ除去の強度です。

マスクぼかしはマスクの端を滑らかにし、インペイントが周囲のピクセルとなじむようにします。硬いマスクの端は目に見える継ぎ目を生みます。ぼかしすぎると、望む以上に編集が柔らかくなります。NSFW衣装編集では、8から15ピクセルのマスクぼかしがちょうど良いところです。精度が重要なきつい編集には低め (4から6ピクセル)。精度よりなじみが重要な柔らかい編集には高め (15から20ピクセル)。

ノイズ除去の強度は、モデルがどれだけ再生成するか対どれだけ保持するかを制御します。ノイズ除去1.0では、モデルはマスクされた領域に完全に新しい内容を生成します。ノイズ除去0.5では、モデルはマスクされた領域を半分だけ変更し、元のピクセルの一部を保持します。ノイズ除去0.0では、まったく再生成が起こりません。

無料のComfyUIワークフロー

この記事のテクニックに関する無料のオープンソースComfyUIワークフローを見つけてください。 オープンソースは強力です。

100%無料 MITライセンス 本番環境対応 スターを付けて試す

衣装の入れ替えNSFW作業では、ノイズ除去0.75から0.85が標準的な範囲です。0.7を下回ると、モデルは元の衣装の色や柄を保持しすぎることがよくあります。0.9を超えると、モデルが完全に再生成しすぎて、マスクされた領域で身体の比率がずれることがあります。

微妙な解剖学的編集には、ノイズ除去0.5から0.65のほうがうまくいきます。ゼロから再生成せずに、既存の解剖学的構造をわずかに変更したいのです。低めのノイズ除去は、編集を生み出しながらも元の構図をより多く保持します。

異なるノイズ除去の強度で二回のインペイントパスを実行するほうが、単一の高ノイズ除去パスより良い結果になることがよくあると私たちは気づきました。パス1のノイズ除去0.85で新しい内容を生成します。パス2のノイズ除去0.4で少し大きめのマスクを使い、編集された領域とされていない領域の間の移行を柔らかくします。この二段階のアプローチはほとんどのエッジケースを扱います。

特にマスクの取り扱いについては、インペインティングのマスク フェザリングと継ぎ目ブレンドガイドが、目に見えない編集を生み出す継ぎ目ブレンドのコツを解説しています。

Flux Fill対SDXLインペイントチェックポイント

インペインティングモデルの選択は、出力品質に実質的に影響します。2026年には主な選択肢が二つ存在します。Flux FillとSDXLインペイントチェックポイントです。

Flux FillはFluxをベースにしたBlack Forest Labsの専用インペインティングモデルです。同じモデルでインペインティングとアウトペインティングの両方を扱います。生成品質は優れています。Q5量子化版はわずか8GBのVRAMしか使わず、ほとんどのユーザーにとって手の届く範囲です。私たちのFlux Fill完全ガイドがこのモデルを詳しく解説しています。

SDXLインペイントチェックポイントは、インペインティングに最適化されたSDXLのファインチューンです。LustifyやJuggernautのようなNSFW対応のベースと組み合わせると、NSFWをうまく扱います。品質は良いですが、複雑な編集では通常Flux Fillよりわずかに劣ります。

NSFW衣装編集に限って言えば、Flux Fillが二つの理由で勝ります。第一に、プロンプトへの忠実度が優れています。望む新しい衣装を記述すると、Flux FillはSDXLインペイントの派生版より正確に生成します。第二に、継ぎ目の品質がよりきれいです。Flux Fillは、目に見える境界なしに周囲となじむ編集をより高い頻度で生み出します。Hugging FaceのFlux Fillモデルカードが技術仕様と推奨される使用パターンを解説しています。

複雑さをスキップしたいですか? Lewdly は、技術的なセットアップなしでプロフェッショナルなAI結果を即座に提供します。

セットアップ不要 同じ品質 30秒で開始 Lewdlyを無料で試す
クレジットカード不要

問題はライセンスです。Flux FillはFlux Devライセンスの下で提供され、商用利用が制限されています。商用のNSFW作業では、自由にライセンスされたベースに基づくSDXLインペイントチェックポイントを使うか、私たちがChroma対Flux Dev比較で取り上げたChromaベースのインペインティングを使うことになるでしょう。

ほとんどのユーザーへの実践的な推奨。ライセンスが問題にならない個人プロジェクトにはFlux Fillを使ってください。商用作業にはLustify、Juggernaut、またはPonyに基づくSDXLインペイントチェックポイントを使ってください。どちらも適切な設定で実運用品質の出力を生み出します。私たちはこのパイプライン全体をlewdly.aiにも組み込んでいて (全面開示として、私たちはその構築を手伝っています)、ComfyUIグラフを管理せずに衣装編集をしたいユーザーは、よりシンプルな入力で同じ出力を得られます。ローカルかホスト型かの選択は、実際にどれだけのワークフローのカスタマイズが必要かにかかっています。

インペイントパス後のFace Detailer

これはほとんどのチュートリアルが飛ばすステップで、プロとアマチュアの出力の違いを生みます。顔の領域に触れる、または身体の比率をずらすインペイントパスの後は、後処理パスとしてFace Detailerを実行してください。

ComfyUIのFace DetailerはYOLO顔検出を使って画像内の顔を見つけ、検出された各顔に対して生成モデルで小さなインペイントパスを実行します。顔はベース画像の顔よりも高い解像度で、より良いディテールで再生成されます。結果は、全体の構図を変えずによりきれいな顔の特徴です。

NSFW作業に限って言えば、Face Detailerは身体の領域をインペイントするときに起こる、よくある「良い身体、変な顔」問題を防ぎます。身体のインペイントは、後段のモデルの挙動を通じて顔の比率を微妙にずらすことがあります。Face Detailerはこれを自動的に修正します。

私たちのComfyUI Face Detailer NSFWワークフローが専用のface detailerパイプラインを解説しています。ここで構築するインペインティングワークフローでは、メインのインペイントパスの後、チェーンの末尾にface detailerノードを追加するだけです。

Face Detailerの設定:

  • 検出モデル、bbox/face_yolov8m.pt (標準) またはCivitaiの顔特化NSFW YOLOモデル
  • 顔の復元にはノイズ除去0.4から0.55
  • ベース画像がより低くても顔のインペイント解像度は1024
  • 顔の領域全体を捉えるためにマスク膨張5から10ピクセル

後処理後の顔は、キャラクターのアイデンティティを変えることなく、ベース出力より明らかにくっきりして見えるはずです。アイデンティティがずれる場合は、ノイズ除去を下げてください。改善が見えない場合は、ノイズ除去を上げてください。

クリエイタープログラム

コンテンツ制作で月$1,250以上稼ぐ

独占クリエイターアフィリエイトプログラムに参加。バイラル動画のパフォーマンスに応じて報酬。自分のスタイルで完全な創造的自由を持ってコンテンツを作成。

$100
300K+ views
$300
1M+ views
$500
5M+ views
週払い
初期費用なし
完全な創造的自由

よくある失敗とその修正

よくある失敗1、マスクの境界が継ぎ目として見える。修正はマスクぼかしを増やすことです。12から15ピクセルを試してください。それでも継ぎ目が見える場合は、上で説明した二段階インペイントを実行してください。柔らかい二回目のパスが継ぎ目を完全に消すことがよくあります。

よくある失敗2、インペイント領域がプロンプトと一致しない。修正はノイズ除去の強度を0.85から0.95に向けて増やし、モデルに再生成の自由をより多く与えることです。それでうまくいかない場合は、プロンプトがモデルの語彙と一致していない可能性があります。よりシンプルで説明的な言葉でインペイントプロンプトを言い換えてください。

よくある失敗3、マスクされた領域で身体の比率がずれる。修正はより保守的なノイズ除去 (0.6から0.7) を使い、保持したい身体の比率についてプロンプトで明示することです。「same body shape, natural proportions, [具体的な衣装編集]」がうまくいく傾向があります。

よくある失敗4、編集された領域とされていない領域の間で照明が一致しない。修正はインペイントプロンプトに照明の記述を含めることです。「soft daylight, matching ambient lighting」がモデルを一貫した照明を生み出すよう導きます。二段階のアプローチもここで役立ちます。

よくある失敗5、Grounding DINOがマスクしたい対象を検出しない。修正は異なるテキストプロンプトを試すことです。「shirt」は見逃すものを「clothing」が拾うことがあります。「underwear」は見逃すものを「lingerie」が拾うことがあります。具体的な品目が検出をトリガーしないとき、「all clothing」が正しいプロンプトになることがあります。

よくある失敗6、マスクが大きすぎて、衣装だけでなく身体まで含む。修正はGrounding DINOのしきい値を下げるか、より具体的なテキストプロンプトを使うことです。自動セグメンテーションの後にマスクを手動で調整する必要があることもあります。ComfyUIのMask Editorノードを使うと、マスク内をクリックして含めたくない領域を消去できます。

特にマスク編集については、自動セグメンテーションにクリーンアップが必要な場合、ComfyUI Mask Editorマスタリーガイドが手動調整のワークフローを解説しています。

全ワークフローのダウンロード

私たちが使う完全なワークフローはComfyUIワークフローJSONとして存在します。基本的なチェーンは次のとおりです:

  1. Load Image (ベース画像)
  2. Grounding DINO + SAM (テキストプロンプトに基づく自動セグメント)
  3. Mask Blur (8から15ピクセル)
  4. Flux FillまたはSDXLインペイントチェックポイントを使うKSampler
  5. インペイント条件 + ポジティブプロンプト
  6. Face Detailer後処理パス
  7. Save Image

JSONファイルはComfyUIのインストール間で移植可能です。任意のComfyUIインスタンスに投入すると、ワークフローが読み込まれます。必要なカスタムノードはワークフローの先頭に列挙されているので、ComfyUI Managerが不足している依存関係をインストールできます。

このワークフローをローカルで実行したくないプラットフォーム向けには、ホスト型サービスが同じパイプラインを扱います。Lewdly.aiはこのとおりのワークフローパターンをバックエンドで実行しています。このプラットフォームが存在するのは、ほとんどのユーザーが7つのカスタムノードと12GBのチェックポイントのダウンロードを管理せずに衣装編集やNSFWインペインティングをしたいからです。ComfyUIの複雑さを避けたいなら、ホスト型のルートが実際に時間を節約します。lewdly.aiのインペインティングフローは、上で取り上げたのと同じSAMとGrounding DINOのコンポーネントを使っていて、よりシンプルなユーザーインターフェースに抽象化されているだけです。

代替のインペインティングアプローチについてのより深い解説は、インペインティングとアウトペインティングの高度な技法ガイドが、アウトペインティング、解剖学的補正、複数領域編集を含め、衣装編集を超えたパターンを解説しています。

よくある質問

このインペインティングワークフローにはどれだけのVRAMが必要ですか?

SDXLベースのインペインティングには最低12GB、Flux Fillには16GBを推奨します。Q4 Flux Fillは8GBで実行できますが、品質が明らかに落ちます。SAMモデルだけで約2.5GB必要です。Grounding DINOは約700MB必要です。

このワークフローをPony Diffusionで使えますか?

はい。SDXLインペイントチェックポイントとしてPony V6 XLを使ってください。ワークフローの構造は同一で、チェックポイントローダーをPonyに入れ替えるだけです。Ponyはベース生成と同じように、インペイントプロンプトにスコアタグが必要であることに注意してください。

なぜGrounding DINOは一部の物体を見逃すのですか?

しきい値の設定です。デフォルトは0.3です。より積極的な検出のために0.2から0.25に下げてください。Grounding DINOモデルは一般的な物体で学習されているので、珍しいものや様式化された品目はデフォルトのしきい値で検出されないことがあります。

NSFWにはFlux FillとSDXLインペイントのどちらを使うべきですか?

ライセンスによります。Flux Fillはより高品質ですが研究ライセンスで制限されています。NSFW対応のベース (Lustify、Juggernaut、Pony) を使うSDXLインペイントは商用利用が無制限です。ほとんどのユーザーにとって、SDXLインペイントが実践的な選択です。

インペイントされた領域と元の領域の間の継ぎ目をどう修正しますか?

マスクぼかしを12から15ピクセルに増やしてください。それでも継ぎ目が見える場合は、境界領域に対して低いノイズ除去 (0.3から0.4) で二回目のパスを実行してください。柔らかいパスが、編集を大きく変えずに編集された領域とされていない領域のピクセルをブレンドします。

SAMとSAM2の違いは何ですか?

SAMはMetaの元のSegment Anything Modelです。SAM2はより良いセグメンテーション品質とより速い推論を備えた更新版です。2026年のComfyUIインペインティングワークフローでは、一般的にSAM2が好まれますが、SAM2がインストールされていない場合はSAMでも動作します。私たちの最良の動画セグメンテーションツールSAM2ガイドがSAM2をより詳しく解説しています。

このワークフローで多くの画像をバッチ処理できますか?

はい。ComfyUIはワークフローの変更を通じてバッチ処理に対応しています。Load ImageをLoad Images from Directoryに置き換えると、ワークフローはフォルダ内のすべての画像を処理します。各画像は同じGrounding DINOプロンプトとインペイント設定を受け取ります。

これは動画フレームで機能しますか?

ある程度は。ワークフローは個々のフレームを問題なく扱いますが、フレーム間の時間的一貫性を維持するにはAnimateDiffや動画専用のインペインティングワークフローのような追加のノードが必要です。時間的連続性のないフレームごとの編集なら、このワークフローは抽出したフレームでそのまま機能します。

AIインフルエンサーを作成する準備はできましたか?

115人の学生とともに、51レッスンの完全なコースでComfyUIとAIインフルエンサーマーケティングをマスター。

早期割引終了まで:
--
:
--
時間
:
--
:
--
あなたの席を確保 - $199
$200節約 - 価格は永久に$399に上昇