MakeTrainingDataset - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

このノードは、画像とテキストをエンコードすることでトレーニング用のデータを準備します。画像のリストとそれに対応するテキストキャプションのリストを受け取り、VAEモデルを使用して画像を潜在表現に変換し、CLIPモデルを使用してテキストをコンディショニングデータに変換します。結果として得られるペアリングされた潜在表現とコンディショニングはリストとして出力され、トレーニングワークフローで使用できる状態になります。

入力

パラメータ	データ型	必須	範囲	説明
`画像`	IMAGE	はい	N/A	エンコードする画像のリスト。
`vae`	VAE	はい	N/A	画像を潜在表現にエンコードするためのVAEモデル。
`clip`	CLIP	はい	N/A	テキストをコンディショニングにエンコードするためのCLIPモデル。
`テキスト`	STRING	いいえ	N/A	テキストキャプションのリスト。長さはn（画像と一致）、1（すべてに繰り返し）、または省略（空文字列を使用）にできます。

パラメータ制約：

texts リストのアイテム数は、0、1、または images リストのアイテム数と正確に一致している必要があります。0の場合は、すべての画像に空文字列が使用されます。1の場合は、その単一のテキストがすべての画像に繰り返し使用されます。

出力

出力名	データ型	説明
`コンディショニング`	LATENT	潜在表現の辞書のリスト。
`conditioning`	CONDITIONING	コンディショニングリストのリスト。

Source fingerprint (SHA-256): 95947c03f140f527f3db54d0b0131d956646055542ddb546ae5eaa82e4e8cefa

Documentation Index

​入力

​出力

入力

出力