メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
このノードは、画像とテキストをエンコードすることでトレーニング用のデータを準備します。画像のリストとそれに対応するテキストキャプションのリストを受け取り、VAEモデルを使用して画像を潜在表現に変換し、CLIPモデルを使用してテキストをコンディショニングデータに変換します。結果として得られるペアリングされた潜在表現とコンディショニングはリストとして出力され、トレーニングワークフローで使用できる状態になります。

入力

パラメータデータ型必須範囲説明
画像IMAGEはいN/Aエンコードする画像のリスト。
vaeVAEはいN/A画像を潜在表現にエンコードするためのVAEモデル。
clipCLIPはいN/AテキストをコンディショニングにエンコードするためのCLIPモデル。
テキストSTRINGいいえN/Aテキストキャプションのリスト。長さはn(画像と一致)、1(すべてに繰り返し)、または省略(空文字列を使用)にできます。
パラメータ制約:
  • texts リストのアイテム数は、0、1、または images リストのアイテム数と正確に一致している必要があります。0の場合は、すべての画像に空文字列が使用されます。1の場合は、その単一のテキストがすべての画像に繰り返し使用されます。

出力

出力名データ型説明
コンディショニングLATENT潜在表現の辞書のリスト。
conditioningCONDITIONINGコンディショニングリストのリスト。

Source fingerprint (SHA-256): 95947c03f140f527f3db54d0b0131d956646055542ddb546ae5eaa82e4e8cefa