メインコンテンツへスキップ
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
このドキュメントは AI によって生成されました。誤りや改善の提案がありましたら、ぜひご協力ください! GitHub で編集する Wan22ImageToVideoLatent ノードは、画像からビデオの潜在表現を生成します。指定された寸法で空白のビデオ潜在空間を作成し、オプションで開始画像シーケンスを先頭フレームにエンコードできます。開始画像が提供されると、画像を潜在空間にエンコードし、インペイント領域に対応するノイズマスクを生成します。

入力

パラメータデータ型必須範囲説明
vaeVAEはい-画像を潜在空間にエンコードするために使用されるVAEモデル
INTはい32 ~ MAX_RESOLUTION出力ビデオの幅(ピクセル単位)(デフォルト:1280、ステップ:32)
高さINTはい32 ~ MAX_RESOLUTION出力ビデオの高さ(ピクセル単位)(デフォルト:704、ステップ:32)
長さINTはい1 ~ MAX_RESOLUTIONビデオシーケンスのフレーム数(デフォルト:49、ステップ:4)
バッチサイズINTはい1 ~ 4096生成するバッチ数(デフォルト:1)
開始画像IMAGEいいえ-ビデオ潜在表現にエンコードするオプションの開始画像シーケンス
注記: start_image が提供されると、ノードは画像シーケンスを潜在空間の先頭フレームにエンコードし、対応するノイズマスクを生成します。widthheight パラメータは、適切な潜在空間の次元を得るために16で割り切れる必要があります。length パラメータはビデオ潜在表現のフレーム数を決定します。潜在空間の時間次元は ((length - 1) // 4) + 1 として計算されます。

出力

出力名データ型説明
samplesLATENT生成されたビデオ潜在表現
noise_maskLATENT生成中にどの領域をノイズ除去すべきかを示すノイズマスク

Source fingerprint (SHA-256): 0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c