Wan22ImageToVideoLatent - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

このドキュメントは AI によって生成されました。誤りや改善の提案がありましたら、ぜひご協力ください！ GitHub で編集する Wan22ImageToVideoLatent ノードは、画像からビデオの潜在表現を生成します。指定された寸法で空白のビデオ潜在空間を作成し、オプションで開始画像シーケンスを先頭フレームにエンコードできます。開始画像が提供されると、画像を潜在空間にエンコードし、インペイント領域に対応するノイズマスクを生成します。

入力

パラメータ	データ型	必須	範囲	説明
`vae`	VAE	はい	-	画像を潜在空間にエンコードするために使用されるVAEモデル
`幅`	INT	はい	32 ～ MAX_RESOLUTION	出力ビデオの幅（ピクセル単位）（デフォルト：1280、ステップ：32）
`高さ`	INT	はい	32 ～ MAX_RESOLUTION	出力ビデオの高さ（ピクセル単位）（デフォルト：704、ステップ：32）
`長さ`	INT	はい	1 ～ MAX_RESOLUTION	ビデオシーケンスのフレーム数（デフォルト：49、ステップ：4）
`バッチサイズ`	INT	はい	1 ～ 4096	生成するバッチ数（デフォルト：1）
`開始画像`	IMAGE	いいえ	-	ビデオ潜在表現にエンコードするオプションの開始画像シーケンス

注記： start_image が提供されると、ノードは画像シーケンスを潜在空間の先頭フレームにエンコードし、対応するノイズマスクを生成します。width と height パラメータは、適切な潜在空間の次元を得るために16で割り切れる必要があります。length パラメータはビデオ潜在表現のフレーム数を決定します。潜在空間の時間次元は ((length - 1) // 4) + 1 として計算されます。

出力

出力名	データ型	説明
`samples`	LATENT	生成されたビデオ潜在表現
`noise_mask`	LATENT	生成中にどの領域をノイズ除去すべきかを示すノイズマスク

Source fingerprint (SHA-256): 0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c

​入力

​出力

入力

出力