CosmosImageToVideoLatent - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

CosmosImageToVideoLatent ノードは、入力画像からビデオの潜在表現を生成します。空のビデオ潜在表現を作成し、オプションで開始画像や終了画像をビデオシーケンスの先頭フレームや末尾フレームにエンコードします。画像が提供された場合、生成中に潜在表現のどの部分を保持すべきかを示す、対応するノイズマスクも作成します。

入力

パラメータ	データ型	必須	範囲	説明
`vae`	VAE	はい	-	画像を潜在空間にエンコードするために使用されるVAEモデル
`幅`	INT	はい	16 ～ MAX_RESOLUTION	出力ビデオの幅（ピクセル単位）（デフォルト：1280）
`高さ`	INT	はい	16 ～ MAX_RESOLUTION	出力ビデオの高さ（ピクセル単位）（デフォルト：704）
`長さ`	INT	はい	1 ～ MAX_RESOLUTION	ビデオシーケンスのフレーム数（デフォルト：121）
`バッチサイズ`	INT	はい	1 ～ 4096	生成する潜在バッチの数（デフォルト：1）
`開始画像`	IMAGE	いいえ	-	ビデオシーケンスの先頭にエンコードするオプションの画像
`終了画像`	IMAGE	いいえ	-	ビデオシーケンスの末尾にエンコードするオプションの画像

注記： start_image と end_image の両方が提供されない場合、ノードはノイズマスクなしの空の潜在表現を返します。いずれかの画像が提供された場合、潜在表現の該当部分がエンコードされ、それに応じてマスクされます。

出力

出力名	データ型	説明
`latent`	LATENT	オプションでエンコードされた画像と対応するノイズマスクを含む、生成されたビデオ潜在表現

Source fingerprint (SHA-256): 31ce4dc577c672e0b3dc0bfb6644b2ef7ab737f6c4ee5e0677973b6a4efdd66d

​入力

​出力

入力

出力