CosmosPredict2ImageToVideoLatent - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

CosmosPredict2ImageToVideoLatent ノードは、動画生成のために画像からビデオ潜在表現を作成します。空白のビデオ潜在表現を生成したり、開始画像と終了画像を組み込んで、指定された寸法と長さの動画シーケンスを作成することができます。このノードは、画像を動画処理に適した潜在空間フォーマットにエンコードします。

入力

パラメータ	データ型	必須	範囲	説明
`vae`	VAE	はい	-	画像を潜在空間にエンコードするために使用されるVAEモデル
`width`	INT	いいえ	16 ～ MAX_RESOLUTION	出力動画の幅（ピクセル単位、デフォルト：848、16で割り切れる必要があります）
`height`	INT	いいえ	16 ～ MAX_RESOLUTION	出力動画の高さ（ピクセル単位、デフォルト：480、16で割り切れる必要があります）
`length`	INT	いいえ	1 ～ MAX_RESOLUTION	動画シーケンスのフレーム数（デフォルト：93、ステップ：4）
`batch_size`	INT	いいえ	1 ～ 4096	生成する動画シーケンスの数（デフォルト：1）
`start_image`	IMAGE	いいえ	-	動画シーケンスの開始画像（オプション）
`end_image`	IMAGE	いいえ	-	動画シーケンスの終了画像（オプション）

注記： start_image と end_image の両方が指定されていない場合、ノードは空白のビデオ潜在表現を生成します。画像が指定された場合、それらはエンコードされ、適切なマスキングとともに動画シーケンスの開始位置や終了位置に配置されます。

出力

出力名	データ型	説明
`samples`	LATENT	エンコードされた動画シーケンスを含む、生成されたビデオ潜在表現
`noise_mask`	LATENT	生成中に潜在表現のどの部分を保持すべきかを示すマスク

Source fingerprint (SHA-256): 55fab16180c0e3fa254bcc77694dbc666810b28522e61b9c613f720fae66bd0c

​入力

​出力

入力

出力