メインコンテンツへスキップ
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
CosmosPredict2ImageToVideoLatent ノードは、動画生成のために画像からビデオ潜在表現を作成します。空白のビデオ潜在表現を生成したり、開始画像と終了画像を組み込んで、指定された寸法と長さの動画シーケンスを作成することができます。このノードは、画像を動画処理に適した潜在空間フォーマットにエンコードします。

入力

パラメータデータ型必須範囲説明
vaeVAEはい-画像を潜在空間にエンコードするために使用されるVAEモデル
widthINTいいえ16 ~ MAX_RESOLUTION出力動画の幅(ピクセル単位、デフォルト:848、16で割り切れる必要があります)
heightINTいいえ16 ~ MAX_RESOLUTION出力動画の高さ(ピクセル単位、デフォルト:480、16で割り切れる必要があります)
lengthINTいいえ1 ~ MAX_RESOLUTION動画シーケンスのフレーム数(デフォルト:93、ステップ:4)
batch_sizeINTいいえ1 ~ 4096生成する動画シーケンスの数(デフォルト:1)
start_imageIMAGEいいえ-動画シーケンスの開始画像(オプション)
end_imageIMAGEいいえ-動画シーケンスの終了画像(オプション)
注記: start_imageend_image の両方が指定されていない場合、ノードは空白のビデオ潜在表現を生成します。画像が指定された場合、それらはエンコードされ、適切なマスキングとともに動画シーケンスの開始位置や終了位置に配置されます。

出力

出力名データ型説明
samplesLATENTエンコードされた動画シーケンスを含む、生成されたビデオ潜在表現
noise_maskLATENT生成中に潜在表現のどの部分を保持すべきかを示すマスク

Source fingerprint (SHA-256): 55fab16180c0e3fa254bcc77694dbc666810b28522e61b9c613f720fae66bd0c