メインコンテンツへスキップ
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
CosmosImageToVideoLatent ノードは、入力画像からビデオの潜在表現を生成します。空のビデオ潜在表現を作成し、オプションで開始画像や終了画像をビデオシーケンスの先頭フレームや末尾フレームにエンコードします。画像が提供された場合、生成中に潜在表現のどの部分を保持すべきかを示す、対応するノイズマスクも作成します。

入力

パラメータデータ型必須範囲説明
vaeVAEはい-画像を潜在空間にエンコードするために使用されるVAEモデル
INTはい16 ~ MAX_RESOLUTION出力ビデオの幅(ピクセル単位)(デフォルト:1280)
高さINTはい16 ~ MAX_RESOLUTION出力ビデオの高さ(ピクセル単位)(デフォルト:704)
長さINTはい1 ~ MAX_RESOLUTIONビデオシーケンスのフレーム数(デフォルト:121)
バッチサイズINTはい1 ~ 4096生成する潜在バッチの数(デフォルト:1)
開始画像IMAGEいいえ-ビデオシーケンスの先頭にエンコードするオプションの画像
終了画像IMAGEいいえ-ビデオシーケンスの末尾にエンコードするオプションの画像
注記: start_imageend_image の両方が提供されない場合、ノードはノイズマスクなしの空の潜在表現を返します。いずれかの画像が提供された場合、潜在表現の該当部分がエンコードされ、それに応じてマスクされます。

出力

出力名データ型説明
latentLATENTオプションでエンコードされた画像と対応するノイズマスクを含む、生成されたビデオ潜在表現

Source fingerprint (SHA-256): 31ce4dc577c672e0b3dc0bfb6644b2ef7ab737f6c4ee5e0677973b6a4efdd66d