このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集CosmosImageToVideoLatent ノードは、入力画像からビデオの潜在表現を生成します。空のビデオ潜在表現を作成し、オプションで開始画像や終了画像をビデオシーケンスの先頭フレームや末尾フレームにエンコードします。画像が提供された場合、生成中に潜在表現のどの部分を保持すべきかを示す、対応するノイズマスクも作成します。
入力
| パラメータ | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
vae | VAE | はい | - | 画像を潜在空間にエンコードするために使用されるVAEモデル |
幅 | INT | はい | 16 ~ MAX_RESOLUTION | 出力ビデオの幅(ピクセル単位)(デフォルト:1280) |
高さ | INT | はい | 16 ~ MAX_RESOLUTION | 出力ビデオの高さ(ピクセル単位)(デフォルト:704) |
長さ | INT | はい | 1 ~ MAX_RESOLUTION | ビデオシーケンスのフレーム数(デフォルト:121) |
バッチサイズ | INT | はい | 1 ~ 4096 | 生成する潜在バッチの数(デフォルト:1) |
開始画像 | IMAGE | いいえ | - | ビデオシーケンスの先頭にエンコードするオプションの画像 |
終了画像 | IMAGE | いいえ | - | ビデオシーケンスの末尾にエンコードするオプションの画像 |
start_image と end_image の両方が提供されない場合、ノードはノイズマスクなしの空の潜在表現を返します。いずれかの画像が提供された場合、潜在表現の該当部分がエンコードされ、それに応じてマスクされます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
latent | LATENT | オプションでエンコードされた画像と対応するノイズマスクを含む、生成されたビデオ潜在表現 |
Source fingerprint (SHA-256):
31ce4dc577c672e0b3dc0bfb6644b2ef7ab737f6c4ee5e0677973b6a4efdd66d