このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集CosmosPredict2ImageToVideoLatent ノードは、動画生成のために画像からビデオ潜在表現を作成します。空白のビデオ潜在表現を生成したり、開始画像と終了画像を組み込んで、指定された寸法と長さの動画シーケンスを作成することができます。このノードは、画像を動画処理に適した潜在空間フォーマットにエンコードします。
入力
| パラメータ | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
vae | VAE | はい | - | 画像を潜在空間にエンコードするために使用されるVAEモデル |
width | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の幅(ピクセル単位、デフォルト:848、16で割り切れる必要があります) |
height | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の高さ(ピクセル単位、デフォルト:480、16で割り切れる必要があります) |
length | INT | いいえ | 1 ~ MAX_RESOLUTION | 動画シーケンスのフレーム数(デフォルト:93、ステップ:4) |
batch_size | INT | いいえ | 1 ~ 4096 | 生成する動画シーケンスの数(デフォルト:1) |
start_image | IMAGE | いいえ | - | 動画シーケンスの開始画像(オプション) |
end_image | IMAGE | いいえ | - | 動画シーケンスの終了画像(オプション) |
start_image と end_image の両方が指定されていない場合、ノードは空白のビデオ潜在表現を生成します。画像が指定された場合、それらはエンコードされ、適切なマスキングとともに動画シーケンスの開始位置や終了位置に配置されます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
samples | LATENT | エンコードされた動画シーケンスを含む、生成されたビデオ潜在表現 |
noise_mask | LATENT | 生成中に潜在表現のどの部分を保持すべきかを示すマスク |
Source fingerprint (SHA-256):
55fab16180c0e3fa254bcc77694dbc666810b28522e61b9c613f720fae66bd0c