このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集このドキュメントは AI によって生成されました。誤りや改善の提案がありましたら、ぜひご協力ください! GitHub で編集する Wan22ImageToVideoLatent ノードは、画像からビデオの潜在表現を生成します。指定された寸法で空白のビデオ潜在空間を作成し、オプションで開始画像シーケンスを先頭フレームにエンコードできます。開始画像が提供されると、画像を潜在空間にエンコードし、インペイント領域に対応するノイズマスクを生成します。
入力
| パラメータ | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
vae | VAE | はい | - | 画像を潜在空間にエンコードするために使用されるVAEモデル |
幅 | INT | はい | 32 ~ MAX_RESOLUTION | 出力ビデオの幅(ピクセル単位)(デフォルト:1280、ステップ:32) |
高さ | INT | はい | 32 ~ MAX_RESOLUTION | 出力ビデオの高さ(ピクセル単位)(デフォルト:704、ステップ:32) |
長さ | INT | はい | 1 ~ MAX_RESOLUTION | ビデオシーケンスのフレーム数(デフォルト:49、ステップ:4) |
バッチサイズ | INT | はい | 1 ~ 4096 | 生成するバッチ数(デフォルト:1) |
開始画像 | IMAGE | いいえ | - | ビデオ潜在表現にエンコードするオプションの開始画像シーケンス |
start_image が提供されると、ノードは画像シーケンスを潜在空間の先頭フレームにエンコードし、対応するノイズマスクを生成します。width と height パラメータは、適切な潜在空間の次元を得るために16で割り切れる必要があります。length パラメータはビデオ潜在表現のフレーム数を決定します。潜在空間の時間次元は ((length - 1) // 4) + 1 として計算されます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
samples | LATENT | 生成されたビデオ潜在表現 |
noise_mask | LATENT | 生成中にどの領域をノイズ除去すべきかを示すノイズマスク |
Source fingerprint (SHA-256):
0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c