このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集以下は、指定された英語ドキュメントを日本語に翻訳したものです。
Kandinsky5ImageToVideo ノードは、Kandinsky モデルを使用した動画生成のために、条件付け(conditioning)と潜在空間(latent space)のデータを準備します。このノードは空の動画潜在テンソルを作成し、オプションで開始画像をエンコードして生成動画の初期フレームをガイドし、それに応じてポジティブ条件付けとネガティブ条件付けを変更します。
入力
| パラメータ | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
ポジティブ | CONDITIONING | はい | なし | 動画生成をガイドするポジティブ条件付けプロンプトです。 |
ネガティブ | CONDITIONING | はい | なし | 特定の概念から動画生成を遠ざけるためのネガティブ条件付けプロンプトです。 |
vae | VAE | はい | なし | オプションの開始画像を潜在空間にエンコードするために使用される VAE モデルです。 |
幅 | INT | いいえ | 16 ~ 8192(ステップ 16) | 出力動画の幅(ピクセル単位、デフォルト:768)。 |
高さ | INT | いいえ | 16 ~ 8192(ステップ 16) | 出力動画の高さ(ピクセル単位、デフォルト:512)。 |
長さ | INT | いいえ | 1 ~ 8192(ステップ 4) | 動画のフレーム数(デフォルト:121)。 |
バッチサイズ | INT | いいえ | 1 ~ 4096 | 同時に生成する動画シーケンスの数(デフォルト:1)。 |
開始画像 | IMAGE | いいえ | なし | オプションの開始画像です。指定された場合、エンコードされ、モデルの出力潜在ノイズの開始部分を置き換えるために使用されます。 |
start_image が指定された場合、指定された width と height に合わせてバイリニア補間で自動的にリサイズされます。画像バッチの最初の length フレームがエンコードに使用されます。エンコードされた潜在表現は、positive 条件付けと negative 条件付けの両方に注入され、動画の初期外観をガイドします。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
ネガティブ | CONDITIONING | 変更されたポジティブ条件付けです。エンコードされた開始画像データで更新される可能性があります。 |
latent | CONDITIONING | 変更されたネガティブ条件付けです。エンコードされた開始画像データで更新される可能性があります。 |
cond_latent | LATENT | 指定された次元に合わせて形状が設定された、ゼロで満たされた空の動画潜在テンソルです。 |
cond_latent | LATENT | 提供された開始画像の、クリーンでエンコードされた潜在表現です。これは内部で使用され、生成された動画潜在のノイズの多い開始部分を置き換えます。 |
Source fingerprint (SHA-256):
19d3b60be18f5adcd659563329988bce2511a1b27b33fd0ab3a9d93e265557f2