このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集WanAnimateToVideo ノードは、ポーズ参照、表情、背景要素を含む複数の条件付け入力を組み合わせてビデオコンテンツを生成します。様々なビデオ入力を処理して、フレーム間の時間的一貫性を維持しながら、一貫性のあるアニメーションシーケンスを作成します。このノードは潜在空間の操作を処理し、モーションパターンを継続することで既存のビデオを拡張することもできます。
入力
| パラメータ | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
ポジティブ | CONDITIONING | はい | - | 生成を目的のコンテンツに導くためのポジティブ条件付け |
ネガティブ | CONDITIONING | はい | - | 生成を望ましくないコンテンツから遠ざけるためのネガティブ条件付け |
vae | VAE | はい | - | 画像データのエンコードとデコードに使用されるVAEモデル |
幅 | INT | はい | 16 ~ MAX_RESOLUTION | 出力ビデオの幅(ピクセル単位)(デフォルト:832、ステップ:16) |
高さ | INT | はい | 16 ~ MAX_RESOLUTION | 出力ビデオの高さ(ピクセル単位)(デフォルト:480、ステップ:16) |
長さ | INT | はい | 1 ~ MAX_RESOLUTION | 生成するフレーム数(デフォルト:77、ステップ:4) |
バッチサイズ | INT | はい | 1 ~ 4096 | 同時に生成するビデオの数(デフォルト:1) |
クリップビジョン出力 | CLIP_VISION_OUTPUT | いいえ | - | 追加の条件付けのためのオプションのCLIPビジョンモデル出力 |
参照画像 | IMAGE | いいえ | - | 生成の開始点として使用される参照画像 |
顔動画 | IMAGE | いいえ | - | 表情ガイダンスを提供するビデオ入力 |
ポーズ動画 | IMAGE | いいえ | - | ポーズとモーションガイダンスを提供するビデオ入力 |
継続モーション最大フレーム数 | INT | はい | 1 ~ MAX_RESOLUTION | 以前のモーションから継続する最大フレーム数(デフォルト:5、ステップ:4) |
背景動画 | IMAGE | いいえ | - | 生成コンテンツと合成する背景ビデオ |
キャラクターマスク | MASK | いいえ | - | 選択的処理のためのキャラクター領域を定義するマスク |
継続モーション | IMAGE | いいえ | - | 時間的一貫性のために継続する以前のモーションシーケンス |
動画フレームオフセット | INT | はい | 0 ~ MAX_RESOLUTION | すべての入力ビデオ内でシークするフレーム数。チャンク単位でより長いビデオを生成するために使用します。ビデオを拡張するには、前のノードのvideo_frame_offset出力に接続します。(デフォルト:0、ステップ:1) |
pose_videoが提供された場合、trim_to_pose_videoロジックが有効であれば(現在ソースコードではFalseに設定)、出力長はポーズビデオの長さに合わせて調整されますface_videoは処理時に自動的に512x512解像度にリサイズされ、-1.0から1.0の範囲に正規化されますcontinue_motionフレームはcontinue_motion_max_framesパラメータによって制限され、入力の最後のcontinue_motion_max_framesフレームのみが使用されます- 入力ビデオ(
face_video、pose_video、background_video、character_mask)は処理前にvideo_frame_offset分だけオフセットされます。オフセットがビデオ長を超えた場合、その入力は無視されます character_maskに1フレームのみが含まれている場合、すべてのフレームに繰り返し適用されますclip_vision_outputが提供された場合、ポジティブ条件付けとネガティブ条件付けの両方に適用されますreference_imageが提供されない場合、黒色画像(すべてゼロ)がデフォルトの参照として使用されますcontinue_motionが提供されない場合、初期フレームはグレー(強度0.5)のノイズで埋められます
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
ネガティブ | CONDITIONING | CLIPビジョン出力、ポーズビデオ潜在、顔ビデオピクセル、連結された潜在画像、連結されたマスクを含む追加のビデオコンテキストを持つ修正済みポジティブ条件付け |
潜在変数 | CONDITIONING | CLIPビジョン出力、ポーズビデオ潜在、顔ビデオピクセル(反転)、連結された潜在画像、連結されたマスクを含む追加のビデオコンテキストを持つ修正済みネガティブ条件付け |
トリム潜在変数 | LATENT | 形状 [batch_size, 16, latent_length + trim_latent, latent_height, latent_width] の潜在空間形式で生成されたビデオコンテンツ |
トリム画像 | INT | 先頭からトリミングする潜在フレーム数を示す潜在空間トリミング情報(参照画像の潜在フレームに対応) |
動画フレームオフセット | INT | 参照モーションフレームの画像空間トリミング情報。先頭からトリミングする画像フレーム数を示します |
動画フレームオフセット | INT | チャンク単位でビデオ生成を継続するための更新されたフレームオフセット。以前のオフセットに生成された長さを加算して計算されます |
Source fingerprint (SHA-256):
c2ca90f4963f629d51cdd7f4bdb67e01c32ce5ca7d916b1f992ccd220f57566c