WanAnimateToVideo - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

WanAnimateToVideo ノードは、ポーズ参照、表情、背景要素を含む複数の条件付け入力を組み合わせてビデオコンテンツを生成します。様々なビデオ入力を処理して、フレーム間の時間的一貫性を維持しながら、一貫性のあるアニメーションシーケンスを作成します。このノードは潜在空間の操作を処理し、モーションパターンを継続することで既存のビデオを拡張することもできます。

入力

パラメータ	データ型	必須	範囲	説明
`ポジティブ`	CONDITIONING	はい	-	生成を目的のコンテンツに導くためのポジティブ条件付け
`ネガティブ`	CONDITIONING	はい	-	生成を望ましくないコンテンツから遠ざけるためのネガティブ条件付け
`vae`	VAE	はい	-	画像データのエンコードとデコードに使用されるVAEモデル
`幅`	INT	はい	16 ～ MAX_RESOLUTION	出力ビデオの幅（ピクセル単位）（デフォルト：832、ステップ：16）
`高さ`	INT	はい	16 ～ MAX_RESOLUTION	出力ビデオの高さ（ピクセル単位）（デフォルト：480、ステップ：16）
`長さ`	INT	はい	1 ～ MAX_RESOLUTION	生成するフレーム数（デフォルト：77、ステップ：4）
`バッチサイズ`	INT	はい	1 ～ 4096	同時に生成するビデオの数（デフォルト：1）
`クリップビジョン出力`	CLIP_VISION_OUTPUT	いいえ	-	追加の条件付けのためのオプションのCLIPビジョンモデル出力
`参照画像`	IMAGE	いいえ	-	生成の開始点として使用される参照画像
`顔動画`	IMAGE	いいえ	-	表情ガイダンスを提供するビデオ入力
`ポーズ動画`	IMAGE	いいえ	-	ポーズとモーションガイダンスを提供するビデオ入力
`継続モーション最大フレーム数`	INT	はい	1 ～ MAX_RESOLUTION	以前のモーションから継続する最大フレーム数（デフォルト：5、ステップ：4）
`背景動画`	IMAGE	いいえ	-	生成コンテンツと合成する背景ビデオ
`キャラクターマスク`	MASK	いいえ	-	選択的処理のためのキャラクター領域を定義するマスク
`継続モーション`	IMAGE	いいえ	-	時間的一貫性のために継続する以前のモーションシーケンス
`動画フレームオフセット`	INT	はい	0 ～ MAX_RESOLUTION	すべての入力ビデオ内でシークするフレーム数。チャンク単位でより長いビデオを生成するために使用します。ビデオを拡張するには、前のノードのvideo_frame_offset出力に接続します。（デフォルト：0、ステップ：1）

パラメータ制約：

pose_videoが提供された場合、trim_to_pose_videoロジックが有効であれば（現在ソースコードではFalseに設定）、出力長はポーズビデオの長さに合わせて調整されます
face_videoは処理時に自動的に512x512解像度にリサイズされ、-1.0から1.0の範囲に正規化されます
continue_motionフレームはcontinue_motion_max_framesパラメータによって制限され、入力の最後のcontinue_motion_max_framesフレームのみが使用されます
入力ビデオ（face_video、pose_video、background_video、character_mask）は処理前にvideo_frame_offset分だけオフセットされます。オフセットがビデオ長を超えた場合、その入力は無視されます
character_maskに1フレームのみが含まれている場合、すべてのフレームに繰り返し適用されます
clip_vision_outputが提供された場合、ポジティブ条件付けとネガティブ条件付けの両方に適用されます
reference_imageが提供されない場合、黒色画像（すべてゼロ）がデフォルトの参照として使用されます
continue_motionが提供されない場合、初期フレームはグレー（強度0.5）のノイズで埋められます

出力

出力名	データ型	説明
`ネガティブ`	CONDITIONING	CLIPビジョン出力、ポーズビデオ潜在、顔ビデオピクセル、連結された潜在画像、連結されたマスクを含む追加のビデオコンテキストを持つ修正済みポジティブ条件付け
`潜在変数`	CONDITIONING	CLIPビジョン出力、ポーズビデオ潜在、顔ビデオピクセル（反転）、連結された潜在画像、連結されたマスクを含む追加のビデオコンテキストを持つ修正済みネガティブ条件付け
`トリム潜在変数`	LATENT	形状 [batch_size, 16, latent_length + trim_latent, latent_height, latent_width] の潜在空間形式で生成されたビデオコンテンツ
`トリム画像`	INT	先頭からトリミングする潜在フレーム数を示す潜在空間トリミング情報（参照画像の潜在フレームに対応）
`動画フレームオフセット`	INT	参照モーションフレームの画像空間トリミング情報。先頭からトリミングする画像フレーム数を示します
`動画フレームオフセット`	INT	チャンク単位でビデオ生成を継続するための更新されたフレームオフセット。以前のオフセットに生成された長さを加算して計算されます

Source fingerprint (SHA-256): c2ca90f4963f629d51cdd7f4bdb67e01c32ce5ca7d916b1f992ccd220f57566c

​入力

​出力

入力

出力