メインコンテンツへスキップ
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
以下は、ご依頼の翻訳ルールに従って作成した日本語訳です。

概要

WanHuMoImageToVideo ノードは、ビデオフレームの潜在表現を生成することで、画像をビデオシーケンスに変換します。このノードは条件付け入力を処理し、参照画像やオーディオ埋め込みを組み込んでビデオ生成に影響を与えることができます。出力として、ビデオ合成に適した修正済みの条件付けデータと潜在表現を提供します。

入力

パラメータデータ型必須範囲説明
ポジティブCONDITIONINGはい-所望のコンテンツに向けてビデオ生成を導く、ポジティブな条件付け入力
ネガティブCONDITIONINGはい-不要なコンテンツからビデオ生成を遠ざける、ネガティブな条件付け入力
VAEVAEはい-参照画像を潜在空間にエンコードするために使用されるVAEモデル
INTはい16 ~ MAX_RESOLUTION出力ビデオフレームの幅(ピクセル単位、デフォルト: 832、16で割り切れる必要があります)
高さINTはい16 ~ MAX_RESOLUTION出力ビデオフレームの高さ(ピクセル単位、デフォルト: 480、16で割り切れる必要があります)
長さINTはい1 ~ MAX_RESOLUTION生成されるビデオシーケンスのフレーム数(デフォルト: 97、(length - 1) が4で割り切れる必要があります)
バッチサイズINTはい1 ~ 4096同時に生成するビデオシーケンスの数(デフォルト: 1)
オーディオエンコーダー出力AUDIOENCODEROUTPUTいいえ-オーディオコンテンツに基づいてビデオ生成に影響を与える可能性がある、オプションのオーディオエンコードデータ
参照画像IMAGEいいえ-ビデオ生成のスタイルとコンテンツをガイドするために使用される、オプションの参照画像
注記: 参照画像が提供された場合、それはエンコードされ、ポジティブ条件付けとネガティブ条件付けの両方に追加されます。オーディオエンコーダ出力が提供された場合、それは処理され、条件付けデータに組み込まれます。どちらも提供されない場合は、参照潜在変数とオーディオ埋め込みの両方にゼロ埋めされたプレースホルダーテンソルが使用されます。

出力

出力名データ型説明
ネガティブCONDITIONING参照画像やオーディオ埋め込みが組み込まれた、修正済みのポジティブ条件付け
潜在表現CONDITIONING参照画像やオーディオ埋め込みが組み込まれた、修正済みのネガティブ条件付け
latentLATENTビデオシーケンスデータを含む、生成された潜在表現

Source fingerprint (SHA-256): 6301671d04748ce80c561a65df80c7ca146b91bcce8851872df40211af29fd39