KlingLipSyncTextToVideoNode - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

以下が翻訳結果です。

Kling Lip Sync Text to Video Node は、動画ファイル内の口の動きをテキストプロンプトに同期させます。入力動画を元に、キャラクターの口の動きが指定されたテキストに合わせて調整された新しい動画を生成します。このノードは音声合成を使用して、自然な発話同期を実現します。

入力

パラメータ	データ型	必須	範囲	説明
`動画`	VIDEO	はい	-	リップシンク用の入力動画ファイル
`テキスト`	STRING	はい	-	リップシンク動画生成用のテキスト内容。モードが text2video の場合に必須です。最大文字数は120文字です。
`音声`	COMBO	いいえ	”Melody" "Bella" "Aria" "Ethan" "Ryan" "Dorothy" "Nathan" "Lily" "Aaron" "Emma" "Grace" "Henry" "Isabella" "James" "Katherine" "Liam" "Mia" "Noah" "Olivia" "Sophia”	リップシンク音声用の音声選択（デフォルト：“Melody”）
`話速`	FLOAT	いいえ	0.8-2.0	発話速度。有効範囲：0.8～2.0、小数点第1位まで指定可能（デフォルト：1）

動画の要件：

Source fingerprint (SHA-256): f16200d52ba05acfedebc027dde91e2c91bdbb80086888d947c9f56a4e92856d