メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
以下が翻訳結果です。
Kling Lip Sync Text to Video Node は、動画ファイル内の口の動きをテキストプロンプトに同期させます。入力動画を元に、キャラクターの口の動きが指定されたテキストに合わせて調整された新しい動画を生成します。このノードは音声合成を使用して、自然な発話同期を実現します。

入力

パラメータデータ型必須範囲説明
動画VIDEOはい-リップシンク用の入力動画ファイル
テキストSTRINGはい-リップシンク動画生成用のテキスト内容。モードが text2video の場合に必須です。最大文字数は120文字です。
音声COMBOいいえ”Melody"
"Bella"
"Aria"
"Ethan"
"Ryan"
"Dorothy"
"Nathan"
"Lily"
"Aaron"
"Emma"
"Grace"
"Henry"
"Isabella"
"James"
"Katherine"
"Liam"
"Mia"
"Noah"
"Olivia"
"Sophia”
リップシンク音声用の音声選択(デフォルト:“Melody”)
話速FLOATいいえ0.8-2.0発話速度。有効範囲:0.8~2.0、小数点第1位まで指定可能(デフォルト:1)
動画の要件:
  • 動画ファイルは100MB以下である必要があります
  • 高さ/幅は720px~1920pxの間である必要があります
  • 長さは2秒~10秒の間である必要があります

出力

出力名データ型説明
動画IDVIDEOリップシンクされた音声付きの生成動画
再生時間STRING生成された動画の一意識別子
durationSTRING生成された動画の長さ情報

Source fingerprint (SHA-256): f16200d52ba05acfedebc027dde91e2c91bdbb80086888d947c9f56a4e92856d