メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
以下が翻訳結果です。

概要

Kling リップシンク音声動画ノードは、動画ファイル内の口の動きを音声ファイルのオーディオコンテンツに同期させます。このノードは、音声内の音声パターンを分析し、動画内の顔の動きを調整して、リアルなリップシンクを実現します。この処理には、明確な顔が含まれる動画と、はっきりと識別できる音声が含まれる音声ファイルの両方が必要です。

入力

パラメータデータ型必須範囲説明
動画VIDEOはい-リップシンク対象の顔が含まれる動画ファイル
音声AUDIOはい-動画と同期する音声が含まれる音声ファイル
音声言語COMBOはい"en"
"zh"
"es"
"fr"
"de"
"it"
"pt"
"pl"
"tr"
"ru"
"nl"
"cs"
"ar"
"ja"
"hu"
"ko"
音声ファイル内の音声の言語(デフォルト: “en”)
重要な制約事項:
  • 音声ファイルは5MB以下である必要があります
  • 動画ファイルは100MB以下である必要があります
  • 動画の寸法は、高さ・幅ともに720pxから1920pxの間である必要があります
  • 動画の長さは2秒から10秒の間である必要があります
  • 音声には、はっきりと識別できる音声が含まれている必要があります
  • 動画には、明確な顔が含まれている必要があります

出力

出力名データ型説明
動画IDVIDEO口の動きがリップシンクされた処理済み動画
再生時間STRING処理済み動画の一意識別子
durationSTRING処理済み動画の長さ

Source fingerprint (SHA-256): 92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592