KlingLipSyncAudioToVideoNode - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

以下が翻訳結果です。

概要

Kling リップシンク音声動画ノードは、動画ファイル内の口の動きを音声ファイルのオーディオコンテンツに同期させます。このノードは、音声内の音声パターンを分析し、動画内の顔の動きを調整して、リアルなリップシンクを実現します。この処理には、明確な顔が含まれる動画と、はっきりと識別できる音声が含まれる音声ファイルの両方が必要です。

入力

パラメータ	データ型	必須	範囲	説明
`動画`	VIDEO	はい	-	リップシンク対象の顔が含まれる動画ファイル
`音声`	AUDIO	はい	-	動画と同期する音声が含まれる音声ファイル
`音声言語`	COMBO	はい	`"en"` `"zh"` `"es"` `"fr"` `"de"` `"it"` `"pt"` `"pl"` `"tr"` `"ru"` `"nl"` `"cs"` `"ar"` `"ja"` `"hu"` `"ko"`	音声ファイル内の音声の言語（デフォルト: “en”）

重要な制約事項：

音声ファイルは5MB以下である必要があります
動画ファイルは100MB以下である必要があります
動画の寸法は、高さ・幅ともに720pxから1920pxの間である必要があります
動画の長さは2秒から10秒の間である必要があります
音声には、はっきりと識別できる音声が含まれている必要があります
動画には、明確な顔が含まれている必要があります

出力

出力名	データ型	説明
`動画ID`	VIDEO	口の動きがリップシンクされた処理済み動画
`再生時間`	STRING	処理済み動画の一意識別子
`duration`	STRING	処理済み動画の長さ

Source fingerprint (SHA-256): 92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592

Documentation Index

​概要

​入力

​出力

概要

入力

出力