メインコンテンツへスキップ
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
LTXVSeparateAVLatent ノードは、結合された音声・映像の潜在表現を受け取り、それを映像用と音声用の2つの個別の部分に分割します。入力された潜在表現からサンプルを分離し、ノイズマスクが存在する場合も同様に分割して、2つの新しい潜在オブジェクトを作成します。

入力

パラメータデータ型必須範囲説明
av_latentLATENTはいなし分割対象となる、結合された音声・映像の潜在表現です。
注記: 入力された潜在表現の samples テンソルは、最初の次元(バッチ次元)に少なくとも2つの要素を持つことが想定されています。最初の要素は映像の潜在表現に使用され、2番目の要素は音声の潜在表現に使用されます。noise_mask が存在する場合も、同様の方法で分割されます。

出力

出力名データ型説明
オーディオlatentLATENT分割された映像データを含む潜在表現です。
audio_latentLATENT分割された音声データを含む潜在表現です。

Source fingerprint (SHA-256): 55bce5d768e7fe13f885cc32d34ecdac5cdcbb667b03743004866ea4b6d58d46