このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集LTXVSeparateAVLatent ノードは、結合された音声・映像の潜在表現を受け取り、それを映像用と音声用の2つの個別の部分に分割します。入力された潜在表現からサンプルを分離し、ノイズマスクが存在する場合も同様に分割して、2つの新しい潜在オブジェクトを作成します。
入力
| パラメータ | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
av_latent | LATENT | はい | なし | 分割対象となる、結合された音声・映像の潜在表現です。 |
samples テンソルは、最初の次元(バッチ次元)に少なくとも2つの要素を持つことが想定されています。最初の要素は映像の潜在表現に使用され、2番目の要素は音声の潜在表現に使用されます。noise_mask が存在する場合も、同様の方法で分割されます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
オーディオlatent | LATENT | 分割された映像データを含む潜在表現です。 |
audio_latent | LATENT | 分割された音声データを含む潜在表現です。 |
Source fingerprint (SHA-256):
55bce5d768e7fe13f885cc32d34ecdac5cdcbb667b03743004866ea4b6d58d46