メインコンテンツへスキップ
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
このノードは、Variational Autoencoder(VAE)を使用して、圧縮された音声表現(潜在サンプル)を音声波形に戻します。メモリ使用量を管理するために、データをより小さな重なり合うセクション(タイル)に分割して処理するため、長い音声シーケンスの処理に適しています。

入力

パラメータデータ型必須範囲説明
サンプルLATENTはいなしデコードする音声の圧縮された潜在表現。
vaeVAEはいなしデコードを実行するために使用されるVariational Autoencoderモデル。
タイルサイズINTはい32~8192各処理タイルのサイズ。メモリを節約するために、音声はこの長さのセクションに分割されてデコードされます(デフォルト:512)。
オーバーラップINTはい0~1024隣接するタイルが重なり合うサンプル数。タイル間の境界におけるアーティファクトを低減するのに役立ちます(デフォルト:64)。

出力

出力名データ型説明
outputAUDIOデコードされた音声波形。

Source fingerprint (SHA-256): d989f0cd0e4b4bf992d6860e27c25b8e814df52763c82909a61c58f418306352