ボーカル除去(カラオケ)の仕組み
ボーカル除去は、ステレオ像の中央(リードボーカルが通常いる場所)を打ち消して曲のカラオケ版を作ります。ステレオ音源を置き、ステレオかモノラルの出力を選んで結果をダウンロードします。WebAssembly にコンパイルされた ffmpeg(`pan` フィルター)を通じて動きます。
できることを現実的に捉えてください:これは位相反転であり、AIによる分離ではありません。左右のチャンネルを差し引いて、ほぼ中央に定位した音(多くはリードボーカルですが、中央のベース・キック・スネアも)を取り除きます。ミックスによっては驚くほどうまくいき、別のものではほとんど変わらなかったり、目立つアーティファクトが残ったりします。声を完全に分離することはありません。