操作教程

为卡拉 OK 去除歌曲中的人声

中置声道抵消能在许多商业混音的立体声音轨中削弱主唱人声，因为人声通常被声像定位在中央。效果因音轨的混音方式不同而差异很大。这并不是 AI 分离，也不能在每首歌上都完美奏效，但它是一种快速、免费、私密的方式，能在不把文件上传到任何地方的前提下得到一个伴奏版本。

分步操作

打开人声去除工具并把音频文件拖入。该工具针对立体声音轨：MP3、WAV、AAC 和 OGG。运行前请先阅读页面顶部的诚实说明。单声道音轨，以及人声声像不在中央的音轨，都不会产生有用的结果。
选择输出模式。立体声会保留伴奏残留部分完整的立体声声场宽度。单声道会把两个声道合并为一个声道，当抵消在两侧留下可闻的相位失真时，这样听起来可能更干净。先选立体声，如果结果听起来空洞或发飘，再切换到单声道。
点击运行，在下载前先试听结果。质量取决于原音轨的混音方式：声像清晰居中的人声会被干净地削弱，而共用中置声道的鼓、贝斯或其他乐器也会一并被减弱。如果结果不可用，这个工具会诚实地说明自身的局限，无法再进一步改善。

中置声道抵消的工作原理

一个立体声音频文件包含一个左声道和一个右声道。在两个声道中完全相同的内容（中置声像）会在一个减去另一个时相互抵消。商业流行和摇滚混音中的主唱人声通常被放在这里，这与单声道收音机兼容性的原理有关。贝斯和底鼓同样居中。减去中置部分会把它们一起去除或削弱，而不仅仅是人声。结果是立体声差值信号：声像定位在两侧的乐器（吉他、合成器、被展开的和声）得以保留，而所有居中的内容都会被减弱。

什么时候效果好，什么时候不好

在 1990 年代以来商业混音的流行、摇滚和嘻哈作品上效果最好，这些作品里人声声像清晰居中。在现场录音（一切都是展开的）、人声带有渗入两侧的空间混响效果的重度处理作品，或单声道文件（左减右得到的是静音，而非有用的输出）上，效果很差。如果检测到单声道音源，工具会提醒你。即便音源不错，在削弱人声的同时也要预料到贝斯和底鼓会有所变薄。可以用音频剪辑工具把效果好的段落截取出来。

本指南用到的工具

常见问题

这个工具能完美分离出伴奏音轨吗？

不能。中置声道抵消去除的是左右声道中完全相同的内容，这其中包括人声，但也包括贝斯、底鼓以及任何混到中央的内容。它并不会先把人声单独分离出来、再只去除人声。结果是一个伴奏近似版本，其质量完全取决于原作的混音方式。确实存在能在特定曲风上做得更好的 AI 音源分离模型，但它们需要大量计算，并会产生自身的失真。这个工具是一种快速的浏览器端近似处理，而非录音棚级工具。

我的音频文件会被发送到服务器吗？

不会。人声去除工具完全在你的浏览器标签页内运行编译为 WebAssembly 的 FFmpeg。你的文件从本地内存读取并在那里处理；它永远不会离开你的设备。FFmpeg 引擎在首次使用时下载一次（约 30 MB），并会被缓存供以后的会话使用。