无需上传, 100% 本地处理, 无需账户

操作教程

为卡拉 OK 去除歌曲中的人声

中置声道抵消能在许多商业混音的立体声音轨中削弱主唱人声,因为人声通常被声像定位在中央。效果因音轨的混音方式不同而差异很大。这并不是 AI 分离,也不能在每首歌上都完美奏效,但它是一种快速、免费、私密的方式,能在不把文件上传到任何地方的前提下得到一个伴奏版本。

分步操作

  1. 打开人声去除工具并把音频文件拖入。该工具针对立体声音轨:MP3、WAV、AAC 和 OGG。运行前请先阅读页面顶部的诚实说明。单声道音轨,以及人声声像不在中央的音轨,都不会产生有用的结果。
  2. 选择输出模式。立体声会保留伴奏残留部分完整的立体声声场宽度。单声道会把两个声道合并为一个声道,当抵消在两侧留下可闻的相位失真时,这样听起来可能更干净。先选立体声,如果结果听起来空洞或发飘,再切换到单声道。
    人声去除工具中已载入一个立体声 MP3,输出模式选择器可见
  3. 点击运行,在下载前先试听结果。质量取决于原音轨的混音方式:声像清晰居中的人声会被干净地削弱,而共用中置声道的鼓、贝斯或其他乐器也会一并被减弱。如果结果不可用,这个工具会诚实地说明自身的局限,无法再进一步改善。
    已削弱人声、可供下载的处理后音轨

中置声道抵消的工作原理

一个立体声音频文件包含一个左声道和一个右声道。在两个声道中完全相同的内容(中置声像)会在一个减去另一个时相互抵消。商业流行和摇滚混音中的主唱人声通常被放在这里,这与单声道收音机兼容性的原理有关。贝斯和底鼓同样居中。减去中置部分会把它们一起去除或削弱,而不仅仅是人声。结果是立体声差值信号:声像定位在两侧的乐器(吉他、合成器、被展开的和声)得以保留,而所有居中的内容都会被减弱。

什么时候效果好,什么时候不好

在 1990 年代以来商业混音的流行、摇滚和嘻哈作品上效果最好,这些作品里人声声像清晰居中。在现场录音(一切都是展开的)、人声带有渗入两侧的空间混响效果的重度处理作品,或单声道文件(左减右得到的是静音,而非有用的输出)上,效果很差。如果检测到单声道音源,工具会提醒你。即便音源不错,在削弱人声的同时也要预料到贝斯和底鼓会有所变薄。可以用音频剪辑工具把效果好的段落截取出来。

本指南用到的工具

常见问题

这个工具能完美分离出伴奏音轨吗?

不能。中置声道抵消去除的是左右声道中完全相同的内容,这其中包括人声,但也包括贝斯、底鼓以及任何混到中央的内容。它并不会先把人声单独分离出来、再只去除人声。结果是一个伴奏近似版本,其质量完全取决于原作的混音方式。确实存在能在特定曲风上做得更好的 AI 音源分离模型,但它们需要大量计算,并会产生自身的失真。这个工具是一种快速的浏览器端近似处理,而非录音棚级工具。

我的音频文件会被发送到服务器吗?

不会。人声去除工具完全在你的浏览器标签页内运行编译为 WebAssembly 的 FFmpeg。你的文件从本地内存读取并在那里处理;它永远不会离开你的设备。FFmpeg 引擎在首次使用时下载一次(约 30 MB),并会被缓存供以后的会话使用。