AI歌手训练预处理--音频文件人声分离

AI歌手训练预处理--音频文件人声分离模型的训练需要大量的音频

模型的训练需要大量的音频。所以我首先搜集了eason百多首wav的歌曲。鉴于国语与粤语的区别,因此我只选择了其中44首国语歌曲,尝试训练一下国语版的eason。(其实我更喜欢easonde粤语歌。)

下载好歌曲之后,需要去除背景音乐,得到纯净的人声。尝试自己构建模型过于复杂,音频剪辑的软件不方便批量操作。

这里需要用到一个github上开源的工具--slpeeter。通过这个工具,可以直接去分离人声与背景音乐,非常方便。效果也不错,分离速度也很快。下载不易,我将文件打包整理在百度网盘中,分享在文末。

这个工具有gui版的,下载之后直接打开。双击该gui应用程序即可。

另外,分离背景音乐与人声需要用到该工具下的双声道模型。即下图中的2stems。将压缩包解压后将其中的模型复制到SpleeterGUI文件夹中的pretrained_models文件夹中(见上图)。

gui界面的使用:

parts to separate选择2,表示分离出两个声道。即背景音乐与人声。

save to:选择自己想要保存的路径即可。

带宽与音频时长默认即可。

将需要处理的音频文件直接拖到这个工具界面即可。

 处理完之后会得到一个文件夹,文件夹包含两个音频文件。一个音频文件表示伴奏,一个表示人声(vocals)。

分离的效果还不错。 

SpleeterGUI工具分享:

链接:https://bianchenghao.cn/s/1dR7wIRV9oQPrHuJxIv78-w?pwd=r1dr 
提取码:r1dr 
--来自百度网盘超级会员V5的分享

今天的文章 AI歌手训练预处理--音频文件人声分离分享到此就结束了,感谢您的阅读。
编程小号
上一篇 2024-12-17 14:46
下一篇 2024-12-17 14:40

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/88860.html