耳机网-耳机大家坛

标题: AudioSR智能大模型音频超采样修复,将你硬盘音乐批量转为母带,比升频好! [打印本页]

作者: aries215    时间: 2024-9-21 09:40
标题: AudioSR智能大模型音频超采样修复,将你硬盘音乐批量转为母带,比升频好!
本帖最后由 aries215 于 2024-9-21 10:02 编辑

人工智能发展迅猛,视频修复大家看过,现在AudioSR大模型音频超级重采样,可批量转换你硬盘那些残旧音乐为母带级音质!

介绍:
输入音频,AudioSR将使其高保真!适用于所有类型的音频(如音乐、语音、狗叫声、雨声......)和(任意 -> 48kHz)采样率。
音频超分辨率是一项基本任务,可预测低分辨率音频的高频成分,从而提高数字应用中的音频质量。以往的方法有其局限性,如音频类型范围有限(如音乐、语音),以及所能处理的特定带宽设置(如 4 kHz 至 8 kHz)。我们引入了一种基于扩散的生成模型 AudioSR,它能够对各种音频类型(包括音效、音乐和语音)进行稳健的音频超分辨率处理。具体来说,AudioSR 可以将带宽在 2 kHz 至 16 kHz 范围内的任何输入音频信号上采样为带宽为 24 kHz、采样率为 48 kHz 的高分辨率音频信号。在各种音频超分辨率基准上进行的广泛客观评估表明,所提出的模型取得了很好的效果。此外,我们的主观评估结果表明,AudioSR 可以作为即插即用模块,提高各种音频生成模型(包括 AudioLDM、Fastspeech2 和 MusicGen)的生成质量。

地址:https://audioldm.github.io/audiosr/  (有图解有试听)
https://github.com/haoheliu/versatile_audio_super_resolution

命令:audiosr -il batch.lst





作者: aries215    时间: 2024-9-28 22:19
Python依赖复杂,搭建这类AI工具麻烦。

看到有人问能否修复抓轨CD时域错误,开发者说只能预测缺失高频。期待AI再发展。
作者: 番茄炒蛋饭    时间: 2024-9-29 08:43
看频谱是在频域进行高频延伸,具体效果待测试
作者: aries215    时间: 2024-9-29 11:07
本帖最后由 aries215 于 2024-9-29 11:10 编辑
番茄炒蛋饭 发表于 2024-9-29 08:43
看频谱是在频域进行高频延伸,具体效果待测试

还等啥?官网有音乐对比试听呀。





欢迎光临 耳机网-耳机大家坛 (http://www2.erji.net/) Powered by Discuz! X3.2