AudioSR智能大模型音频超采样修复，将你硬盘音乐批量转为母带，比升频好！

aries215 · 发表于 2024-9-21 09:40

本帖最后由 aries215 于 2024-9-21 10:02 编辑

人工智能发展迅猛，视频修复大家看过，现在AudioSR大模型音频超级重采样，可批量转换你硬盘那些残旧音乐为母带级音质！

介绍：
输入音频，AudioSR将使其高保真！适用于所有类型的音频（如音乐、语音、狗叫声、雨声......）和(任意 -> 48kHz)采样率。
音频超分辨率是一项基本任务，可预测低分辨率音频的高频成分，从而提高数字应用中的音频质量。以往的方法有其局限性，如音频类型范围有限（如音乐、语音），以及所能处理的特定带宽设置（如 4 kHz 至 8 kHz）。我们引入了一种基于扩散的生成模型 AudioSR，它能够对各种音频类型（包括音效、音乐和语音）进行稳健的音频超分辨率处理。具体来说，AudioSR 可以将带宽在 2 kHz 至 16 kHz 范围内的任何输入音频信号上采样为带宽为 24 kHz、采样率为 48 kHz 的高分辨率音频信号。在各种音频超分辨率基准上进行的广泛客观评估表明，所提出的模型取得了很好的效果。此外，我们的主观评估结果表明，AudioSR 可以作为即插即用模块，提高各种音频生成模型（包括 AudioLDM、Fastspeech2 和 MusicGen）的生成质量。

地址：https://audioldm.github.io/audiosr/ （有图解有试听）
https://github.com/haoheliu/versatile_audio_super_resolution

命令：audiosr -il batch.lst

aries215 · 发表于 2024-9-28 22:19

Python依赖复杂，搭建这类AI工具麻烦。

看到有人问能否修复抓轨CD时域错误，开发者说只能预测缺失高频。期待AI再发展。

番茄炒蛋饭 · 发表于 2024-9-29 08:43

看频谱是在频域进行高频延伸，具体效果待测试

aries215 · 发表于 2024-9-29 11:07

本帖最后由 aries215 于 2024-9-29 11:10 编辑

番茄炒蛋饭发表于 2024-9-29 08:43
看频谱是在频域进行高频延伸，具体效果待测试

还等啥？官网有音乐对比试听呀。

帐号		自动登录	找回密码
密码			-注册-