|
本帖最后由 aries215 于 2024-9-21 10:02 编辑
人工智能发展迅猛,视频修复大家看过,现在AudioSR大模型音频超级重采样,可批量转换你硬盘那些残旧音乐为母带级音质!
介绍:
输入音频,AudioSR将使其高保真!适用于所有类型的音频(如音乐、语音、狗叫声、雨声......)和(任意 -> 48kHz)采样率。
音频超分辨率是一项基本任务,可预测低分辨率音频的高频成分,从而提高数字应用中的音频质量。以往的方法有其局限性,如音频类型范围有限(如音乐、语音),以及所能处理的特定带宽设置(如 4 kHz 至 8 kHz)。我们引入了一种基于扩散的生成模型 AudioSR,它能够对各种音频类型(包括音效、音乐和语音)进行稳健的音频超分辨率处理。具体来说,AudioSR 可以将带宽在 2 kHz 至 16 kHz 范围内的任何输入音频信号上采样为带宽为 24 kHz、采样率为 48 kHz 的高分辨率音频信号。在各种音频超分辨率基准上进行的广泛客观评估表明,所提出的模型取得了很好的效果。此外,我们的主观评估结果表明,AudioSR 可以作为即插即用模块,提高各种音频生成模型(包括 AudioLDM、Fastspeech2 和 MusicGen)的生成质量。
地址:https://audioldm.github.io/audiosr/ (有图解有试听)
https://github.com/haoheliu/versatile_audio_super_resolution
命令:audiosr -il batch.lst
|
|