类似的增强免费改善音频录音

type

status

date

slug

summary

Resemble Enhance是一个开源的AI模型，可以显著提高音频录音的质量

Resemble AI是一家初创公司，提供各种音频的人工智能工具，例如克隆、混音或翻译声音。

付费功能包括文本转语音、语音转语音、情感控制和实时语音转换，可控制语调和语音音调。该公司的一些技术已经在2020年被科技YouTuber Linus Sebastian用于深度伪造测试。

现在，该公司发布了一个名为Resemble Enhance的人工智能模型，可以将噪音干扰的音频数据转换为清晰的语音。与该公司的其他模型不同，Resemble Enhance是开源的。

Resemble在诸如播客、娱乐产业或历史音频文献修复等领域中看到了该技术的应用。该公司通过一段古老讲座的示例展示了其效果。

该模型由两个主要组件组成：一个降噪器和一个增强器。降噪器使用UNet模型将语音与背景噪音分离，从而提高可理解性。

增强器使用潜在条件流匹配（CFM）模型来纠正音频失真并扩展音频带宽。

开发团队计划进一步改进Resemble Enhance，并计划优化处理时间，扩展对语言中单个元素的控制，以进一步提高音频质量。

长期来看，该模型应该能够改善75年以上的音频录音。

Resemble在HuggingFace上提供了Resemble Enhance的演示。代码在GitHub上可获得。