type
status
date
slug
summary
tags
category
icon
password
URL
Resemble Enhance是一个开源的AI模型,可以显著提高音频录音的质量
Resemble AI是一家初创公司,提供各种音频的人工智能工具,例如克隆、混音或翻译声音。
付费功能包括文本转语音、语音转语音、情感控制和实时语音转换,可控制语调和语音音调。该公司的一些技术已经在2020年被科技YouTuber Linus Sebastian用于深度伪造测试。
现在,该公司发布了一个名为Resemble Enhance的人工智能模型,可以将噪音干扰的音频数据转换为清晰的语音。与该公司的其他模型不同,Resemble Enhance是开源的。
Resemble AI可以改善播客和历史录音
Resemble在诸如播客、娱乐产业或历史音频文献修复等领域中看到了该技术的应用。该公司通过一段古老讲座的示例展示了其效果。
该模型由两个主要组件组成:一个降噪器和一个增强器。降噪器使用UNet模型将语音与背景噪音分离,从而提高可理解性。
增强器使用潜在条件流匹配(CFM)模型来纠正音频失真并扩展音频带宽。
开发团队计划进一步改进Resemble Enhance,并计划优化处理时间,扩展对语言中单个元素的控制,以进一步提高音频质量。
长期来看,该模型应该能够改善75年以上的音频录音。
Resemble在HuggingFace上提供了Resemble Enhance的演示。代码在GitHub上可获得。
总结
- Resemble AI发布了一个名为Resemble Enhance的开源AI模型,它可以通过将噪音干扰的音频数据转换为清晰的语音来提高音频录音的质量。
- 该模型由两个主要组件组成:一个去噪器,用于分离语音和背景噪音,以及一个增强器,用于修正音频失真并扩展音频带宽。
- 类似的技术在播客、娱乐产业和历史音频文献的修复中有应用领域,Resemble计划进一步提高音频质量和处理时间。
- 作者:Ai-皇帝
- 链接:https://www.ai-hd.com/article/caaa10ac-8446-4e6b-98ac-10251686feda
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。