新闻资讯
Resemble AI 混合了人类声音和合成声音
00 分钟
2023-12-4
2024-3-14
type
status
date
slug
summary
tags
category
icon
password
URL

Resemble AI 是一个 AI 语音工具包,它使用 GPT 3.5 和通过 API 提供的专有模型。

Resemble 的主要功能包括语音克隆、语音混合和本地化。
本地化功能可以创建多种语言的合成语音,以扩大内容对全球受众的影响。
Resemble 的语音混合功能允许用户将人类声音和合成声音结合起来,形成无缝的音频体验。

人工智能技术

Resemble AI 的工具包包括文本转语音、语音转语音、神经音频编辑和语音配音等多种应用。音频质量令人印象深刻。
该平台的情感功能无需新数据即可在语音中添加大量情感,从而实现更加细致和真实的沟通。
此外,该平台还支持实时语音转换,并可对音调和语调进行精细控制。

用例

Resemble AI 声称已经完善了其产品,拥有 200,000 个人工智能语音,每月产生超过 200 万分钟的音频。 Resemble AI广泛应用于各个行业,包括企业层面。
Resemblezer Python 包可用于说话人验证、数字化、深度伪造检测等。

游戏开发

通过简单的 Unity 插件,游戏开发人员可以创建独特的语音和语言资产,将它们与角色关联起来,并为它们设置动画。
Github 上提供了 Alexa Skill 项目的示例代码,该项目演示了如何将 GPT-3 AI 生成的文本动态链接到自定义的类似语音。

创始人

Resemble AI 背后的推动力是联合创始人 Saqib Muhammad 和 Zohaib Ahmed。
穆罕默德住在加利福尼亚州,但在加拿大学习。他拥有麦吉尔大学工商管理学位,曾在资本管理公司工作。
艾哈迈德是一名软件开发人员,之前曾在黑莓公司工作。他在多伦多大学学习计算机科学。

价格

Resemble AI 提供灵活的定价模型,适应用户的需求。
“基本”计划是一种定价模式,包括通过互联网录制的自定义语音、西班牙语 (MX) 和法语本地化以及对 50 多个市场语音的访问。每秒的价格为 0.006 美元。
为了满足更广泛的需求,“Pro”计划提供了额外的功能,例如自定义数据上传、高级情绪控制、低延迟 API 和超过 24 种语言的多语言支持。
定价结构不公开。
这两个计划都包含无限的团队用户和项目,Pro 计划提供更高级的功能。

总结

  • Resemble AI 是一款 AI 语音工具包,可实现语音克隆、混合和本地化,以及针对各种应用的文本转语音、语音转语音和同步功能。
  • 该平台的情感功能为语音添加了一系列情感,并支持实时语音转换并控制语调和语调,使其适用于游戏开发和企业级应用等行业。
  • Resemble AI 提供灵活的定价模型,包括“基本”套餐和高级“专业”套餐,其中包括自定义数据上传、高级情绪控制和超过 24 种语言的多语言支持等功能。

网址

https://www.resemble.ai/

 
notion image

评论
  • Twikoo