文本转语音-Voicery
专用API
服务商:
Voicery
【更新时间: 2024.08.28】
Voicery提供的文本转语音API 是一种定制化的语音引擎平台,能够将文本内容转换为自然、流畅的语音。该服务支持多种语言和口音,并提供多个语音选择,以满足不同用户的需求。
标准 :$0.001 每个字符
去服务商官网采购>
|
服务星级:2星
调用次数
0
次
集成人数
0
人
商用人数
0
人
SLA: N/A
响应: N/A
适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是Voicery的文本转语音?
自定义文本转语音语音引擎服务-Voicery 是一项技术服务,它允许用户通过输入文本生成自然的语音输出。该服务的核心在于其先进的语音合成技术,能够模拟人类的语音特征,使生成的声音听起来真实且自然。Voicery 支持多种语言和语音风格的选择,用户可以根据特定的应用需求定制语音,如调整语速、音调等。这项服务广泛应用于需要语音输出的行业,例如客户服务系统、智能设备以及媒体内容制作。
什么是Voicery的文本转语音?
Voicery的文本转语音有哪些核心功能?
- 定制化语音引擎:为企业定制独特的声音,包括语言、语调、情感等。
- 多种语言和口音支持:提供英语(美国)、英语(澳大利亚)、英语(英国)、英语(加拿大)、英语(印度)、英语(爱尔兰)、英语(苏格兰)、英语(南非)等多种语言和口音的语音。
- 情感和风格的多样性:能够模拟对话式、旁白、生气、害怕、快乐的等多种情感和风格。
- 高质量的语音合成:利用尖端的人工智能和深度学习技术,提供高质量的语音合成服务。
- 云、本地、离线或混合部署:支持多种部署方式,以满足不同企业的需求。
- 实时流音频和SSML标记:提供实时流音频服务,并允许使用SSML标记调整音频。
Voicery的文本转语音的核心优势是什么?
- 定制化服务:能够根据企业需求定制独特的声音。
- 先进的技术:利用最新的人工智能和深度学习技术。
- 多样化的语言和口音:提供多种语言和口音选择,满足全球市场的需求。
- 情感和风格的丰富性:能够模拟多种情感和风格,使语音更加自然和逼真。
- 灵活的部署选项:支持云、本地、离线或混合部署,适应不同企业的IT架构。
- 实时音频流和SSML标记:提供实时音频流服务,并允许使用SSML标记进行音频调整。
在哪些场景会用到Voicery的文本转语音?
Voicery如果还在运营,可以为视觉障碍者提供一个强大的辅助阅读工具。通过将电子书籍、网页文章或文档内容转换成自然流畅的语音,这些用户能够更轻松地获取信息,无需依赖他人或传统的盲文材料。这种技术不仅提高了他们的自主性,还扩大了他们的阅读选择,使他们能够享受与视力正常的同伴相同的阅读体验。
车载导航系统: 在驾驶时,Voicery的文本转语音服务可以提供实时的语音导航指令,从而减少驾驶员在查看地图或屏幕时的视觉分散。这不仅提高了驾驶安全性,也使得驾驶员能够更专注于道路状况。此外,该技术还可以用于读取实时交通更新和天气预报,进一步增强驾驶体验。
语言学习应用: 教育领域的应用开发者可以利用Voicery的API来开发语言学习工具,这些工具能够将书面文本转换为标准发音的语音,帮助学习者练习听力和发音。这种交互式学习方式特别适合那些希望提高外语口语能力的学习者,使他们能够在没有教师直接指导的情况下,通过模仿正确的发音来提高语言技能。
企业信息播报系统: 在企业环境中,Voicery的文本转语音服务可以用于将内部通讯、报告或关键业务指标转化为语音输出。员工可以在执行其他任务,如处理客户服务请求或进行数据分析时,通过听觉接收这些信息。这种多任务处理能力提高了工作效率,确保员工能够及时了解重要更新,同时保持对主要工作的专注。
1. 获取API密钥
- 注册账户:访问Voicery官方网站,完成注册流程。
- 登录账户:使用您的凭据登录到Voicery账户。
- 获取API密钥:进入账户设置或API管理页面,找到并生成您的API密钥。确保保管好该密钥,因为它用于身份验证。
2. 设置请求环境
- HTTP客户端:选择一个HTTP客户端工具,如Postman,或者在您的编程语言中使用HTTP库(如Python的
requests
、JavaScript的axios
等)。 - 身份验证:在HTTP请求的头部中添加身份验证信息。通常,您需要设置
Authorization
头部,如下所示:Authorization: Bearer <YOUR_API_KEY>
3. 构建请求
- 选择端点:根据Voicery API文档,确定您要调用的API端点。例如,转换文本为语音的端点可能是
/text-to-speech
。 - 确定请求方法:根据API文档选择HTTP方法(GET、POST、PUT、DELETE等)。大多数文本转语音的操作会使用POST方法。
- 准备请求体:
- 内容格式:确定请求体的格式(通常为JSON)。例如,文本转语音请求的体可能包含以下内容:
{ "text": "Hello, world!", "language": "en", "voice": "male" }
- 字段说明:根据API文档,配置必需和可选的字段(如
text
、language
、voice
等)。
- 内容格式:确定请求体的格式(通常为JSON)。例如,文本转语音请求的体可能包含以下内容:
4. 发送请求
- 生成音频 :要生成音频,请向/generate端点发出POST请求。
-
curl https://api.voicery.com/generate \ -H "Authorization: Bearer YOUR-API-KEY" \ -H "Content-Type: application/json; version=1" \ -d '{"text": "This is a test.", "speaker": "steven", "style": "narration", "encoding": "wav"}' \ > my-audio.wav
- 音频时序:我们可以为从我们的 API 生成的音频中找到的句子、单词和音素提供精确的计时信息。要请求音频计时,请发出标准请求来生成音频,但将编码属性设置为json 。
-
//音频时序示例 {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 0, "duration": 487} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 0, "duration": 487} {"type": "phoneme", "start": 0, "end": 5, "value": "HH", "time": 487, "duration": 50} {"type": "phoneme", "start": 0, "end": 5, "value": "EH", "time": 537, "duration": 75} {"type": "phoneme", "start": 0, "end": 5, "value": "L", "time": 612, "duration": 100} {"type": "phoneme", "start": 0, "end": 5, "value": "OW", "time": 712, "duration": 300} {"type": "word", "start": 0, "end": 5, "value": "Hello", "time": 487, "duration": 525} {"type": "phoneme", "start": 7, "end": 10, "value": "AY", "time": 1012, "duration": 125} {"type": "phoneme", "start": 7, "end": 10, "value": "M", "time": 1137, "duration": 100} {"type": "word", "start": 7, "end": 10, "value": "I'm", "time": 1012, "duration": 225} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1237, "duration": 50} {"type": "phoneme", "start": 11, "end": 14, "value": "AA", "time": 1287, "duration": 350} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1637, "duration": 125} {"type": "word", "start": 11, "end": 14, "value": "Bob", "time": 1237, "duration": 525} {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 1762, "duration": 450} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 1762, "duration": 450} {"type": "sentence", "start": 0, "end": 15, "value": "Hello, I'm Bob!", "time": 0, "duration": 2212}
5. 处理响应
- 接收响应:解析API响应。响应通常包括状态码和响应体。
- 状态码:例如,200表示请求成功,400表示请求有误,500表示服务器错误。
- 响应体:响应体的内容根据API的不同操作而异。例如,文本转语音的响应体可能包含音频数据或转换结果的URL。
- 处理数据:根据API文档的说明,提取和使用响应数据。
6. 错误处理
- 识别错误:根据响应的状态码和错误信息(如错误代码、消息等)确定问题的性质。
- 调试:根据API文档中的错误描述,调整请求参数或处理逻辑,解决常见问题(如无效的API密钥、请求格式错误等)。
7. 测试和调试
- 测试工具:使用API测试工具(如Postman)进行请求测试,验证请求和响应是否按预期工作。
- 调试代码:在编程语言中,使用调试工具或日志记录功能,查看请求和响应过程中的详细信息,帮助诊断问题。
详情参考:https://www.voicery.com/docs
1. 获取API密钥
- 注册账户:访问Voicery官方网站,完成注册流程。
- 登录账户:使用您的凭据登录到Voicery账户。
- 获取API密钥:进入账户设置或API管理页面,找到并生成您的API密钥。确保保管好该密钥,因为它用于身份验证。
2. 设置请求环境
- HTTP客户端:选择一个HTTP客户端工具,如Postman,或者在您的编程语言中使用HTTP库(如Python的
requests
、JavaScript的axios
等)。 - 身份验证:在HTTP请求的头部中添加身份验证信息。通常,您需要设置
Authorization
头部,如下所示:Authorization: Bearer <YOUR_API_KEY>
3. 构建请求
- 选择端点:根据Voicery API文档,确定您要调用的API端点。例如,转换文本为语音的端点可能是
/text-to-speech
。 - 确定请求方法:根据API文档选择HTTP方法(GET、POST、PUT、DELETE等)。大多数文本转语音的操作会使用POST方法。
- 准备请求体:
- 内容格式:确定请求体的格式(通常为JSON)。例如,文本转语音请求的体可能包含以下内容:
{ "text": "Hello, world!", "language": "en", "voice": "male" }
- 字段说明:根据API文档,配置必需和可选的字段(如
text
、language
、voice
等)。
- 内容格式:确定请求体的格式(通常为JSON)。例如,文本转语音请求的体可能包含以下内容:
4. 发送请求
- 生成音频 :要生成音频,请向/generate端点发出POST请求。
-
curl https://api.voicery.com/generate \ -H "Authorization: Bearer YOUR-API-KEY" \ -H "Content-Type: application/json; version=1" \ -d '{"text": "This is a test.", "speaker": "steven", "style": "narration", "encoding": "wav"}' \ > my-audio.wav
- 音频时序:我们可以为从我们的 API 生成的音频中找到的句子、单词和音素提供精确的计时信息。要请求音频计时,请发出标准请求来生成音频,但将编码属性设置为json 。
-
//音频时序示例 {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 0, "duration": 487} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 0, "duration": 487} {"type": "phoneme", "start": 0, "end": 5, "value": "HH", "time": 487, "duration": 50} {"type": "phoneme", "start": 0, "end": 5, "value": "EH", "time": 537, "duration": 75} {"type": "phoneme", "start": 0, "end": 5, "value": "L", "time": 612, "duration": 100} {"type": "phoneme", "start": 0, "end": 5, "value": "OW", "time": 712, "duration": 300} {"type": "word", "start": 0, "end": 5, "value": "Hello", "time": 487, "duration": 525} {"type": "phoneme", "start": 7, "end": 10, "value": "AY", "time": 1012, "duration": 125} {"type": "phoneme", "start": 7, "end": 10, "value": "M", "time": 1137, "duration": 100} {"type": "word", "start": 7, "end": 10, "value": "I'm", "time": 1012, "duration": 225} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1237, "duration": 50} {"type": "phoneme", "start": 11, "end": 14, "value": "AA", "time": 1287, "duration": 350} {"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1637, "duration": 125} {"type": "word", "start": 11, "end": 14, "value": "Bob", "time": 1237, "duration": 525} {"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 1762, "duration": 450} {"type": "word", "start": null, "end": null, "value": "<silence>", "time": 1762, "duration": 450} {"type": "sentence", "start": 0, "end": 15, "value": "Hello, I'm Bob!", "time": 0, "duration": 2212}
5. 处理响应
- 接收响应:解析API响应。响应通常包括状态码和响应体。
- 状态码:例如,200表示请求成功,400表示请求有误,500表示服务器错误。
- 响应体:响应体的内容根据API的不同操作而异。例如,文本转语音的响应体可能包含音频数据或转换结果的URL。
- 处理数据:根据API文档的说明,提取和使用响应数据。
6. 错误处理
- 识别错误:根据响应的状态码和错误信息(如错误代码、消息等)确定问题的性质。
- 调试:根据API文档中的错误描述,调整请求参数或处理逻辑,解决常见问题(如无效的API密钥、请求格式错误等)。
7. 测试和调试
- 测试工具:使用API测试工具(如Postman)进行请求测试,验证请求和响应是否按预期工作。
- 调试代码:在编程语言中,使用调试工具或日志记录功能,查看请求和响应过程中的详细信息,帮助诊断问题。
详情参考:https://www.voicery.com/docs