文本转语音-Voicery

专用API

服务商： Voicery

【更新时间: 2024.08.28】 Voicery提供的文本转语音API 是一种定制化的语音引擎平台，能够将文本内容转换为自然、流畅的语音。该服务支持多种语言和口音，并提供多个语音选择，以满足不同用户的需求。

标准：$0.001 每个字符去服务商官网采购>

浏览次数

采购人数

试用次数

SLA: N/A

响应: N/A

适用于个人&企业

书签名称

确定

相似API

文本转语音服务-Azure AI

938

Azure AI的文本转语音服务，这是一款强大的文本到语音应用。它能够将文本巧妙地转换为极其逼真的语音，实现文字转语音的智能语音生成，并且支持多种语言，让文本与语音之间的转换轻松而高效。

语音通知-百度智能云

167

语音通知服务是基于百度智能云强大的语音线路资源打造的语音消息通知应用服务。语音消息具有高到达率、超低延时、秒级触达的优势，致力于提供优质的语音消息服务。

AI语音服务-Cloudmersive

213

文本转语音功能最强大、最具成本效益的语音识别和语音 AI API，包括语音识别和文本到语音，文字转语音实现智能语音生成，文字到语音支持多种语言。

API详情
定价
使用指南
常见 FAQ
关于我们
相关推荐

产品介绍

什么是Voicery的文本转语音?

自定义文本转语音语音引擎服务-Voicery 是一项技术服务，它允许用户通过输入文本生成自然的语音输出。该服务的核心在于其先进的语音合成技术，能够模拟人类的语音特征，使生成的声音听起来真实且自然。Voicery 支持多种语言和语音风格的选择，用户可以根据特定的应用需求定制语音，如调整语速、音调等。这项服务广泛应用于需要语音输出的行业，例如客户服务系统、智能设备以及媒体内容制作。

Voicery的文本转语音有哪些核心功能？

定制化语音引擎：为企业定制独特的声音，包括语言、语调、情感等。
多种语言和口音支持：提供英语（美国）、英语（澳大利亚）、英语（英国）、英语（加拿大）、英语（印度）、英语（爱尔兰）、英语（苏格兰）、英语（南非）等多种语言和口音的语音。
情感和风格的多样性：能够模拟对话式、旁白、生气、害怕、快乐的等多种情感和风格。
高质量的语音合成：利用尖端的人工智能和深度学习技术，提供高质量的语音合成服务。
云、本地、离线或混合部署：支持多种部署方式，以满足不同企业的需求。
实时流音频和SSML标记：提供实时流音频服务，并允许使用SSML标记调整音频。

Voicery的文本转语音的核心优势是什么？

定制化服务：能够根据企业需求定制独特的声音。
先进的技术：利用最新的人工智能和深度学习技术。
多样化的语言和口音：提供多种语言和口音选择，满足全球市场的需求。
情感和风格的丰富性：能够模拟多种情感和风格，使语音更加自然和逼真。
灵活的部署选项：支持云、本地、离线或混合部署，适应不同企业的IT架构。
实时音频流和SSML标记：提供实时音频流服务，并允许使用SSML标记进行音频调整。

在哪些场景会用到Voicery的文本转语音？

1. 辅助阅读工具： Voicery如果还在运营，可以为视觉障碍者提供一个强大的辅助阅读工具。通过将电子书籍、网页文章或文档内容转换成自然流畅的语音，这些用户能够更轻松地获取信息，无需依赖他人或传统的盲文材料。这种技术不仅提高了他们的自主性，还扩大了他们的阅读选择，使他们能够享受与视力正常的同伴相同的阅读体验。

2. 车载导航系统： 在驾驶时，Voicery的文本转语音服务可以提供实时的语音导航指令，从而减少驾驶员在查看地图或屏幕时的视觉分散。这不仅提高了驾驶安全性，也使得驾驶员能够更专注于道路状况。此外，该技术还可以用于读取实时交通更新和天气预报，进一步增强驾驶体验。

3. 语言学习应用： 教育领域的应用开发者可以利用Voicery的API来开发语言学习工具，这些工具能够将书面文本转换为标准发音的语音，帮助学习者练习听力和发音。这种交互式学习方式特别适合那些希望提高外语口语能力的学习者，使他们能够在没有教师直接指导的情况下，通过模仿正确的发音来提高语言技能。

4. 企业信息播报系统： 在企业环境中，Voicery的文本转语音服务可以用于将内部通讯、报告或关键业务指标转化为语音输出。员工可以在执行其他任务，如处理客户服务请求或进行数据分析时，通过听觉接收这些信息。这种多任务处理能力提高了工作效率，确保员工能够及时了解重要更新，同时保持对主要工作的专注。

产品价格

适用范围：

个人&企业

免费方式：

不提供

定价方式：

商务咨询

价格：

标准：$0.001 每个字符

价格详情：

使用指南

1. 获取API密钥

注册账户：访问Voicery官方网站，完成注册流程。
登录账户：使用您的凭据登录到Voicery账户。
获取API密钥：进入账户设置或API管理页面，找到并生成您的API密钥。确保保管好该密钥，因为它用于身份验证。

2. 设置请求环境

HTTP客户端：选择一个HTTP客户端工具，如Postman，或者在您的编程语言中使用HTTP库（如Python的requests、JavaScript的axios等）。
身份验证：在HTTP请求的头部中添加身份验证信息。通常，您需要设置Authorization头部，如下所示：
```
Authorization: Bearer <YOUR_API_KEY>
```

3. 构建请求

选择端点：根据Voicery API文档，确定您要调用的API端点。例如，转换文本为语音的端点可能是/text-to-speech。
确定请求方法：根据API文档选择HTTP方法（GET、POST、PUT、DELETE等）。大多数文本转语音的操作会使用POST方法。
准备请求体：
- 内容格式：确定请求体的格式（通常为JSON）。例如，文本转语音请求的体可能包含以下内容：
```
{
  "text": "Hello, world!",
  "language": "en",
  "voice": "male"
}
```
- 字段说明：根据API文档，配置必需和可选的字段（如text、language、voice等）。

4. 发送请求

生成音频：要生成音频，请向/generate端点发出POST请求。

curl https://api.voicery.com/generate \
  -H "Authorization: Bearer YOUR-API-KEY" \
  -H "Content-Type: application/json; version=1" \
  -d '{"text": "This is a test.", "speaker": "steven", "style": "narration", "encoding": "wav"}' \
  > my-audio.wav

音频时序：我们可以为从我们的 API 生成的音频中找到的句子、单词和音素提供精确的计时信息。要请求音频计时，请发出标准请求来生成音频，但将编码属性设置为json 。

//音频时序示例
{"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 0, "duration": 487}
{"type": "word", "start": null, "end": null, "value": "<silence>", "time": 0, "duration": 487}
{"type": "phoneme", "start": 0, "end": 5, "value": "HH", "time": 487, "duration": 50}
{"type": "phoneme", "start": 0, "end": 5, "value": "EH", "time": 537, "duration": 75}
{"type": "phoneme", "start": 0, "end": 5, "value": "L", "time": 612, "duration": 100}
{"type": "phoneme", "start": 0, "end": 5, "value": "OW", "time": 712, "duration": 300}
{"type": "word", "start": 0, "end": 5, "value": "Hello", "time": 487, "duration": 525}
{"type": "phoneme", "start": 7, "end": 10, "value": "AY", "time": 1012, "duration": 125}
{"type": "phoneme", "start": 7, "end": 10, "value": "M", "time": 1137, "duration": 100}
{"type": "word", "start": 7, "end": 10, "value": "I'm", "time": 1012, "duration": 225}
{"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1237, "duration": 50}
{"type": "phoneme", "start": 11, "end": 14, "value": "AA", "time": 1287, "duration": 350}
{"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1637, "duration": 125}
{"type": "word", "start": 11, "end": 14, "value": "Bob", "time": 1237, "duration": 525}
{"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 1762, "duration": 450}
{"type": "word", "start": null, "end": null, "value": "<silence>", "time": 1762, "duration": 450}
{"type": "sentence", "start": 0, "end": 15, "value": "Hello, I'm Bob!", "time": 0, "duration": 2212}

5. 处理响应

接收响应：解析API响应。响应通常包括状态码和响应体。
- 状态码：例如，200表示请求成功，400表示请求有误，500表示服务器错误。
- 响应体：响应体的内容根据API的不同操作而异。例如，文本转语音的响应体可能包含音频数据或转换结果的URL。
处理数据：根据API文档的说明，提取和使用响应数据。

6. 错误处理

识别错误：根据响应的状态码和错误信息（如错误代码、消息等）确定问题的性质。
调试：根据API文档中的错误描述，调整请求参数或处理逻辑，解决常见问题（如无效的API密钥、请求格式错误等）。

7. 测试和调试

测试工具：使用API测试工具（如Postman）进行请求测试，验证请求和响应是否按预期工作。
调试代码：在编程语言中，使用调试工具或日志记录功能，查看请求和响应过程中的详细信息，帮助诊断问题。

详情参考：https://www.voicery.com/docs

产品问答

Voicery的服务如何帮助我的业务？

Voicery的服务可以帮助您创建一个符合您品牌形象的定制化业务声音。这包括定义声音的语言、语调和情感，使其能够在各种平台和设备上有效传达您的品牌信息。我们的团队会与您紧密合作，确保最终的声音能够完美契合您的业务需求。

如何选择适合我需求的声音人才？

Voicery会根据您的业务需求、目标受众和具体要求，帮助您选择最合适的声音人才。我们会根据您的指示推荐符合您要求的声音类型，并协助您在录制之前确定合适的脚本和录音环境，以确保声音效果符合预期。

我可以在哪些平台或设备上使用Voicery提供的声音？

Voicery提供的声音可以在各种平台和设备上使用，包括移动应用、网站、智能设备和对话系统。我们的服务支持与语音识别系统和对话系统的无缝集成，确保您的声音能够广泛应用于各种场景。

关于我们

Voicery

企业

Voicery是一家专注于语音合成技术的前沿企业。我们致力于通过先进的人工智能和深度学习技术，提供高质量、自然流畅的语音生成解决方案。我们的产品广泛应用于各种领域，包括客服系统、智能助手以及娱乐内容创作。Voicery的使命是通过创新的语音技术，提升人机交互体验，为客户创造更多价值。

联系信息

服务时间： 00:00:00至24:00:00

网页在线客服：咨询

最可能同场景使用的其他API

实时语音翻译-有道专用API

【更新时间：2024.08.28】实时语音翻译服务是一款基于先进深度学习技术的翻译工具，能够即时将语音内容转换成多种语言。该服务支持多语言的语音识别与翻译，广泛应用于会议、在线学习和国际交流等场景，为用户提供流畅的跨语言沟通体验。

生活服务 > 语言翻译

119

刷脸支付-易生支付专用API

【更新时间：2024.08.28】刷脸支付是一种以AI人脸识别为核心的新型支付方式。人脸识别是百一种基于人的相貌特征信息进行身份认证的生物特征识别度技术，技术的最大特征是能避免个人信息泄露，并采用非接触的方式进行识别。

支付服务 > 聚合支付

情感倾向分析通用API 免费

【更新时间：2024.08.28】情感倾向分析API服务是一种基于人工智能技术的工具，用于自动识别和量化文本数据（如社交媒体帖子、产品评论、新闻文章等）中蕴含的情感色彩

AI技术 > AI对话

1.1K

视频内容安全专用API

【更新时间：2024.08.28】基于图像、文本、语音技术的综合审核能力，准确过滤视频中的色情、广告、恶心、违禁等违规内容，也能从美观、清晰等维度对视频进行筛选，紧贴业务需求，提升视频审核效率。

安全服务 > 业务安全

天翼云语音合成专用API

【更新时间：2024.08.28】语音合成（Text To Speech，TTS）将文本转成拟人化的语音。支持中文语音合成，提供男、女两种音色的选择，支持自定义语调、语速等参数。

AI技术 > AI语音 > 音频编辑

114

产品价格

适用范围：

个人&企业

免费方式：

不提供

定价方式：

商务咨询

价格：

标准：$0.001 每个字符

价格详情：

使用指南

1. 获取API密钥

注册账户：访问Voicery官方网站，完成注册流程。
登录账户：使用您的凭据登录到Voicery账户。
获取API密钥：进入账户设置或API管理页面，找到并生成您的API密钥。确保保管好该密钥，因为它用于身份验证。

2. 设置请求环境

HTTP客户端：选择一个HTTP客户端工具，如Postman，或者在您的编程语言中使用HTTP库（如Python的requests、JavaScript的axios等）。
身份验证：在HTTP请求的头部中添加身份验证信息。通常，您需要设置Authorization头部，如下所示：
```
Authorization: Bearer <YOUR_API_KEY>
```

3. 构建请求

选择端点：根据Voicery API文档，确定您要调用的API端点。例如，转换文本为语音的端点可能是/text-to-speech。
确定请求方法：根据API文档选择HTTP方法（GET、POST、PUT、DELETE等）。大多数文本转语音的操作会使用POST方法。
准备请求体：
- 内容格式：确定请求体的格式（通常为JSON）。例如，文本转语音请求的体可能包含以下内容：
```
{
  "text": "Hello, world!",
  "language": "en",
  "voice": "male"
}
```
- 字段说明：根据API文档，配置必需和可选的字段（如text、language、voice等）。

4. 发送请求

生成音频：要生成音频，请向/generate端点发出POST请求。

curl https://api.voicery.com/generate \
  -H "Authorization: Bearer YOUR-API-KEY" \
  -H "Content-Type: application/json; version=1" \
  -d '{"text": "This is a test.", "speaker": "steven", "style": "narration", "encoding": "wav"}' \
  > my-audio.wav

音频时序：我们可以为从我们的 API 生成的音频中找到的句子、单词和音素提供精确的计时信息。要请求音频计时，请发出标准请求来生成音频，但将编码属性设置为json 。

//音频时序示例
{"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 0, "duration": 487}
{"type": "word", "start": null, "end": null, "value": "<silence>", "time": 0, "duration": 487}
{"type": "phoneme", "start": 0, "end": 5, "value": "HH", "time": 487, "duration": 50}
{"type": "phoneme", "start": 0, "end": 5, "value": "EH", "time": 537, "duration": 75}
{"type": "phoneme", "start": 0, "end": 5, "value": "L", "time": 612, "duration": 100}
{"type": "phoneme", "start": 0, "end": 5, "value": "OW", "time": 712, "duration": 300}
{"type": "word", "start": 0, "end": 5, "value": "Hello", "time": 487, "duration": 525}
{"type": "phoneme", "start": 7, "end": 10, "value": "AY", "time": 1012, "duration": 125}
{"type": "phoneme", "start": 7, "end": 10, "value": "M", "time": 1137, "duration": 100}
{"type": "word", "start": 7, "end": 10, "value": "I'm", "time": 1012, "duration": 225}
{"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1237, "duration": 50}
{"type": "phoneme", "start": 11, "end": 14, "value": "AA", "time": 1287, "duration": 350}
{"type": "phoneme", "start": 11, "end": 14, "value": "B", "time": 1637, "duration": 125}
{"type": "word", "start": 11, "end": 14, "value": "Bob", "time": 1237, "duration": 525}
{"type": "phoneme", "start": null, "end": null, "value": "SIL", "time": 1762, "duration": 450}
{"type": "word", "start": null, "end": null, "value": "<silence>", "time": 1762, "duration": 450}
{"type": "sentence", "start": 0, "end": 15, "value": "Hello, I'm Bob!", "time": 0, "duration": 2212}

5. 处理响应

接收响应：解析API响应。响应通常包括状态码和响应体。
- 状态码：例如，200表示请求成功，400表示请求有误，500表示服务器错误。
- 响应体：响应体的内容根据API的不同操作而异。例如，文本转语音的响应体可能包含音频数据或转换结果的URL。
处理数据：根据API文档的说明，提取和使用响应数据。

6. 错误处理

识别错误：根据响应的状态码和错误信息（如错误代码、消息等）确定问题的性质。
调试：根据API文档中的错误描述，调整请求参数或处理逻辑，解决常见问题（如无效的API密钥、请求格式错误等）。

7. 测试和调试

测试工具：使用API测试工具（如Postman）进行请求测试，验证请求和响应是否按预期工作。
调试代码：在编程语言中，使用调试工具或日志记录功能，查看请求和响应过程中的详细信息，帮助诊断问题。

详情参考：https://www.voicery.com/docs

依赖服务

产品问答

Voicery的服务如何帮助我的业务？

如何选择适合我需求的声音人才？

我可以在哪些平台或设备上使用Voicery提供的声音？

关于我们

Voicery

企业

联系信息

服务时间： 00:00:00至24:00:00

网页在线客服：咨询

最可能同场景使用的其他API

实时语音翻译-有道专用API

生活服务 > 语言翻译

119

刷脸支付-易生支付专用API

支付服务 > 聚合支付

情感倾向分析通用API 免费

AI技术 > AI对话

1.1K

视频内容安全专用API

安全服务 > 业务安全

天翼云语音合成专用API

AI技术 > AI语音 > 音频编辑

114

文本转语音-Voicery

什么是Voicery的文本转语音?

Voicery的文本转语音有哪些核心功能？

Voicery的文本转语音的核心优势是什么？

在哪些场景会用到Voicery的文本转语音？

1. 获取API密钥

2. 设置请求环境

3. 构建请求

4. 发送请求

5. 处理响应

6. 错误处理

7. 测试和调试

1. 获取API密钥

2. 设置请求环境

3. 构建请求

4. 发送请求

5. 处理响应

6. 错误处理

7. 测试和调试

API平台

API平台

API学院

公司