Azure文本转语音服务-AI语音
专用API
服务商:
微软云厂商
【更新时间: 2024.04.11】
Azure 文本转语音服务-AI 语音,这是一款强大的文本到语音应用。它能够将文本巧妙地转换为极其逼真的语音,实现文字转语音的智能语音生成,并且支持多种语言,让文本与语音之间的转换轻松而高效。
|
服务星级:6星
调用次数
0
次
集成人数
0
人
商用人数
0
人
SLA: N/A
响应: N/A
适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
|
相似API
有道语音生成服务-文本转语音
0
智能语音合成(text-to-speech,TTS)满足一般语言的文字转语音的需求,文本到语音让您的应用或设备开口说话,让发音更自然和专业,助力提升人机交互体验。文字到语音合成广泛应用于有声阅读、翻译对话、语音导航等场景。
Text to Speech
0
使用该API可以将任何文字转语音,文字到语音使机器和应用程序能够说话。文本转语音支持多种语言,文本到语音实现语音生成。
Amazon 文本转语音服务-Polly
0
Amazon Polly 是一种将文本换为逼真语音的服务,借助文字转语音服务,您可以创建能够说话的应用程序,并构建全新类别的支持语音功能的产品。文字到语音支持多种语言。
- API详情
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
产品介绍
什么是AI语音的Azure文本转语音服务?
Azure 文本转语音是一项AI语音功能,它可以将文本内容转换为自然发音的语音输出。这项服务允许用户通过自定义AI语音生成器来创造独特的品牌声音,并能够根据不同的应用场景选择合适的语音风格和情感语调。
什么是AI语音的Azure文本转语音服务?
由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用AI语音的Azure文本转语音服务,从而实现程序的自动化交互,提高服务效率。
AI语音的Azure文本转语音服务有哪些核心功能?
- 逼真的合成语音:生成流畅、自然的发音,为用户提供类似真人的语音体验。
- 可定制的文本讲述者语音:允许用户根据自己的品牌特色和特定需求定制AI语音。
- 精细的音频控制:通过调整语速、音调、发音、停顿等参数,优化语音输出。
- 灵活部署:支持在云中、本地或容器边缘运行文本转语音,以适应不同的应用需求。
- 自定义语音输出:使用语音合成标记语言(SSML)和音频内容创建工具来定义词典和控制语音参数。
AI语音的Azure文本转语音服务的核心优势是什么?
逼真的合成语音
可自定义文本讲述者语音
精细文本转语音音频控制
灵活部署
灵活转换
灵活转换
在哪些场景会用到AI语音的Azure文本转语音服务?
电子书和有声读物
语音助手和聊天机器人
视频和音频制作
界面朗读
客户服务和呼叫中心
教育和学习应用
使用指南
产品问答
?
文本转语音是如何计费的?
文本转语音服务按字符计费。 查看定价说明中可计费字符的定义。
?
文本转语音合成请求的速率限制是多少?
文本转语音的合成速率在收到更多请求时会自动调整。 每个语音资源都设有默认速率限制。 费率可根据业务理由进行调整,不会因费率上限增加而产生额外的费用。 请在语音服务配额和限制中查看更多详细信息。
?
如何向最终用户披露语音是合成语音?
我们建议每个用户在使用 TTS 服务时都应遵守我们的行为准则。 披露语音的合成性质有多种方式,包括隐式和显式署名。 请参考披露设计准则。
?
如何降低语音应用的延迟?
我们为你提供了一些提示,以降低延迟并为用户提供最佳性能。 请参阅使用语音 SDK 降低语音合成延迟。
?
TTS 支持哪些输出音频格式?
TTS 服务支持采用常用采样率的各种流式处理和非流式处理音频格式。 所有 TTS 预生成的神经语音都可支持 48 kHz 和 24 kHz 的高保真音频输出。 可以根据需要对音频重新采样以支持其他速率。 请参阅音频输出。
?
是否可以自定义语音以重读特定字词?
某些语音支持调整强调,具体取决于区域设置。 请参阅强调标记。
?
每种情绪是否可以有多种不同的强烈程度,比如悲伤、有点悲伤等?
某些语音支持调整风格程度,具体取决于区域设置。 请参阅 mstts:express-as 标记。
?
是否可以在同一组训练数据中包含重复的文本句子?
否。 该服务将标记重复的句子,并仅保留第一个导入的句子。 有关脚本选择条件,请参阅录制自定义语音示例。
?
是否可以在同一组训练数据中包含多个风格?
建议在一组训练数据中保持一致风格。 如果风格不同,请将数据放入不同的训练集中。 在这种情况下,可以考虑使用神经网络定制声音的多风格语音训练功能。 有关脚本选择条件,请参阅录制自定义语音示例。
?
通过 SSML 切换风格是否适用于神经网络定制声音?
通过 SSML 切换风格适用于预生成的多风格语音和 CNV 多风格语音。 通过多风格训练,可以创建以不同风格说话的语音,还可以通过 SSML 调整这些风格。
关于我们
微软云厂商
企业
微软Azure是微软公司提供的云计算服务,以即付即用和免费试用的方式,支持企业构建、部署和管理工作负载。Azure拥有丰富的产品线,包括虚拟机、AI服务、容器服务、混合云解决方案等,满足不同业务需求。其全球基础结构覆盖广泛,确保数据安全和合规性。Azure致力于帮助企业实现数字化转型,通过创新技术推动业务增长。
联系信息
服务时间:
09:00~18:00
电话号码:
400-820-6069
什么是 Azure?
Azure 云平台汇集的产品和云服务超过 200 种,旨在帮助你将新解决方案付诸实践,以便解决当今的难题,并创造未来。利用所选的工具和框架,在多个云中、在本地以及在边缘生成、运行和管理应用程序。
合作伙伴:
API接口列表
使用指南
依赖服务
产品问答
?
文本转语音是如何计费的?
文本转语音服务按字符计费。 查看定价说明中可计费字符的定义。
?
文本转语音合成请求的速率限制是多少?
文本转语音的合成速率在收到更多请求时会自动调整。 每个语音资源都设有默认速率限制。 费率可根据业务理由进行调整,不会因费率上限增加而产生额外的费用。 请在语音服务配额和限制中查看更多详细信息。
?
如何向最终用户披露语音是合成语音?
我们建议每个用户在使用 TTS 服务时都应遵守我们的行为准则。 披露语音的合成性质有多种方式,包括隐式和显式署名。 请参考披露设计准则。
?
如何降低语音应用的延迟?
我们为你提供了一些提示,以降低延迟并为用户提供最佳性能。 请参阅使用语音 SDK 降低语音合成延迟。
?
TTS 支持哪些输出音频格式?
TTS 服务支持采用常用采样率的各种流式处理和非流式处理音频格式。 所有 TTS 预生成的神经语音都可支持 48 kHz 和 24 kHz 的高保真音频输出。 可以根据需要对音频重新采样以支持其他速率。 请参阅音频输出。
?
是否可以自定义语音以重读特定字词?
某些语音支持调整强调,具体取决于区域设置。 请参阅强调标记。
?
每种情绪是否可以有多种不同的强烈程度,比如悲伤、有点悲伤等?
某些语音支持调整风格程度,具体取决于区域设置。 请参阅 mstts:express-as 标记。
?
是否可以在同一组训练数据中包含重复的文本句子?
否。 该服务将标记重复的句子,并仅保留第一个导入的句子。 有关脚本选择条件,请参阅录制自定义语音示例。
?
是否可以在同一组训练数据中包含多个风格?
建议在一组训练数据中保持一致风格。 如果风格不同,请将数据放入不同的训练集中。 在这种情况下,可以考虑使用神经网络定制声音的多风格语音训练功能。 有关脚本选择条件,请参阅录制自定义语音示例。
?
通过 SSML 切换风格是否适用于神经网络定制声音?
通过 SSML 切换风格适用于预生成的多风格语音和 CNV 多风格语音。 通过多风格训练,可以创建以不同风格说话的语音,还可以通过 SSML 调整这些风格。
关于我们
微软云厂商
企业
微软Azure是微软公司提供的云计算服务,以即付即用和免费试用的方式,支持企业构建、部署和管理工作负载。Azure拥有丰富的产品线,包括虚拟机、AI服务、容器服务、混合云解决方案等,满足不同业务需求。其全球基础结构覆盖广泛,确保数据安全和合规性。Azure致力于帮助企业实现数字化转型,通过创新技术推动业务增长。
联系信息
服务时间:
09:00~18:00
电话号码:
400-820-6069
什么是 Azure?
Azure 云平台汇集的产品和云服务超过 200 种,旨在帮助你将新解决方案付诸实践,以便解决当今的难题,并创造未来。利用所选的工具和框架,在多个云中、在本地以及在边缘生成、运行和管理应用程序。
合作伙伴:
合作案例