AI 语音转文本服务-Speechmatics
专用API
服务商:
Speechmatics
【更新时间: 2024.08.07】
Speechmatics AI 语音生成器,融合了精准的语音识别技术与前沿的人工智能及大型语言模型(LLM)。通过API接口,它能够处理50种语言的转录、翻译和语义理解,为多语言环境提供强大支持。
|
- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是Speechmatics的AI 语音转文本服务?
Speechmatics AI 语音生成器是将准确的语音识别与最新的 AI 和 LLM 技术相结合,所有这些都通过一个 API 实现。支持 50 种语言的转录、翻译和理解,使用最准确、最全面的语音 API 为您的应用程序提供支持。专为 50 多种语言的实时转录和翻译而打造。我们的尖端语音技术由语音 AI 领域的先驱者开发,确保您能够以最佳方式进行构建。
什么是Speechmatics的AI 语音转文本服务?
Speechmatics的AI 语音转文本服务有哪些核心功能?
- 高精度转录:提供无与伦比的转录准确性,无论是实时转录还是批处理模式,都能确保最佳性能和快速转录,支持自定义词典、说话者和频道分类、数字格式识别等功能,以进一步提高转录精度。
- 灵活部署:支持本地和云两种部署方式。用户可以根据自己的需求在本地环境中托管API,或者通过云部署获得安全且可扩展的访问,提供Docker容器或预配置的虚拟设备,方便用户在自己的架构、安全性和合规性需求下部署。
- 多语言支持:支持50种语言,涵盖大多数母语,并具备处理各种方言和口音的能力,提供翻译功能,可以将音频转录并翻译为超过30种语言,或进行英语之间的互译,自动检测所说的语言,确保准确的转录。
- 高级功能:提供置信度分数、单词计时、高级标点符号和大小写等功能,帮助用户进行高效的后期处理和编辑,支持音频事件识别,如自动检测和标记媒体中的非语音声音,提高可访问性并自动化字幕制作。
- 行业优化:提供针对行业优化的英语语言包,包含特定行业的术语,如财务等,并计划推出更多行业语言包。
- AI支持功能:结合精准的转录与语音功能,提供如翻译、摘要、情绪分析、主题识别和章节划分等高级AI功能,摘要功能自动生成视频或社交媒体平台的摘要,方便观众快速了解内容,情绪分析功能帮助了解客户对服务的感受,主题和章节功能提供讨论的主题和时间戳,提升观众参与度。
Speechmatics的AI 语音转文本服务的核心优势是什么?
|
|
单一、统一的API |
|
自动语言识别 无需设置预期语言(尽管如果您愿意也可以设置)Speechmatics将自动识别输入语言以确保最高的准确性。 |
|
自定义词典 准确捕捉最专业的词汇 - 公司名称行业术语、俚语等等。使用自定义词典您绝对不会错过任何一个单词。 |
|
直播。即时。实时 |
|
无与伦比的精度 即使在充满挑战的环境中我们为各种声音提供了前所未有的性能,并在现实世界和暗杂的环境中进行了压力测试.因此您始终可以信赖我们的输出。 |
|
寻找新受众 |
在哪些场景会用到Speechmatics的AI 语音转文本服务?
- Red Bee 让每个人都能参与体育运动:Red Bee 帮助英国第四频道成为第一家播放完全无障碍残奥会的广播公司。
-
视频团队的工作空间:Red Bee 帮助英国第四频道成为第一家播放完全无障碍残奥会的广播公司。
- 利用语音识别进行实时字幕广播:Red Bee 帮助英国第四频道成为第一家播放完全无障碍残奥会的广播公司。
Speechmatics 为转录提供了两个操作点:
- 增强——针对尽可能高的准确度进行了优化。
- 标准 - (默认)针对快速批量周转时间进行了优化。
请注意,实时转录时,标准和增强操作点的延迟都由此处max_delay
描述的配置选项控制。
请注意,您选择的操作点将影响定价以及本地客户的处理成本效率。
{
"type": "transcription",
"transcription_config": {
"language": "en",
"operating_point": "enhanced"
}
}
输出区域
仅对于英语语言包,可以根据output_locale
配置设置指定生成转录时要使用的拼写规则。
可用的三种英语区域设置是:
- 英式英语 (en-GB)
- 美国英语 (en-US)
- 澳大利亚英语 (en-AU)
用英语转录时,建议指定语言环境。如果没有指定语言环境,转录中的拼写可能会不一致。
以下区域支持中文普通话:
- 简体普通话 (cmn-Hans)
- 繁体普通话 (cmn-Hant)
默认是简体普通话。
示例配置请求如下:
{
"type": "transcription",
"transcription_config": {
"language": "en",
"output_locale": "en-GB"
}
}
域名语言优化
一些 Speechmatics 语言包针对特定领域进行了优化,这些领域需要对特定词汇和术语具有高精度。使用域参数可提供额外的转录准确性。以下示例显示了双语西班牙语和英语模型的使用:
{
"type": "transcription",
"transcription_config": {
"language": "es",
"domain": "bilingual-en"
}
}
预计虽然特定领域会有所改进,但该领域之外的其他领域的准确性可能会下降。
我们的目标是理解每一个声音
在 Speechmatics,我们创建了有史以来最全面、最准确的语音 API。我们通过为企业提供 AI 时代的基础语音技术来改变企业的工作方式。
我们的故事
Speechmatics 的故事始于 20 世纪 80 年代,当时创始人托尼·罗宾逊博士在剑桥大学率先采用神经网络方法解决语音识别问题。
我们的价值
我们的价值观指导着我们在这里所做的一切。仅仅取得伟大的成就是不够的-我们的价值观让我们知道我们在以正确的方式做事,
深切关怀 我们的目标是“理解每一个声音”。这种想法 不仅仅延伸到我们的技术。我们非常关心我 们的客户,尤其是当涉及到我们的行为对世 界的影响时。 |
以人为本 我们信奉以人为本的理念。我们想要的不只 是最好的团队,我们想要最合适的人。当您 成为我们团队的一员时,我们将竭尽所能帮 助您发展技能。 |
有雄心壮志 要想在行业内做出积极的改变,就需要采取 大胆、有远见的行动。这就是我们相信远大 目标的原因。我们的结果表明,虽然改变从 来都不容易,但总是值得的。 |
快速移动 我们相信在复杂和简单之间找到完美的平 衡。当你成为像我们这样的协作团队的一员 时,你可以自由地快速失败并继续前进。 |
Speechmatics 为转录提供了两个操作点:
- 增强——针对尽可能高的准确度进行了优化。
- 标准 - (默认)针对快速批量周转时间进行了优化。
请注意,实时转录时,标准和增强操作点的延迟都由此处max_delay
描述的配置选项控制。
请注意,您选择的操作点将影响定价以及本地客户的处理成本效率。
{
"type": "transcription",
"transcription_config": {
"language": "en",
"operating_point": "enhanced"
}
}
输出区域
仅对于英语语言包,可以根据output_locale
配置设置指定生成转录时要使用的拼写规则。
可用的三种英语区域设置是:
- 英式英语 (en-GB)
- 美国英语 (en-US)
- 澳大利亚英语 (en-AU)
用英语转录时,建议指定语言环境。如果没有指定语言环境,转录中的拼写可能会不一致。
以下区域支持中文普通话:
- 简体普通话 (cmn-Hans)
- 繁体普通话 (cmn-Hant)
默认是简体普通话。
示例配置请求如下:
{
"type": "transcription",
"transcription_config": {
"language": "en",
"output_locale": "en-GB"
}
}
域名语言优化
一些 Speechmatics 语言包针对特定领域进行了优化,这些领域需要对特定词汇和术语具有高精度。使用域参数可提供额外的转录准确性。以下示例显示了双语西班牙语和英语模型的使用:
{
"type": "transcription",
"transcription_config": {
"language": "es",
"domain": "bilingual-en"
}
}
预计虽然特定领域会有所改进,但该领域之外的其他领域的准确性可能会下降。
我们的目标是理解每一个声音
在 Speechmatics,我们创建了有史以来最全面、最准确的语音 API。我们通过为企业提供 AI 时代的基础语音技术来改变企业的工作方式。
我们的故事
Speechmatics 的故事始于 20 世纪 80 年代,当时创始人托尼·罗宾逊博士在剑桥大学率先采用神经网络方法解决语音识别问题。
我们的价值
我们的价值观指导着我们在这里所做的一切。仅仅取得伟大的成就是不够的-我们的价值观让我们知道我们在以正确的方式做事,
深切关怀 我们的目标是“理解每一个声音”。这种想法 不仅仅延伸到我们的技术。我们非常关心我 们的客户,尤其是当涉及到我们的行为对世 界的影响时。 |
以人为本 我们信奉以人为本的理念。我们想要的不只 是最好的团队,我们想要最合适的人。当您 成为我们团队的一员时,我们将竭尽所能帮 助您发展技能。 |
有雄心壮志 要想在行业内做出积极的改变,就需要采取 大胆、有远见的行动。这就是我们相信远大 目标的原因。我们的结果表明,虽然改变从 来都不容易,但总是值得的。 |
快速移动 我们相信在复杂和简单之间找到完美的平 衡。当你成为像我们这样的协作团队的一员 时,你可以自由地快速失败并继续前进。 |