AI 语音转文本服务-Speechmatics

AI 语音转文本服务-Speechmatics

专用API
服务商 服务商: Speechmatics
【更新时间: 2024.08.07】 Speechmatics AI 语音生成器,融合了精准的语音识别技术与前沿的人工智能及大型语言模型(LLM)。通过API接口,它能够处理50种语言的转录、翻译和语义理解,为多语言环境提供强大支持。
免费 (每月免费 8 小时 ) 去服务商官网采购>
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是Speechmatics的AI 语音转文本服务?

Speechmatics AI 语音生成器是将准确的语音识别与最新的 AI 和 LLM 技术相结合,所有这些都通过一个 API 实现。支持 50 种语言的转录、翻译和理解,使用最准确、最全面的语音 API 为您的应用程序提供支持。专为 50 多种语言的实时转录和翻译而打造。我们的尖端语音技术由语音 AI 领域的先驱者开发,确保您能够以最佳方式进行构建。

 

什么是Speechmatics的AI 语音转文本服务?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用Speechmatics的AI 语音转文本服务,从而实现程序的自动化交互,提高服务效率。

Speechmatics的AI 语音转文本服务有哪些核心功能?

  1. 高精度转录:提供无与伦比的转录准确性,无论是实时转录还是批处理模式,都能确保最佳性能和快速转录,支持自定义词典、说话者和频道分类、数字格式识别等功能,以进一步提高转录精度。
  2. 灵活部署:支持本地和云两种部署方式。用户可以根据自己的需求在本地环境中托管API,或者通过云部署获得安全且可扩展的访问,提供Docker容器或预配置的虚拟设备,方便用户在自己的架构、安全性和合规性需求下部署。
  3. 多语言支持:支持50种语言,涵盖大多数母语,并具备处理各种方言和口音的能力,提供翻译功能,可以将音频转录并翻译为超过30种语言,或进行英语之间的互译,自动检测所说的语言,确保准确的转录。
  4. 高级功能:提供置信度分数、单词计时、高级标点符号和大小写等功能,帮助用户进行高效的后期处理和编辑,支持音频事件识别,如自动检测和标记媒体中的非语音声音,提高可访问性并自动化字幕制作。
  5. 行业优化:提供针对行业优化的英语语言包,包含特定行业的术语,如财务等,并计划推出更多行业语言包。
  6. AI支持功能:结合精准的转录与语音功能,提供如翻译、摘要、情绪分析、主题识别和章节划分等高级AI功能,摘要功能自动生成视频或社交媒体平台的摘要,方便观众快速了解内容,情绪分析功能帮助了解客户对服务的感受,主题和章节功能提供讨论的主题和时间戳,提升观众参与度。

Speechmatics的AI 语音转文本服务的核心优势是什么?


覆盖多种语言
我们的语言覆盖范围覆盖近 40 亿人。借助 Speechmatics,您可以让客户的媒体覆盖尽可能广泛的受众。

单一、统一的API
减少技术开销并绕过多个 API 调用的要求:使用Speechmatics您只需发送一次音频即可获得转录和翻译。

自动语言识别
无需设置预期语言(尽管如果您愿意也可以设置)Speechmatics将自动识别输入语言以确保最高的准确性。
自定义词典
准确捕捉最专业的词汇 - 公司名称行业术语、俚语等等。使用自定义词典您绝对不会错过任何一个单词。

 

直播。即时。实时
低延迟,高精度实时转录时不要牺牲准确性,与市场领先的实时语音转文本引擎合作。

无与伦比的精度
即使在充满挑战的环境中我们为各种声音提供了前所未有的性能,并在现实世界和暗杂的环境中进行了压力测试.因此您始终可以信赖我们的输出。

寻找新受众
50多种语言,我们的语言覆盖范围覆盖了全球一半以上的人口.帮助企业在全球范围内扩张。向问自己一一下一步在哪里?

在哪些场景会用到Speechmatics的AI 语音转文本服务?

  1. Red Bee 让每个人都能参与体育运动:Red Bee 帮助英国第四频道成为第一家播放完全无障碍残奥会的广播公司。
  2. 视频团队的工作空间:Red Bee 帮助英国第四频道成为第一家播放完全无障碍残奥会的广播公司。

     

  3. 利用语音识别进行实时字幕广播:Red Bee 帮助英国第四频道成为第一家播放完全无障碍残奥会的广播公司。
<
产品价格
>

<
使用指南
>

Speechmatics 为转录提供了两个操作点:

  • 增强——针对尽可能高的准确度进行了优化。
  • 标准 - (默认)针对快速批量周转时间进行了优化。

请注意,实时转录时,标准和增强操作点的延迟都由此处max_delay描述的配置选项控制。

请注意,您选择的操作点将影响定价以及本地客户的处理成本效率。

{
  "type": "transcription",
  "transcription_config": {
    "language": "en",
    "operating_point": "enhanced"
  }
}
 

输出区域

仅对于英语语言包,可以根据output_locale配置设置指定生成转录时要使用的拼写规则。

可用的三种英语区域设置是:

  • 英式英语 (en-GB)
  • 美国英语 (en-US)
  • 澳大利亚英语 (en-AU)

用英语转录时,建议指定语言环境。如果没有指定语言环境,转录中的拼写可能会不一致。

以下区域支持中文普通话:

  • 简体普通话 (cmn-Hans)
  • 繁体普通话 (cmn-Hant)

默认是简体普通话。

示例配置请求如下:

{
  "type": "transcription",
  "transcription_config": {
    "language": "en",
    "output_locale": "en-GB"
  }
}
 

域名语言优化

一些 Speechmatics 语言包针对特定领域进行了优化,这些领域需要对特定词汇和术语具有高精度。使用域参数可提供额外的转录准确性。以下示例显示了双语西班牙语和英语模型的使用:

{
  "type": "transcription",
  "transcription_config": {
    "language": "es",
    "domain": "bilingual-en"
  }
}
 

预计虽然特定领域会有所改进,但该领域之外的其他领域的准确性可能会下降。

<
产品问答
>
?
什么是⚡精简模式?
当作业符合条件时,请打开精简模式以最低费率批量转录。只有当您用完当月的免费分钟数后,才会对作业计费。 要打开精简模式,请访问门户的计费部分。 启用精简模式后,您的数据可能会被保留,以帮助改善 Speechmatics 服务。 启用精简模式后,如果服务繁忙,作业可能需要更长时间。 启用精简模式后,如果作业配置也符合精简模式,则只会按较低的费率收费。 启用精简模式后,如果您的工作配置不符合精简模式要求 - 您的数据将不会被保留。 什么是精简模式? 仅标准精度。 仅限英语、西班牙语、法语和德语转录。“自动”语言识别不适用于精简模式。 没有自定义词典、说话人分类或频道分类。
?
标准版和增强版有何区别?
我们为所有客户提供两种专有的转录模型: 标准- 非常适合优先考虑速度的用户和成绩单,但需要权衡准确性。 增强型- 当无与伦比的准确性是必须具备的时,我们的增强型模型可为我们所有的语言提供一流的准确性。 不同的模型可用于不同的工作,因此可以根据任务的特定需求进行定制。
?
我可以免费注册吗?
是的,完全可以!您每月可免费试用我们屡获殊荣的技术 8 小时。无需信用卡。
?
你们支持哪些语言?
我们支持 50 种语言的转录,支持 69 种语言的翻译。 转录 阿拉伯语 - 巴什基尔语 - 巴斯克语 - 白俄罗斯语 - 保加利亚语 - 粤语 - 加泰罗尼亚语 - 克罗地亚语 - 捷克语 - 丹麦语 - 荷兰语 - 英语 - 世界语 - 爱沙尼亚语 - 芬兰语 - 法语 - 加利西亚语 - 德语 - 希腊语 - 希伯来语 - 印地语 - 匈牙利语 - 印尼语 - 国际语 - 意大利语 - 日语 - 韩语 - 拉脱维亚语 - 立陶宛语 - 马来语 - 普通话 (繁体 & 简体) - 马拉地语 - 蒙古语 - 挪威语 - 波斯语 - 波兰语 - 葡萄牙语 - 罗马尼亚语 - 俄语 - 斯洛伐克语 - 斯洛文尼亚语 - 西班牙语 - 瑞典语 - 泰米尔语 - 泰语 - 土耳其语 - 乌克兰语 - 维吾尔语 - 越南语 - 威尔士语 翻译 保加利亚语 - 加泰罗尼亚语 - 克罗地亚语 - 捷克语 - 丹麦语 - 荷兰语 - 英语 - 爱沙尼亚语 - 芬兰语 - 法语 - 加利西亚语 - 德语 - 希腊语 - 印地语 - 匈牙利语 - 印尼语 - 意大利语 - 日语 - 韩语 - 拉脱维亚语 - 立陶宛语 - 马来语 - 普通话 (繁体 & 简体) - 波兰语 - 葡萄牙语 - 罗马尼亚语 - 俄语 - 斯洛伐克语 - 斯洛文尼亚语 - 西班牙语 - 瑞典语 - 土耳其语 - 乌克兰语 - 越南语 - 博克马尔语 > 新挪威语
?
你们提供批量折扣吗?
当然!如果您要通过我们的技术发送大量内容(每年超过 5,000 小时),那么我们很乐意与您联系并提供批量折扣。
?
计费如何运作?
我们每月 1 日收取前一个月的使用费。用户有 15 天的时间付款。
?
当我达到免费小时数限制时会发生什么?
只需在门户网站的“管理账单”部分添加您的信用卡详细信息即可增加您的使用量。
?
我怎样才能与某人交谈?
请随时发送电子邮件至 hello@speechmatics.com - 我们随时为您提供帮助!
<
关于我们
>
Speechmatics是一家专注于语音识别技术的领先企业,提供实时转录和翻译服务,支持50多种语言。公司由语音人工智能领域的先驱者开发,确保了技术的前沿性和准确性。其产品广泛应用于媒体监控、会议平台、教育技术等多个领域,帮助企业实现全球化扩展。Speechmatics致力于提供无与伦比的语音转文本性能,即使在嘈杂环境中也能保持高准确度,是构建企业语音应用的理想选择。
联系信息
服务时间: 09:00~17:00
电话号码: +44 (0)1223 948 977
邮箱: hello@speechmatics.com
邮箱: support@speechmatics.com
网页在线客服: 咨询

 

我们的目标是理解每一个声音

在 Speechmatics,我们创建了有史以来最全面、最准确的语音 API。我们通过为企业提供 AI 时代的基础语音技术来改变企业的工作方式。

 

我们的故事

Speechmatics 的故事始于 20 世纪 80 年代,当时创始人托尼·罗宾逊博士在剑桥大学率先采用神经网络方法解决语音识别问题。

 

我们的价值

我们的价值观指导着我们在这里所做的一切。仅仅取得伟大的成就是不够的-我们的价值观让我们知道我们在以正确的方式做事,

深切关怀
我们的目标是“理解每一个声音”。这种想法
不仅仅延伸到我们的技术。我们非常关心我
们的客户,尤其是当涉及到我们的行为对世
界的影响时。
以人为本
我们信奉以人为本的理念。我们想要的不只
是最好的团队,我们想要最合适的人。当您
成为我们团队的一员时,我们将竭尽所能帮
助您发展技能。
有雄心壮志
要想在行业内做出积极的改变,就需要采取
大胆、有远见的行动。这就是我们相信远大
目标的原因。我们的结果表明,虽然改变从
来都不容易,但总是值得的。
快速移动
我们相信在复杂和简单之间找到完美的平
衡。当你成为像我们这样的协作团队的一员
时,你可以自由地快速失败并继续前进。

 

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>

<
使用指南
>

Speechmatics 为转录提供了两个操作点:

  • 增强——针对尽可能高的准确度进行了优化。
  • 标准 - (默认)针对快速批量周转时间进行了优化。

请注意,实时转录时,标准和增强操作点的延迟都由此处max_delay描述的配置选项控制。

请注意,您选择的操作点将影响定价以及本地客户的处理成本效率。

{
  "type": "transcription",
  "transcription_config": {
    "language": "en",
    "operating_point": "enhanced"
  }
}
 

输出区域

仅对于英语语言包,可以根据output_locale配置设置指定生成转录时要使用的拼写规则。

可用的三种英语区域设置是:

  • 英式英语 (en-GB)
  • 美国英语 (en-US)
  • 澳大利亚英语 (en-AU)

用英语转录时,建议指定语言环境。如果没有指定语言环境,转录中的拼写可能会不一致。

以下区域支持中文普通话:

  • 简体普通话 (cmn-Hans)
  • 繁体普通话 (cmn-Hant)

默认是简体普通话。

示例配置请求如下:

{
  "type": "transcription",
  "transcription_config": {
    "language": "en",
    "output_locale": "en-GB"
  }
}
 

域名语言优化

一些 Speechmatics 语言包针对特定领域进行了优化,这些领域需要对特定词汇和术语具有高精度。使用域参数可提供额外的转录准确性。以下示例显示了双语西班牙语和英语模型的使用:

{
  "type": "transcription",
  "transcription_config": {
    "language": "es",
    "domain": "bilingual-en"
  }
}
 

预计虽然特定领域会有所改进,但该领域之外的其他领域的准确性可能会下降。

<
依赖服务
>
<
产品问答
>
?
什么是⚡精简模式?
当作业符合条件时,请打开精简模式以最低费率批量转录。只有当您用完当月的免费分钟数后,才会对作业计费。 要打开精简模式,请访问门户的计费部分。 启用精简模式后,您的数据可能会被保留,以帮助改善 Speechmatics 服务。 启用精简模式后,如果服务繁忙,作业可能需要更长时间。 启用精简模式后,如果作业配置也符合精简模式,则只会按较低的费率收费。 启用精简模式后,如果您的工作配置不符合精简模式要求 - 您的数据将不会被保留。 什么是精简模式? 仅标准精度。 仅限英语、西班牙语、法语和德语转录。“自动”语言识别不适用于精简模式。 没有自定义词典、说话人分类或频道分类。
?
标准版和增强版有何区别?
我们为所有客户提供两种专有的转录模型: 标准- 非常适合优先考虑速度的用户和成绩单,但需要权衡准确性。 增强型- 当无与伦比的准确性是必须具备的时,我们的增强型模型可为我们所有的语言提供一流的准确性。 不同的模型可用于不同的工作,因此可以根据任务的特定需求进行定制。
?
我可以免费注册吗?
是的,完全可以!您每月可免费试用我们屡获殊荣的技术 8 小时。无需信用卡。
?
你们支持哪些语言?
我们支持 50 种语言的转录,支持 69 种语言的翻译。 转录 阿拉伯语 - 巴什基尔语 - 巴斯克语 - 白俄罗斯语 - 保加利亚语 - 粤语 - 加泰罗尼亚语 - 克罗地亚语 - 捷克语 - 丹麦语 - 荷兰语 - 英语 - 世界语 - 爱沙尼亚语 - 芬兰语 - 法语 - 加利西亚语 - 德语 - 希腊语 - 希伯来语 - 印地语 - 匈牙利语 - 印尼语 - 国际语 - 意大利语 - 日语 - 韩语 - 拉脱维亚语 - 立陶宛语 - 马来语 - 普通话 (繁体 & 简体) - 马拉地语 - 蒙古语 - 挪威语 - 波斯语 - 波兰语 - 葡萄牙语 - 罗马尼亚语 - 俄语 - 斯洛伐克语 - 斯洛文尼亚语 - 西班牙语 - 瑞典语 - 泰米尔语 - 泰语 - 土耳其语 - 乌克兰语 - 维吾尔语 - 越南语 - 威尔士语 翻译 保加利亚语 - 加泰罗尼亚语 - 克罗地亚语 - 捷克语 - 丹麦语 - 荷兰语 - 英语 - 爱沙尼亚语 - 芬兰语 - 法语 - 加利西亚语 - 德语 - 希腊语 - 印地语 - 匈牙利语 - 印尼语 - 意大利语 - 日语 - 韩语 - 拉脱维亚语 - 立陶宛语 - 马来语 - 普通话 (繁体 & 简体) - 波兰语 - 葡萄牙语 - 罗马尼亚语 - 俄语 - 斯洛伐克语 - 斯洛文尼亚语 - 西班牙语 - 瑞典语 - 土耳其语 - 乌克兰语 - 越南语 - 博克马尔语 > 新挪威语
?
你们提供批量折扣吗?
当然!如果您要通过我们的技术发送大量内容(每年超过 5,000 小时),那么我们很乐意与您联系并提供批量折扣。
?
计费如何运作?
我们每月 1 日收取前一个月的使用费。用户有 15 天的时间付款。
?
当我达到免费小时数限制时会发生什么?
只需在门户网站的“管理账单”部分添加您的信用卡详细信息即可增加您的使用量。
?
我怎样才能与某人交谈?
请随时发送电子邮件至 hello@speechmatics.com - 我们随时为您提供帮助!
<
关于我们
>
Speechmatics是一家专注于语音识别技术的领先企业,提供实时转录和翻译服务,支持50多种语言。公司由语音人工智能领域的先驱者开发,确保了技术的前沿性和准确性。其产品广泛应用于媒体监控、会议平台、教育技术等多个领域,帮助企业实现全球化扩展。Speechmatics致力于提供无与伦比的语音转文本性能,即使在嘈杂环境中也能保持高准确度,是构建企业语音应用的理想选择。
联系信息
服务时间: 09:00~17:00
电话号码: +44 (0)1223 948 977
邮箱: hello@speechmatics.com
邮箱: support@speechmatics.com
网页在线客服: 咨询

 

我们的目标是理解每一个声音

在 Speechmatics,我们创建了有史以来最全面、最准确的语音 API。我们通过为企业提供 AI 时代的基础语音技术来改变企业的工作方式。

 

我们的故事

Speechmatics 的故事始于 20 世纪 80 年代,当时创始人托尼·罗宾逊博士在剑桥大学率先采用神经网络方法解决语音识别问题。

 

我们的价值

我们的价值观指导着我们在这里所做的一切。仅仅取得伟大的成就是不够的-我们的价值观让我们知道我们在以正确的方式做事,

深切关怀
我们的目标是“理解每一个声音”。这种想法
不仅仅延伸到我们的技术。我们非常关心我
们的客户,尤其是当涉及到我们的行为对世
界的影响时。
以人为本
我们信奉以人为本的理念。我们想要的不只
是最好的团队,我们想要最合适的人。当您
成为我们团队的一员时,我们将竭尽所能帮
助您发展技能。
有雄心壮志
要想在行业内做出积极的改变,就需要采取
大胆、有远见的行动。这就是我们相信远大
目标的原因。我们的结果表明,虽然改变从
来都不容易,但总是值得的。
快速移动
我们相信在复杂和简单之间找到完美的平
衡。当你成为像我们这样的协作团队的一员
时,你可以自由地快速失败并继续前进。

 

<
最可能同场景使用的其他API
>