![]() |
语音转文本-Google Cloud
专用API
【更新时间: 2024.06.28】
Google Cloud语音转文本使用功能强大的 API 将语音准确地转换为文本。它通过使用准确的字幕转录您的语音来提供出色的用户体验。它还通过从客户互动中获取和转录的见解来帮助改进您的服务。
|
浏览次数
109
采购人数
13
试用次数
0
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐


什么是Google Cloud的语音转文本?
Google Cloud 依托 AI 技术的 API 可帮助您大规模翻译文档、网站、应用、音频文件、视频等内容,并提供出色的质量以及企业级控制和安全性。 |
什么是Google Cloud的语音转文本接口?
Google Cloud的语音转文本有哪些核心功能?
1. 高级语音 AI
Speech-to-Text 可以利用 Chirp,这是 Google Cloud 的语音基础模型,使用数百万小时的音频数据和数十亿个文本句子训练而成。这与传统语音识别技术(侧重于大量特定于语言的监督数据)形成了鲜明对比。这些技术可以为用户提高识别和转录能力,从而更好地理解口语和口音。
支持 125 种语言和语言变体
通过广泛的语言支持打造全球用户群。转录短音频、长音频甚至流式传输的音频数据。Speech-to-Text 还利用新一代通用语音模型 Chirp,为用户提供更加准确、覆盖全球的翻译和识别。Chirp 使用数百万小时的音频和 280 亿个句子的文本(涵盖 100 多种语言)的自监督训练构建而成。
2. 用于转写的预训练模型或可自定义的模型
从多种经过训练的模型中进行选择,实现优化的语音控制、电话和视频转录,满足特定领域的质量要求。通过 Speech-to-Text 界面,轻松自定义、试验、创建和管理自定义资源。
3. 开箱即用的监管和安全合规性
无需额外设置,Speech-to-Text API v2 即可帮助企业客户满足额外安全和监管要求。数据驻留支持通过完全区域化的服务(该服务接入至新加坡和比利时等 Google Cloud 区域)来调用转录模型。借助识别器应变性 (resourcefulness),您无需使用专用服务账号进行身份验证和授权。您可以在 Google Cloud 控制台中轻松查看关于资源生成和转写的日志。Speech-to-Text API v2 为所有资源以及批量转录提供使用客户管理的加密密钥的企业级加密。
4. AI 赋能的语音识别和转录
Speech-to-Text 使用模型自适应技术来提高常用字词的准确性、扩充可用于转录的词汇,并改善嘈杂音频的转录效果。模型自适应可让用户自定义 Speech-to-Text,使其能够更频繁地使用同音字词中的某一个而非建议的其他选项。例如,您可以让 Speech-to-Text 在转录时更多地使用“时常”而不是“时长”。
Google Cloud的语音转文本的核心优势是什么?
在哪些场景会用到Google Cloud的语音转文本?
创建音频转写内容 了解如何在 Cloud 控制台中使用 Speech-to-Text API 只通过几个步骤创建音频转写内容。您还可以转录短音频、长音频和流式音频。 |
|
利用 AI 为视频创建字幕 转写音频和视频以添加字幕。为现有内容添加字幕,或实时向流式传输内容添加字幕。我们的视频转写模型非常适合为视频和/或有多人说话的内容编制索引或编排字幕,该模型使用与 YouTube 视频字幕类似的机器学习技术。本教程介绍了如何使用 Google Cloud AI 服务 Speech-to-Text API 和 Translation API 为视频添加字幕,以及提供其他语言的本地化字幕。 |
|
将 Speech-to-Text 添加到应用 了解如何借助 Google Cloud 快速轻松地为您的应用启用 Speech-to-Text。此视频介绍了如何在没有大量机器学习模型经验的情况下将 AI 添加到您的应用。利用预训练的 Speech-to-Text API,您可以快速轻松地为应用启用 AI。 |
|
利用 Google Cloud API 处理语言、语音、文本和翻译 在本课程中,您将使用 Speech-to-Text API 将音频文件转录为文本文件,使用 Google Cloud Translation API 进行翻译,并使用 Natural Language AI 创建合成语音。 |

