通义听悟
专用API
服务商:
阿里巴巴达摩院(杭州)科技有限公司
【更新时间: 2024.08.19】
通义听悟API服务,在语音识别、翻译和发言人识别的基础上,提炼全文摘要、章节速览、发言总结、待办事项、PPT、问答、关键词等内容,对人与人交流的音视频进行分析与精简,帮助使用者快速了解音视频主要内容。
咨询
去服务商官网采购>
|
- API详情
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是通义听悟?
通义听悟API服务,在语音识别、翻译和发言人识别的基础上,提炼全文摘要、章节速览、发言总结、待办事项、PPT、问答、关键词等内容,对人与人交流的音视频进行分析与精简,帮助使用者快速了解音视频主要内容。
什么是通义听悟?
通义听悟有哪些核心功能?
- 语音转写:支持将实时音频流或音视频文件中的语音转写为文字,支持多种语言包括中文、英文、粤语、中英混和日语,能够将对话中的不同人物进行区分,支持两人或多人对话的识别。
- 章节速览:基于不同的交流话题对音视频内容进行章节划分,为每个章节提供一句话的总结标题,用简短文字(约250字)概括章节内容。
- 大模型摘要:对完整的音视频内容进行总结,对不同发言人的说话内容进行分别总结,需配合“语音转写”中的“说话人分离”功能,识别对话中的显性和隐性问题,并提炼回答内容。
- 智能纪要:从对话中提取关键词,识别对话中的待办事项,提取关键句,帮助用户快速定位重要信息,分析对话内容,识别出是面试、演讲还是会议等场景。
- PPT抽取和总结:从视频文件中抽取出现的PPT内容,对每页PPT的讲解语音进行摘要总结,并与PPT内容相互对应。
- 文本翻译:支持中英、中日双向实时互译,将音视频文件中的语音转写为文字后,支持中英、中日双向互译
通义听悟的核心优势是什么?
-
语音、语言、视觉多模态,17个AI功能灵活搭配:支持音视频信息处理与提取,所需的多种AI能力,除语音识别、翻译、发言人识别外,还包括全文摘要、章节速览、发言总结、待办事项、PPT、问答、关键词等功能。
-
对接速度快,省时省力:一套接口的参数化配置,即可开启不同场景中所需的AI能力,降低构建AI场景化服务的API对接成本,省时省力。
-
稳定服务:支持自定义主动消息推送通知与状态查询,提供多种异常情况处理机制,方便业务方进行上层业务逻辑处理。
在哪些场景会用到通义听悟?
-
实时会议记录:线上、线下会议使用通义听悟实时呈现多语言字幕;会后检索关键内容,可结合录音反复听取其中含义。完整会议录音和语音转文字结果,保证会议内容不被遗漏;音频与转写结果逐字对应,确保纪要撰写理解正确。待办事项提取可辅助会后任务跟进。
-
录音转写;使用智能工牌、手机、录音笔进行的录音,可通过通义听悟进行离线转写,并可分离发言人、查看全文概要、章节速览、发言总结。对门店服务、电话坐席进行内容分析与总结。
-
面试:实时记录一对一沟通交流的内容,避免因记录导致交流不畅或遗漏访谈内容,提高访谈效率和面试体验。
-
拜访纪要:智能纪要关键词和重点内容提取帮助销售人员快速了解交流重点;章节速览还原交流过程;待办事项保证客户的每项要求都不遗漏、可跟进。
-
企业培训:实时添加语言字幕,并能将培训关键词、主题进行提取,方便后续检索与定位。方便无法实时参加的人员在后续进行回看,提升培训内容在企业内部的持续价值。
-
教学视频分析:批量上传教学视频文件,可转写文字、知识点提取、教学内容分割,方便快速检索、定位、回看教学视频,学习更轻松。通过关键词总结,可分析教师授课的知识点覆盖度。
-
外语资料学习:英文或日语的音视频教学内容,实时转写并翻译成中文,拓宽学生的知识来源。尤其在出国留学的准备期,对提升听力有很大帮助
快速入门
本文档介绍快速入门体验,帮助您快速体验通义听悟能力。
入门流程
准备账号
1:注册阿里云账号,请参见注册阿里云账号。
2:个人实名认证,请参见个人实名认证。
3:(仅使用旧版接口或MQ回调才需要该步骤)创建并授权RAM用户,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制。联系主账户在RAM控制台按以下步骤授权,使用通义听悟管控台时需要读取对象存储OSS和Rocket MQ的列表。如果RAM子账户没有读取对象存储OSS和Rocket MQ的列表的权限,会出现下图提示:
创建AccessKey
1:创建阿里云账号的AccessKey,登录RAM访问控制台,使用阿里云账号创建AccessKey。
2:创建RAM用户的AccessKey(可选)使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。
快速入门
本文档介绍快速入门体验,帮助您快速体验通义听悟能力。
入门流程
准备账号
1:注册阿里云账号,请参见注册阿里云账号。
2:个人实名认证,请参见个人实名认证。
3:(仅使用旧版接口或MQ回调才需要该步骤)创建并授权RAM用户,请参见创建RAM用户。关于RAM用户的更多信息,请参见什么是访问控制。联系主账户在RAM控制台按以下步骤授权,使用通义听悟管控台时需要读取对象存储OSS和Rocket MQ的列表。如果RAM子账户没有读取对象存储OSS和Rocket MQ的列表的权限,会出现下图提示:
创建AccessKey
1:创建阿里云账号的AccessKey,登录RAM访问控制台,使用阿里云账号创建AccessKey。
2:创建RAM用户的AccessKey(可选)使用阿里云账号登录RAM访问控制台,为RAM用户创建AccessKey。