Amazon 文本数据提取服务-Textract

Amazon 文本数据提取服务-Textract

专用API
【更新时间: 2024.06.18】 Amazon Textract是一种机器学习服务,能够自动从扫描的文档中提取文本、手写内容、布局元素和数据。它超越了传统的光学字符识别,能够识别、理解和提取文档中的特定数据。Textract文本提取器支持多种文档格式。
服务星级:2星
⭐ ⭐ 🌟 🌟 🌟 🌟 🌟
调用次数
0
集成人数
0
商用人数
0
! SLA: N/A
! 响应: N/A
! 适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
<
产品介绍
>

什么是Textract的Amazon 文本数据提取服务?

Amazon Textract 是一种高度先进的文本提取器,它使用机器学习技术从扫描文档中自动提取文本、手写内容、布局元素和数据。这项服务超越了传统的OCR技术,能够识别文本、理解和提取文档中的具体数据,从而显著提高了数据处理的效率和准确性。

 

Textract文本提取器支持多种文档格式,包括PDF、TIFF、PNG和JPEG,使其成为金融服务、医疗保健、公共部门等多个领域的理想选择。用户可以通过AWS管理控制台、AWS CLI或AWS SDK轻松使用这项服务,快速提取关键业务数据,如金融表格中的抵押贷款利率、申请人姓名和发票总额。

 

此外,Textract文本提取器还提供了强大的自定义功能,允许用户根据自己的业务需求定制预训练模型,以满足特定的文档处理需求。这意味着用户可以快速自动化文档处理流程,无论是处理贷款还是从发票和收据中提取信息,都能够在几分钟内完成,而不是之前的几小时甚至几天。

什么是Textract的Amazon 文本数据提取服务?

由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用Textract的Amazon 文本数据提取服务,从而实现程序的自动化交互,提高服务效率。

Textract的Amazon 文本数据提取服务有哪些核心功能?

  1. 文本、手写和布局元素提取智能化文本处理能够从文档中提取文本、手写内容和布局元素,如段落、标题、列表、页眉、页脚等,实用的文本工具

  2. 边界框坐标返回:所有提取的数据都会返回边界框坐标(多边形框架),帮助用户确定每一段已识别的数据在文档中的具体位置。

  3. 置信度分数:Amazon Textract还为它识别的所有内容返回置信度分数,以便用户可以根据这些分数就如何使用结果做出明智的决定。

  4. 自定义查询:允许用户自定义预训练的模型,以提高特定业务文档类型的提取准确性。

  5. 光学字符识别(OCR):自动从文档和图像中检测并识别打印文本和手写文本,应用OCR提升办公效率

  6. 表格数据提取:能够识别文档中的表格,并保留表格的结构和其中的数据关联。

  7. 签名检测:能够检测文档或各种图像及AI图像上的签名,并返回签名的位置和置信度分数。

  8. 基于查询的抽取:允许用户以自然语言的形式指定所需的数据,并自动从文档中提取这些信息。

  9. 分析贷款(Analyze Lending API):专门用于从贷款包中提取信息的实用文本处理API轻松实现业务需求

  10. 发票和收据提取高效票据和收据的识别,并自动提取相关数据。

  11. 身份证件提取(Analyze ID):从身份文档中自动提取信息,如姓名、地址、有效期等。

Textract的Amazon 文本数据提取服务的技术原理是什么?

Amazon Textract 是一种机器学习(ML)服务,它作为强大的textract文本提取器,从扫描的文档(如 PDF)中自动提取文本、手写内容、布局元素和数据。与传统的光学字符识别技术(OCR)不同,textract文本提取器可以识别、理解并提取文档中的特定数据。在当今的商业环境中,许多公司都需要从扫描文档(如 PDF、图片、表格和表单)中手动提取数据,或依赖需要手动配置的简单OCR软件,这些软件在表单发生变化时往往需要重新配置。为了避免这些昂贵且耗时的手动流程,textract文本提取器使用 ML 来读取和处理任何类型的文档,可以精确地提取文本、手写字、表格和其他数据,而不需要任何手动工作。
 
作为应用程序开发中不可或缺的开放API,textract文本提取器提供了实用的文本API,使您可以使用我们的预训练或自定义功能来快速自动处理文档。无论是自动处理贷款还是从发票和收据中提取信息,textract文本提取器都能助您轻松实现业务需求。与传统方法相比,textract文本提取器可以在几分钟内提取数据,而不再需要耗费几小时甚至几天的时间,显著提高了工作效率。

 

Textract的Amazon 文本数据提取服务的核心优势是什么?

  1. 高精度文本识别:textract文本提取器不仅仅是OCR,它能识别、理解并提取文档中的特定数据,包括表格数据提取和签名检测。

  2. 支持多种文档格式:textract文本提取器支持PDF、TIFF、PNG和JPEG等多种文档格式,适用于金融服务、医疗保健、公共部门等多个领域。

  3. 易于集成:用户可以通过AWS管理控制台、AWS CLI或AWS SDK轻松使用textract文本提取器,快速提取关键业务数据。

  4. 自定义预训练模型:textract文本提取器允许用户自定义预训练功能,以满足特定的文档处理需求。

  5. 快速处理能力:textract文本提取器可以在几分钟内提取数据,而不再需要耗费几小时甚至几天的时间。

  6. 数据安全与合规:使用数据隐私、加密和合规性标准安全地自动处理数据。

  7. 低成本:使用 textract文本提取器,您只需为分析文档付费,没有最低费用或预付费用,采用分级定价模式。

  8. 持续学习与更新:textract文本提取器始终从新数据进行学习,Amazon 会不断向此服务添加新功能。

  9. 异步与同步处理:textract文本提取器提供同步处理,可以分析延迟至关重要的应用程序的单页文档,同时也提供异步操作以将支持扩展到多页文档。

  10. 与其他AWS服务集成:textract文本提取器可以与其他AWS服务(如Amazon Comprehend、Amazon Translate)集成,提供更深层次的文本分析和数据处理能力。

在哪些场景会用到Textract的Amazon 文本数据提取服务?

1. 金融服务

准确提取有关金融科技的抵押贷款利率、申请人姓名和发票总额等各种金融表格的关键业务数据,以在数分钟内处理贷款和抵押贷款申请。

2. 医护及生命科学

从健康摄食表单、保险金申请和预授权表单中提取重要患者数据,结合医疗大模型可以更好地为患者和保险公司服务。保持数据在其原始上下文中组织有序,免去对输出的人工审查。

3. 公共部门

轻松地从政府相关表格中提取相关数据,例如小企业贷款、联邦税表或商业申请,具有高度的准确性。

<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
设置并登录您的 AWS 账户 观看网络研讨会并阅读文档 登录 Polly 控制台并开始构建。
<
产品问答
>
?
目前,哪些区域提供 Amazon Polly 服务?
请参阅 AWS 区域服务列表了解支持 Amazon Polly 标准语音的所有区域。这些区域的以下子集支持神经语音:美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、亚太地区(东京)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、非洲(开普敦)、欧洲(伦敦)、欧洲(法兰克福)、欧洲(爱尔兰)亚太地区和 AWS GovCloud (美国西部)。
?
如何开始使用 Amazon Polly?
您只需登录到您的 AWS 账户,前往 Amazon Polly 控制台(AWS 控制台的一部分),即可开始使用该产品。接下来,您可以使用控制台输入任何文本并收听生成的语音,或将其另存为音频文件。
?
Amazon Polly 支持哪些音频格式?
借助 Amazon Polly,您可以近乎实时地将音频流式传输给您的用户。Amazon Polly 还提供多种采样率供您选择,便于您为应用程序优化带宽和音频质量。Amazon Polly 支持 MP3、Vorbis 和原始 PCM 音频流格式。
?
Amazon Polly 是否有 AWS 服务限制?
为了帮助保证 AWS 资源的可用性并最大限度降低新客户的账单风险,AWS 对每个账户均设置有服务限制。使用 Amazon Polly 为应用程序提供高质量语音输出功能时,需遵循默认的服务限制,包括对限制设置、操作和语音合成标记语言 (SSML) 的使用的限制。有关详情,请参阅《Amazon Polly 开发人员指南》中的 Limits in Amazon Polly。将 Polly Amazon 与其他 AWS 服务(例如可以高效进行批处理的 AWS Batch)结合使用,您可以在这些服务的限制内充分利用 Amazon Polly。
?
Amazon Polly 支持哪些编程语言?
Amazon Polly 支持 AWS 软件开发工具包中包含的所有编程语言(Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++)以及 AWS 移动软件开发工具包中包含的所有编程语言 (iOS/Android)。Amazon Polly 还支持 HTTP API,因此您可以实施自己的访问层。
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
最可能同场景使用的其他API
>
API接口列表
<
产品价格
>
按实际使用量付费模式

您按月付费,计费依据是您处理的文本的字符数量。Amazon Polly 的标准语音定价为:对于超出免费套餐的语音或语音标记请求,每 100 万个字符 4.00 USD。Amazon Polly 的神经语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 16.00 USD。Amazon Polly 的长格式语音定价为:对于超出免费套餐的语音或请求的语音标记,每 100 万个字符 100.00 USD。 Amazon Polly 的生成式语音定价为:对于超出免费套餐的语音请求,每 100 万个字符 30 USD。

每月数百万个字符

对于 Amazon Polly 的标准语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 500 万个字符服务。对于神经语音,从您提交第一个语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 100 万个字符服务。对于长格式语音,从您提交第一个 Polly 语音或语音标记请求起 12 个月内,针对该类请求,免费套餐每个月提供 50 万个字符服务。 对于生成式语音,从您提交第一个 Polly 语音请求起 12 个月内,针对该类请求,免费套餐每个月提供 10 万字符的服务。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
设置并登录您的 AWS 账户 观看网络研讨会并阅读文档 登录 Polly 控制台并开始构建。
<
依赖服务
>
<
产品问答
>
?
目前,哪些区域提供 Amazon Polly 服务?
请参阅 AWS 区域服务列表了解支持 Amazon Polly 标准语音的所有区域。这些区域的以下子集支持神经语音:美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、亚太地区(东京)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、非洲(开普敦)、欧洲(伦敦)、欧洲(法兰克福)、欧洲(爱尔兰)亚太地区和 AWS GovCloud (美国西部)。
?
如何开始使用 Amazon Polly?
您只需登录到您的 AWS 账户,前往 Amazon Polly 控制台(AWS 控制台的一部分),即可开始使用该产品。接下来,您可以使用控制台输入任何文本并收听生成的语音,或将其另存为音频文件。
?
Amazon Polly 支持哪些音频格式?
借助 Amazon Polly,您可以近乎实时地将音频流式传输给您的用户。Amazon Polly 还提供多种采样率供您选择,便于您为应用程序优化带宽和音频质量。Amazon Polly 支持 MP3、Vorbis 和原始 PCM 音频流格式。
?
Amazon Polly 是否有 AWS 服务限制?
为了帮助保证 AWS 资源的可用性并最大限度降低新客户的账单风险,AWS 对每个账户均设置有服务限制。使用 Amazon Polly 为应用程序提供高质量语音输出功能时,需遵循默认的服务限制,包括对限制设置、操作和语音合成标记语言 (SSML) 的使用的限制。有关详情,请参阅《Amazon Polly 开发人员指南》中的 Limits in Amazon Polly。将 Polly Amazon 与其他 AWS 服务(例如可以高效进行批处理的 AWS Batch)结合使用,您可以在这些服务的限制内充分利用 Amazon Polly。
?
Amazon Polly 支持哪些编程语言?
Amazon Polly 支持 AWS 软件开发工具包中包含的所有编程语言(Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++)以及 AWS 移动软件开发工具包中包含的所有编程语言 (iOS/Android)。Amazon Polly 还支持 HTTP API,因此您可以实施自己的访问层。
<
关于我们
>
亚马逊云科技(Amazon Web Services,简称AWS)是全球领先的云计算服务提供商,提供包括计算、存储、数据库、分析、机器学习、物联网、移动、安全、混合云、虚拟和增强现实等在内的广泛服务。AWS在全球34个地理区域内运营108个可用区,服务超过200个国家和地区,帮助企业、开发者和政府机构构建灵活、可靠、可扩展的云基础设施。作为亚马逊公司的一部分,AWS致力于提供创新的云解决方案,支持客户实现数字化转型。
联系信息
服务时间: 早9:00-晚8:00 (法定假期除外)
电话号码: +86 (10) 1010 0866
网页在线客服: 咨询

AWS 云计算

Amazon Web Services(AWS)是全球最全面、应用最广泛的云,从全球数据中心提供超过 200 项功能齐全的服务。数百万客户(包括增长最快速的初创公司、最大型企业和主要的政府机构)都在使用 AWS 来降低成本、提高敏捷性并加速创新。

 

 

<
合作案例
>
engie ascender caratlane
<
最可能同场景使用的其他API
>