面向Anthropic的Claude的Elasticsearch开放推理API

作者:API传播员 · 2025-12-18 · 阅读时间:4分钟

我们很高兴地宣布,生成式AI(GenAI)应用程序。此前,用户只能通过Amazon Bedrock等提供商访问此功能,而现在,他们可以直接使用自己的Anthropic账户实现这些目标。


使用Anthropic的信息回答问题

配置推理端点

首先,我们需要配置一个推理端点,该端点将与Anthropic的消息API交互。在成功创建推理端点后,系统会返回类似以下的响应,状态代码为“200 OK”。

接下来,我们可以调用配置好的端点来处理任何文本输入。例如,我们可以向模型询问GenAI的简短描述,并期望获得状态代码为“200 OK”的响应,同时返回GenAI的简要说明。

创建问题目录并索引

我们可以建立一个问题目录,用于在数据摄入过程中得到解答。通过Elasticsearch Bulk API,我们可以为以下与Elastic产品相关的问题进行索引。索引成功后,系统会返回类似的响应,确认操作完成。

创建问答摄入管道

接下来,我们使用脚本推理功能创建一个问答摄入管道,并删除处理器。该管道会在“问题”字段前添加文本“请回答以下问题:”,并将其存储在名为“提示”的临时字段中。随后,临时字段的内容通过推理API发送到Anthropic服务。

这种方法提供了极大的灵活性,用户可以根据需求设置预提示。此外,这种方法还可用于文档摘要生成。

通过问答管道处理文档

我们可以通过调用reindex API,将包含问题的文档通过问答管道发送处理。操作完成后,系统会返回类似的响应。

在生产环境中,用户可能会采用其他自动化方式摄入文档。有关更多摄入选项,请参考Elastic的《向Elasticsearch添加数据》指南。此外,我们还提供了使用第三方工具将数据导入Elasticsearch的指导。例如,您可以了解如何使用Meltano将数据从Snowflake摄入到Elasticsearch。


使用搜索API获取答案

完成数据摄入后,我们可以使用搜索API来查询预先生成的答案。响应将包含这些预生成的答案。

这种方法在降低运营成本方面非常有效。通过减少即时响应生成的需求,可以显著降低计算资源的使用。此外,这种方法确保每位用户都能获得一致且精确的信息。这种一致性在医疗、法律或技术支持等需要高可靠性和准确性的领域尤为重要。


总结

通过将Anthropic的Claude集成到Elasticsearch Open推理API中,Elastic用户可以更高效地构建生成式AI应用程序。这种集成不仅简化了问答功能的实现,还显著提升了数据处理的灵活性和一致性。未来,随着更多工具和功能的支持,用户将能够进一步优化其AI应用程序的性能和可靠性。


原文链接

点击查看原文

原文链接: https://www.elastic.co/search-labs/blog/elasticsearch-anthropic-support