商业LLM及其API - 积累点

作者:API传播员 · 2025-12-15 · 阅读时间:4分钟

在这篇文章中,我们简要回顾了当前最受欢迎的商业LLM(大语言模型)API(截至3月19日更新)。具体来说,我们探讨了OpenAI、Google(Gemini)、Anthropic(Claude)、Cohere、Mistral和Perplexity的API,并概述了它们的主要功能和特点。


为什么关注商业LLM API?

我们撰写本文的目的是帮助行业更好地在业务中应用LLM。通常情况下,由于安全性和隐私问题,使用本地非商业引擎是更安全的选择,因为这样可以避免将敏感数据传输到外部基础设施。然而,商业API也有其独特的优势:

  1. 隐私协议:大多数商业供应商提供了完善的隐私协议,以保护用户数据。
  2. 功能领先:商业API通常提供行业领先的功能,推动了技术的创新和开源产品的发展。

因此,了解这些商业API的功能和特点对于行业应用具有重要意义。


商业LLM API的主要功能

商业LLM API的核心功能可以概括为以下三类:

1. 基本消息/聊天

这是最常见的功能,允许用户发送提示并接收响应。大多数情况下,提示和响应是文本形式,但某些供应商还支持图像或其他形式的数据。

2. 函数调用

通过函数调用,LLM可以与外部功能(如计算器或网络搜索)交互。用户可以定义自定义函数,API会根据需要为应用程序提供使用这些函数的说明。这种功能扩展了LLM的能力,使其能够完成更复杂的任务。

3. 嵌入

嵌入功能允许用户发送文本并接收嵌入向量作为响应。这些嵌入向量通常用于构建检索、语义搜索和基于检索增强生成(RAG)的应用程序。

其他功能

除了上述核心功能外,部分API还提供微调、图像生成、文本转语音等高级功能。


使用API的基本流程

使用商业LLM API通常需要以下步骤:

  1. 获取API密钥:从供应商处注册并获取API密钥,用于身份验证和计费。
  2. 发送HTTPS请求:通过HTTPS请求与API通信,可以直接使用工具(如cURL)或编程语言(如Python、Node.js)实现。

以下是一个使用OpenAI API的cURL示例:

curl https://api.openai.com/v1/chat/completions 
-H "Content-Type: application/json" 
-H "Authorization: Bearer $OPENAI_API_KEY" 
-d '{
  "model": "gpt-3.5-turbo",
  "messages": [{"role": "system", "content": "你是一个富有诗意的助手,擅长用创造性的天赋解释复杂的编程概念。"}]
}'

各供应商API概述

OpenAI

OpenAI是目前最成熟的商业LLM供应商,其ChatGPT产品处于行业领先地位。

  • 消息传递:支持聊天完成API和JSON模式。
  • 函数调用:内置功能包括代码解释器和知识检索。
  • 嵌入:提供多种嵌入模型,如text-embedding-ada-002
  • 支持语言:Python、Node.js。
  • 其他功能:微调、图像生成、文本转语音等。

Google Gemini

Google的Gemini API是其PaLM API的升级版,支持更大的上下文窗口,适用于复杂任务。

Anthropic Claude

Anthropic的Claude 3在某些基准测试中表现优于GPT-4,提供三种模型(Haiku、Sonnet和Opus)以满足不同需求。

Cohere

Cohere专注于自然语言处理(NLP)服务,其API设计适合构建RAG应用程序。

Mistral

Mistral的API目前仍在完善中,更多细节有待披露。

Perplexity

Perplexity的API支持基本消息传递,但不支持函数调用和嵌入功能。

  • 支持语言:Python、Node.js、Ruby、PHP。

其他供应商

  • Clarifai:提供多种机器学习任务的API,包括包装其他商业LLM API。
  • Groq:专注于高效硬件平台,支持多个开放模型的运行。

商业LLM API的未来发展

随着2024年的到来,LLM领域将继续快速发展。尽管如此,商业LLM API的功能已经趋于稳定,并且足够成熟,可以集成到各种业务应用中。


原文链接: https://www.accumulationpoint.com/blog/post/commercial-llm-apis/