商业LLM及其API - 积累点
在这篇文章中,我们简要回顾了当前最受欢迎的商业LLM(大语言模型)API(截至3月19日更新)。具体来说,我们探讨了OpenAI、Google(Gemini)、Anthropic(Claude)、Cohere、Mistral和Perplexity的API,并概述了它们的主要功能和特点。
为什么关注商业LLM API?
我们撰写本文的目的是帮助行业更好地在业务中应用LLM。通常情况下,由于安全性和隐私问题,使用本地非商业引擎是更安全的选择,因为这样可以避免将敏感数据传输到外部基础设施。然而,商业API也有其独特的优势:
- 隐私协议:大多数商业供应商提供了完善的隐私协议,以保护用户数据。
- 功能领先:商业API通常提供行业领先的功能,推动了技术的创新和开源产品的发展。
因此,了解这些商业API的功能和特点对于行业应用具有重要意义。
商业LLM API的主要功能
商业LLM API的核心功能可以概括为以下三类:
1. 基本消息/聊天
这是最常见的功能,允许用户发送提示并接收响应。大多数情况下,提示和响应是文本形式,但某些供应商还支持图像或其他形式的数据。
2. 函数调用
通过函数调用,LLM可以与外部功能(如计算器或网络搜索)交互。用户可以定义自定义函数,API会根据需要为应用程序提供使用这些函数的说明。这种功能扩展了LLM的能力,使其能够完成更复杂的任务。
3. 嵌入
嵌入功能允许用户发送文本并接收嵌入向量作为响应。这些嵌入向量通常用于构建检索、语义搜索和基于检索增强生成(RAG)的应用程序。
其他功能
除了上述核心功能外,部分API还提供微调、图像生成、文本转语音等高级功能。
使用API的基本流程
使用商业LLM API通常需要以下步骤:
- 获取API密钥:从供应商处注册并获取API密钥,用于身份验证和计费。
- 发送HTTPS请求:通过HTTPS请求与API通信,可以直接使用工具(如cURL)或编程语言(如Python、Node.js)实现。
以下是一个使用OpenAI API的cURL示例:
curl https://api.openai.com/v1/chat/completions
-H "Content-Type: application/json"
-H "Authorization: Bearer $OPENAI_API_KEY"
-d '{
"model": "gpt-3.5-turbo",
"messages": [{"role": "system", "content": "你是一个富有诗意的助手,擅长用创造性的天赋解释复杂的编程概念。"}]
}'
各供应商API概述
OpenAI
OpenAI是目前最成熟的商业LLM供应商,其ChatGPT产品处于行业领先地位。
- 消息传递:支持聊天完成API和JSON模式。
- 函数调用:内置功能包括代码解释器和知识检索。
- 嵌入:提供多种嵌入模型,如
text-embedding-ada-002。 - 支持语言:Python、Node.js。
- 其他功能:微调、图像生成、文本转语音等。
Google Gemini
Google的Gemini API是其PaLM API的升级版,支持更大的上下文窗口,适用于复杂任务。
Anthropic Claude
Anthropic的Claude 3在某些基准测试中表现优于GPT-4,提供三种模型(Haiku、Sonnet和Opus)以满足不同需求。
Cohere
Cohere专注于自然语言处理(NLP)服务,其API设计适合构建RAG应用程序。
Mistral
Mistral的API目前仍在完善中,更多细节有待披露。
Perplexity
Perplexity的API支持基本消息传递,但不支持函数调用和嵌入功能。
- 支持语言:Python、Node.js、Ruby、PHP。
其他供应商
- Clarifai:提供多种机器学习任务的API,包括包装其他商业LLM API。
- Groq:专注于高效硬件平台,支持多个开放模型的运行。
商业LLM API的未来发展
随着2024年的到来,LLM领域将继续快速发展。尽管如此,商业LLM API的功能已经趋于稳定,并且足够成熟,可以集成到各种业务应用中。
原文链接: https://www.accumulationpoint.com/blog/post/commercial-llm-apis/