使用 Gemini 1.5 Pro API 开发 AI 应用程序的完整指南

在本指南中，我们将详细介绍如何使用 Gemini 1.5 Pro API 开发自己的 AI 应用程序，包括获取 API 密钥、安装所需库、配置 API，以及如何利用 API 的高级功能。

获取 API 密钥

在开始使用 Gemini 1.5 Pro API 之前，您需要从 Google AI 开发者页面获取 API 密钥。此密钥用于验证您的请求并允许访问 API。

前往 Google AI 开发者页面。
使用您的 Google 帐户登录。
创建一个新项目或选择现有项目。
一旦项目设置完成，系统将生成一个 API 密钥。请妥善保存此密钥，因为所有 API 请求都需要它。

安装 API 库

接下来，您需要安装 Gemini 1.5 Pro API 的 Python 库。

打开终端或命令提示符。
使用以下命令安装所需的库：
```
pip install google-generativeai
```

安装完成后，您可以在 Python 脚本中导入相关库：

import google.generativeai as genai
from google.generativeai.types import ContentType
from PIL import Image

配置 API 密钥

在代码中配置您的 API 密钥，以便与 Gemini 1.5 Pro API 进行交互。

GOOGLE_API_KEY = '在这里输入您的API密钥'
genai.configure(api_key=GOOGLE_API_KEY)

将 GOOGLE_API_KEY 替换为您在获取 API 密钥步骤中生成的密钥。

访问 Gemini 1.5 Pro 模型

Gemini 1.5 Pro API 提供多种模型，每种模型都有不同的功能和专长。在本示例中，我们将使用最新版本的模型 gemini-1.5-pro-latest。

model = genai.GenerativeModel('gemini-1.5-pro-latest')

使用 API 生成内容

生成纯文本内容

您可以通过 generate_content 方法生成文本内容。例如：

request = "写一个关于魔法背包的故事。"
response = model.generate_content(request)
print(response.text)

上述代码将根据请求生成文本内容，并在控制台中输出结果。

生成多模态内容

Gemini 1.5 Pro API 支持多模态输入，例如结合文本和图像的请求。以下是生成图像描述的示例：

from PIL import Image

text_request = "详细描述图像。"
image = Image.open('sample.jpg')
request = [text_request, image]
response = model.generate_content(request)
print(response.text)

在此示例中，API 将根据输入的文本和图像生成详细描述。

高级功能

多轮对话

Gemini 1.5 Pro API 支持多轮对话功能，您可以通过以下代码实现：

model = genai.GenerativeModel('gemini-1.5-flash')
chat = model.start_chat(history=[])
response = chat.send_message("想象一下，你是一个雪人，留在你的角色中的每个答案。")
print(response.text)

response = chat.send_message("一年中最喜欢的时间是什么？")
print(response.text)

通过 send_message 方法，您可以与模型进行多轮交互。

流式回复

API 支持流式数据返回，可在生成内容时实时接收响应，提高用户体验：

response = model.generate_content(request, stream=True)
for chunk in response.iter_text():
    print(chunk, end='')

嵌入生成

Gemini API 提供嵌入服务，可生成单词、短语和句子的嵌入，用于语义搜索、文本分类等任务：

from google.generativeai import EmbeddingModel

embeddings_model = EmbeddingModel()
text = "这是一个示例句子。"
embeddings = embeddings_model.get_embeddings(text)
print(embeddings)

与 Anakin.ai 的 API 集成

Anakin.ai 提供全面的 API 服务，支持与 Gemini API 的无缝集成，帮助开发人员快速构建 AI 应用程序。

API 集成的优势

快速开发满足业务需求的 AI 应用程序。
支持多种 AI 模型供应商，灵活切换。
提供直观的可视化界面和实时实施功能。
预览即将推出的高级功能。

设置与使用步骤

设置计划并检查账户余额

确保账户余额充足，以支持 API 调用。
生成 API 访问令牌

在 Anakin.ai 的管理页面生成新的 API 访问令牌，并妥善保存。

调用 API

以下是调用 Quick App API 的示例：

curl --location --request POST 'https://api.anakin.ai/v1/quickapps/{{appId}}/runs' 
--header 'Authorization: Bearer ANAKINAI_API_ACCESS_TOKEN' 
--header 'X-Anakin-API-Version: 2024-05-06' 
--header 'Content-Type: application/json' 
--data-raw '{"input": {"product/service": "云服务", "features": "可靠性和性能"}, "stream": true}'

替换 {{appId}} 和 ANAKINAI_API_ACCESS_TOKEN 为实际值。

总结

通过 Gemini 1.5 Pro API 和 Anakin.ai 的集成，开发人员可以轻松构建功能强大的 AI 应用程序，从文本生成到多模态内容处理，再到高级嵌入服务。这些工具为开发人员提供了极大的灵活性和便捷性，助力快速实现创新想法。

建议定期查看官方文档，了解最新功能和更新，以充分利用这些强大的工具。

原文链接: http://anakin.ai/de/blog/how-to-use-the-gemini-1-5-pro-api/

使用 Gemini 1.5 Pro API 开发 AI 应用程序的完整指南