所有文章 > API开发 > 掌握 Google Gemini API
掌握 Google Gemini API

掌握 Google Gemini API

Google Gemini API综合指南

在本 Google Gemini API 指南中,我将解释如何使用 Google Gemini API 从提示生成文本。 此外,我将演示如何使用 Google Gemini Vision 模型通过传递图像来生成内容。本教程将非常精彩,让我们开始吧!

要利用 Google Gemini Pro 的强大功能处理文本和聊天对话,并利用 Google Gemini Pro Vision 来处理图像,您需要“google-generativeai”软件包。首先使用“!pip install google-generativeai”安装它。 🔥

安装:

!pip install google-generativeai

🚀导入一些重要的库

import google.generativeai as genaiimport osfrom google.colab import userdatafrom IPython.display import Markdown
#give gemini api to google generative AIgeminiKey = userdata.get('geminiKey')genai.configure(api_key = geminiKey)

该代码用于通过配置 API 密钥来设置与 Gemini API 交互的身份验证,您可以从 Google AI studio 对其进行评估,然后将其设置到您的环境中。

# get the modelmodel = genai.GenerativeModel('gemini-pro')response = model.generate_content('Explain me Quantum Computing like I’m a 5-year-old ')
  1. model = genai.GenerativeModel(‘gemini-pro’):这一行使用 genai 库中的 GenerativeModel 类初始化一个名为 model 的生成模型对象。选择用于初始化的模型指定为 “gemini-pro”。
  2. response = model.generate_content(‘Explain me Quantum Computing like I’m a 5-year-old ‘):这一行从初始化的模型中生成内容。它调用了模型对象的 generate_content 方法,并将提示作为输入。提供的提示是 “像 5 岁小孩一样向我解释量子计算”。模型将尝试根据该提示生成内容。
print(response.text)

打印 response.text 会输出生成的文本,让你看到生成模型用简单的语言解释了量子计算。

此提示的输出结果:像 5 岁小孩一样给我解释量子计算
Markdown(response.text)

通过附带 response.text,我们将生成的原始文本转换为 Markdown 格式。

以 Markdown 格式输出

Gemini-Pro 聊天对话

再次加载 Gemini pro 模型

model = genai.GenerativeModel('gemini-pro')chat = model.start_chat(history=[])
  • 使用 genai 库中的 GenerativeModel 类创建名为 model 的对象。
  • 参数 “gemini-pro “表示我们要使用 Gemini-Pro 模型(Google AI 的大型语言模型)。
  • 开始聊天会话
  • chat = model.start_chat(history=[])
  • 这一行调用模型对象上的 start_chat 方法。
  • start_chat 方法会启动与所选模型(本例中为 Gemini-Pro)的聊天会话。
  • 作为 start_chat 参数传递的空列表 [] 表示聊天开始时没有任何之前的对话记录。

response = chat.send_message('What is Quantum physics'):

  • 该行试图通过聊天对象(chat)发送一条信息(”什么是量子物理学”)。
  • Markdown(response.text):
  • 这一行是从 chat.send_message 调用返回的响应对象。然后,它会从响应中提取文本并将其传递给 Markdown 函数。Markdown 函数会将原始格式转换为 Markdown 格式。
本提示的输出:什么是量子物理学
response = chat.send_message('Explain me LLM in simple words')Markdown(response.text)
此提示的输出:用简单的话解释一下 LLM
for text in chat.history:  display(Markdown(f"**{text.role}**: {text.parts[0].text}"))

这段代码会遍历聊天记录,并以格式化的方式显示每个提示和交叉回复。

Gemini-Pro 视觉模型

首先,导入图像

from PIL import Imageimage = Image.open('/content/tesla truck.jpg')

让我们与谷歌生成式人工智能模型–Gemini-Pro Vision 进行互动。

model = genai.GenerativeModel('gemini-pro-vision')response = model.generate_content(image)Markdown(response.text)

model = genai.GenerativeModel('gemini-pro-vision'):

  • 创建名为 model 的模型对象。
  • .GenerativeModel(‘gemini-pro-vision’) 部分说明我们正在初始化一个用于处理 “gemini-pro-vision “模型的模型。

response = model.generate_content(image):

  • 这种方法将图像数据发送到 Geminii-Pro Vision 模型,促使其根据图像生成内容。内容可以是描述、解释或相关信息。
  • 该方法的结果存储在响应变量中。

Markdown(response.text):

  • 将提取的文本转换成 Markdown 格式。

模型在图像上的输出

我们还可以根据图片生成内容,如博客文章,要根据图片生成内容,我们需要通过图片提示。

response = model.generate_content(['Write a blog post about that image', image])Markdown(response.text)

结论

我们已经探索了 Google Gemini API 的功能,并演示了如何在不产生成本的情况下利用它来生成内容。Gemini API可以生成从文本到图像等各种内容。这就为创意项目、研究工作和创新应用提供了令人兴奋的可能性,而无需承担经济负担。

幂简集成API HUB也为大家汇集了很多Google系列API,若您有需要请访问我们!

原文链接:Mastering the Google Gemini API

#你可能也喜欢这些API文章!
搜索、试用、集成国内外API!
幂简集成API平台已有 4030种API!
API大全