Gemini 开发者 API 怎么用?接入指南(附示例)

发布于:2025-06-07 ⋅ 阅读:(21) ⋅ 点赞:(0)

如果你是开发者、AI 工具作者、个人站长,可能已经关注到:Google 推出的 Gemini 不仅是聊天助手,它也开放了开发者 API,可以像调用 OpenAI 的 GPT-4 一样调用 Gemini 模型。

但很多中文用户还不太清楚 Gemini 的 API 怎么用、能干嘛、用起来和 OpenAI 有啥区别、需要哪些前置条件。

这篇文章就来讲清楚:
Gemini 开发者 API 怎么用?怎么申请?怎么调用?


一、Gemini API 能做什么?

Gemini API 是 Google 为开发者开放的大模型接口,核心是对接 Gemini 1.5 Pro 模型。

你可以用它来做:

  • 多轮对话 AI(类 ChatGPT)
  • 文件问答(上传 PDF、Word、TXT 等)
  • 图像识别、多模态输入
  • 编写代码、解释代码、调试脚本
  • 智能摘要、信息提取、结构化数据生成

适合场景包括客服系统、AI 内容生成、自动化工具、教育类产品、编程辅助等。


二、Gemini API 官方地址和文档

Gemini API 是 Google 的 Vertex AI 服务的一部分。


三、使用 Gemini API 的前置条件

想调用 Gemini 模型,你需要具备以下几点:

  1. 一个 Google 账号(设置为美区最佳)
  2. 启用 Google Cloud 项目
  3. 开通 Vertex AI API
  4. 绑定有效的付款方式(国外信用卡或虚拟 Visa 卡)
  5. 获取 API Key 或设置服务账户凭证
  6. 获取 API Key 充值入口

四、快速开始:Gemini API Python 示例

  1. 安装 SDK:
pip install google-generativeai
  1. 初始化 API:
import google.generativeai as genai

genai.configure(api_key="你的 API KEY")

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("帮我总结一下量子计算的核心概念")
print(response.text)
  1. 上传文件进行问答(需要 gemini-pro-vision):
model = genai.GenerativeModel('gemini-pro-vision')
with open("example.png", "rb") as img:
    image_data = img.read()

response = model.generate_content(
    ["这张图有什么内容?", {"mime_type": "image/png", "data": image_data}]
)
print(response.text)
  1. 支持多轮对话上下文:
chat = model.start_chat()
chat.send_message("你能写一个快速排序吗?")
chat.send_message("那能用 Python 改写吗?")

五、费用说明

Gemini API 定价(以 Gemini 1.5 Pro 为例):

  • 输入 tokens:约 $0.000125 / 1000 tokens
  • 输出 tokens:约 $0.000375 / 1000 tokens
  • 长上下文窗口(1M tokens)非常适合大文档处理

免费额度:注册后默认可用部分免费 tokens,适合测试、开发。


网站公告

今日签到

点亮在社区的每一天
去签到