The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

了解支持的型号

对于移动应用和 Web 应用，Firebase AI Logic SDK 可让您直接从应用中与受支持的 Gemini 模型互动。

Gemini 模型之所以被视为多模态模型，是因为它们能够处理甚至生成多种模态的内容，包括文本、代码、PDF、图片、视频和音频。

此外，请查看我们的常见问题解答，了解 Firebase AI Logic 支持和不支持的所有模型。

通用模型

前往包含模型详细信息的表格

Gemini 3.x 个通用模型

我们的高级思维模型

Gemini 3.1 Pro

gemini-3.1-pro-preview

具备高级智能、复杂问题解决能力，以及强大的代理和氛围编码能力。 （需要结算）

FAST AND INTELLIGENT

Gemini 3.5 Flash

gemini-3.5-flash

以远低于大型模型的成本，实现可与 Frontier 级模型相媲美的性能。 （结算不是必需的）

超快

Gemini 3.1 Flash-Lite

gemini-3.1-flash-lite

一款高吞吐量、成本敏感型实用模型，具有 Gemini 3 系列的性能和质量。 （结算不是必需的）

Gemini 2.5 个通用模型

Gemini 2.5 Pro (gemini-2.5-pro)：Gemini 2.5 系列中最先进的模型，具有深度推理和编码能力。 （无需结算）
Gemini 2.5 Flash (gemini-2.5-flash)：Gemini 2.5 系列中性价比最高的模型，尤其适合需要推理的低延迟、大批量任务。 （无需结算）
Gemini 2.5 Flash (gemini-2.5-flash-lite)：Gemini 2.5 系列中最快速且最经济实惠的多模态模型。 （无需结算）

图片生成模型

前往包含模型详细信息的表格

Gemini 3.x 图片生成模型

Gemini 3 Pro Image（Nano Banana Pro）

gemini-3-pro-image

先进的图片生成和编辑模型，可创建高度情境化的原生图片。 （需要结算）

Gemini 3.1 Flash Image (Nano Banana 2)

gemini-3.1-flash-image

功能强大的高效图片生成和编辑模型，专为速度和大规模量产场景而优化。 （需要结算）

Gemini 3.1 Flash-Lite Image（Nano Banana 2 Lite）

gemini-3.1-flash-lite-image

超低延迟且经济实惠的图片生成和编辑功能，专为大批量互动应用场景而设计。 （需要结算）

Gemini 2.5 图片生成模型

Gemini 2.5 Flash Image（gemini-2.5-flash-image，又称“Nano Banana”）：专为速度和效率而设计，针对大批量、低延迟的任务进行了优化。 （需要结算）

音频生成模型

您可以使用支持 Gemini Live API 的模型生成流式音频。

前往包含模型详细信息的页面

Gemini 2.5 Flash（支持 Gemini Live API 原生音频）

Gemini Developer API：gemini-2.5-flash-native-audio-preview-12-2025

Vertex AI Gemini API：gemini-live-2.5-flash-native-audio

支持与双向 Gemini 模型进行低延迟、实时的语音和视频互动。 （结算不是必需的）

本页的其余部分详细介绍了 Firebase AI Logic 支持的型号。

比较模型：
- 支持的输入和输出
- 支持的功能的高级比较
- 规范和限制，例如输入 token 数上限或输入视频时长上限
说明模型如何进行版本控制，特别是其稳定版、自动更新版、预览版和实验版
在初始化期间包含在代码中的可用模型名称列表
模型支持的语言列表

在本页底部，您可以查看有关上一代模型的详细信息。

如需详细了解 Gemini Live API 模型（例如 gemini-live-2.5-flash-native-audio），请参阅Live API 的限制和规范。

对比模型

每种模型都具有不同的功能，可支持各种用例。请注意，本部分中的每个表格都描述了每个模型在与 Firebase AI Logic 搭配使用时的情况。每种模型可能都具有使用我们的 SDK 时无法使用的其他功能。

如果您在以下子部分中找不到所需信息，还可以在所选 API 提供商的文档中找到更多信息：Gemini Developer API 或 Vertex AI Gemini API。

如需详细了解 Gemini Live API 模型（例如 gemini-live-2.5-flash-native-audio），请参阅Live API 的限制和规范。

支持的输入和输出

下表列出了将每个模型与 Firebase AI Logic 搭配使用时支持的输入和输出类型。

如需了解支持的文件类型，请参阅支持的输入文件和要求。

	<span="notranslate">Gemini 3.x Pro、Flash、Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 3.x Pro 图片 </span="notranslate">	<span="notranslate">Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gemini 3.x Flash‑Lite 映像 </span="notranslate">
输入类型
文字
代码
文档（PDF 或纯文本）
图片
视频
音频
输出类型
文字
文本（流式传输）
代码
结构化输出（例如 JSON）
图片
音频

支持的输入和输出（Gemini 2.5 模型）

	<span="notranslate">Gemini 2.5 Pro、Flash、Flash‑Lite </span="notranslate">		<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">
输入类型
文字
代码
文档（PDF 或纯文本）
图片
视频
音频
输出类型
文字
文本（流式传输）
代码
结构化输出（例如 JSON）
图片
音频

支持的功能和特性

下表列出了将每种模型与 Firebase AI Logic 搭配使用时支持的功能和特性。

	<span="notranslate">Gemini 3.x Pro 图片 </span="notranslate">	<span="notranslate">Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gemini 3.x Flash‑Lite 映像 </span="notranslate">
思考型
根据纯文本输入或多模态输入生成文本	交错或作为图片的一部分	交错或作为图片的一部分	交错或作为图片的一部分
生成图片
修改图片
生成音频
生成结构化输出（例如 JSON）
分析文档（PDF 或纯文本）（文本输出 \| 图片输出）
分析图片（文本输出 \| 图片输出）
分析视频（文本输出 \| 图片输出）
分析音频
多轮对话
双向多模态流式传输
支持的工具
函数调用
代码执行
网址上下文
依托 Google Search 进行接地
依托 Google Maps 进行接地

支持的功能和特性（Gemini 2.5 模型）

	<span="notranslate">Gemini 2.5 Pro、Flash、Flash‑Lite </span="notranslate">		<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">
思考型
根据纯文本输入或多模态输入生成文本			交错或作为图片的一部分
生成图片
修改图片
生成音频
生成结构化输出（例如 JSON）
分析文档（PDF 或纯文本）（文本输出 \| 图片输出）
分析图片（文本输出 \| 图片输出）
分析视频（文本输出 \| 图片输出）
分析音频
多轮对话
双向多模态流式传输
支持的工具
函数调用
代码执行
网址上下文
依托 Google Search 进行接地
依托 Google Maps 进行接地

规范和限制

下表列出了将每种型号与 Firebase AI Logic 搭配使用时的规格和限制。

属性	<span="notranslate">Gemini 3.x Pro、Flash、Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 3.x Pro 图片 </span="notranslate">	<span="notranslate">Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gemini 3.x Flash‑Lite 映像 </span="notranslate">
输入 token 限制 *	1,048,576 个 token	65,536 个 token	131,072 个词元	65,536 个 token
输出 token 限制 *	65,536 个 token	32,768 个 token	32,768 个 token	4,096 个 token
知识截点日期	2025 年 1 月	2025 年 1 月	2025 年 1 月	2025 年 1 月
PDF（按需提供）
输入 PDF 文件的数量上限 **	900 个文件	14 个文件	14 个文件	14 个文件
每个输入 PDF 文件的页数上限 **	900 页	14 页	14 页	14 页
每个输入 PDF 文件的最大大小	50 MB	50 MB	50 MB	50 MB
Google 图片（每次请求）
输入图片数量上限	1000 张图片	14 张图片	14 张图片	14 张图片
每个输入 base64 编码的图片的最大大小	7 MB	7 MB	7 MB	7 MB
输出图片数量上限	---	最高为输出 token 限制	最高为输出 token 限制	最高为输出 token 限制
视频（每次请求）
输入视频文件的数量上限	10 个文件	---	最高为输入 token 限制	最高为输入 token 限制
所有输入视频的最大时长（仅限帧数）	约 60 分钟	---	约 25 分钟	约 12 分钟
所有输入视频（画面 + 音频）的时长上限	约 45 分钟	---	---	---
音频（每次请求）
输入音频文件的数量上限	1 个文件	---	---	---
所有输入音频的时长上限	约 8.4 小时	---	---	---

规范和限制（Gemini 2.5 型号）

	<span="notranslate">Gemini 2.5 Pro、Flash、Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">
输入 token 限制 *	1,048,576 个 token	32,768 个 token
输出 token 限制 *	65,536 个 token	8,192 个 token
知识截点日期	2025 年 1 月	2024 年 6 月
PDF（按需提供）
输入 PDF 文件的数量上限 **	3,000 个文件	3 个文件
每个输入 PDF 文件的页数上限 **	1,000 页	3 页
每个输入 PDF 文件的最大大小	50 MB	50 MB
Google 图片（每次请求）
输入图片数量上限	3,000 张图片	3 张图片
每个输入 base64 编码的图片的最大大小	7 MB	7 MB
输出图片数量上限	---	最高为输出 token 限制
视频（每次请求）
输入视频文件的数量上限	10 个文件	---
所有输入视频的最大时长（仅限帧数）	约 60 分钟	---
所有输入视频（画面 + 音频）的时长上限	约 45 分钟	---
音频（每次请求）
输入音频文件的数量上限	1 个文件	---
所有输入音频的时长上限	约 8.4 小时	---

^{*
对于所有 Gemini 模型，一个 token 大致相当于 4 个字符，因此 100 个 token 大致相当于 60-80 个英文字词。对于 Gemini 模型，您可以使用 countTokens 确定请求中的词元总数。}

^{**
PDF 文件被视为图片，因此 PDF 文件的单页被视为一张图片。请求中允许的页数取决于模型可以支持的图片数量。}

查找其他详细信息

每种模型的配额和价格各不相同。价格还取决于输入和输出。
如需了解支持的输入文件类型、如何指定 MIME 类型，以及如何确保输入文件和多模态请求符合要求并遵循最佳实践，请参阅支持的输入文件和要求。

重要提示：请求总大小上限为 20 MB。 如需发送大型文件，请查看在多模态请求中提供文件的选项。
如需详细了解 Gemini Live API 型号，请参阅Live API 的限制和规格。

模型版本控制和命名模式

模型提供稳定版、预览版和实验版。为方便起见，系统支持没有明确版本值的别名。

如需查找要在代码中使用的特定模型名称，请参阅本页后面的“可用模型名称”部分。

版本类型 / 发布阶段	说明	模型名称格式
稳定版	*稳定版*从发布之日起即可用于生产环境，并会获得支持。稳定版模型版本通常会随附弃用日期，该日期表示模型可用的最后一天。在此日期之后，Google 将不再支持或提供该模型。	Gemini 2.5 及更高版本的模型稳定版本的模型名称没有后缀示例：`gemini-3.5-flash`
预览	*预览版具有新功能，但被认为不稳定*。这些模型不建议用于生产环境，具有更严格的速率限制，并且可能需要付费。这些模型会在其关联的稳定版发布后的几周或几个月内关闭（停用）。对于 Vertex AI Gemini API，预览模型通常需要您将访问模型的位置设置为 `global`。	预览版模型的名称会附加 `-preview`，通常还会附加模型的发布日期（对于较旧的模型为 `-MM-DD`，对于较新的模型为 `-MM-YYYY`）示例： `gemini-2.5-flash-preview-04-17` （发布于 2025 年 4 月 17 日）或 `gemini-2.5-flash-preview-09-2025` （发布于 2025 年 9 月）或 `gemini-3-pro-preview` （发布于 2025 年 11 月）
实验性	*实验性版本具有新功能，但被认为不稳定*。这些模型不建议用于生产用途，并且具有更严格的速率限制。实验版模型旨在收集反馈，并让用户能够试用我们的最新功能。这些模型会在其关联的稳定版发布后的几周或几个月内关闭（停用）。对于 Vertex AI Gemini API，实验性模型要求您将访问模型的位置设置为 `global`。	实验版模型的名称会附加 `-exp` 以及模型的发布日期 (`-MM-DD`) 示例：`gemini-2.5-pro-exp-03-25` （2025 年 3 月 25 日发布）
关闭（已停用）	*已关闭（已停用）*版本已过关闭（停用）日期，并且已被永久停用。 Google 不再提供已关闭（已停用）模型的访问权限或支持，使用已停用模型名称的请求会返回 404 错误。	---

可用的模型名称

模型名称是您在模型初始化期间在代码中包含的显式值。

通用模型（例如 gemini-3.5-flash）
图片生成模型（例如 gemini-3.1-flash-image，又称“Nano Banana”模型）
音频生成模型（例如 gemini-live-2.5-flash-native-audio）

如需查看适用于您平台的初始化示例，请参阅入门指南。

如需详细了解发布阶段（尤其是使用情形、结算和关闭），请参阅模型版本控制和命名模式。

以程序化方式列出所有可用模型

您可以使用 REST API 列出所有可用的模型名称：

Gemini Developer API：调用 models.list 端点
Vertex AI Gemini API：调用 publishers.models.list 端点

请注意，返回的列表将包含 API 提供商支持的所有模型，但 Firebase AI Logic 仅支持本页面中描述的 Gemini 模型。

通用模型