了解支持的型号

对于移动应用和 Web 应用,Firebase AI Logic SDK 可让您直接从应用中与受支持的 Gemini 模型Imagen 模型进行互动。

Gemini 模型之所以被视为多模态,是因为它们能够处理甚至生成多种模态的内容,包括文本、代码、PDF、图片、视频和音频。Imagen 模型可以通过文本提示生成图片。

此外,请查看我们的常见问题解答,了解 Firebase AI Logic 支持和不支持的所有模型。

通用模型

跳转到模型对比

我们最智能的模型

gemini-3-pro-preview

这是我们最出色的多模态理解模型,也是我们迄今为止最强大的智能体和氛围编程模型,能够提供更丰富的视觉效果和更深入的互动体验,所有这些都建立在先进的推理技术基础上。(需要结算)

我们最快、最智能的模型

gemini-3-flash-preview

我们最智能的模型,专为速度、效率和成本而打造。 它能够以更出色的推理能力处理日常任务,同时还能应对最复杂的智能体工作流。 (结算是必需的)


我们的高级思考模型

gemini-2.5-pro

我们最先进的思维模型,能够推理代码、数学和 STEM 领域中的复杂问题,还能使用长上下文分析大型数据集、代码库和文档。 (结算是必需的)

快速而智能

gemini-2.5-flash

在性价比方面表现出色的模型,可提供全面的功能。2.5 Flash 最适合大规模处理需要思考的低延迟、高数据量任务,以及代理应用场景。 (结算是必需的)

超快

gemini-2.5-flash-lite

我们速度最快的 Flash 模型,在成本效益和高吞吐量方面经过专门优化。 (结算是必需的)

图片生成模型

您可以使用 GeminiImagen 模型生成图片。

跳转到模型对比

Gemini

gemini-3-pro-image-preview

专为专业素材资源制作和复杂指令而设计。它具有以下特点:使用 Google 搜索提供真实世界的基础知识;默认的“思考”流程可在生成之前优化构图;可生成分辨率高达 4K 的图片。 (需要结算)

gemini-2.5-flash-image

专为速度和效率而设计。它针对高数据量、低延迟的任务进行了优化,并以 1024 像素的分辨率生成图片。(需要结算)

Imagen

imagen-4.0-generate-001

根据自然语言文本提示生成逼真且高画质的图片。(需要结算)

imagen-4.0-fast-generate-001

生成图片,用于原型设计或低延迟应用场景。 (需要结算)

imagen-4.0-ultra-generate-001

根据自然语言文本提示生成逼真且高画质的图片。(需要结算)

音频生成模型

您可以使用支持 Gemini Live API 的模型生成流式音频。

跳转到模型对比

Gemini Developer API:gemini-2.5-flash-native-audio-preview-12-2025

Vertex AI Gemini API:gemini-live-2.5-flash-native-audio

支持与 双向 Gemini 模型进行低延迟、实时的语音和视频互动。 (结算是必需的)

上一代模型

以下是有效但属于上一代型号的设备。我们建议您尽可能使用最新的模型。

跳转到模型对比

Gemini 模型

我们的第二代主力模型

gemini-2.0-flash-001

我们的第二代主力模型,可处理 100 万个词元的上下文窗口。提供新一代功能和改进的功能,包括卓越的速度和原生工具使用。 (结算是必需的)

我们的第二代快速模型

gemini-2.0-flash-lite-001

我们的第二代小型主力模型,可处理 100 万个词元的上下文窗口。经过优化,提高了成本效益并缩短了延迟时间。 (结算是必需的)


本页的其余部分详细介绍了 Firebase AI Logic 支持的型号。

  • 比较模型

    • 支持的输入和输出
    • 支持的功能的高级比较
    • 规范和限制,例如输入 token 数上限或输入视频时长上限
  • 说明模型如何进行版本控制,特别是其稳定版自动更新版预览版实验版

  • 在初始化期间包含在代码中的可用模型名称列表

  • 模型支持的语言列表

在本页底部,您可以查看有关上一代模型的详细信息



对比模型

每种模型都具有不同的功能,可支持各种用例。请注意,本部分中的每个表格都描述了每个模型在与 Firebase AI Logic 搭配使用时的情况。每种模型可能都具有使用我们的 SDK 时无法使用的其他功能。

如果您在以下子部分中找不到所需信息,可以在所选 API 提供商的文档中找到更多信息:

支持的输入和输出

以下是将每种模型与 Firebase AI Logic 搭配使用时支持的输入和输出类型:

<span="notranslate">Gemini
3 Pro、Flash </span="notranslate">
<span="notranslate">Gemini
3 Pro
图片 </span="notranslate">
<span="notranslate">Gemini
2.5 Pro、Flash、Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
图片 </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Live *** </span="notranslate">
Imagen(生成) Imagen(功能)
输入类型
文字 (流式传输)
代码
文档
(PDF 或纯文本)
图片
视频 (流式传输)
音频 (流式传输)
输出类型
文字
文本(流式传输) (转写)
代码
结构化输出
(例如 JSON)
图片
音频 (流式传输)

如需了解支持的文件类型,请参阅支持的输入文件和要求

支持的功能

以下是将每种模型与 Firebase AI Logic 搭配使用时支持的功能:

<span="notranslate">Gemini
3 Pro、Flash</span="notranslate">
<span="notranslate">Gemini
3 Pro
图片 </span="notranslate">
<span="notranslate">Gemini
2.5 Pro、Flash、Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
图片 </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Live *** </span="notranslate">
Imagen(生成) Imagen(功能)
思考型
根据纯文本输入或多模态输入生成文本 交错或作为图片的一部分 交错或作为图片的一部分 仅转写
生成图片
GeminiImagen
编辑图片
GeminiImagen
生成音频 仅限流式传输
生成结构化输出(例如 JSON)
分析文档
(PDF 或纯文本)
分析图片(视觉)
分析视频(视觉) 仅限流式传输
分析音频 仅限流式传输
多轮聊天 仅限流式传输
双向多模态流式传输
函数调用
代码执行
使用 Google 搜索建立依据
系统指令
统计 token 数量

规范和限制

以下是将每种型号与 Firebase AI Logic 搭配使用时的规格和限制

属性 <span="notranslate">Gemini
3 Pro、Flash</span="notranslate">
<span="notranslate">Gemini
3 Pro
图片 </span="notranslate">
<span="notranslate">Gemini
2.5 Pro、Flash、Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
图片 </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Live *** </span="notranslate">
Imagen(生成) Imagen(功能)
输入 token 限制 * 1,048,576 个 token 65,536 个词元 1,048,576 个 token 32,768 个 token 3.2 万个 token(默认;可升级到 12.8 万个 token) 480 个词元 480 个词元
输出 token 限制 * 65,536 个词元 32,768 个 token 65,536 个词元 8,192 个 token 64K 个 token --- ---
知识截点日期 2025 年 1 月 2025 年 1 月 2025 年 1 月 June 2025 2025 年 1 月 --- ---
PDF(按需提供)
输入 PDF 文件的数量上限
**
900 个文件 14 个文件 3,000 个文件 3 个文件 --- --- ---
每个输入 PDF 文件的
页数
上限**
900 页 14 页 1,000 页 3 页 --- --- ---
每个输入 PDF 文件的最大大小
50 MB 50 MB 50 MB 50 MB --- --- ---
图片(每个请求)
输入图片数量上限
1000 张图片 14 张图片 3,000 张图片 3 张图片 --- --- 4 张图片
输出图片数量上限
--- 10 张图片 --- 10 张图片 --- 4 张图片 4 张图片
每个输入 base64 编码的图片的最大大小
7 MB 7 MB 7 MB 7 MB --- --- ---
视频(按请求)
输入视频文件的数量上限
10 个文件 --- 10 个文件 --- --- --- ---
所有输入视频
的最大时长
(仅限帧数)
约 60 分钟 --- 约 60 分钟 --- --- --- ---
所有输入视频
(画面 + 音频)的最大长度
约 45 分钟 --- 约 45 分钟 --- --- --- ---
音频(每次请求)
输入音频文件的数量上限
1 个文件 --- 1 个文件 --- --- --- ---
输出音频文件的数量上限
--- --- --- --- --- --- ---
所有输入音频的时长上限
约 8.4 小时 --- 约 8.4 小时 --- --- --- ---
所有输出音频的时长上限
--- --- --- --- --- --- ---

* 对于所有 Gemini 模型,一个 token 大致相当于 4 个字符,因此 100 个 token 大致相当于 60-80 个英文字词。对于 Gemini 模型,您可以使用 countTokens 确定请求中的词元总数。

** PDF 文件被视为图片,因此 PDF 文件的单页被视为一张图片。请求中允许的页数取决于模型可以支持的图片数量。

*** Gemini 2.5 Flash-Live 模型是支持 Gemini Live API 的原生音频模型。

查找其他详细信息



模型版本控制和命名模式

模型提供稳定版预览版实验版。为方便起见,系统支持不含明确版本值的别名。

如需查找要在代码中使用的特定模型名称,请参阅本页后面的“可用模型名称”部分。

版本类型 /
发布阶段
说明 模型名称格式
稳定版 稳定版自发布之日起即可用于生产环境,并会获得支持。
  • 稳定版模型版本通常会随附弃用日期,该日期表示模型可用的最后一天。在此日期之后,Google 将不再支持该型号,您也无法再访问该型号。
  • Gemini 2.5 模型
    稳定版本的模型名称没有后缀

    示例:gemini-2.5-pro

  • Gemini 2.0Imagen 模型
    稳定版模型名称会附加一个特定的三位数版本号

    示例:gemini-2.0-flash-001
    示例:imagen-3.0-generate-002

自动更新的稳定别名
(仅限 Gemini 2.0 模型)
自动更新的稳定版别名始终指向相应模型的最新稳定版
  • 如果发布了新的稳定版,自动更新别名会自动开始指向该新稳定版。

仅限 Gemini 2.0 型号
别名的模型名称没有后缀

示例:gemini-2.0-flash

预览 预览版具有新功能,但被视为不稳定
  • 不建议将这些模型用于生产用途,这些模型具有更严格的速率限制,并且可能需要满足结算要求。
  • 这些模型会在其关联的稳定版发布后的几周或几个月内停用。
  • 对于 Vertex AI Gemini API,2025 年 6 月之后发布的预览版模型通常需要您将模型的位置设置为 global

预览版模型的名称会附加 -preview,通常还会附加模型的发布日期(对于旧模型为 -MM-DD,对于新模型为 -MM-YYYY

示例:
gemini-2.5-flash-preview-04-17
(发布于 2025 年 4 月 17 日)

gemini-2.5-flash-preview-09-2025
(发布于 2025 年 9 月)

gemini-3-pro-preview
(发布于 2025 年 11 月)

实验性 实验性版本具有新功能,但被认为不稳定
  • 这些模型建议用于生产用途,并且具有更严格的速率限制。实验版模型旨在收集反馈,并让用户能够试用我们的最新功能。
  • 这些模型会在其关联的稳定版发布后的几周或几个月内停用。
  • 对于 Vertex AI Gemini API,2025 年 6 月之后发布的实验性模型要求您将模型的位置设置为 global

实验版模型的名称会附加 -exp 以及模型的发布日期 (-MM-DD)

示例:gemini-2.5-pro-exp-03-25
(于 2025 年 3 月 25 日发布)

已退休 已停用的版本已过弃用日期,并且已被永久停用。
  • Google 不再提供对已弃用模型的支持,也无法再访问这些模型,使用已弃用模型名称的请求会返回 404 错误。

---



可用的模型名称

模型名称是您在模型初始化期间在代码中包含的显式值。

跳转到 Gemini 型号名称 跳转到 Imagen 型号名称

以程序化方式列出所有可用模型

您可以使用 REST API 列出所有可用的模型名称:

请注意,返回的此列表将包含 API 提供商支持的所有模型,但 Firebase AI Logic 仅支持本页面中介绍的 GeminiImagen 模型。另请注意,自动更新别名(例如 gemini-2.0-flash)不会列出,因为它们是基础模型的便捷别名。

Gemini 个模型名称

如需查看适用于您平台的初始化示例,请参阅入门指南

如需详细了解发布阶段(尤其是使用情形、结算和停用),请参阅模型版本控制和命名模式

Gemini 3 Pro 个模型名称

无论您的 Gemini API 提供商是谁,都需要采用随用随付 Blaze 定价方案

模型名称 说明 发布阶段 发布日期 弃用日期
gemini-3-pro-preview Gemini 3 Pro 的预览版 预览 2025-11-18 待定

Gemini 3 Flash 个模型名称

如果您使用的是 Gemini Developer API,则需要采用随用随付 Blaze 定价方案(通常预览版模型需要采用付费方案)。

模型名称 说明 发布阶段 发布日期 弃用日期
gemini-3-flash-preview Gemini 3 Flash 的预览版 预览 2025-12-17 待定

Gemini 3 Pro Image 模型名称(又称“nano banana pro”)

无论您的 Gemini API 提供商是谁,都需要采用随用随付 Blaze 定价方案

模型名称 说明 发布阶段 发布日期 弃用日期
gemini-3-pro-image-preview Gemini 3 Pro Image
(又称“nano banana pro”)的预览版
预览 2025-11-20 待定

Gemini 2.5 Pro 个模型名称

如果您使用的是 Gemini Developer API,则需要采用随用随付 Blaze 定价方案。

模型名称 说明 发布阶段 发布日期 弃用日期
gemini-2.5-pro Gemini 2.5 Pro 的稳定版 稳定版 2025-06-17 不早于
2026-06-17

Gemini 2.5 Flash 个模型名称

如果您使用的是 Gemini Developer API,则需要采用随用随付 Blaze 定价方案。

模型名称 说明 发布阶段 发布日期 弃用日期
gemini-2.5-flash Gemini 2.5 Flash 的稳定版 稳定版 2025-06-17 不早于
2026-06-17

Gemini 2.5 Flash‑Lite 个模型名称

如果您使用的是 Gemini Developer API,则需要采用随用随付 Blaze 定价方案。

模型名称 说明 发布阶段 发布日期 弃用日期
gemini-2.5-flash-lite Gemini 2.5 Flash‑Lite 的稳定版 稳定版 2025-07-22 不早于
2026-07-22

Gemini 2.5 Flash Image 模型名称(又称“nano banana”)

无论您的 Gemini API 提供商是谁,都需要采用随用随付 Blaze 定价方案

模型名称 说明 发布阶段 发布日期 弃用日期
gemini-2.5-flash-image 适用于 Gemini 2.5 Flash Image(又称“nano banana”)的稳定版 稳定版 2025-10-02 不早于
2026-10-02

Gemini 2.5 Flash Live 个模型名称

如果您使用的是 Gemini Developer API,则需要采用随用随付 Blaze 定价方案(通常预览版模型需要采用付费方案)。

Gemini 2.5 Flash Live 模型是支持 Gemini Live API原生音频模型。尽管模型具有不同的模型名称(具体取决于 Gemini API 提供方),但模型的行为和功能是相同的。

Gemini Developer API
模型名称
说明 发布阶段 发布日期 弃用日期
gemini-2.5-flash-native-audio-preview-12-2025 1 Gemini Developer APILive API 的最新预览版 预览 2025-12-12 待定
gemini-2.5-flash-native-audio-preview-09-2025 1 Gemini Developer APILive API 的初始预览版本 预览 2025-09-18 待定
Vertex AI Gemini API
模型名称
说明 发布阶段 发布日期 弃用日期
gemini-live-2.5-flash-native-audio 2 Vertex AI Gemini APILive API 的稳定版本 稳定版 2025-12-12 不早于
2026-12-12
gemini-live-2.5-flash-preview-native-audio-09-2025 2 Vertex AI Gemini APILive API 的预览版 预览 2025-09-18 待定

1 Gemini Developer API 支持。 此外,虽然这些模型是预览版,但它们可在 Gemini Developer API 的“免费层级”中使用。
2 Vertex AI Gemini API 支持。 此外,这些模型在 global 位置不受支持。

Imagen 个模型名称

如需查看您平台的初始化示例,请参阅使用 Imagen 生成图片指南

如需详细了解发布阶段(尤其是使用情形、结算和停用),请参阅模型版本控制和命名模式

Imagen 4 个模型名称

模型名称 说明 发布阶段 发布日期 弃用日期
imagen-4.0-generate-001 Imagen 4 的稳定版 稳定版 2025-08-14 不早于 2026 年 8 月 14 日

Imagen 4 Fast 个模型名称

模型名称 说明 发布阶段 发布日期 弃用日期
imagen-4.0-fast-generate-001 Imagen 4 Fast 的稳定版 稳定版 2025-08-14 不早于 2026 年 8 月 14 日

Imagen 4 Ultra 个模型名称

模型名称 说明 发布阶段 发布日期 弃用日期
imagen-4.0-ultra-generate-001 Imagen 4 Ultra 的稳定版 稳定版 2025-08-14 不早于 2026 年 8 月 14 日

Imagen 3 Capability 个模型名称

模型名称 说明 发布阶段 发布日期 弃用日期
imagen-3.0-capability-001 2 Imagen 3 Capability 的初始稳定版 稳定版 2024-12-10 不早于 2025-12-10

2 不受 Gemini Developer API 支持,无论您以何种方式访问。



支持的语言

Gemini

  • 所有 Gemini 模型都可以理解并以以下语言回答:

    阿拉伯语 (ar)、孟加拉语 (bn)、保加利亚语 (bg)、中文(简体和繁体)(zh)、克罗地亚语 (hr)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、爱沙尼亚语 (et)、芬兰 (fi)、法语 (fr)、德语 (de)、希腊语 (el)、希伯来语 (iw)、印地语 (hi)、匈牙利语 (hu)、印度尼西亚语 (id)、意大利语 (it)、日语 (ja)、韩语 (ko)、拉脱维亚语 (lv)、立陶宛语 (lt)、挪威语 (no)、波兰语 (pl)、葡萄牙语 (pt)、罗马尼亚语 (ro)、俄语 (ru)、塞尔维亚语 (sr)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、西班牙语 (es)、斯瓦希里语 (sw)、瑞典语 (sv)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、越南语 (vi)

  • Gemini 2.0 FlashGemini 1.5 ProGemini 1.5 Flash 模型可以理解并用以下其他语言做出回答:

    南非荷兰语 (af)、阿姆哈拉语 (am)、阿萨姆语 (as)、阿塞拜疆语 (az)、白俄罗斯语 (be)、波斯尼亚语 (bs)、加泰隆语 (ca)、宿务语 (ceb)、科西嘉语 (co)、威尔士语 (cy)、迪维希语 (dv)、世界语 (eo)、巴斯克语 (eu)、波斯语 (fa)、菲律宾语 (Tagalog) (fil)、弗里西语 (fy)、爱尔兰语 (ga)、苏格兰语 (gd)、加利西亚语 (gl)、古吉拉特语 (gu)、豪萨语 (ha)、夏威夷语 (haw)、苗语 (hmn)、海地克里奥语 (ht)、亚美尼亚语 (hy)、伊博语 (ig)、冰岛语 (is)、爪哇语 (jv)、格鲁吉亚语 (ka)、哈萨克语 (kk)、高棉语 (km)、卡纳达语 (kn)、克里奥语 (kri)、库尔德语 (ku)、吉尔吉斯语 (ky)、拉丁语 (la)、卢森堡语 (lb)、老挝语 (lo)、马达加斯加语 (mg)、毛利语 (mi)、马其顿语 (mk)、马拉雅拉姆语 (ml)、蒙古语 (mn)、曼尼普尔语 (Manipuri) (mni-Mtei)、马拉地语 (mr)、马来语 (ms)、马耳他语 (mt)、缅甸语 (Myanmar) (my)、尼泊尔语 (ne)、尼亚查语 (Chichewa) (ny)、奥里亚语 (Oriya) (or)、旁遮普语 (pa)、普什图语 (ps)、信德语 (sd)、僧伽罗语 (Sinhalese) (si)、萨摩亚语 (sm)、绍纳语 (sn)、索马里语 (so)、阿尔巴尼亚语 (sq)、塞索托语 (st)、巽他语 (su)、泰米尔语 (ta)、泰卢固语 (te)、塔吉克语 (tg)、维吾尔语 (ug)、乌尔都语 (ur)、乌兹别克语 (uz)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo)、祖鲁语 (zu)

Imagen

  • 正式版:英语

  • 预览版:简体中文、繁体中文、印地语、日语、韩语、葡萄牙语、西班牙语



有关旧型号的信息

以下是有效但属于上一代型号的设备。我们建议您尽可能使用最新型号之一。

Gemini 个模型

  • gemini-2.0-flash-001(及其自动更新的别名 gemini-2.0-flash
  • gemini-2.0-flash-lite-001(及其自动更新的别名 gemini-2.0-flash-lite

如需了解旧版 Gemini Live API 模型,请参阅 Gemini API 提供方文档:

Imagen 个模型

  • imagen-3.0-generate-002
  • imagen-3.0-fast-generate-001



后续步骤

试用 Gemini API 的功能