了解支持的型号

对于移动应用和 Web 应用,Vertex AI in Firebase SDK 让您可以直接从应用中与受支持的 Gemini 模型互动。

Gemini 模型被视为多模态,因为它们能够处理甚至生成多种模态,包括文本、代码、PDF、图片、视频和音频。

下表简要介绍了 Vertex AI in Firebase 支持的模型及其最新的稳定模型名称。此表还列出了可用于用例原型设计的预览版和实验性模型。

型号 输入 输出 说明
Gemini 稳定型模型
Gemini 2.0 Flash
gemini-2.0-flash-001
文本、代码、PDF 文件、图片、视频、音频 文本、代码、JSON
(图片和音频即将推出!)
为各种各样的任务提供新一代功能和速度
(多模态生成功能即将推出!)
Gemini 1.5 Pro
gemini-1.5-pro-002
文本、代码、PDF 文件、图片、视频、音频 文本、代码、JSON 支持需要更高智能的复杂推理任务; 200 万个令牌的长上下文
Gemini 1.5 Flash
gemini-1.5-flash-002
文本、代码、PDF 文件、图片、视频、音频 文本、代码、JSON 在各种任务中提供快速且多样化的性能
Gemini 预览版和实验性模型 (仅建议用于原型设计用例)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
文本、代码、PDF 文件、图片、视频、音频 文本、代码、JSON 提供最强的模型质量,尤其是对于代码和世界知识;200 万个 token 的长上下文
Gemini 2.0 Flash Lite
gemini-2.0-flash-lite-preview-02-05
文本、代码、PDF 文件、图片、视频、音频 文本、代码、JSON 提供经济高效且低延迟的性能;支持高吞吐量
Gemini 2.0 Flash Thinking
gemini-2.0-flash-thinking-exp-01-21
文本、代码、PDF 文件、图片 文本、代码、JSON 提供更强的推理能力,并在回答中体现出思维过程


本页的其余内容详细介绍了 Vertex AI in Firebase 支持的模型:

您可以在本页底部查看有关旧款型号的详细信息



比较模型

每种模型都有不同的功能,可支持不同的用例。请注意,本部分中的每个表都介绍了Vertex AI in Firebase 搭配使用时的每种模型。每个模型都可能具有使用 SDK 时无法使用的其他功能。

如果您在以下子部分中找不到所需的信息,可以在 Google Cloud 文档中找到有关 Gemini 模型的更多信息。

支持的输入和输出

将每种模型与 Vertex AI in Firebase 搭配使用时支持的输入和输出类型如下:

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 闪光
思考 </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
输入类型
文字
代码
文档
(PDF 或纯文本)
图片
视频
音频
音频(在线播放) 即将推出!
输出类型
文字
代码
结构化输出
(例如 JSON)
图片 即将推出!
音频 即将推出!
音频(在线播放) 即将推出!

如需了解支持的文件类型,请参阅 Vertex AI Gemini API 支持的输入文件和要求

支持的 capability 和功能

将每种模型与 Vertex AI in Firebase 搭配使用时支持的功能如下:

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 闪光
思考 </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
根据文本多模态输入生成文本
生成图片 即将推出!
生成音频 即将推出!
生成结构化输出
(如 JSON)
分析文档
(PDF 或纯文本)
分析图片 (Vision)
分析视频(视觉)
分析音频
多轮聊天
函数调用(工具)
计算词元数和计费字符数
系统说明
Multimodal Live API
(双向流式传输)
即将推出!

规范和限制

将每种模型与 Vertex AI in Firebase 搭配使用时的规范和限制如下:

属性 <span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 闪光
思考 </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
上下文窗口 *
总令牌数上限
(输入和输出总和)
2,097,152 个令牌 1,048,576 个令牌 1,048,576 个令牌 1,048,576 个令牌 2,097,152 个令牌 1,048,576 个令牌
输出令牌限制 * 8,192 个令牌 8,192 个令牌 8,192 个令牌 8,192 个令牌 8,192 个令牌 8,192 个令牌
知识截止日期 2024 年 6 月 2024 年 6 月 2024 年 6 月 2024 年 6 月 2024 年 5 月 2024 年 5 月
PDF 文件(应要求提供)
输入 PDF 文件的
数量上限 **
3,000 个文件 3,000 个文件 3,000 个文件 3,000 个文件 3,000 个文件 3,000 个文件
每个输入 PDF 文件的
页数上限 **
1,000 页 1,000 页 1,000 页 1,000 页 1,000 页 1,000 页
每个输入 PDF 文件的大小上限
50 MB 50 MB 50 MB 50 MB 50 MB 50 MB
图片(每次请求)
输入图片的数量上限
3,000 张图片 3,000 张图片 3,000 张图片 3,000 张图片 3,000 张图片 3,000 张图片
输出图片的
数量上限
--- 即将推出! --- --- --- ---
每张输入的 base64 编码图片的大小上限
7 MB 7 MB 7 MB 7 MB 7 MB 7 MB
视频(每次请求)
输入视频文件数量上限
10 个文件 10 个文件 10 个文件 --- 10 个文件 10 个文件
所有输入视频的长度上限

(仅限帧数)
约 60 分钟 约 60 分钟 约 60 分钟 --- 约 60 分钟 约 60 分钟

所有输入视频
(帧数 + 音频)的长度上限
约 45 分钟 约 45 分钟 约 45 分钟 --- 约 45 分钟 约 45 分钟
音频(每次请求)
输入音频文件的数量上限
1 个文件 1 个文件 1 个文件 --- 1 个文件 1 个文件
输出音频文件的数量上限
--- 即将推出! --- --- --- ---
所有输入音频的长度上限
约 8.4 小时 约 8.4 小时 约 8.4 小时 --- 约 8.4 小时 约 8.4 小时
所有输出音频的长度上限
--- 即将推出! --- --- --- ---

* 对于所有模型,一个令牌大约相当于 4 个字符,因此 100 个令牌大约相当于 60-80 个英语单词。对于 Gemini 模型,您可以使用 countTokens 确定请求中的词元总数。

** PDF 文件被视为图片,因此 PDF 文件的单页被视为一张图片。请求中允许的页面数量取决于模型可以支持的图片数量。

查找其他详细信息



模型版本控制和命名模式

模型分为稳定版预览版实验版。为方便起见,系统支持不含明确版本值的别名。

如需查找要在代码中使用的特定模型名称,请参阅本页面下文中的“可用模型名称”部分。

版本类型 说明 模型名称格式
稳定版 稳定版本被视为正式版。

稳定版本的模型名称会附加特定的三位数版本号

示例:gemini-2.0-flash-001

自动更新的稳定别名 自动更新稳定别名始终指向该模型的最新稳定版本。 如果有新的稳定版发布,自动更新别名会自动开始指向该新稳定版。

别名的模型名称没有附加项

示例:gemini-2.0-flash

预览 预览版版本具有新功能,但被视为不稳定

预览版始终指向该模型的最新 预览版。如果发布了新的预览版,所有现有预览版都会自动开始指向该新预览版。

预览版模型的名称会附加 -preview 以及模型的初始发布日期 (-MMDD)

示例:gemini-2.0-flash-lite-preview-02-05
(发布日期:2025 年 2 月 5 日)

实验性 实验性版本具有新功能,被视为不稳定,并且不遵循 Google 的标准模型生命周期计划和版本控制方案。

详细了解实验模型

实验版本的模型名称会附加 -exp 以及模型的初始发布日期 (-MMDD)

示例:gemini-2.0-pro-exp-02-05
(发布日期:2025 年 2 月 5 日)

如需详细了解可用模型版本及其生命周期 (Gemini),请参阅 Google Cloud 文档。



可用的模型名称

模型名称是您在生成式模型初始化期间在代码中添加的显式值(这是调用 Gemini API 的必需步骤)。

您可以使用 publishers.models.list 端点列出所有可用的模型名称。请注意,此返回列表将包含 Vertex AI 支持的所有模型,但 Vertex AI in Firebase 仅支持本页中所述的 Gemini 模型。另请注意,系统不会列出自动更新的别名(例如 gemini-2.0-flash),因为它们是基础模型的便捷别名。

Gemini 型号名称

如需查看适用于您所用语言的初始化示例,请参阅入门指南

Gemini 2.0 Pro 型号名称

模型名称 说明 发布阶段 首发日期 终止日期
稳定版本
没有稳定版本可用 --- --- --- ---
自动更新的稳定别名
没有可用的自动更新稳定版别名 --- --- --- ---
预览版
没有预览版 --- --- --- ---
实验性版本
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro 的实验版 实验性 2025-02-05 待定

Gemini 2.0 Flash 型号名称

模型名称 说明 发布阶段 首发日期 终止日期
稳定版本
gemini-2.0-flash-001 最新的稳定版 Gemini 2.0 Flash 正式版 2025-02-05 待定
自动更新的稳定别名
gemini-2.0-flash 指向 2.0 Flash
最新稳定版(目前为 gemini-2.0-flash-001
正式版 2025-02-10 ---
预览版
没有预览版 --- --- --- ---
实验性版本
没有可用的实验性版本 --- --- --- ---

Gemini 2.0 Flash Lite 型号名称

模型名称 说明 发布阶段 首发日期 终止日期
稳定版本
没有稳定版本可用 --- --- --- ---
自动更新的稳定别名
没有可用的自动更新稳定版别名 --- --- --- ---
预览版
gemini-2.0-flash-lite-preview-02-05 Gemini 2.0 Flash Lite 的预览版 预览 2025-02-05 待定
实验性版本
没有可用的实验性版本 --- --- --- ---

Gemini 2.0 Flash Thinking 型号名称

模型名称 说明 发布阶段 首发日期 终止日期
稳定版本
没有稳定版本可用 --- --- --- ---
自动更新的稳定别名
没有可用的自动更新稳定版别名 --- --- --- ---
预览版
没有预览版 --- --- --- ---
实验性版本
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.0 Flash Thinking 的实验版 实验性 2025-01-21 待定

Gemini 1.5 Pro 型号名称

模型名称 说明 发布阶段 首发日期 终止日期
稳定版本
gemini-1.5-pro-002 最新的稳定版 Gemini 1.5 Pro 正式版 2024-09-24 不早于 2025 年 9 月 24 日
gemini-1.5-pro-001 Gemini 1.5 Pro 的初始稳定版 正式版 2024-05-24 不早于 2025 年 5 月 24 日
自动更新的稳定别名
gemini-1.5-pro 指向 1.5 Pro 的最新稳定版
(目前为 gemini-1.5-pro-002
正式版 2024-09-24 ---
预览版
没有预览版 --- --- --- ---
实验性版本
没有可用的实验性版本 --- --- --- ---

Gemini 1.5 Flash 型号名称

模型名称 说明 发布阶段 首发日期 终止日期
稳定版本
gemini-1.5-flash-002 最新的稳定版 Gemini 1.5 Flash 正式版 2024-09-24 不早于 2025 年 9 月 24 日
gemini-1.5-flash-001 Gemini 1.5 Flash 的初始稳定版 正式版 2024-05-24 不早于 2025 年 5 月 24 日
自动更新的稳定别名
gemini-1.5-flash 指向 1.5 Flash 的最新稳定版
(目前为 gemini-1.5-flash-002
正式版 2024-09-24 ---
预览版
没有预览版 --- --- --- ---
实验性版本
没有可用的实验性版本 --- --- --- ---



支持的语言

Gemini

  • 所有 Gemini 模型都可以理解以下语言并以相应语言做出回复:

    阿拉伯语 (ar)、孟加拉语 (bn)、保加利亚语 (bg)、中文(简体和繁体)(zh)、克罗地亚语 (hr)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、爱沙尼亚语 (et)、芬兰 (fi)、法语 (fr)、德语 (de)、希腊语 (el)、希伯来语 (iw)、印地语 (hi)、匈牙利语 (hu)、印度尼西亚语 (id)、意大利语 (it)、日语 (ja)、韩语 (ko)、拉脱维亚语 (lv)、立陶宛语 (lt)、挪威语 (no)、波兰语 (pl)、葡萄牙语 (pt)、罗马尼亚语 (ro)、俄语 (ru)、塞尔维亚语 (sr)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、西班牙语 (es)、斯瓦希里语 (sw)、瑞典语 (sv)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、越南语 (vi)

  • Gemini 2.0 FlashGemini 1.5 ProGemini 1.5 Flash 模型可以理解以下其他语言,并以这些语言进行回答:

    阿非利卡语 (af)、阿姆哈拉语 (am)、阿萨姆语 (as)、阿塞拜疆语 (az)、白俄罗斯语 (be)、波斯尼亚语 (bs)、加泰罗尼亚语 (ca)、宿务语 (ceb)、科西嘉语 (co)、威尔士语 (cy)、迪维希语 (dv)、世界语 (eo)、巴斯克语 (eu)、波斯语 (fa)、菲律宾语(他加禄语)(fil)、弗里西语 (fy)、爱尔兰语 (ga)、苏格兰盖尔语 (gd)、加利西亚语 (gl)、古吉拉特语 (gu)、豪萨语 (ha)、夏威夷语 (haw)、苗语 (hmn)、海地克里奥尔语 (ht)、亚美尼亚语 (hy)、伊博语 (ig)、冰岛语 (is)、爪哇语 (jv)、格鲁吉亚语 (ka)、哈萨克语 (kk)、高棉语 (km)、卡纳达语 (kn)、克里奥尔语 (kri)、库尔德语 (ku)、吉尔吉斯语 (ky)、拉丁语 (la)、卢森堡语 (lb)、老挝语 (lo)、马达加斯加语 (mg)、毛利语 (mi)、马其顿语 (mk)、马拉雅拉姆语 (ml)、蒙古语 (mn)、曼尼普里语 (mni-Mtei)、马拉地语 (mr)、马来语 (ms)、马耳他语 (mt)、缅甸语 (my)、尼泊尔语 (ne)、尼日利亚语 (ny)、奥里亚语 (Oriya) (or)、旁遮普语 (pa)、普什图语 (ps)、信德语 (sd)、僧伽罗语 (Sinhalese) (si)、萨摩亚语 (sm)、绍纳语 (sn)、索马里语 (so)、阿尔巴尼亚语 (sq)、塞索托语 (st)、苏门答语 (su)、泰米尔语 (ta)、泰卢固语 (te)、塔吉克语 (tg)、维吾尔语 (ug)、乌尔都语 (ur)、乌兹别克语 (uz)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo)、祖鲁语 (zu)



有关旧款型号的信息

Vertex AI in Firebase 支持所有 Gemini 型号,包括 Gemini 1.0 ProGemini 1.0 Pro Vision 等旧型号。不过,我们强烈建议您搭配使用较新型号的设备和我们的 SDK。这些旧版 Gemini 型号即将停用,并且不提供新版型号的所有功能。



后续步骤

试用 Gemini API 的功能