对于移动应用和 Web 应用,Vertex AI in Firebase SDK 让您可以直接从应用中与受支持的 Gemini 模型互动。
Gemini 模型被视为多模态,因为它们能够处理甚至生成多种模态,包括文本、代码、PDF、图片、视频和音频。
下面简要介绍了 Vertex AI in Firebase 支持的模型及其最新稳定版本。本页的后续部分提供了更详细的比较和信息。
型号 | 输入 | 输出 | 优化目标 |
---|---|---|---|
Gemini 模型 | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
文本、代码、PDF 文件、图片、视频、音频 | 文本、代码、JSON (图片和音频即将推出!) |
新一代功能、速度和多模态生成,适用于各种各样的任务 |
Gemini 1.5 Progemini-1.5-pro-002 |
文本、代码、PDF 文件、图片、视频、音频 | 文本、代码、JSON | 需要更高智能的复杂推理任务 |
Gemini 1.5 Flashgemini-1.5-flash-002 |
文本、代码、PDF 文件、图片、视频、音频 | 文本、代码、JSON | 在各种任务中提供快速、多样化的性能 |
本页的其余内容详细介绍了 Vertex AI in Firebase 支持的模型:
比较模型:
- 支持的输入和输出
- 支持的功能的概要比较
- 规范和限制,例如输入令牌数上限或输入视频时长上限
介绍模型的版本控制方式,特别是其稳定版、自动更新版和预览版
要在初始化期间在代码中添加的可用模型名称列表
模型的支持的语言列表
您可以在本页底部查看有关旧款型号的详细信息。
比较模型
每种模型都有不同的功能,可支持不同的用例。请注意,本部分中的每个表都介绍了与 Vertex AI in Firebase 搭配使用时的每种模型。每个模型都可能具有使用 SDK 时无法使用的其他功能。
如需详细了解每个 Gemini 模型,请参阅 Google Cloud 文档。
支持的输入和输出
将每种模型与 Vertex AI in Firebase 搭配使用时支持的输入和输出类型如下:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
输入类型 | ||||
文字 | ||||
代码 | ||||
文档(PDF 或纯文本) | ||||
图片、视频和音频 | ||||
音频(在线播放) | 即将推出! | |||
输出类型 | ||||
文字 | ||||
结构化输出(例如 JSON) | ||||
代码 | ||||
图片 | 即将推出! | |||
音频 | 即将推出! | |||
音频(在线播放) | 即将推出! |
如需了解支持的文件类型,请参阅 Vertex AI Gemini API 支持的输入文件和要求。
支持的 capability 和功能
将每种模型与 Vertex AI in Firebase 搭配使用时支持的功能如下:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
根据文本或多模态输入生成文本 | ||||
生成图片 | 即将推出! | |||
生成音频 | 即将推出! | |||
生成结构化输出(例如 JSON) | ||||
分析图片和视频(视觉) | ||||
分析音频 | ||||
分析文档(PDF 或纯文本) | ||||
多轮聊天 | ||||
函数调用(工具) | ||||
基本函数调用 | ||||
并行函数调用 | ||||
函数调用模式 | ||||
计算词元数和计费字符数 | ||||
系统指令 | ||||
Multimodal Live API(双向流式传输) | 即将推出! |
规范和限制
将每种模型与 Vertex AI in Firebase 搭配使用时的规范和限制如下:
属性 | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
上下文窗口 * 总令牌数限制(输入和输出总和) |
1,048,576 个令牌 | 2,097,152 个令牌 | 1,048,576 个令牌 |
输出令牌限制 * | 8,192 个令牌 | 8,192 个令牌 | 8,192 个令牌 |
知识截止日期 | 2024 年 6 月 | 2024 年 5 月 | 2024 年 5 月 |
图片(每次请求) | |||
输入图片数量上限 | 3,000 张图片 | 3,000 张图片 | 3,000 张图片 |
输出图片数量上限 | 即将推出! | --- | --- |
每张输入的 base64 编码图片的大小上限 | 7 MB | 7 MB | 7 MB |
PDF 文件(应要求提供) | |||
输入 PDF 文件的数量上限 ** | 3,000 个文件 | 3,000 个文件 | 3,000 个文件 |
每个输入 PDF 文件的页数上限 ** | 1,000 页 | 1,000 页 | 1,000 页 |
每个输入 PDF 文件的大小上限 | 50 MB | 50 MB | 50 MB |
视频(每次请求) | |||
输入视频文件数量上限 | 10 个文件 | 10 个文件 | 10 个文件 |
所有输入视频的时长上限(仅限帧) | 约 60 分钟 | 约 60 分钟 | 约 60 分钟 |
所有输入视频(帧数 + 音频)的时长上限 | 约 45 分钟 | 约 45 分钟 | 约 45 分钟 |
音频(每次请求) | |||
输入音频文件数量上限 | 1 个文件 | 1 个文件 | 1 个文件 |
输出音频文件数量上限 | 即将推出! | --- | --- |
所有输入音频的长度上限 | 约 8.4 小时 | 约 8.4 小时 | 约 8.4 小时 |
所有输出音频的长度上限 | 即将推出! | --- | --- |
* 对于所有模型,一个令牌大约相当于 4 个字符,因此 100 个令牌大约相当于 60-80 个英语单词。对于 Gemini 模型,您可以使用 countTokens
确定请求中的词元总数。
** PDF 文件被视为图片,因此 PDF 文件的单页被视为一张图片。请求中允许的页面数量取决于模型可以支持的图片数量。
查找其他详细信息
如需了解支持的输入文件类型、如何指定 MIME 类型,以及如何确保输入文件和多模式请求符合要求并遵循最佳实践,请参阅Vertex AI Gemini API 支持的输入文件和要求。
模型版本控制和命名模式
模型提供稳定版、自动更新版和预览版。
稳定版本被视为正式版。
- 稳定版本的模型名称会附加特定的三位数版本号,例如
。gemini-2.0-flash-001
- 稳定版本的模型名称会附加特定的三位数版本号,例如
自动更新版本始终指向该模型的最新稳定版本;如果有新的稳定版本发布,自动更新版本会自动开始指向该新的稳定版本。
- 自动更新版本的模型名称不含附加项,例如
。gemini-2.0-flash
- 自动更新版本的模型名称不含附加项,例如
预览版版本具有新功能,但被视为不稳定。请注意,预览版始终指向该模型的最新预览版;如果发布了新的预览版,则所有现有预览版都会自动开始指向该新预览版。
- 预览版的模型名称会附加
以及模型的初始发布日期 (-preview
),例如-MMDD
(发布时间为 2024 年 4 月 9 日)。gemini-1.5-pro-preview-0409
- 预览版的模型名称会附加
如需详细了解可用模型版本及其生命周期 (Gemini),请参阅 Google Cloud 文档。
可用的模型名称
模型名称是您在生成式模型初始化期间在代码中添加的显式值(这是调用 Gemini API 的必需步骤)。
您可以使用 publishers.models.list
端点列出所有可用的模型名称。请注意,此返回列表将包含 Vertex AI 支持的所有模型,但 Vertex AI in Firebase 仅支持本页中所述的 Gemini 模型。另请注意,系统不会列出自动更新的版本(例如 gemini-2.0-flash
),因为它们是基础稳定型模型的便捷别名。
Gemini 型号名称
如需查看适用于您所用语言的初始化示例,请参阅入门指南。
Gemini 2.0 Flash 型号名称
模型名称 | 说明 | 发布阶段 | 首发日期 | 终止日期 |
---|---|---|---|---|
稳定版本 | ||||
gemini-2.0-flash-001 |
最新的稳定版 Gemini 2.0 Flash | 正式版 | 2025-02-05 | 待定 |
自动更新的版本 | ||||
gemini-2.0-flash |
指向 2.0 Flash 的最新稳定版(目前为 gemini-2.0-flash-001 |
正式版 | 2025-02-10 | --- |
Gemini 1.5 Pro 型号名称
模型名称 | 说明 | 发布阶段 | 首发日期 | 终止日期 |
---|---|---|---|---|
稳定版本 | ||||
gemini-1.5-pro-002 |
最新的稳定版 Gemini 1.5 Pro | 正式版 | 2024-09-24 | 不早于 2025 年 9 月 24 日 |
gemini-1.5-pro-001 |
Gemini 1.5 Pro 的初始稳定版 | 正式版 | 2024-05-24 | 不早于 2025 年 5 月 24 日 |
自动更新的版本 | ||||
gemini-1.5-pro |
指向 1.5 Pro 的最新稳定版 (目前为 gemini-1.5-pro-002 |
正式版 | 2024-09-24 | --- |
Gemini 1.5 Flash 型号名称
模型名称 | 说明 | 发布阶段 | 首发日期 | 终止日期 |
---|---|---|---|---|
稳定版本 | ||||
gemini-1.5-flash-002 |
最新的稳定版 Gemini 1.5 Flash | 正式版 | 2024-09-24 | 不早于 2025 年 9 月 24 日 |
gemini-1.5-flash-001 |
Gemini 1.5 Flash 的初始稳定版 | 正式版 | 2024-05-24 | 不早于 2025 年 5 月 24 日 |
自动更新的版本 | ||||
gemini-1.5-flash |
指向 1.5 Flash 的最新稳定版 (目前为 gemini-1.5-flash-002 |
正式版 | 2024-09-24 | --- |
支持的语言
Gemini
所有 Gemini 模型都可以理解以下语言并以相应语言做出回复:
阿拉伯语 (ar)、孟加拉语 (bn)、保加利亚语 (bg)、中文(简体和繁体)(zh)、克罗地亚语 (hr)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、爱沙尼亚语 (et)、芬兰 (fi)、法语 (fr)、德语 (de)、希腊语 (el)、希伯来语 (iw)、印地语 (hi)、匈牙利语 (hu)、印度尼西亚语 (id)、意大利语 (it)、日语 (ja)、韩语 (ko)、拉脱维亚语 (lv)、立陶宛语 (lt)、挪威语 (no)、波兰语 (pl)、葡萄牙语 (pt)、罗马尼亚语 (ro)、俄语 (ru)、塞尔维亚语 (sr)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、西班牙语 (es)、斯瓦希里语 (sw)、瑞典语 (sv)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、越南语 (vi)
Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型可以理解以下其他语言,并用这些语言做出回答:
阿非利加语 (af)、阿姆哈拉语 (am)、阿萨姆语 (as)、阿塞拜疆语 (az)、白俄罗斯语 (be)、波斯尼亚语 (bs)、加泰罗尼亚语 (ca)、宿务语 (ceb)、科西嘉语 (co)、威尔士语 (cy)、迪维希语 (dv)、世界语 (eo)、巴斯克语 (eu)、波斯语 (fa)、菲律宾语(他加禄语)(fil)、弗里西语 (fy)、爱尔兰语 (ga)、苏格兰盖尔语 (gd)、加利西亚语 (gl)、古吉拉特语 (gu)、豪萨语 (ha)、夏威夷语 (haw)、苗语 (hmn)、海地克里奥尔语 (ht)、亚美尼亚语 (hy)、伊博语 (ig)、冰岛语 (is)、爪哇语 (jv)、格鲁吉亚语 (ka)、哈萨克语 (kk)、高棉语 (km)、卡纳达语 (kn)、克里奥尔语 (kri)、库尔德语 (ku)、吉尔吉斯语 (ky)、拉丁语 (la)、卢森堡语 (lb)、老挝语 (lo)、马达加斯加语 (mg)、毛利语 (mi)、马其顿语 (mk)、马拉雅拉姆语 (ml)、蒙古语 (mn)、曼尼普里语 (mni-Mtei)、马拉地语 (mr)、马来语 (ms)、马耳他语 (mt)、缅甸语 (my)、尼泊尔语 (ne)、尼日利亚语 (ny)、奥里亚语 (Oriya) (or)、旁遮普语 (pa)、普什图语 (ps)、信德语 (sd)、僧伽罗语 (Sinhalese) (si)、萨摩亚语 (sm)、绍纳语 (sn)、索马里语 (so)、阿尔巴尼亚语 (sq)、塞索托语 (st)、苏门答语 (su)、泰米尔语 (ta)、泰卢固语 (te)、塔吉克语 (tg)、维吾尔语 (ug)、乌尔都语 (ur)、乌兹别克语 (uz)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo)、祖鲁语 (zu)
有关旧款型号的信息
Vertex AI in Firebase 支持所有 Gemini 型号,包括 Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 等旧型号。不过,我们强烈建议您搭配使用较新型号的设备和我们的 SDK。这些旧版 Gemini 型号即将停用,并且不提供新版型号的所有功能。
后续步骤
试用 Gemini API 的功能
- 构建多轮对话(聊天)。
- 根据纯文本提示生成文本。
- 从多模态提示(包括文本、图片、PDF、视频和音频)生成文本。
- 从文本和多模态提示生成结构化输出(例如 JSON)。
- 使用函数调用将生成式模型连接到外部系统和信息。