对于移动应用和 Web 应用,Firebase AI Logic SDK 可让您直接从应用中与受支持的 Gemini 模型和 Imagen 模型进行互动。
Gemini 模型之所以被视为多模态模型,是因为它们能够处理甚至生成多种模态,包括文本、代码、PDF、图片、视频和音频。Imagen 模型可以通过文本提示生成图片。
下表简要概述了 Firebase AI Logic 支持的模型及其最新的稳定模型名称。此表还列出了可用于原型设计用例的预览版和实验性模型。
此外,请查看我们的常见问题解答,了解 Firebase AI Logic 支持和不支持的所有模型。
Gemini 个模型
型号 | 输入 | 输出 | 说明 |
---|---|---|---|
具有稳定版本的 Gemini 模型 | |||
Gemini 2.5 Progemini-2.5-pro
|
文本、代码、PDF、图片、视频、音频 | 文本、代码、JSON | 我们最先进的推理模型,能够解决复杂问题。 |
Gemini 2.5 Flashgemini-2.5-flash
|
文本、代码、PDF、图片、视频、音频 | 文本、代码、JSON | 我们的思考模型,可提供出色的全方位功能。旨在在价格与性能之间取得平衡。 |
Gemini 2.0 Flashgemini-2.0-flash-001
|
文本、代码、PDF、图片、视频、音频 | 文本、代码、JSON | 我们的多模态模型,具有新一代功能和改进的功能, 包括出色的速度、内置工具使用和 100 万个 token 的上下文窗口 |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
文本、代码、PDF、图片、视频、音频 | 文本、代码、JSON | 我们速度最快、最具成本效益的 Flash 模型。对于希望以相同的价格和速度获得更高画质体验的 1.5 Flash 用户来说,这是一个升级途径。 |
Gemini 仅具有预览版和实验版版本的模型(仅建议用于原型设计用例) | |||
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite-preview-06-17
|
文本、代码、PDF、图片、视频、音频 | 文本、代码、JSON | 我们最均衡的一款 Gemini 模型,在低延迟使用场景中经过专门优化。 |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
文本、代码、PDF、图片、视频、音频 | 图片、文字和图片 | 支持多模态输入和图片输出的多模态模型。 |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09
|
文本(流式传输)、 音频(流式传输) |
文本(流式传输)、 音频(流式传输) |
支持低延迟实时流式传输多模态输入和输出的多模态模型。 |
1 使用 Gemini Developer API 和 Firebase AI Logic SDK 时不支持。
Imagen 个模型
型号 | 输入 | 输出 | 说明 |
---|---|---|---|
具有稳定版本的 Imagen 模型 | |||
Imagen 3imagen-3.0-generate-002 |
text | 图片 | 根据自然语言文本提示生成逼真的高质量图片 |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
text | 图片 | 生成图片,用于原型设计或低延迟应用场景 |
Imagen 仅具有预览版和实验版版本的模型(仅建议用于原型设计用例) | |||
Imagen 4 2imagen-4.0-generate-preview-06-06
|
text | 图片 | 根据自然语言文本提示生成逼真的高质量图片 |
Imagen 4 Fast 2imagen-4.0-fast-generate-preview-06-06
|
text | 图片 | 生成图片,用于原型设计或低延迟应用场景 |
Imagen 4 Ultra 2imagen-4.0-ultra-generate-preview-06-06
|
text | 图片 | 根据自然语言文本提示生成逼真的高质量图片 |
2 无论您如何访问 API,Gemini Developer API 都不支持此 Imagen 模型。
本页的其余部分详细介绍了 Firebase AI Logic 支持的型号。
比较模型:
- 支持的输入和输出
- 支持的功能的简要比较
- 规范和限制,例如输入 token 上限或输入视频时长上限
说明模型如何进行版本控制,特别是其稳定版、自动更新版、预览版和实验版
在初始化期间包含在代码中的可用模型名称列表
在本页底部,您可以查看有关旧型号的详细信息。
对比模型
每种型号都具有不同的功能,可支持各种使用情形。请注意,本部分中的每个表格都描述了每个模型在与 Firebase AI Logic 搭配使用时的情况。每种模型可能都具有使用我们的 SDK 时无法使用的其他功能。
如果您在以下子部分中找不到所需信息,可以在所选 API 提供商的文档中找到更多信息:
支持的输入和输出
以下是将每种模型与 Firebase AI Logic 搭配使用时支持的输入和输出类型:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash 图片生成 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|---|
输入类型 | |||||||||
文字 | |||||||||
文本(流式传输) | |||||||||
代码 | |||||||||
文档 (PDF 或纯文本) |
|||||||||
图片 | |||||||||
视频 | |||||||||
音频 | |||||||||
音频(流式) | |||||||||
输出类型 | |||||||||
文字 | |||||||||
文本(流式传输) | |||||||||
代码 | |||||||||
结构化输出 (例如 JSON) |
|||||||||
图片 | |||||||||
音频 | |||||||||
音频(流式) |
如需了解支持的文件类型,请参阅支持的输入文件和要求。
支持的功能
以下是将每个模型与 Firebase AI Logic 搭配使用时支持的功能:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash 图片生成 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|---|
根据纯文本或多模态输入生成文本 | 交错或作为图片的一部分 | 仅限流式传输 | ||||||
生成图片 (Gemini 或 Imagen) |
||||||||
生成音频 | 仅限流式传输 | |||||||
生成结构化输出(例如 JSON)
|
||||||||
分析文档
(PDF 或纯文本) |
||||||||
分析图像 (视觉) | ||||||||
分析视频(视觉) | ||||||||
分析音频 | 仅限流式传输 | |||||||
多轮聊天 | ||||||||
函数调用(工具) | ||||||||
统计 token 数量 | ||||||||
系统指令 | ||||||||
双向多模态流式传输 |
规范和限制
以下是将每种模型与 Firebase AI Logic 搭配使用时的规范和限制:
属性 |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash 图片生成 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|---|
上下文窗口 * 总 token 限制 (输入 + 输出) |
1,048,576 个 token | 1,048,576 个 token | 1,048,576 个 token | 1,048,576 个 token | 1,048,576 个 token | 32,768 个词元 | 32,768 个词元 | 480 个词元 |
输出 token 限制 * | 65,536 个词元 | 65,536 个词元 | 65,536 个词元 | 8,192 个 token | 8,192 个 token | 8,192 个 token | 8,192 个 token | --- |
知识截点日期 | 2025 年 1 月 | 2025 年 1 月 | 2025 年 1 月 | 2024 年 6 月 | 2024 年 6 月 | 2024 年 8 月 | 2024 年 8 月 | --- |
PDF(按需提供) | ||||||||
输入 PDF 文件的数量上限 ** |
3,000 个文件 | 3,000 个文件 | 3,000 个文件 | 3,000 个文件 | 3,000 个文件 | 3,000 个文件 | --- | --- |
每个输入 PDF 文件的 页数 上限** |
1,000 页 | 1,000 页 | 1,000 页 | 1,000 页 | 1,000 页 | 1,000 页 | --- | --- |
每个输入 PDF 文件的最大大小 |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
图片(每次请求) | ||||||||
张输入图片数量上限 |
3,000 张图片 | 3,000 张图片 | 3,000 张图片 | 3,000 张图片 | 3,000 张图片 | 3,000 张图片 | --- | --- |
输出图片数量上限 |
--- | --- | --- | --- | --- | 10 张图片 | --- | 4 张图片 |
每个输入 base64 编码的图片的最大大小 |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
视频(按需) | ||||||||
输入视频文件的最大数量 |
10 个文件 | 10 个文件 | 10 个文件 | 10 个文件 | 10 个文件 | 10 个文件 | --- | --- |
所有输入视频 的最大长度 (仅限帧数) |
约 60 分钟 | 约 60 分钟 | 约 60 分钟 | 约 60 分钟 | 约 60 分钟 | 约 60 分钟 | --- | --- |
所有输入视频 (画面 + 音频)的最大时长 |
约 45 分钟 | 约 45 分钟 | 约 45 分钟 | 约 45 分钟 | 约 45 分钟 | 约 45 分钟 | --- | --- |
音频(每次请求) | ||||||||
输入音频文件的数量上限 |
1 个文件 | 1 个文件 | 1 个文件 | 1 个文件 | 1 个文件 | 1 个文件 | --- | --- |
输出音频文件的数量上限 |
--- | --- | --- | --- | --- | --- | --- | --- |
所有输入音频的最大长度 |
约 8.4 小时 | 约 8.4 小时 | 约 8.4 小时 | 约 8.4 小时 | 约 8.4 小时 | 约 8.4 小时 | --- | --- |
所有输出音频的长度上限 |
--- | --- | --- | --- | --- | --- | --- | --- |
*
对于所有 Gemini 模型,一个词元相当于大约 4 个字符,因此 100 个词元相当于大约 60-80 个英文单词。对于 Gemini 模型,您可以使用 countTokens
确定请求中的词元总数。
** PDF 文件被视为图片,因此 PDF 文件的单页被视为一张图片。请求中允许的页数取决于模型可以支持的图片数量。
查找其他详细信息
您可以参阅支持的输入文件和要求,了解支持的输入文件类型、如何指定 MIME 类型,以及如何确保输入文件和多模态请求符合要求并遵循最佳实践。
模型版本控制和命名模式
模型提供稳定版、预览版和实验版。为方便起见,系统支持不含明确版本值的别名。
如需查找要在代码中使用的特定模型名称,请参阅本页后面的“可用模型名称”部分。
版本类型 / 发布阶段 |
说明 | 模型名称格式 | |
---|---|---|---|
稳定版 |
稳定版自发布之日起即可用于生产环境,并提供支持。
稳定版模型版本通常会随附一个停用日期,该日期表示模型可用的最后一天。在此日期之后,Google 将不再支持该型号,您也无法再访问该型号。 |
|
|
自动更新的稳定别名 (仅限 Gemini 2.0 模型) |
自动更新的稳定版别名始终指向相应模型的最新稳定版。如果发布了新的稳定版,自动更新别名会自动开始指向该新的稳定版。 |
仅限 Gemini 2.0 型号
示例: |
|
预览 |
预览版具有新功能,但被认为不稳定。
我们不建议将这些模型用于生产环境,这些模型具有更严格的速率限制,并且可能需要付费。
对于 Vertex AI Gemini API,2025 年 6 月之后发布的预览版模型通常需要您将模型的位置设置为 |
预览版模型的名称会附加
示例: |
|
实验性 |
实验性版本具有新功能,但被视为不稳定。
这些模型不建议用于生产用途,并且具有更严格的速率限制。实验版模型旨在收集反馈,并让用户能够试用我们的最新功能。 对于 Vertex AI Gemini API,2025 年 6 月之后发布的实验性模型要求您将模型的位置设置为 |
实验版模型的名称会附加
示例: |
|
已退休 |
已停用的版本已过停用日期,并且已被永久停用。
已弃用的模型不再受 Google 支持,也无法再访问,引用已弃用模型 ID 的请求通常会返回 404 错误。 |
--- |
可用模型名称
模型名称是您在模型初始化期间在代码中包含的显式值。
以程序化方式列出所有可用模型
您可以使用 REST API 列出所有可用的模型名称:
Gemini Developer API:调用
models.list
端点Vertex AI Gemini API:调用
publishers.models.list
端点
请注意,返回的此列表将包含 API 提供商支持的所有模型,但 Firebase AI Logic 仅支持本页面中描述的 Gemini 和 Imagen 模型。
另请注意,自动更新别名(例如 gemini-2.0-flash
)不会列出,因为它们是基础模型的便捷别名。
Gemini 个模型名称
如需查看适用于您平台的初始化示例,请参阅入门指南。
如需详细了解发布阶段(尤其是使用情形和结算),请参阅模型版本控制和命名模式。
Gemini 2.5 Pro 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro 的最新稳定版 | 稳定版 | 2025-06-17 | 不早于 2026-06-17 |
gemini-2.5-pro-preview-06-05 |
指向 Gemini 2.5 Pro 的最新稳定版本(目前为 gemini-2.5-pro |
预览 | 2025-06-05 | 不早于 2025-07-15 |
gemini-2.5-pro-preview-05-06 |
指向 Gemini 2.5 Pro* 的最新稳定版本的预览版(目前为 gemini-2.5-pro |
预览 | 2025-05-06 | 不早于 2025-07-15 |
gemini-2.5-pro-preview-03-25 |
指向 Gemini 2.5 Pro* 的最新稳定版本的预览版(目前为 gemini-2.5-pro |
预览 | 2025-03-25 | 不早于 2025-07-15 |
* Gemini 2.5 Pro 模型的现有预览版将于 2025 年 6 月 19 日开始指向稳定版。
Gemini 2.5 Flash 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash 的最新稳定版 | 稳定版 | 2025-06-17 | 不早于 2026-06-17 |
gemini-2.5-flash-preview-05-20 |
指向 Gemini 2.5 Flash 的最新稳定版本(目前为 gemini-2.5-flash |
预览 | 2025-05-20 | 不早于 2025-07-15 |
gemini-2.5-flash-preview-04-17 |
指向 Gemini 2.5 Flash* 的最新稳定版本的预览版(目前为 gemini-2.5-flash |
预览 | 2025-04-17 | 不早于 2025-07-15 |
* Gemini 2.5 Flash 模型的现有预览版将于 2025 年 6 月 19 日开始指向稳定版。
Gemini 2.5 Flash‑Lite 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
gemini-2.5-flash-lite-preview-06-17 |
Gemini 2.5 Flash‑Lite的初始预览版本 | 预览 | 2025-06-17 | 待定 |
Gemini 2.0 Flash 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
gemini-2.0-flash-001 |
Gemini 2.0 Flash 的最新稳定版 | 稳定版 | 2025-02-05 | 不早于 2026-02-05 |
gemini-2.0-flash |
指向 Gemini 2.0 Flash 的最新稳定版的自动更新别名 (目前为 gemini-2.0-flash-001 |
稳定版 | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite 的最新稳定版 | 稳定版 | 2025-02-25 | 不早于 2026-02-25 |
gemini-2.0-flash-lite |
指向 Gemini 2.0 Flash‑Lite 的最新稳定版的自动更新别名 (目前为 gemini-2.0-flash-lite-001 |
稳定版 | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Gemini 2.0 Flash Image Generation 的预览版 | 预览 | 2025-05-06 | 待定 |
Gemini 2.0 Flash Live 个模型名称
仅在将 Vertex AI Gemini API 用作 API 提供方时可用。 |
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Gemini 2.0 Flash Live 的预览版 | 预览 | 2025-04-09 | 待定 |
1 使用 Gemini Developer API 和 Firebase AI Logic SDK 时不支持。
Imagen 个模型名称
如需查看您平台的初始化示例,请参阅使用 Imagen 生成图片指南。
如需详细了解发布阶段(尤其是使用情形和结算),请参阅模型版本控制和命名模式。
Imagen 4 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 2 |
Imagen 4 的预览版 | 预览 | 2025-06-06 | 待定 |
imagen-4.0-generate-preview-05-20 2 |
Imagen 4 的预览版 | 预览 | 2025-05-20 | 不早于 2025 年 7 月 7 日 |
Imagen 4 Fast 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
imagen-4.0-fast-generate-preview-06-06 2 |
Imagen 4 Fast 的预览版 | 预览 | 2025-06-06 | 待定 |
Imagen 4 Ultra 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
imagen-4.0-ultra-generate-preview-06-06 2 |
Imagen 4 Ultra 的预览版 | 预览 | 2025-06-06 | 待定 |
imagen-4.0-ultra-generate-exp-05-20 2 |
Imagen 4 Ultra 的实验性版本 | 实验性 | 2025-05-20 | 不早于 2025 年 7 月 7 日 |
Imagen 3 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
imagen-3.0-generate-002 |
Imagen 3 的最新稳定版 | 稳定版 | 2025-01-23 | 不早于 2026-01-23 |
imagen-3.0-generate-001 2 |
Imagen 3 的初始稳定版 | 稳定版 | 2024-07-31 | 不早于 2025 年 7 月 31 日 |
Imagen 3 Fast 个模型名称
模型名称 | 说明 | 发布阶段 | 发布日期 | 停用日期 |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Imagen 3 Fast 的初始稳定版 | 稳定版 | 2024-07-31 | 不早于 2025 年 7 月 31 日 |
2 无论您如何访问 API,Gemini Developer API 都不支持此功能。
支持的语言
Gemini
所有 Gemini 模型都可以理解并以以下语言回答:
阿拉伯语 (ar)、孟加拉语 (bn)、保加利亚语 (bg)、中文(简体和繁体)(zh)、克罗地亚语 (hr)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、爱沙尼亚语 (et)、芬兰 (fi)、法语 (fr)、德语 (de)、希腊语 (el)、希伯来语 (iw)、印地语 (hi)、匈牙利语 (hu)、印度尼西亚语 (id)、意大利语 (it)、日语 (ja)、韩语 (ko)、拉脱维亚语 (lv)、立陶宛语 (lt)、挪威语 (no)、波兰语 (pl)、葡萄牙语 (pt)、罗马尼亚语 (ro)、俄语 (ru)、塞尔维亚语 (sr)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、西班牙语 (es)、斯瓦希里语 (sw)、瑞典语 (sv)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、越南语 (vi)
Gemini 2.0 Flash、Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型可以理解并用以下其他语言做出回答:
南非荷兰语 (af)、阿姆哈拉语 (am)、阿萨姆语 (as)、阿塞拜疆语 (az)、白俄罗斯语 (be)、波斯尼亚语 (bs)、加泰隆语 (ca)、宿务语 (ceb)、科西嘉语 (co)、威尔士语 (cy)、迪维希语 (dv)、世界语 (eo)、巴斯克语 (eu)、波斯语 (fa)、菲律宾语 (Tagalog) (fil)、弗里西语 (fy)、爱尔兰语 (ga)、苏格兰语 (gd)、加利西亚语 (gl)、古吉拉特语 (gu)、豪萨语 (ha)、夏威夷语 (haw)、苗语 (hmn)、海地克里奥语 (ht)、亚美尼亚语 (hy)、伊博语 (ig)、冰岛语 (is)、爪哇语 (jv)、格鲁吉亚语 (ka)、哈萨克语 (kk)、高棉语 (km)、卡纳达语 (kn)、克里奥语 (kri)、库尔德语 (ku)、吉尔吉斯语 (ky)、拉丁语 (la)、卢森堡语 (lb)、老挝语 (lo)、马达加斯加语 (mg)、毛利语 (mi)、马其顿语 (mk)、马拉雅拉姆语 (ml)、蒙古语 (mn)、曼尼普尔语 (Manipuri) (mni-Mtei)、马拉地语 (mr)、马来语 (ms)、马耳他语 (mt)、缅甸语 (Myanmar) (my)、尼泊尔语 (ne)、尼亚查语 (Chichewa) (ny)、奥里亚语 (Oriya) (or)、旁遮普语 (pa)、普什图语 (ps)、信德语 (sd)、僧伽罗语 (Sinhalese) (si)、萨摩亚语 (sm)、绍纳语 (sn)、索马里语 (so)、阿尔巴尼亚语 (sq)、塞索托语 (st)、巽他语 (su)、泰米尔语 (ta)、泰卢固语 (te)、塔吉克语 (tg)、维吾尔语 (ug)、乌尔都语 (ur)、乌兹别克语 (uz)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo)、祖鲁语 (zu)
Imagen
正式版:英语
预览版:简体中文、繁体中文、印地语、日语、韩语、葡萄牙语、西班牙语
有关旧版模型的信息
Firebase AI Logic 支持旧版有效 Gemini 型号(例如 Gemini 1.5 型号)。
Firebase AI Logic 不支持旧版 Imagen 模型(例如 Imagen 2)。
型号 | 输入 | 输出 | 优化目标 |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
文本、代码、PDF、图片、视频、音频 | 文本、代码、JSON | 支持需要更高智能的复杂推理任务; 200 万个 token 的长上下文 |
Gemini 1.5 Flashgemini-1.5-flash-002 |
文本、代码、PDF、图片、视频、音频 | 文本、代码、JSON | 在各种任务中提供快速而多样的性能 |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
后续步骤
试用 Gemini API 的功能
- 构建多轮对话(聊天)。
- 根据纯文本提示生成文本。
- 通过各种文件类型(例如图片、PDF、视频和音频)提示来生成文本。
- 根据文本提示和多模态提示生成结构化输出(如 JSON)。
- 根据文本提示生成图片(Gemini 或 Imagen)。
- 使用 Gemini Live API 以流式方式输入和输出(包括音频)。
- 使用函数调用将生成式模型连接到外部系统和信息。