瞭解 Gemini 模型

Gemini 模型系列視為「多模態」,因為它們可以處理多種形式的資訊,包括圖片、影片和文字。舉例來說,您可以傳送 Gemini 模型,拍攝一盤餅乾的相片,並要求它提供這些 Cookie 的食譜。

提示 回應

給我看這些餅乾的食譜。

多個巧克力脆片餅乾的相片
**紅色標示**
- 1 c. (2 棒) 無鹽奶油,軟性柔軟
- 3/4 c. 焦糖花糖
- 3/4 c. 棕色糖,已裝滿
- 1 Tsp。香草擷取
- 2 顆大蛋
- 2 1/4 c. 全用途麵粉
- 1 Tsp. 烘培蘇打水
- 1 Tsp. 鹽
...

您可以使用 Google Cloud 上的 Vertex AI 提供的 Gemini API 與 Gemini 模型系列互動。如果是行動和網頁應用程式,您可以使用 Vertex AI for Firebase SDK 呼叫 Gemini API,並直接從應用程式與 Genmini 模型互動。

本頁面提供 Gemini 模型的下列資訊:

  • 各種 Gemini 模型用途的高階比較,包括支援的輸入類型。

  • 每個模型的詳細資料比較,例如輸入符記上限或影片長度上限。

  • 說明 Gemini 模型的「版本編號」如何建立版本的說明,特別是穩定版自動更新預覽版本。

  • 請在初始化期間納入程式碼的可用模型名稱清單。

  • Gemini 模型的支援語言清單。

可用的模型

您可以將下列任何 Gemini 模型與 Vertex AI for Firebase 搭配使用:

  • Gemini 1.5 Flash:支援 1.5 Pro 的輸入和輸出類型 (及符記總數) 的多模態模型,不過 1.5 Flash 是專為高流量、成本效益高的應用程式所設計。

  • Gemini 1.5 Pro:支援在文字或聊天提示中,新增圖片、音訊、影片和 PDF 檔案的多模態模型,用於回應文字或程式碼回應。另外,您也能透過多達 100 萬個符記,進行長期理解。

  • Gemini 1.0 Pro Vision:多模態模型,用於處理文字或程式碼回應的文字、圖片和影片。無法進行即時通訊,

  • Gemini 1.0 Pro:專為處理自然語言工作、包含文字和程式碼的多輪即時通訊以及程式碼產生而設計的模型。

跳至「模型名稱」,將名稱加入程式碼

各模型的應用情境

Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
輸入類型
文字
程式碼
映像檔
PDF
影片 (僅限影格)
影片 (影格和音訊)
音訊
輸出類型
文字
程式碼
一般用途
多模態要求
多輪對話

如要進一步瞭解 Gemini 模型的用途,請參閱 Google Cloud 說明文件:

每個模型的詳細資訊

在所有 Gemini 模型中,符記都相當於約 4 個半形字元;100 組符記大約是 60 到 80 個英文字詞。您可以使用 countTokens 判斷要求中的權杖總數。

屬性 Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
符記總限制 (合併輸入和輸出) 100 萬個符記 16,384 個符記 32,760 個符記
輸出詞元限制 8,192 個符記 2,048 個符記 8,192 個符記
每項要求的圖片數量上限 3,000 張圖片 16 張圖片 不適用
最大 Base64 編碼圖片大小 7 MB 7 MB 不適用
PDF 大小上限 30 MB 30 MB 不適用
每次要求的影片檔案數量上限 10 個影片檔案 1 部影片檔案 不適用
影片長度上限 (僅限影格) 60 分鐘影片 2 分鐘 不適用
影片長度上限 (影格和音訊) 約 45 分鐘的影片 不適用 不適用
每個要求的音訊檔案數量上限 1 個音訊檔案 不適用 不適用
音訊長度上限 約 8.4 小時的音訊 不適用 不適用

以下是模型和輸入檔案的詳細資訊:

模型的版本管理

Gemini 模型提供穩定版自動更新預覽版本。

  • 「穩定版」是指正式發布版。

    • 穩定版會在「模型名稱」後方加上特定的三位數版本號碼,例如 gemini-1.0-pro-001
  • 「自動更新」版本一律會指向該模型的「最新穩定版本。在新穩定版發布後,自動更新版本會自動開始指向新的穩定版本。

    • 自動更新版本的「模型名稱」不含附屬項目,例如 gemini-1.0-pro
  • 預先發布版包含新功能,因此不穩定。請注意,預先發布版一律會指向該模型的最新「預先發布版」。新的預先發布版發布後,所有現有的預先發布版都會自動開始指向該新的預先發布版。

    • 預先發布版會附加 模型名稱 和模型的初始發布日期 (-MMDD),例如 gemini-1.5-pro-preview-0409 (發布日期:2024 年 4 月 9 日)。-preview

如要進一步瞭解可用的 Gemini 模型版本及其生命週期,請參閱 Google Cloud 說明文件。

可用的模型名稱

模型名稱是指在生成式模型初始化期間,程式碼中加入的明確值 (這是呼叫 Gemini API 的必要步驟)。如需您程式語言的初始化範例,請參閱入門指南

Gemini 1.5 Flash 模式名稱

模型名稱 Description 發布階段 第一版發布日期 終止日期
穩定版
gemini-1.5-flash-001 Gemini 1.5 Flash 的最新穩定版本 正式發布 2024-05-24 不得早於 2025-05-24
自動更新版本
gemini-1.5-flash 指向最新的穩定 1.5 Flash 版本
(目前為 gemini-1.5-flash-001)
正式發布 2024-05-24 ---
預先發布版
gemini-1.5-flash-preview-0514 Gemini 1.5 Flash 最新預先發布版 公開預先發布版 2024-05-14 2024-06-24

Gemini 1.5 Pro 模型名稱

模型名稱 Description 發布階段 第一版發布日期 終止日期
穩定版
gemini-1.5-pro-001 Gemini 1.5 Pro 的最新穩定版本 正式發布 2024-05-24 不得早於 2025-05-24
自動更新版本
gemini-1.5-pro 指向最新的穩定 1.5 Pro 版本
(目前為 gemini-1.5-pro-001)
正式發布 2024-05-24 ---
預先發布版
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro 最新預先發布版 公開預先發布版 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 指向 gemini-1.5-pro-preview-0514
(這是最新的預先發布版版本)
公開預先發布版 2024-04-09 2024-06-14

Gemini 1.0 Pro Vision 模型名稱

模型名稱 Description 發布階段 第一版發布日期 終止日期
穩定版
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision 的最新穩定版 正式發布 2024-02-15 不得早於 2025-02-15
自動更新版本
gemini-1.0-pro-vision 指向 1.5 Pro Vision 的最新穩定版本
(目前為 gemini-1.5-pro-vision-001)
正式發布 2024-01-04 ---

Gemini 1.0 Pro 模型名稱

模型名稱 Description 發布階段 第一版發布日期 終止日期
穩定版
gemini-1.0-pro-002 Gemini 1.0 Pro 的最新穩定版本 正式發布 2024-04-09 不得早於 2025-04-09
gemini-1.0-pro-001 Gemini 1.0 Pro 穩定版 正式發布 2024-02-15 不得早於 2025-02-15
自動更新版本
gemini-1.0-pro 指向最新的穩定 1.0 Pro 版本
(目前為 gemini-1.0-pro-002)
正式發布 2024-02-15 ---

支援的語言

Gemini 模型支援下列語言:

阿拉伯文 (ar)、孟加拉文 (bn)、保加利亞文 (bg)、中文 (簡體和繁體 (zh)、克羅埃西亞文 (hr)、捷克文 (cs)、丹麥文 (da)、荷蘭文 (nl)、法文 (法文)、德文 (德文)、希臘文 (土耳其文)、希伯來文 (iwrian)

後續步驟

試用 Gemini API 的功能