Gemini 模型系列視為「多模態」,因為它們可以處理多種形式的資訊,包括圖片、影片和文字。舉例來說,您可以傳送 Gemini 模型,拍攝一盤餅乾的相片,並要求它提供這些 Cookie 的食譜。
提示 | 回應 |
給我看這些餅乾的食譜。 |
**紅色標示** - 1 c. (2 棒) 無鹽奶油,軟性柔軟 - 3/4 c. 焦糖花糖 - 3/4 c. 棕色糖,已裝滿 - 1 Tsp。香草擷取 - 2 顆大蛋 - 2 1/4 c. 全用途麵粉 - 1 Tsp. 烘培蘇打水 - 1 Tsp. 鹽 ... |
您可以使用 Google Cloud 上的 Vertex AI 提供的 Gemini API 與 Gemini 模型系列互動。如果是行動和網頁應用程式,您可以使用 Vertex AI for Firebase SDK 呼叫 Gemini API,並直接從應用程式與 Genmini 模型互動。
本頁面提供 Gemini 模型的下列資訊:
各種 Gemini 模型用途的高階比較,包括支援的輸入類型。
每個模型的詳細資料比較,例如輸入符記上限或影片長度上限。
請在初始化期間納入程式碼的可用模型名稱清單。
Gemini 模型的支援語言清單。
可用的模型
您可以將下列任何 Gemini 模型與 Vertex AI for Firebase 搭配使用:
Gemini 1.5 Flash:支援 1.5 Pro 的輸入和輸出類型 (及符記總數) 的多模態模型,不過 1.5 Flash 是專為高流量、成本效益高的應用程式所設計。
Gemini 1.5 Pro:支援在文字或聊天提示中,新增圖片、音訊、影片和 PDF 檔案的多模態模型,用於回應文字或程式碼回應。另外,您也能透過多達 100 萬個符記,進行長期理解。
Gemini 1.0 Pro Vision:多模態模型,用於處理文字或程式碼回應的文字、圖片和影片。無法進行即時通訊,
Gemini 1.0 Pro:專為處理自然語言工作、包含文字和程式碼的多輪即時通訊以及程式碼產生而設計的模型。
各模型的應用情境
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|
輸入類型 | |||
文字 | |||
程式碼 | |||
映像檔 | |||
影片 (僅限影格) | |||
影片 (影格和音訊) | |||
音訊 | |||
輸出類型 | |||
文字 | |||
程式碼 | |||
一般用途 | |||
多模態要求 | |||
多輪對話 |
如要進一步瞭解 Gemini 模型的用途,請參閱 Google Cloud 說明文件:
每個模型的詳細資訊
在所有 Gemini 模型中,符記都相當於約 4 個半形字元;100 組符記大約是 60 到 80 個英文字詞。您可以使用 countTokens
判斷要求中的權杖總數。
屬性 |
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|
符記總限制 (合併輸入和輸出) | 100 萬個符記 | 16,384 個符記 | 32,760 個符記 |
輸出詞元限制 | 8,192 個符記 | 2,048 個符記 | 8,192 個符記 |
每項要求的圖片數量上限 | 3,000 張圖片 | 16 張圖片 | 不適用 |
最大 Base64 編碼圖片大小 | 7 MB | 7 MB | 不適用 |
PDF 大小上限 | 30 MB | 30 MB | 不適用 |
每次要求的影片檔案數量上限 | 10 個影片檔案 | 1 部影片檔案 | 不適用 |
影片長度上限 (僅限影格) | 60 分鐘影片 | 2 分鐘 | 不適用 |
影片長度上限 (影格和音訊) | 約 45 分鐘的影片 | 不適用 | 不適用 |
每個要求的音訊檔案數量上限 | 1 個音訊檔案 | 不適用 | 不適用 |
音訊長度上限 | 約 8.4 小時的音訊 | 不適用 | 不適用 |
以下是模型和輸入檔案的詳細資訊:
請參閱 Google Cloud 說明文件,瞭解多模態模型之間的差異。
瞭解支援的檔案類型、如何指定 MIME 類型,以及如何確保您的檔案和多模態要求符合規範,並遵循「Vertex AI Gemini API 支援的輸入檔案和規定」中的最佳做法。
模型的版本管理
Gemini 模型提供穩定版、自動更新和預覽版本。
「穩定版」是指正式發布版。
「自動更新」版本一律會指向該模型的「最新穩定」版本。在新穩定版發布後,自動更新版本會自動開始指向新的穩定版本。
預先發布版包含新功能,因此不穩定。請注意,預先發布版一律會指向該模型的最新「預先發布版」。新的預先發布版發布後,所有現有的預先發布版都會自動開始指向該新的預先發布版。
- 預先發布版會附加 模型名稱 和模型的初始發布日期 (
),例如-MMDD
(發布日期:2024 年 4 月 9 日)。gemini-1.5-pro-preview-0409
-preview
- 預先發布版會附加 模型名稱 和模型的初始發布日期 (
如要進一步瞭解可用的 Gemini 模型版本及其生命週期,請參閱 Google Cloud 說明文件。
可用的模型名稱
模型名稱是指在生成式模型初始化期間,程式碼中加入的明確值 (這是呼叫 Gemini API 的必要步驟)。如需您程式語言的初始化範例,請參閱入門指南。
Gemini 1.5 Flash 模式名稱
模型名稱 | Description | 發布階段 | 第一版發布日期 | 終止日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.5-flash-001 |
Gemini 1.5 Flash 的最新穩定版本 | 正式發布 | 2024-05-24 | 不得早於 2025-05-24 |
自動更新版本 | ||||
gemini-1.5-flash |
指向最新的穩定 1.5 Flash 版本 (目前為 gemini-1.5-flash-001 |
正式發布 | 2024-05-24 | --- |
預先發布版 | ||||
gemini-1.5-flash-preview-0514 |
Gemini 1.5 Flash 最新預先發布版 | 公開預先發布版 | 2024-05-14 | 2024-06-24 |
Gemini 1.5 Pro 模型名稱
模型名稱 | Description | 發布階段 | 第一版發布日期 | 終止日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro 的最新穩定版本 | 正式發布 | 2024-05-24 | 不得早於 2025-05-24 |
自動更新版本 | ||||
gemini-1.5-pro |
指向最新的穩定 1.5 Pro 版本 (目前為 gemini-1.5-pro-001 |
正式發布 | 2024-05-24 | --- |
預先發布版 | ||||
gemini-1.5-pro-preview-0514 |
Gemini 1.5 Pro 最新預先發布版 | 公開預先發布版 | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
指向 gemini-1.5-pro-preview-0514 (這是最新的預先發布版版本) |
公開預先發布版 | 2024-04-09 | 2024-06-14 |
Gemini 1.0 Pro Vision 模型名稱
模型名稱 | Description | 發布階段 | 第一版發布日期 | 終止日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision 的最新穩定版 | 正式發布 | 2024-02-15 | 不得早於 2025-02-15 |
自動更新版本 | ||||
gemini-1.0-pro-vision |
指向 1.5 Pro Vision 的最新穩定版本 (目前為 gemini-1.5-pro-vision-001 |
正式發布 | 2024-01-04 | --- |
Gemini 1.0 Pro 模型名稱
模型名稱 | Description | 發布階段 | 第一版發布日期 | 終止日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro 的最新穩定版本 | 正式發布 | 2024-04-09 | 不得早於 2025-04-09 |
gemini-1.0-pro-001 |
Gemini 1.0 Pro 穩定版 | 正式發布 | 2024-02-15 | 不得早於 2025-02-15 |
自動更新版本 | ||||
gemini-1.0-pro |
指向最新的穩定 1.0 Pro 版本 (目前為 gemini-1.0-pro-002 |
正式發布 | 2024-02-15 | --- |
支援的語言
Gemini 模型支援下列語言:
阿拉伯文 (ar)、孟加拉文 (bn)、保加利亞文 (bg)、中文 (簡體和繁體 (zh)、克羅埃西亞文 (hr)、捷克文 (cs)、丹麥文 (da)、荷蘭文 (nl)、法文 (法文)、德文 (德文)、希臘文 (土耳其文)、希伯來文 (iwrian)
後續步驟