對於行動和網頁應用程式,Vertex AI in Firebase SDK 可讓您直接透過應用程式與支援的 Gemini 模型互動。
Gemini 模型屬於多模態模型,因為它們能夠處理甚至產生多種模態,包括文字、程式碼、PDF、圖片、影片和音訊。
以下簡要介紹 Vertex AI in Firebase 支援的裝置型號,以及這些裝置的最新穩定版。本頁後續的各節會提供更詳細的比較和資訊。
模型 | 輸入 | 輸出 | 適合用途 |
---|---|---|---|
Gemini 模型 | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON (圖片和音訊即將推出!) |
新一代功能、速度和多模態生成功能,可用於各種任務 |
Gemini 1.5 Progemini-1.5-pro-002 |
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 需要更多智慧的複雜推論工作 |
Gemini 1.5 Flashgemini-1.5-flash-002 |
文字、程式碼、PDF 檔案、圖片、影片、音訊 | 文字、程式碼、JSON | 在各種任務中提供快速且多功能的效能 |
本頁的其餘部分會提供 Vertex AI in Firebase 支援的模型詳細資訊:
比較模式:
- 支援的輸入和輸出
- 支援功能的概略比較
- 規格和限制,例如輸入符記上限或輸入影片長度上限
說明模型的版本編號方式,特別是穩定版、自動更新版和預覽版
在初始化期間,要納入程式碼的可用模型名稱清單
模型支援的語言清單
您可以在本頁底部查看舊型機型詳細資訊。
比較模型
每個模型的功能各有不同,可支援各種用途。請注意,本節中的每個表格都會說明與 Vertex AI in Firebase 搭配使用時的每個模型。每個模型可能都有額外功能,這些功能在使用 SDK 時無法使用。
如要進一步瞭解各個 Gemini 模型,請參閱 Google Cloud 說明文件。
支援的輸入和輸出
以下是搭配 Vertex AI in Firebase 使用各個模型時支援的輸入和輸出類型:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
輸入類型 | ||||
文字 | ||||
程式碼 | ||||
文件 (PDF 或純文字) | ||||
圖片、影片和音訊 | ||||
音訊 (串流) | 敬請期待! | |||
輸出類型 | ||||
文字 | ||||
結構化輸出內容 (例如 JSON) | ||||
程式碼 | ||||
圖片 | 敬請期待! | |||
音訊 | 敬請期待! | |||
音訊 (串流) | 敬請期待! |
如要瞭解支援的檔案類型,請參閱「Vertex AI Gemini API 支援的輸入檔案和相關需求」。
支援的功能
以下是搭配 Vertex AI in Firebase 使用各個模型時支援的功能和功能:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
根據文字或多模態輸入內容生成文字 | ||||
產生圖片 | 敬請期待! | |||
產生音訊 | 敬請期待! | |||
產生結構化輸出內容 (例如 JSON) | ||||
分析圖片和影片 (視覺) | ||||
分析音訊 | ||||
分析文件 (PDF 或純文字) | ||||
多輪對話 | ||||
函式呼叫 (工具) | ||||
基本函式呼叫 | ||||
並行函式呼叫 | ||||
函式呼叫模式 | ||||
計算符記和可計費字元 | ||||
系統操作說明 | ||||
Multimodal Live API (雙向串流) | 敬請期待! |
規格和限制
以下是將每個模型與 Vertex AI in Firebase 搭配使用時的規格和限制:
屬性 | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
脈絡窗口 * 總符號限制 (輸入和輸出總和) |
1,048,576 個符記 | 2,097,152 個符記 | 1,048,576 個符記 |
輸出符記限制 * | 8,192 個符記 | 8,192 個符記 | 8,192 個符記 |
知識截止日期 | 2024 年 6 月 | 2024 年 5 月 | 2024 年 5 月 |
圖片 (每個要求) | |||
輸入圖片的數量上限 | 3,000 張圖片 | 3,000 張圖片 | 3,000 張圖片 |
輸出圖片的數量上限 | 敬請期待! | --- | --- |
每個輸入 Base64 編碼圖片的大小上限 | 7 MB | 7 MB | 7 MB |
PDF (每項要求) | |||
輸入 PDF 檔案的數量上限 ** | 3,000 個檔案 | 3,000 個檔案 | 3,000 個檔案 |
每個輸入 PDF 檔案的頁數上限 ** | 1,000 頁 | 1,000 頁 | 1,000 頁 |
每個輸入 PDF 檔案的大小上限 | 50 MB | 50 MB | 50 MB |
影片 (每項要求) | |||
輸入影片檔案數量上限 | 10 個檔案 | 10 個檔案 | 10 個檔案 |
所有輸入影片的長度上限 (僅限影格) | 約 60 分鐘 | 約 60 分鐘 | 約 60 分鐘 |
所有輸入影片 (影格 + 音訊) 的長度上限 | 約 45 分鐘 | 約 45 分鐘 | 約 45 分鐘 |
音訊 (依要求) | |||
輸入音訊檔案的數量上限 | 1 個檔案 | 1 個檔案 | 1 個檔案 |
輸出音訊檔案的數量上限 | 敬請期待! | --- | --- |
所有輸入音訊的長度上限 | 約 8.4 小時 | 約 8.4 小時 | 約 8.4 小時 |
所有輸出音訊的長度上限 | 敬請期待! | --- | --- |
* 對於所有模型,一個符記相當於約 4 個字元,因此 100 個符記約等於 60 到 80 個英文單字。針對 Gemini 模型,您可以使用 countTokens
判斷要求中的符記總數。
** PDF 會視為圖片,因此 PDF 的單頁會視為一張圖片。要求中允許的頁面數量,不得超過模型可支援的圖片數量。
查看其他詳細資訊
請參閱「支援的輸入檔案類型和 Vertex AI Gemini API 的相關規定」,瞭解支援的輸入檔案類型、如何指定 MIME 類型,以及如何確保輸入檔案和多模態要求符合規定並遵循最佳做法。
模型版本管理和命名模式
模型提供穩定、自動更新和預覽版本。
穩定版視為正式發布版。
- 穩定版會在模型名稱後方附加特定的三位數版本號碼,例如
。gemini-2.0-flash-001
- 穩定版會在模型名稱後方附加特定的三位數版本號碼,例如
自動更新版本一律會指向該模型的最新穩定版本;如果發布新的穩定版本,自動更新版本會自動開始指向該新穩定版本。
- 自動更新版本的模型名稱沒有附加字元,例如
。gemini-2.0-flash
- 自動更新版本的模型名稱沒有附加字元,例如
預先發布版具有新功能,且被視為不穩定。請注意,預先發布版一律會指向該模型的最新預先發布版;如果發布新的預先發布版,所有現有的預先發布版都會自動開始指向該新預先發布版。
- 預覽版本會在模型名稱後方加上
,並附上模型的初始發布日期 (-preview
),例如-MMDD
(2024 年 4 月 9 日發布)。gemini-1.5-pro-preview-0409
- 預覽版本會在模型名稱後方加上
如要進一步瞭解可用的模型版本及其生命週期 (Gemini),請參閱 Google Cloud 說明文件。
可用的模型名稱
模型名稱是您在初始化生成模型時在程式碼中加入的明確值 (這是呼叫 Gemini API 的必要步驟)。
您可以使用 publishers.models.list
端點列出所有可用的模型名稱。請注意,這個傳回清單會包含 Vertex AI 支援的所有模型,但 Vertex AI in Firebase 只支援本頁所述的 Gemini 模型。另請注意,自動更新的版本 (例如 gemini-2.0-flash
) 不會列出,因為這些是基本穩定模型的方便別名。
Gemini 型號名稱
如需所用語言的初始化範例,請參閱入門指南。
Gemini 2.0 Flash 型號名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 停用日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-2.0-flash-001 |
Gemini 2.0 Flash 的最新穩定版 | 正式發布版 | 2025-02-05 | 待定 |
自動更新版本 | ||||
gemini-2.0-flash |
指向 2.0 Flash 的最新穩定版 (目前為 gemini-2.0-flash-001 |
正式發布版 | 2025-02-10 | --- |
Gemini 1.5 Pro 型號名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 停用日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.5-pro-002 |
Gemini 1.5 Pro 的最新穩定版 | 正式發布版 | 2024-09-24 | 最早於 2025-09-24 |
gemini-1.5-pro-001 |
Gemini 1.5 Pro 的初始穩定版本 | 正式發布版 | 2024-05-24 | 最早於 2025-05-24 |
自動更新版本 | ||||
gemini-1.5-pro |
指向 1.5 Pro 的最新穩定版本 (目前為 gemini-1.5-pro-002 |
正式發布版 | 2024-09-24 | --- |
Gemini 1.5 Flash 型號名稱
模型名稱 | 說明 | 發布階段 | 第一版發布日期 | 停用日期 |
---|---|---|---|---|
穩定版 | ||||
gemini-1.5-flash-002 |
Gemini 1.5 Flash 的最新穩定版 | 正式發布版 | 2024-09-24 | 最早於 2025-09-24 |
gemini-1.5-flash-001 |
Gemini 1.5 Flash 的初始穩定版本 | 正式發布版 | 2024-05-24 | 最早於 2025-05-24 |
自動更新版本 | ||||
gemini-1.5-flash |
指向 1.5 Flash 的最新穩定版 (目前為 gemini-1.5-flash-002 |
正式發布版 | 2024-09-24 | --- |
支援的語言
Gemini
所有 Gemini 模型都能以以下語言理解及回應:
阿拉伯文 (ar)、孟加拉文 (bn)、保加利亞文 (bg)、簡體中文和繁體中文 (zh)、克羅埃西亞文 (hr)、捷克文 (cs)、丹麥文 (da)、荷蘭文 (nl)、英文 (en)、愛沙尼亞文 (et)、芬蘭文 (fi)、法文 (fr)、德文 (de)、希臘文 (el)、希伯來文 (iw)、北印度文 (hi)、匈牙利文 (hu)、印尼文 (id)、義大利文 (it)、日文 (ja)、韓文 (ko)、拉脫維亞文 (lv)、立陶宛文 (lt)、挪威文 (no)、波蘭文 (pl)、葡萄牙文 (pt)、羅馬尼亞文 (ro)、俄文 (ru)、塞爾維亞文 (sr)、斯洛伐克文 (sk)、斯洛維尼亞文 (sl)、西班牙文 (es)、斯瓦希里文 (sw)、瑞典文 (sv)、泰文 (th)、土耳其文 (tr)、烏克蘭文 (uk)、越南文 (vi)
Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型可理解並以以下其他語言回應:
Afrikaans (af)、Amharic (am)、Assamese (as)、Azerbaijani (az)、 Belarusian (be)、Bosnian (bs)、Catalan (ca)、Cebuano (ceb)、Corsican (co)、 Welsh (cy)、Dhivehi (dv)、Esperanto (eo)、Basque (eu)、Persian (fa)、 Filipino (Tagalog) (fil)、Frisian (fy)、Irish (ga)、Scots Gaelic (gd)、 Galician (gl)、Gujarati (gu)、Hausa (ha)、Hawaiian (haw)、Hmong (hmn)、 Haitian Creole (ht)、Armenian (hy)、Igbo (ig)、Icelandic (is)、Javanese (jv)、 Georgian (ka)、Kazakh (kk)、Khmer (km)、Kannada (kn)、Krio (kri)、 Kurdish (ku)、Kyrgyz (ky)、Latin (la)、Luxembourgish (lb)、Lao (lo)、 Malagasy (mg)、Maori (mi)、Macedonian (mk)、Malayalam (ml)、Mongolian (mn)、 Meiteilon (Manipuri) (mni-Mtei)、Marathi (mr)、Malay (ms)、Maltese (mt)、 Myanmar (Burmese) (my)、Nepali (ne)、Nyanja (Chichewa) (ny)、 Odia (Oriya) (or)、Punjabi (pa)、Pashto (ps)、Sindhi (sd)、 Sinhala (Sinhalese) (si)、Samoan (sm)、Shona (sn)、Somali (so)、Albanian (sq)、 Sesotho (st)、Sundanese (su)、Tamil (ta)、Telugu (te)、Tajik (tg)、 Uyghur (ug)、Urdu (ur)、Uzbek (uz)、Xhosa (xh)、Yiddish (yi)、Yoruba (yo)、 Zulu (zu)
舊型機型相關資訊
Vertex AI in Firebase 支援所有 Gemini 型號,包括 Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 等舊型號。不過,我們強烈建議您搭配我們的 SDK 使用較新的型號。這些舊款 Gemini 型號即將停產,且不提供新款型號的所有功能。
後續步驟
試用 Gemini API 的功能
- 建構多輪對話 (聊天)。
- 使用文字提示來生成文字。
- 使用多模態提示 (包括文字、圖片、PDF、影片和音訊) 來生成文字。
- 從文字和多模態提示產生結構化輸出內容 (例如 JSON)。
- 使用函式呼叫,將生成模型連結至外部系統和資訊。