All Gemini 1.0 and Gemini 1.5 models are now retired.
To avoid service disruption, update to a newer model (for example, gemini-2.5-flash-lite). Learn more.

本頁面由 Cloud Translation API 翻譯而成。

使用裝置端和雲端代管模型建構混合式體驗

運用混合式推論技術，透過 Firebase AI Logic 建構 AI 技術輔助應用程式與功能。混合式推論功能可讓您在裝置端模型可用時，使用該模型執行推論，否則會順暢地改用雲端代管模型 (反之亦然)。

在此版本中，您可以使用 Firebase AI Logic 用戶端 SDK for Web 進行混合推論，並支援在桌機版 Chrome 上進行裝置端推論。

直接查看程式碼範例

建議用途和支援的功能

建議用途：

使用裝置端模型進行推論：
- 強化隱私權
- 查看當地特色
- 免付費推論
- 離線功能
使用混合功能方案：
- 無論裝置型號是否支援或網路連線狀態如何，都能觸及 100% 的目標對象

裝置端推論支援的功能：

單輪內容生成 (串流和非串流)
僅使用文字輸入生成文字
根據文字和圖片輸入內容生成文字，具體來說，輸入的圖片類型為 JPEG 和 PNG
生成結構化輸出，包括 JSON 和列舉

開始使用

本指南說明如何開始使用 Firebase AI Logic SDK for Web 執行混合推論。

使用裝置端模型進行推論時，會使用 Chrome 的提示 API；使用雲端託管模型進行推論時，則會使用您選擇的Gemini API供應商 (Gemini Developer API 或 Vertex AI Gemini API)。

如本節所述，開始使用 localhost 進行開發 (您也可以參閱 Chrome 說明文件，進一步瞭解如何在 localhost 上使用 API)。實作功能後，您可以選擇讓使用者試用功能。

步驟 1：設定 Chrome 和 Prompt API，以便在裝置上進行推論

確認你使用的是新版 Chrome。在 chrome://settings/help 中更新。
Chrome 第 139 版以上版本支援裝置端推論。
將下列標記設為「Enabled」，即可啟用裝置端多模態模型：
- chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
重新啟動 Chrome。
(選用) 在發出第一個要求前，先下載裝置端模型。

Prompt API 已內建於 Chrome，但預設不會提供裝置端模型。如果您尚未下載模型，就首次要求進行裝置端推論，系統會自動在背景啟動模型下載作業。

注意： 下載模型可能需要幾分鐘，因此等待系統在收到第一個要求時自動下載模型，可能會大幅延遲該要求的相關回應。
查看如何下載裝置端模型的說明
1. 開啟「開發人員工具」>「控制台」。
2. 執行以下指令：
```
await LanguageModel.availability();
```
3. 確認輸出結果為 available、downloading 或 downloadable。
4. 如果輸出內容為 downloadable，請執行下列指令，開始下載模型：
```
await LanguageModel.create();
```
5. 您可以使用下列 monitor 回呼監聽下載進度，並確保模型處於 available 狀態，再提出要求：
```
const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});
```

步驟 2：設定 Firebase 專案，並將應用程式連結至 Firebase

登入 Firebase 控制台，然後選取 Firebase 專案。
還沒有 Firebase 專案嗎？

如果您還沒有 Firebase 專案，請按一下按鈕建立新的 Firebase 專案，然後使用下列任一選項：
- 選項 1：在工作流程的第一個步驟中輸入新專案名稱，即可建立全新的 Firebase 專案 (以及底層的 Google Cloud專案)。
- 方法 2：點按「將 Firebase 新增到 Google Cloud 專案」(頁面底部)，將 Firebase 新增到現有的 Google Cloud 專案。在工作流程的第一個步驟中，開始輸入現有專案的專案名稱，然後從顯示的清單中選取專案。
完成畫面上的工作流程，建立 Firebase 專案。請注意，系統提示時，您不需要設定 Google Analytics 即可使用 Firebase AI Logic SDK。
前往 Firebase 控制台的「Firebase AI Logic」頁面。
按一下「開始使用」，即可啟動導覽工作流程，協助您為專案設定必要 API 和資源。
選取要搭配 Firebase AI Logic SDK 使用的「Gemini API」供應商。Gemini Developer API 建議初次使用者採用。如要新增帳單或設定Vertex AI Gemini API，之後隨時可以進行。
- Gemini Developer API - 計費為選用項目 (適用於免付費的 Spark 價格方案，您日後可視需要升級)
  控制台會啟用必要的 API，並在專案中建立 Gemini API 金鑰。
  請勿將這個 Gemini API 金鑰加入應用程式的程式碼集。 瞭解詳情。
- Vertex AI Gemini API - 需要計費 (需要即付即用 Blaze 定價方案)
  控制台會協助您設定帳單，並在專案中啟用必要的 API。
如果控制台的工作流程中出現提示，請按照畫面上的指示註冊應用程式，並將其連結至 Firebase。
請繼續按照本指南的下一個步驟，將 SDK 新增至應用程式。

步驟 3：新增 SDK

Firebase 程式庫提供 API 存取權，可與生成模型互動。這個程式庫是 Firebase JavaScript SDK for Web 的一部分。

使用 npm 安裝適用於網頁的 Firebase JS SDK：
```
npm install firebase
```

在應用程式中初始化 Firebase：

import { initializeApp } from "firebase/app";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

步驟 4：初始化服務並建立模型例項

按一下 Gemini API 供應商，即可在這個頁面查看供應商專屬內容和程式碼。

將提示傳送至 Gemini 模型前，請先初始化所選 API 供應商的服務，並建立 GenerativeModel 執行個體。

將 mode 設為下列其中一個值：

PREFER_ON_DEVICE：設定 SDK 使用裝置端模型 (如有)，或改用雲端代管模型。
ONLY_ON_DEVICE：設定 SDK 使用裝置端模型或擲回例外狀況。
PREFER_IN_CLOUD：設定 SDK 使用雲端代管模型 (如有)，或改用裝置端模型。
ONLY_IN_CLOUD：將 SDK 設定為一律不使用裝置端模型。

使用 PREFER_ON_DEVICE、PREFER_IN_CLOUD 或 ONLY_IN_CLOUD 時，預設的雲端代管模型為 gemini-2.0-flash-lite，但您可以覆寫預設值。

import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend, InferenceMode } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create a `GenerativeModel` instance
// Set the mode, for example to use on-device model when possible
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });

將提示要求傳送至模型

本節提供範例，說明如何傳送各種輸入內容來生成不同類型的輸出內容，包括：

使用純文字輸入生成文字
透過文字和圖片 (多模態) 輸入內容生成文字

如要生成結構化輸出內容 (例如 JSON 或列舉)，請使用下列其中一個「生成文字」範例，並將模型設定為根據提供的結構定義回覆。

使用純文字輸入生成文字

嘗試這個範例之前，請先完成本指南的「開始使用」一節。

您可以使用 generateContent() 從含有文字的提示生成文字：

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Wrap in an async function so you can use await
async function run() {
  // Provide a prompt that contains text
  const prompt = "Write a story about a magic backpack."

  // To generate text output, call `generateContent` with the text input
  const result = await model.generateContent(prompt);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

請注意，Firebase AI Logic 也支援使用 generateContentStream (而非 generateContent) 串流傳輸文字回應。

根據文字和圖片 (多模態) 輸入內容生成文字

嘗試這個範例之前，請先完成本指南的「開始使用」一節。

您可以透過含有文字和圖片檔案的提示，使用 generateContent() 生成文字，並提供每個輸入檔案的 mimeType 和檔案本身。

裝置端推論支援的輸入圖片類型為 PNG 和 JPEG。

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Converts a File object to a Part object.
async function fileToGenerativePart(file) {
  const base64EncodedDataPromise = new Promise((resolve) => {
    const reader = new FileReader();
    reader.onloadend = () => resolve(reader.result.split(',')[1]);
    reader.readAsDataURL(file);
  });
  return {
    inlineData: { data: await base64EncodedDataPromise, mimeType: file.type },
  };
}

async function run() {
  // Provide a text prompt to include with the image
  const prompt = "Write a poem about this picture:";

  const fileInputEl = document.querySelector("input[type=file]");
  const imagePart = await fileToGenerativePart(fileInputEl.files[0]);

  // To generate text output, call `generateContent` with the text and image
  const result = await model.generateContent([prompt, imagePart]);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

請注意，Firebase AI Logic 也支援使用 generateContentStream (而非 generateContent) 串流傳輸文字回應。

你還能做些什麼？

除了上述範例，您也可以讓使用者試用您的功能、使用替代推論模式、覆寫預設備援模型，以及使用模型設定控管回覆內容。

讓使用者試用您的功能

如要讓使用者試用您的功能，請註冊 Chrome 原始碼試用計畫。請注意，這些試用版有使用期限和用量限制。

註冊參加 Prompt API Chrome 來源試用。系統會提供權杖。
在要啟用試用功能的每個網頁上提供權杖。請使用下列其中一種方式：
- 在 <head> 標記中以中繼標記的形式提供權杖： <meta http-equiv="origin-trial" content="TOKEN">
- 以 HTTP 標頭形式提供權杖： Origin-Trial: TOKEN
- 以程式輔助方式提供權杖。

使用其他推論模式

上述範例使用 PREFER_ON_DEVICE 模式設定 SDK，以便在有裝置端模型時使用該模型，否則改用雲端代管模型。SDK 提供三種替代的推論模式：ONLY_ON_DEVICE、ONLY_IN_CLOUD 和 PREFER_IN_CLOUD。

使用 ONLY_ON_DEVICE 模式，讓 SDK 只能使用裝置端模型。在此設定中，如果沒有裝置端模型，API 就會擲回錯誤。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_ON_DEVICE });
```

使用 ONLY_IN_CLOUD 模式，讓 SDK 只能使用雲端代管模型。

const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_IN_CLOUD });

使用 PREFER_IN_CLOUD 模式，讓 SDK 嘗試使用雲端代管模型，但如果雲端代管模型無法使用 (例如裝置離線)，則會改用裝置端模型。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_IN_CLOUD });
```

判斷是使用裝置端還是雲端推論

如果您使用 PREFER_ON_DEVICE 或 PREFER_IN_CLOUD 推論模式，瞭解特定要求使用的模式可能會很有幫助。這項資訊是由每個回應的 inferenceSource 屬性提供 (適用於 JS SDK 12.5.0 以上版本)。

存取這個屬性時，傳回的值會是 ON_DEVICE 或 IN_CLOUD。

// ...

console.log('You used: ' + result.response.inferenceSource);

console.log(result.response.text());

覆寫預設備用模型

預設的雲端託管模型為 gemini-2.0-flash-lite。

使用 PREFER_ON_DEVICE 模式時，這個模型是備用的雲端託管模型。使用 ONLY_IN_CLOUD 模式或 PREFER_IN_CLOUD 模式時，這也是預設模型。

您可以使用 inCloudParams 設定選項，指定其他預設的雲端託管模型。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
  }
});

查看所有支援的 Gemini 模型名稱。

使用模型設定控制回覆內容

在傳送給模型的每個要求中，您可以一併傳送模型設定，藉此控制模型生成回覆的方式。雲端代管模型和裝置端模型提供不同的設定選項。

這項設定會在執行個體生命週期內維持不變。如要使用其他設定，請使用該設定建立新的 GenerativeModel 執行個體。

設定雲端託管模型

使用 inCloudParams 選項設定雲端託管的 Gemini 模型。瞭解可用參數。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
    temperature: 0.8,
    topK: 10
  }
});

設定裝置端模型的設定

請注意，使用裝置端模型進行推論時，會用到 Chrome 的 Prompt API。

使用 onDeviceParams 選項設定裝置端模型。瞭解可用參數。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  onDeviceParams: {
    createOptions: {
      temperature: 0.8,
      topK: 8
    }
  }
});

設定結構化輸出內容 (例如 JSON)

使用雲端託管和裝置端模型進行推論時，系統支援生成結構化輸出內容 (例如 JSON 和列舉)。

如要進行混合推論，請同時使用 inCloudParams 和 onDeviceParams，將模型設定為以結構化輸出內容回應。其他模式則只適用相關設定。

適用於 inCloudParams：指定適當的 responseMimeType (在本範例中為 application/json) 和您希望模型使用的 responseSchema。
對於 onDeviceParams：指定您要模型使用的 responseConstraint。

JSON 輸出內容

下列範例會改編一般 JSON 輸出範例，以用於混合式推論：

import {
  getAI,
  getGenerativeModel,
  Schema
} from "firebase/ai";

const jsonSchema = Schema.object({
 properties: {
    characters: Schema.array({
      items: Schema.object({
        properties: {
          name: Schema.string(),
          accessory: Schema.string(),
          age: Schema.number(),
          species: Schema.string(),
        },
        optionalProperties: ["accessory"],
      }),
    }),
  }
});

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "gemini-2.5-flash"
    generationConfig: {
      responseMimeType: "application/json",
      responseSchema: jsonSchema
    },
  }
  onDeviceParams: {
    promptOptions: {
      responseConstraint: jsonSchema
    }
  }
});

列舉輸出內容

與上述做法相同，但要根據列舉輸出說明文件調整混合推論：

// ...

const enumSchema = Schema.enumString({
  enum: ["drama", "comedy", "documentary"],
});

const model = getGenerativeModel(ai, {

// ...

    generationConfig: {
      responseMimeType: "text/x.enum",
      responseSchema: enumSchema
    },

// ...
});

// ...

目前尚未支援裝置端推論的功能

由於這是實驗版本，因此並非所有 Web SDK 功能都適用於裝置端推論。下列功能尚未支援裝置端推論 (但通常適用於雲端推論)。

從 JPEG 和 PNG 以外的圖片檔案輸入類型生成文字
- 可改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。
從音訊、影片和文件 (例如 PDF) 輸入內容生成文字
- 可改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。
使用 Gemini 或 Imagen 模型生成圖片
- 可改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。
在多模態要求中，使用網址提供檔案。您必須以內嵌資料的形式，將檔案提供給裝置端模型。
多輪對話
- 可改用雲端託管模型，但 ONLY_ON_DEVICE 模式會擲回錯誤。
使用 Gemini Live API 進行雙向串流
提供工具給模型，協助生成回覆 (例如函式呼叫、程式碼執行，以及依據 Google 搜尋結果生成回覆)
計算詞元數
- 一律會擲回錯誤。雲端代管和裝置端模型之間的計數會有所不同，因此沒有直覺式的備援機制。
在 Firebase 控制台中監控裝置端推論的 AI。
- 請注意，使用雲端主機代管模型進行的任何推論，都可以像使用 Firebase AI Logic 用戶端網頁 SDK 進行的其他推論一樣受到監控。

提供有關 Firebase AI Logic 的使用體驗意見回饋