モバイルアプリとウェブアプリの場合、Vertex AI in Firebase SDK を使用すると、サポートされている Gemini モデルと Imagen 3 モデルをアプリから直接操作できます。
Gemini モデルは、テキスト、コード、PDF、画像、動画、音声など、複数のモダリティを処理し、生成できるため、マルチモーダルと見なされます。Imagen 3 モデルにはテキストを指定して画像を生成できます。
次の表に、Vertex AI in Firebase でサポートされているモデルと、最新の安定版モデル名の概要を示します。この表には、ユースケースのプロトタイピングに使用できるプレビュー版モデルと試験運用版モデルも示されています。
モデル | 入力 | 出力 | 説明 |
---|---|---|---|
安定版の Gemini モデル | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON (画像と音声は近日提供予定) |
さまざまなタスクに対応する次世代の機能と速度を提供します。
(マルチモーダル生成は近日提供予定です) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 費用対効果の高い低レイテンシのパフォーマンスを提供し、高スループットをサポートします。 |
Gemini 1.5 Progemini-1.5-pro-002 |
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | より高度なインテリジェンスを必要とする複雑な推論タスクをサポート。200 万トークンの長いコンテキスト |
Gemini 1.5 Flashgemini-1.5-flash-002 |
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | さまざまなタスクで高速で汎用性の高いパフォーマンスを提供します。 |
プレビュー バージョンと試験運用版のみの Gemini モデル(プロトタイピングのユースケースにのみ推奨) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 特にコードと世界に関する知識で、最も優れたモデル品質を提供します。200 万文字の長いコンテキスト |
Gemini 2.0 Flash‑Thinkinggemini-2.0-flash-thinking-exp-01-21
|
テキスト、コード、PDF、画像 | テキスト、コード、JSON | より強力な推論機能を提供します。回答に思考プロセスが含まれます。 |
Imagen 3 モデル (Vertex AI in Firebase で使用する場合) | |||
Imagen 3imagen-3.0-generate-002 |
テキスト | 画像 | 自然言語テキスト プロンプトからリアルで高品質な画像を生成します。 |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
テキスト | 画像 | プロトタイピングや低レイテンシのユースケース用の画像を生成します。 |
このページの残りの部分では、Vertex AI in Firebase でサポートされているモデルについて詳しく説明します。
-
- サポートされている入力と出力
- サポートされている機能の概要の比較
- 仕様と制限事項(最大入力トークン数、入力動画の最大長など)
モデルのバージョニング方法の説明(特に、安定版、自動更新版、プレビュー版)。
初期化時にコードに含める使用可能なモデル名のリスト
モデルでサポートされている言語の一覧
このページの下部にある以前のモデルの詳細情報をご覧ください。
モデルを比較する
各モデルには、さまざまなユースケースをサポートするためのさまざまな機能があります。このセクションの各表は、Vertex AI in Firebase で使用する場合の各モデルについて説明しています。各モデルには、Google の SDK では利用できない追加機能が含まれている場合があります。
次のサブセクションで目的の情報が見つからない場合は、Google Cloud のドキュメントで Gemini モデルと Imagen 3 モデルの詳細を確認してください。
サポートされている入力と出力
Vertex AI in Firebase で各モデルを使用する場合、サポートされている入力と出力のタイプは次のとおりです。
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 フラッシュ </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 フラッシュ </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
入力値の型 | |||||||
テキスト | |||||||
コード | |||||||
ドキュメント (PDF またはテキスト) |
|||||||
画像 | |||||||
動画 | |||||||
音声 | |||||||
オーディオ(ストリーミング) | 近日提供予定 | ||||||
出力タイプ | |||||||
テキスト | |||||||
コード | |||||||
構造化出力 (JSON など) |
|||||||
画像 | 近日提供予定 | ||||||
音声 | 近日提供予定 | ||||||
オーディオ(ストリーミング) | 近日提供予定 |
サポートされているファイル形式については、サポートされている入力ファイルと Vertex AI Gemini API の要件をご覧ください。
サポートされている機能
Vertex AI in Firebase で各モデルを使用する場合にサポートされる機能は次のとおりです。
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 フラッシュ </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 フラッシュ </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
テキストまたはマルチモーダル入力からテキストを生成する | |||||||
画像を生成 (Imagen 3) |
近日提供予定 | ||||||
音声を生成する | 近日提供予定 | ||||||
構造化出力を生成する
(JSON など) |
|||||||
ドキュメントを分析する
(PDF またはテキスト) |
|||||||
画像を分析する(ビジョン) | |||||||
動画を分析する(ビジョン) | |||||||
音声を分析する | |||||||
マルチターン チャット | |||||||
関数呼び出し(ツール) | |||||||
トークンと課金対象文字数をカウントする | |||||||
システム指示 | |||||||
Multimodal Live API (双方向ストリーミング) |
近日提供予定 |
仕様と制限事項
Vertex AI in Firebase で各モデルを使用する場合の仕様と制限事項は次のとおりです。
プロパティ |
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 フラッシュ </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 フラッシュ </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
---|---|---|---|---|---|---|---|
コンテキスト ウィンドウ * トークンの合計上限 (入力と出力の合計) |
2,097,152 個のトークン | 1,048,576 個のトークン | 1,048,576 個のトークン | 1,048,576 個のトークン | 2,097,152 個のトークン | 1,048,576 個のトークン | 480 トークン |
出力トークンの上限 * | 8,192 トークン | 8,192 トークン | 8,192 トークン | 8,192 トークン | 8,192 トークン | 8,192 トークン | --- |
知識の締め切り日 | 2024 年 6 月 | 2024 年 6 月 | 2024 年 6 月 | 2024 年 6 月 | 2024 年 5 月 | 2024 年 5 月 | --- |
PDF(リクエストに応じて) | |||||||
入力 PDF ファイルの最大数 ** |
3,000 ファイル | 3,000 ファイル | 3,000 ファイル | 3,000 ファイル | 3,000 ファイル | 3,000 ファイル | --- |
入力 PDF ファイルあたりの最大ページ数 ** |
1,000 ページ | 1,000 ページ | 1,000 ページ | 1,000 ページ | 1,000 ページ | 1,000 ページ | --- |
入力 PDF ファイルあたりの最大サイズ |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- |
画像(リクエストあたり) | |||||||
入力画像の最大数 |
3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | --- |
出力画像の最大数 |
--- | 近日提供予定 | --- | --- | --- | --- | 4 枚 |
入力 base64 エンコード画像あたりの最大サイズ |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- |
動画(リクエストに応じて) | |||||||
入力動画ファイルの最大数 |
10 ファイル | 10 ファイル | 10 ファイル | --- | 10 ファイル | 10 ファイル | --- |
すべての入力動画の最大長 (フレームのみ) |
60 分程度 | 60 分程度 | 60 分程度 | --- | 60 分程度 | 60 分程度 | --- |
すべての入力動画の最大長 (フレーム数と音声) |
45 分程度 | 45 分程度 | 45 分程度 | --- | 45 分程度 | 45 分程度 | --- |
音声(リクエストに応じて) | |||||||
入力音声ファイルの最大数 |
1 個のファイル | 1 個のファイル | 1 個のファイル | --- | 1 個のファイル | 1 個のファイル | --- |
出力音声ファイルの最大数 |
--- | 近日提供予定 | --- | --- | --- | --- | --- |
すべての入力音声の最大長 |
~ 8.4 時間 | ~ 8.4 時間 | ~ 8.4 時間 | --- | ~ 8.4 時間 | ~ 8.4 時間 | --- |
すべての出力音声の最大長 |
--- | 近日提供予定 | --- | --- | --- | --- | --- |
*
すべての Gemini モデルで、1 トークンは約 4 文字に相当するため、100 トークンは約 60 ~ 80 ワード(英語)に相当します。Gemini モデルの場合、countTokens
を使用してリクエスト内のトークンの合計数を特定できます。
** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。
詳細情報を確認する
サポートされている入力ファイルの種類、MIME タイプの指定方法、入力ファイルとマルチモーダル リクエストが要件を満たしていることを確認する方法、ベスト プラクティスに沿って作成する方法については、Vertex AI Gemini API でサポートされている入力ファイルと要件をご覧ください。
モデルのバージョニングと命名パターン
モデルには、安定版、プレビュー版、試験運用版があります。便宜上、明示的なバージョン値のないエイリアスがサポートされています。
コードで使用する特定のモデル名については、このページの「使用可能なモデル名」をご覧ください。
バージョンの種類 | 説明 | モデル名のパターン | |
---|---|---|---|
安定版 | 安定版は一般提供と見なされます。 |
安定版のモデル名には、特定の 3 桁のバージョン番号が付加されます。
例: |
|
自動更新の安定版エイリアス | 自動更新の安定版エイリアスは、常にそのモデルの最新の安定版を参照します。新しい安定版がリリースされると、自動更新エイリアスは自動的にその新しい安定版を参照するようになります。 |
エイリアスのモデル名に接尾辞がない
例: |
|
プレビュー |
プレビュー版には新しい機能が含まれており、安定版ではないと見なされます。 プレビュー バージョンは、常にそのモデルの最新の プレビュー バージョンを参照します。新しいプレビュー バージョンがリリースされると、既存のプレビュー バージョンは自動的にその新しいプレビュー バージョンを参照するようになります。 |
プレビュー バージョンのモデル名には、モデルの最初のリリース日(
例: |
|
試験運用版 |
試験運用版には新しい機能が含まれており、安定版ではないと見なされ、Google の標準モデル ライフサイクル計画とバージョニング スキームに準拠していません。 詳しくは、試験運用版モデルをご覧ください。 |
試験運用版のモデル名には、モデルの最初のリリース日(
例: |
使用可能なモデル バージョンとそのライフサイクル(Gemini)の詳細については、Google Cloud のドキュメントで Imagen をご覧ください。
使用可能なモデル名
モデル名は、モデルの初期化時にコードに含める明示的な値です。
publishers.models.list
エンドポイントを使用して、使用可能なすべてのモデル名を一覧表示できます。返されるリストには、Vertex AI がサポートするすべてのモデルが含まれますが、Vertex AI in Firebase は、このページで説明する Gemini モデルと Imagen モデルのみをサポートします。また、自動更新エイリアス(gemini-2.0-flash
など)は、ベースモデルの便利なエイリアスであるため、リストに表示されません。
Gemini モデル名
使用言語の初期化例については、スタートガイドをご覧ください。
Gemini 2.0 Pro モデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
利用可能な安定版はありません | --- | --- | --- | --- |
自動更新の安定版エイリアス | ||||
自動更新の安定版エイリアスが利用できない | --- | --- | --- | --- |
プレビュー版 | ||||
利用可能なプレビュー バージョンはありません | --- | --- | --- | --- |
試験運用版 | ||||
gemini-2.0-pro-exp-02-05 |
Gemini 2.0 Pro の試験運用版 | 試験運用版 | 2025-02-05 | 未定 |
Gemini 2.0 Flash モデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
gemini-2.0-flash-001 |
Gemini 2.0 Flash の最新の安定版 | 一般提供 | 2025-02-05 | 2026-02-05 以降 |
自動更新の安定版エイリアス | ||||
gemini-2.0-flash |
2.0 Flash の最新の安定版を指します (現在は gemini-2.0-flash-001 |
一般提供 | 2025-02-10 | --- |
プレビュー版 | ||||
利用可能なプレビュー バージョンはありません | --- | --- | --- | --- |
試験運用版 | ||||
利用可能な試験運用版はありません | --- | --- | --- | --- |
Gemini 2.0 Flash‑Lite モデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite の最新の安定版 | 一般提供 | 2025-02-25 | 2026-02-25 以降 |
自動更新の安定版エイリアス | ||||
gemini-2.0-flash-lite |
2.0 Flash-Lite の最新の安定版を指します (現在は gemini-2.0-flash-lite-001 |
一般提供 | 2025-02-25 | --- |
プレビュー版 | ||||
gemini-2.0-flash-lite-preview-02-05 |
Gemini 2.0 Flash‑Lite のプレビュー版 | プレビュー | 2025-02-05 | 未定 |
試験運用版 | ||||
利用可能な試験運用版はありません | --- | --- | --- | --- |
Gemini 2.0 Flash‑Thinking モデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
利用可能な安定版はありません | --- | --- | --- | --- |
自動更新の安定版エイリアス | ||||
自動更新の安定版エイリアスが利用できない | --- | --- | --- | --- |
プレビュー版 | ||||
利用可能なプレビュー バージョンはありません | --- | --- | --- | --- |
試験運用版 | ||||
gemini-2.0-flash-thinking-exp-01-21 |
Gemini 2.0 Flash‑Thinking の試験運用版 | 試験運用版 | 2025-01-21 | 未定 |
Gemini 1.5 Pro のモデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
gemini-1.5-pro-002 |
Gemini 1.5 Pro の最新の安定版 | 一般提供 | 2024-09-24 | 2025 年 9 月 24 日以降 |
gemini-1.5-pro-001 |
Gemini 1.5 Pro の最初の安定版 | 一般提供 | 2024-05-24 | 2025 年 5 月 24 日以降 |
自動更新の安定版エイリアス | ||||
gemini-1.5-pro |
1.5 Pro の最新の安定版を指します (現在は gemini-1.5-pro-002 |
一般提供 | 2024-09-24 | --- |
プレビュー版 | ||||
利用可能なプレビュー バージョンはありません | --- | --- | --- | --- |
試験運用版 | ||||
利用可能な試験運用版はありません | --- | --- | --- | --- |
Gemini 1.5 Flash モデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
gemini-1.5-flash-002 |
Gemini 1.5 Flash の最新の安定版 | 一般提供 | 2024-09-24 | 2025 年 9 月 24 日以降 |
gemini-1.5-flash-001 |
Gemini 1.5 Flash の最初の安定版 | 一般提供 | 2024-05-24 | 2025 年 5 月 24 日以降 |
自動更新の安定版エイリアス | ||||
gemini-1.5-flash |
1.5 Flash の最新の安定版を指します (現在は gemini-1.5-flash-002 |
一般提供 | 2024-09-24 | --- |
プレビュー版 | ||||
利用可能なプレビュー バージョンはありません | --- | --- | --- | --- |
試験運用版 | ||||
利用可能な試験運用版はありません | --- | --- | --- | --- |
Imagen モデル名
言語の初期化例については、Imagen を使用して画像を生成するガイドをご覧ください。
現在、Imagen 3 モデルのプレビュー版または試験運用版はいずれも利用できません。
Imagen 3 モデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
imagen-3.0-generate-002 |
Imagen 3 の最新の安定版 | 一般提供 | 2025-01-23 | 2026 年 1 月 23 日以降 |
imagen-3.0-generate-001 |
Imagen 3 の最初の安定版 | 一般提供 | 2024-07-31 | 2025-07-31 以降 |
Imagen 3 Fast モデル名
モデル名 | 説明 | リリース ステージ | 初回リリース日 | 廃止日 |
---|---|---|---|---|
安定版 | ||||
imagen-3.0-fast-generate-001 |
Imagen 3 Fast の最初の安定版 | 一般提供 | 2024-07-31 | 2025-07-31 以降 |
サポートされている言語
Gemini
すべての Gemini モデルは、次の言語を理解して応答できます。
アラビア語(ar)、ベンガル語(bn)、ブルガリア語(bg)、中国語(簡体字、繁体字)(zh)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(iw)、ヒンディー語(hi)、ハンガリー語(hu)、インドネシア語(id)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(lv)、リトアニア語(lt)、ノルウェー語(no)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、セルビア語(sr)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スワヒリ語(sw)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr)、ウクライナ語(uk)、ベトナム語(vi)
Gemini 2.0 Flash、Gemini 1.5 Pro、Gemini 1.5 Flash モデルは、次の追加言語を理解して応答できます。
アフリカーンス語(af)、アムハラ語(am)、アッサム語(as)、アゼリー語(az)、ベラルーシ語(be)、ボスニア語(bs)、カタロニア語(ca)、セブアノ語(ceb)、コルシカ語(co)、ウェールズ語(cy)、ディーベヒ語(dv)、エスペラント語(eo)、バスク語(eu)、ペルシア語(fa)、フィリピン語(タガログ語)(fil)、フリジア語(fy)、アイルランド語(ga)、スコットランド ゲール語(gd)、ガリシア語(gl)、グジャラート語(gu)、ハウサ語(ha)、ハワイ語(haw)、モンゴル語(hmn)、ハイチ語(ht)、アルメニア語(hy)、イボ語(ig)、アイスランド語(is)、ジャワ語(jv)、グルジア語(ka)、カザフ語(kk)、クメール語(km)、カンナダ語(kn)、クリオ語(kri)、クルド語(ku)、キルギス語(ky)、ラテン語(la)、ルクセンブルク語(lb)、ラオス語(lo)、マダガスカル語(mg)、マオリ語(mi)、マケドニア語(mk)、マラヤーラム語(ml)、モンゴル語(mn)、メイテイ語(マニプル語)(mni-Mtei)、マラーティー語(mr)、マレー語(ms)、マルタ語(mt)、ミャンマー語(ビルマ語)(my)、ネパール語(ne)、ニャンジャ語(チチェワ語)(ny)、オディア語(オリア語)(or)、パンジャブ語(pa)、パシュトゥ語(ps)、シンド語(sd)、シンハラ語(シンハラ語)(si)、サモア語(sm)、ショナ語(sn)、ソマリ語(so)、アルバニア語(sq)、セソト語(st)、スンダ語(su)、タミル語(ta)、テルグ語(te)、タジク語(tg)、ウイグル語(ug)、ウルドゥ語(ur)、ウズベク語(uz)、コサ語(xh)、イディッシュ語(yi)、ヨルバ語(yo)、ズールー語(zu)
Imagen
一般提供: 英語
プレビュー: 中国語(簡体字)、中国語(繁体字)、ヒンディー語、日本語、韓国語、ポルトガル語、スペイン語
以前のモデルに関する情報
Vertex AI in Firebase は、Gemini 1.0 Pro や Gemini 1.0 Pro Vision などの古いモデルを含む、すべての Gemini モデルをサポートしています。ただし、Google の SDK では新しいモデルを使用することを強くおすすめします。これらの古い Gemini モデルは、販売終了日が近づいており、新しいモデルのすべての機能を備えていません。
Vertex AI in Firebase は Imagen 3 モデルのみをサポートします。古い Imagen モデル(Imagen 2 など)はサポートされていません。
次のステップ
Gemini API の機能を試す
- マルチターンの会話(チャット)を構築します。
- テキストのみのプロンプトからテキストを生成する。
- マルチモーダル プロンプト(テキスト、画像、PDF、動画、音声など)からテキストを生成します。
- テキストとマルチモーダル プロンプトの両方から構造化出力(JSON など)を生成します。
- 関数呼び出しを使用して、生成モデルを外部システムと情報に接続します。