The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Mempelajari model yang didukung

Untuk aplikasi seluler dan web, SDK Firebase AI Logic memungkinkan Anda berinteraksi dengan model Gemini yang didukung langsung dari aplikasi Anda.

Model Gemini dianggap multimodal karena mampu memproses dan bahkan menghasilkan berbagai modalitas, termasuk teks, kode, PDF, gambar, video, dan audio.

Selain itu, tinjau FAQ kami tentang semua model yang didukung dan tidak didukung oleh Firebase AI Logic.

Model penggunaan umum

Buka tabel dengan detail model

Model Gemini 3.x penggunaan umum

MODEL PEMIKIRAN LANJUTAN KAMI

Gemini 3.1 Pro

gemini-3.1-pro-preview

Kecerdasan tingkat lanjut, keterampilan pemecahan masalah yang kompleks, dan kemampuan pengodean suasana dan agen yang canggih. (penagihan diperlukan)

CEPAT DAN CERDAS

Gemini 3.5 Flash

gemini-3.5-flash

Performa kelas terdepan yang menyaingi model yang lebih besar dengan sebagian kecil biaya. (penagihan tidak diperlukan)

ULTRA CEPAT

Gemini 3.1 Flash-Lite

gemini-3.1-flash-lite

Model andalan bervolume tinggi dan hemat biaya dengan performa dan kualitas seri Gemini 3. (penagihan tidak diperlukan)

Model Gemini 2.5 penggunaan umum

Gemini 2.5 Pro (gemini-2.5-pro): Model paling canggih untuk tugas kompleks dari seri Gemini 2.5, yang menampilkan kemampuan penalaran dan coding yang mendalam. (penagihan tidak diperlukan)
Gemini 2.5 Flash (gemini-2.5-flash): Model performa harga terbaik dari seri Gemini 2.5, terutama untuk tugas volume tinggi latensi rendah yang memerlukan penalaran. (penagihan tidak diperlukan)
Gemini 2.5 Flash (gemini-2.5-flash-lite): Model multimodal tercepat dan paling hemat biaya dari seri Gemini 2.5. (penagihan tidak diperlukan)

Model pembuatan gambar

Buka tabel dengan detail model

Model pembuatan gambar Gemini 3.x

Gambar Gemini 3 Pro (Nano Banana Pro)

gemini-3-pro-image

Model pengeditan dan pembuatan gambar tercanggih untuk pembuatan gambar native yang sangat kontekstual. (penagihan diperlukan)

Gemini 3.1 Flash Image (Nano Banana 2)

gemini-3.1-flash-image

Pembuatan dan pengeditan gambar yang canggih dan sangat efisien, dioptimalkan untuk kecepatan dan kasus penggunaan bervolume tinggi. (penagihan diperlukan)

Gambar Gemini 3.1 Flash-Lite (Nano Banana 2 Lite)

gemini-3.1-flash-lite-image

Latensi ultra-rendah serta pembuatan dan pengeditan gambar yang hemat biaya, dirancang untuk kasus penggunaan interaktif bervolume tinggi. (penagihan diperlukan)

Model pembuatan gambar Gemini 2.5

Gemini 2.5 Flash Image (gemini-2.5-flash-image, alias "Nano Banana"): Didesain untuk kecepatan dan efisiensi, dioptimalkan untuk tugas bervolume tinggi dan latensi rendah. (penagihan diperlukan)

Model pembuatan audio

Anda dapat membuat audio streaming dengan model yang mendukung Gemini Live API.

Buka halaman dengan detail model

Gemini 2.5 Flash dengan audio native Gemini Live API

Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025

Vertex AI Gemini API: gemini-live-2.5-flash-native-audio

Memungkinkan interaksi suara dan video real-time dengan latensi rendah dengan model Gemini yang bidireksional. (penagihan tidak diperlukan)

Bagian selanjutnya di halaman ini memberikan informasi mendetail tentang model yang didukung oleh Firebase AI Logic.

Membandingkan model:
- Input dan output yang didukung
- Perbandingan umum kemampuan yang didukung
- Spesifikasi dan batasan, misalnya token input maksimum atau panjang maksimum video input
Deskripsi cara membuat versi model, khususnya versi stabil, diperbarui otomatis, pratinjau, dan eksperimental
Daftar nama model yang tersedia untuk disertakan dalam kode Anda selama inisialisasi
Daftar bahasa yang didukung untuk model

Di bagian bawah halaman ini, Anda dapat melihat informasi mendetail tentang model generasi sebelumnya.

Untuk mengetahui detail tentang model Gemini Live API (seperti gemini-live-2.5-flash-native-audio), lihat Batas dan spesifikasi Live API.

Bandingkan model

Setiap model memiliki kemampuan yang berbeda untuk mendukung berbagai kasus penggunaan. Perhatikan bahwa setiap tabel di bagian ini menjelaskan setiap model saat digunakan dengan Firebase AI Logic. Setiap model mungkin memiliki kemampuan tambahan yang tidak tersedia saat menggunakan SDK kami.

Jika Anda tidak dapat menemukan informasi yang Anda cari di sub-bagian berikut, Anda dapat menemukan informasi lebih lanjut di dokumentasi penyedia API yang Anda pilih: Gemini Developer API atau Vertex AI Gemini API.

Untuk mengetahui detail tentang model Gemini Live API (seperti gemini-live-2.5-flash-native-audio), lihat Batas dan spesifikasi Live API.

Input dan output yang didukung

Tabel berikut mencantumkan jenis input dan output yang didukung saat menggunakan setiap model dengan Firebase AI Logic.

Untuk mempelajari jenis file yang didukung, lihat File input yang didukung dan persyaratan.

	<span="notranslate">Gemini 3.x Pro, Flash, Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 3.x Pro Image </span="notranslate">	<span="notranslate">Gambar Flash Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gambar Gemini 3.x Flash‑Lite </span="notranslate">
Jenis input
Teks
Kode
Dokumen (PDF atau teks biasa)
Gambar
Video
Audio
Jenis output
Teks
Teks (streaming)
Kode
Output terstruktur (seperti JSON)
Gambar
Audio

Input dan output yang didukung (model Gemini 2.5)

	<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate">		<span="notranslate">Gambar Flash Gemini 2.5 Flash </span="notranslate">
Jenis input
Teks
Kode
Dokumen (PDF atau teks biasa)
Gambar
Video
Audio
Jenis output
Teks
Teks (streaming)
Kode
Output terstruktur (seperti JSON)
Gambar
Audio

Kemampuan dan fitur yang didukung

Tabel berikut mencantumkan kemampuan dan fitur yang didukung saat menggunakan setiap model dengan Firebase AI Logic.

	<span="notranslate">Gemini 3.x Pro Image </span="notranslate">	<span="notranslate">Gambar Flash Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gambar Gemini 3.x Flash‑Lite </span="notranslate">
Berpikir
Membuat teks dari input multimodal atau khusus teks	disisipkan atau sebagai bagian dari gambar	disisipkan atau sebagai bagian dari gambar	disisipkan atau sebagai bagian dari gambar
Membuat gambar
Mengedit gambar
Membuat audio
Buat output terstruktur (seperti JSON)
Menganalisis dokumen (PDF atau teks biasa) (output-teks \| output-gambar)
Menganalisis gambar (text-output \| image-output)
Analisis video (text-output \| image-output)
Menganalisis audio
Multi-turn chat
Streaming multimodal dua arah
Alat yang didukung
Pemanggilan fungsi
Eksekusi kode
Konteks URL
Perujukan dengan Google Search
Perujukan dengan Google Maps

Kemampuan dan fitur yang didukung (model Gemini 2.5)

	<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate">		<span="notranslate">Gambar Flash Gemini 2.5 Flash </span="notranslate">
Berpikir
Membuat teks dari input multimodal atau khusus teks			disisipkan atau sebagai bagian dari gambar
Membuat gambar
Mengedit gambar
Membuat audio
Buat output terstruktur (seperti JSON)
Menganalisis dokumen (PDF atau teks biasa) (output-teks \| output-gambar)
Menganalisis gambar (text-output \| image-output)
Analisis video (text-output \| image-output)
Menganalisis audio
Multi-turn chat
Streaming multimodal dua arah
Alat yang didukung
Pemanggilan fungsi
Eksekusi kode
Konteks URL
Perujukan dengan Google Search
Perujukan dengan Google Maps

Spesifikasi dan batasan

Tabel berikut mencantumkan spesifikasi dan batasan saat menggunakan setiap model dengan Firebase AI Logic.

Properti	<span="notranslate">Gemini 3.x Pro, Flash, Flash‑Lite </span="notranslate">	<span="notranslate">Gemini 3.x Pro Image </span="notranslate">	<span="notranslate">Gambar Flash Gemini 3.x Flash Image </span="notranslate">	<span="notranslate">Gambar Gemini 3.x Flash‑Lite </span="notranslate">
Batas token input *	1.048.576 token	65.536 token	131.072 token	65.536 token
Batas token output *	65.536 token	32.768 token	32.768 token	4.096 token
Tanggal batas informasi	Januari 2025	Januari 2025	Januari 2025	Januari 2025
PDF (per permintaan)
Jumlah maksimum file PDF input **	900 file	14 file	14 file	14 file
Jumlah maksimum halaman per file PDF input **	900 halaman	14 halaman	14 halaman	14 halaman
Ukuran maks per file PDF input	50 MB	50 MB	50 MB	50 MB
Gambar (per permintaan)
Jumlah maksimum gambar input	1.000 gambar	14 gambar	14 gambar	14 gambar
Ukuran maks per input gambar berenkode base64	7 MB	7 MB	7 MB	7 MB
Jumlah maksimum gambar output	---	Hingga batas token output	Hingga batas token output	Hingga batas token output
Video (sesuai permintaan)
Jumlah maksimum file video input	10 file	---	Hingga batas token input	Hingga batas token input
Durasi maksimum semua video input (hanya frame)	~60 menit	---	~25 menit	~12 menit
Panjang maksimum semua video input (frame+audio)	~45 menit	---	---	---
Audio (per permintaan)
Jumlah maksimum file audio input	1 file	---	---	---
Panjang maksimum semua audio input	~8,4 jam	---	---	---

Spesifikasi dan batasan (model Gemini 2.5)

	<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate">	<span="notranslate">Gambar Flash Gemini 2.5 Flash </span="notranslate">
Batas token input *	1.048.576 token	32.768 token
Batas token output *	65.536 token	8.192 token
Tanggal batas informasi	Januari 2025	Juni 2024
PDF (per permintaan)
Jumlah maksimum file PDF input **	3.000 file	3 file
Jumlah maksimum halaman per file PDF input **	1.000 halaman	3 halaman
Ukuran maks per file PDF input	50 MB	50 MB
Gambar (per permintaan)
Jumlah maksimum gambar input	3.000 gambar	3 gambar
Ukuran maks per input gambar berenkode base64	7 MB	7 MB
Jumlah maksimum gambar output	---	Hingga batas token output
Video (sesuai permintaan)
Jumlah maksimum file video input	10 file	---
Durasi maksimum semua video input (hanya frame)	~60 menit	---
Panjang maksimum semua video input (frame+audio)	~45 menit	---
Audio (per permintaan)
Jumlah maksimum file audio input	1 file	---
Panjang maksimum semua audio input	~8,4 jam	---

^{*
Untuk semua model Gemini, satu token setara dengan sekitar 4 karakter,
jadi 100 token setara dengan sekitar 60-80 kata dalam bahasa Inggris. Untuk model Gemini, Anda dapat
menentukan jumlah total token dalam permintaan menggunakan
countTokens.}

^{**
PDF diperlakukan sebagai gambar, sehingga satu halaman PDF diperlakukan sebagai
satu gambar. Jumlah halaman yang diizinkan dalam permintaan dibatasi hingga jumlah gambar yang dapat didukung model.}

Menemukan informasi mendetail tambahan

Kuota dan harga berbeda untuk setiap model. Harga juga bergantung pada input dan output.
Pelajari jenis file input yang didukung, cara menentukan jenis MIME, dan cara memastikan file input dan permintaan multimodal Anda memenuhi persyaratan dan mengikuti praktik terbaik dalam File input dan persyaratan yang didukung.

Penting: Batas ukuran total permintaan adalah 20 MB. Untuk mengirim file besar, tinjau opsi untuk menyediakan file dalam permintaan multimodal.
Untuk mengetahui detail tentang model Gemini Live API, lihat Batas dan spesifikasi Live API.

Pola penamaan dan pembuatan versi model

Model ditawarkan dalam versi stabil, pratinjau, dan eksperimental. Untuk kemudahan, alias tanpa nilai versi eksplisit didukung.

Untuk menemukan nama model tertentu yang akan digunakan dalam kode Anda, lihat bagian "nama model yang tersedia" di halaman ini.

Jenis versi / Tahap rilis	Deskripsi	Pola nama model
Stabil	Versi *Stabil* tersedia dan didukung untuk penggunaan produksi mulai tanggal rilis. Versi model stabil biasanya dirilis dengan tanggal penghentian, yang menunjukkan hari terakhir model tersedia. Setelah tanggal ini, model tidak lagi dapat diakses atau didukung oleh Google.	Model Gemini 2.5 dan yang lebih baru Nama model versi stabil tidak memiliki akhiran Contoh: `gemini-3.5-flash`
Pratinjau	Versi *Pratinjau* memiliki kemampuan baru dan dianggap tidak stabil. Model ini tidak direkomendasikan untuk penggunaan produksi, memiliki batas frekuensi yang lebih ketat, dan mungkin memiliki persyaratan penagihan. Model ini akan dihentikan (tidak digunakan lagi) dalam beberapa minggu atau bulan setelah versi stabil terkait dirilis. Untuk Vertex AI Gemini API, model pratinjau biasanya mengharuskan Anda menetapkan lokasi tempat Anda mengakses model ke `global`.	Nama model versi pratinjau ditambahkan dengan `-preview` dan sering kali tanggal rilis model (`-MM-DD` untuk model lama atau `-MM-YYYY` untuk model baru) Contoh: `gemini-2.5-flash-preview-04-17` (dirilis pada 17 April 2025) atau `gemini-2.5-flash-preview-09-2025` (dirilis pada September 2025) atau `gemini-3-pro-preview` (dirilis pada November 2025)
Eksperimental	Versi *Eksperimental* memiliki kemampuan baru dan dianggap tidak stabil. Model ini tidak direkomendasikan untuk penggunaan produksi dan memiliki batas frekuensi yang lebih ketat. Model eksperimental ditujukan untuk mengumpulkan masukan dan memungkinkan eksperimen dengan fitur terbaru kami. Model ini akan dihentikan (tidak digunakan lagi) dalam beberapa minggu atau bulan setelah versi stabil terkait dirilis. Untuk Vertex AI Gemini API, model eksperimental mengharuskan Anda menetapkan lokasi tempat Anda mengakses model ke `global`.	Nama model versi eksperimental ditambahi dengan `-exp` beserta tanggal rilis model (`-MM-DD`) Contoh: `gemini-2.5-pro-exp-03-25` (dirilis pada 25 Maret 2025)
Shutdown (dihentikan)	Versi *Penonaktifan (dihentikan)* telah melewati tanggal penonaktifan (penghentian) dan telah dinonaktifkan secara permanen. Model yang dihentikan (tidak digunakan lagi) tidak lagi dapat diakses atau didukung oleh Google, dan permintaan menggunakan nama model yang dihentikan akan menampilkan error 404.	---

Nama model yang tersedia

Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model.

Model penggunaan umum (seperti gemini-3.5-flash)
Model pembuatan gambar (seperti gemini-3.1-flash-image, alias model "Nano Banana")
Model pembuatan audio (seperti gemini-live-2.5-flash-native-audio)

Untuk contoh inisialisasi platform Anda, lihat panduan memulai.

Untuk mengetahui detail tentang tahap rilis (terutama untuk kasus penggunaan, penagihan, dan penonaktifan), lihat pola penamaan dan pembuatan versi model.

Mencantumkan semua model yang tersedia secara terprogram

Anda dapat mencantumkan semua nama model yang tersedia menggunakan REST API:

Gemini Developer API: Panggil endpoint models.list
Vertex AI Gemini API: Panggil endpoint publishers.models.list

Perhatikan bahwa daftar yang ditampilkan ini akan mencakup semua model yang didukung oleh penyedia API, tetapi Firebase AI Logic hanya mendukung model Gemini yang dijelaskan di halaman ini.

Model penggunaan umum