Pelajari model Gemini

Kelompok model Gemini dianggap multimodal karena mampu memproses informasi dari berbagai modalitas, termasuk gambar, video, dan teks. Misalnya, Anda dapat mengirim foto sepiring kue kepada model Gemini dan memintanya untuk memberi Anda resep kue tersebut.

Perintah Respons

Beri saya resep untuk kue ini.

foto beberapa biskuit keripik cokelat
**BAHAN**
- 1 c. (2 batang) mentega tawar, melunak
- 3/4 c. gula pasir
- 3/4 c. gula merah, dikemas
- 1 sdt . ekstrak vanila
- 2 telur besar
- 2 1/4 c. tepung serbaguna
- 1 sdt soda kue
- 1 sdt. garam
...

Anda dapat berinteraksi dengan kelompok model Gemini menggunakan Gemini API yang disediakan oleh Vertex AI di Google Cloud. Untuk aplikasi seluler dan web, Anda dapat menggunakan Vertex AI for Firebase SDK untuk memanggil Gemini API dan berinteraksi dengan model Gemini langsung dari aplikasi.

Halaman ini memberikan informasi berikut tentang model Gemini:

Model yang tersedia

Anda dapat menggunakan salah satu model Gemini berikut dengan Vertex AI for Firebase:

  • Gemini 1.5 Flash: Model multimodal yang mendukung jenis input dan output yang sama seperti 1.5 Pro (serta jumlah total token), tetapi 1, 5 Flash dirancang khusus untuk aplikasi bervolume tinggi dan hemat biaya.

  • Gemini 1.5 Pro: Model multimodal yang mendukung penambahan file gambar, audio, video, dan PDF dalam perintah teks atau chat untuk respons teks atau kode. Selain itu, Cloud Shell mendukung pemahaman konteks panjang hingga 1 juta token.

  • Gemini 1.0 Pro Vision: Model multimodal yang dirancang untuk menangani teks plus gambar dan video untuk respons teks atau kode. Tidak dapat digunakan untuk chat.

  • Gemini 1.0 Pro: Model yang dirancang untuk menangani tugas natural language, chat banyak dengan teks dan kode, serta pembuatan kode.

Langsung ke bagian nama model yang akan disertakan dalam kode Anda

Kasus penggunaan untuk setiap model

Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
Jenis input
Teks
Code
Gambar
PDF
Video (hanya frame)
Video (bingkai dan audio)
Audio
Jenis output
Teks
Code
Kasus penggunaan umum
Permintaan multimodal
Chat multi-giliran

Pelajari lebih lanjut kasus penggunaan untuk model Gemini dalam dokumentasi Google Cloud:

Informasi mendetail tentang setiap model

Untuk semua model Gemini, token setara dengan sekitar 4 karakter. 100 token berisi sekitar 60-80 kata dalam bahasa Inggris. Anda dapat menentukan jumlah total token dalam permintaan Anda menggunakan countTokens.

Properti Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
Batas token total (input dan output gabungan) 1 juta token 16.384 token 32.760 token
Batas token output 8.192 token 2.048 token 8.192 token
Jumlah maksimum gambar per permintaan 3.000 gambar 16 gambar T/A
Ukuran gambar maksimum yang dienkode base64 7 MB 7 MB T/A
Ukuran PDF maksimum 30 MB 30 MB T/A
Jumlah maksimum file video per permintaan 10 file video 1 file video T/A
Durasi video maksimum (khusus frame) Video berdurasi 60 menit 2 menit T/A
Durasi video maksimum (frame dan audio) ~45 menit video T/A T/A
Jumlah maksimum file audio per permintaan 1 file audio T/A T/A
Durasi audio maksimum Audio ~8,4 jam T/A T/A

Di sinilah Anda dapat menemukan informasi yang lebih mendetail tentang model dan file input:

Pembuatan versi model

Model Gemini ditawarkan dalam versi stabil, update otomatis, dan pratinjau.

  • Versi Stabil dianggap tersedia secara umum.

    • Versi stabil memiliki nama model yang ditambahkan dengan nomor versi tiga digit tertentu, misalnya gemini-1.0-pro-001.
  • Versi yang diupdate otomatis selalu mengarah ke versi stabil terbaru dari model tersebut; jika versi stabil baru dirilis, versi yang diupdate otomatis akan otomatis mulai mengarah ke versi stabil baru tersebut.

    • Versi yang diupdate otomatis memiliki nama model tanpa penambahan, misalnya gemini-1.0-pro.
  • Versi Pratinjau memiliki kemampuan baru dan dianggap tidak stabil. Perlu diperhatikan bahwa versi pratinjau selalu mengarah ke versi pratinjau terbaru dari model tersebut; jika versi pratinjau baru dirilis, versi pratinjau yang ada akan otomatis mulai mengarah ke versi pratinjau baru tersebut.

    • Versi pratinjau memiliki nama model yang ditambahkan dengan -preview beserta tanggal rilis awal model (-MMDD), misalnya gemini-1.5-pro-preview-0409 (dirilis pada 9 April 2024).

Pelajari versi model Gemini yang tersedia dan siklus prosesnya lebih lanjut di dokumentasi Google Cloud.

Nama model yang tersedia

Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model generatif (yang merupakan langkah yang diperlukan untuk memanggil API Gemini). Guna mengetahui contoh inisialisasi untuk bahasa Anda, lihat panduan memulai.

Nama model Flash Gemini 1.5

Nama model Deskripsi Tahap rilis Tanggal rilis awal Tanggal penghentian
Versi stabil
gemini-1.5-flash-001 Gemini 1.5 Flash versi stabil terbaru Ketersediaan Umum 2024-05-24 Paling lambat 24-05-2025
Versi yang diupdate otomatis
gemini-1.5-flash Mengarah ke versi stabil terbaru Flash 1.5
(saat ini gemini-1.5-flash-001)
Ketersediaan Umum 2024-05-24 ---
Versi pratinjau
gemini-1.5-flash-preview-0514 Gemini 1.5 Flash versi pratinjau terbaru Pratinjau Publik 2024-05-14 2024-06-24

Nama model Gemini 1.5 Pro

Nama model Deskripsi Tahap rilis Tanggal rilis awal Tanggal penghentian
Versi stabil
gemini-1.5-pro-001 Versi stabil terbaru Gemini 1.5 Pro Ketersediaan Umum 2024-05-24 Paling lambat 24-05-2025
Versi yang diupdate otomatis
gemini-1.5-pro Mengarah ke versi stabil terbaru 1.5 Pro
(saat ini gemini-1.5-pro-001)
Ketersediaan Umum 2024-05-24 ---
Versi pratinjau
gemini-1.5-pro-preview-0514 Versi pratinjau terbaru Gemini 1.5 Pro Pratinjau Publik 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 Mengarah ke gemini-1.5-pro-preview-0514
(yang merupakan versi pratinjau terbaru)
Pratinjau Publik 2024-04-09 2024-06-14

Nama model Gemini 1.0 Pro Vision

Nama model Deskripsi Tahap rilis Tanggal rilis awal Tanggal penghentian
Versi stabil
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision versi stabil terbaru Ketersediaan Umum 2024-02-15 Tidak lebih awal dari 15-02-2025
Versi yang diupdate otomatis
gemini-1.0-pro-vision Mengarah ke versi stabil terbaru 1.5 Pro Vision
(saat ini gemini-1.5-pro-vision-001)
Ketersediaan Umum 2024-01-04 ---

Nama model Gemini 1.0 Pro

Nama model Deskripsi Tahap rilis Tanggal rilis awal Tanggal penghentian
Versi stabil
gemini-1.0-pro-002 Versi stabil terbaru Gemini 1.0 Pro Ketersediaan Umum 2024-04-09 Tidak lebih awal dari 09-04-2025
gemini-1.0-pro-001 Versi stabil Gemini 1.0 Pro Ketersediaan Umum 2024-02-15 Tidak lebih awal dari 15-02-2025
Versi yang diupdate otomatis
gemini-1.0-pro Mengarah ke versi stabil terbaru 1.0 Pro
(saat ini gemini-1.0-pro-002)
Ketersediaan Umum 2024-02-15 ---

Bahasa yang didukung

Model Gemini mendukung bahasa berikut:

Arab (ar), Bengali (bn), Bulgaria (bg), China Aksara Sederhana dan Tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Jepang (hu), Indonesia (id), Italia (it), Jepang (hu), Indonesia

Langkah berikutnya

Coba kemampuan Gemini API