Per le app web e mobile, gli SDK Firebase AI Logic ti consentono di interagire con i modelli Gemini e Imagen supportati direttamente dalla tua app.
I modelli Gemini sono considerati multimodali perché sono in grado di elaborare e persino generare più modalità, tra cui testo, codice, PDF, immagini, video e audio. I modelli Imagen possono essere richiesti con testo per generare immagini.
Consulta anche le nostre domande frequenti su tutti i modelli supportati e non supportati da Firebase AI Logic.
Modelli in primo piano
Vai ai confronti tra i modelli
Gemini 3 Pro
gemini-3-pro-preview
Il nostro miglior modello per la comprensione multimodale e il nostro modello più potente per la codifica di agenti e vibrazioni, che offre immagini più ricche e un'interattività più profonda, il tutto basato su una base di ragionamento all'avanguardia. (fatturazione obbligatoria)
Gemini 2.5 Pro
gemini-2.5-pro
Il nostro modello di pensiero all'avanguardia, in grado di ragionare su problemi complessi di programmazione, matematica e materie STEM, nonché di analizzare grandi set di dati, codebase e documenti utilizzando il contesto lungo.
Gemini 2.5 Flash
gemini-2.5-flash
Il nostro miglior modello in termini di rapporto prezzo/prestazioni, che offre funzionalità complete. 2.5 Flash è ideale per l'elaborazione su larga scala, per attività a bassa latenza e ad alto volume che richiedono ragionamento e per casi d'uso con agenti.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Il nostro modello flash più veloce, ottimizzato per l'efficienza dei costi e l'elevato throughput.
Modelli di generazione di immagini
Puoi generare immagini con i modelli Gemini o Imagen.
Gemini
Gemini 2.5 Flash Image (noto anche come nano banana)
gemini-2.5-flash-image
Il nostro modello Flash standard aggiornato per workflow rapidi e creativi con funzionalità di generazione di immagini e di modifica conversazionale in più passaggi. (fatturazione obbligatoria)
Imagen
Imagen 4
imagen-4.0-generate-001
Genera immagini realistiche di alta qualità da prompt di testo in linguaggio naturale. (fatturazione obbligatoria)
Imagen 4 Fast
imagen-4.0-fast-generate-001
Genera immagini per la prototipazione o per casi d'uso a bassa latenza. (fatturazione obbligatoria)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Genera immagini realistiche di alta qualità da prompt di testo in linguaggio naturale. (fatturazione obbligatoria)
Modelli di generazione precedente
I seguenti sono modelli attivi, ma di generazione precedente. Ti consigliamo di utilizzare uno dei modelli più recenti, se possibile.
Vai ai confronti tra i modelli
Modelli Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
Il nostro modello di seconda generazione, con una finestra contestuale da 1 milione di token. Offre funzionalità di nuova generazione e capacità migliorate, tra cui velocità superiore e utilizzo di strumenti nativi.
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Il nostro modello di seconda generazione, piccolo ma potente, con una finestra contestuale da 1 milione di token. Ottimizzato per l'efficienza dei costi e la bassa latenza.
Il resto di questa pagina fornisce informazioni dettagliate sui modelli supportati da Firebase AI Logic.
-
- Input e output supportati
- Confronto di alto livello delle funzionalità supportate
- Specifiche e limitazioni, ad esempio numero massimo di token di input o lunghezza massima del video di input
Descrizione di come vengono versionati i modelli, in particolare le versioni stabile, aggiornata automaticamente, anteprima e sperimentale
Elenchi di nomi di modelli disponibili da includere nel codice durante l'inizializzazione
Elenchi delle lingue supportate per i modelli
In fondo a questa pagina, puoi visualizzare informazioni dettagliate sui modelli di generazione precedente.
Confronta i modelli
Ogni modello ha funzionalità diverse per supportare vari casi d'uso. Tieni presente che ciascuna tabella in questa sezione descrive ogni modello se utilizzato con Firebase AI Logic. Ogni modello potrebbe avere funzionalità aggiuntive che non sono disponibili quando si utilizzano i nostri SDK.
Se non riesci a trovare le informazioni che cerchi nelle seguenti sottosezioni, puoi trovare ancora più informazioni nella documentazione del fornitore di API che hai scelto:
Gemini Developer API: Modelli Gemini e modelli Imagen
Vertex AI Gemini API: Modelli Gemini e modelli Imagen
Input e output supportati
Di seguito sono riportati i tipi di input e output supportati quando utilizzi ciascun modello con Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (genera) | Imagen (funzionalità) | |
|---|---|---|---|---|---|---|
| Tipi di input | ||||||
| Testo | ||||||
| Testo (streaming) | ||||||
| Codice | ||||||
| Documenti (PDF o testo normale) |
||||||
| Immagini | ||||||
| Video | ||||||
| Audio | ||||||
| Audio (streaming) | ||||||
| Tipi di output | ||||||
| Testo | ||||||
| Testo (streaming) | ||||||
| Codice | ||||||
| Output strutturato (come JSON) |
||||||
| Immagini | ||||||
| Audio | ||||||
| Audio (streaming) | ||||||
Per informazioni sui tipi di file supportati, consulta File di input e requisiti supportati.
Funzionalità e capacità supportate
Di seguito sono riportate le funzionalità e le capacità supportate quando utilizzi ciascun modello con Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (genera) | Imagen (funzionalità) | |
|---|---|---|---|---|---|---|
| Pensando | ||||||
| Genera testo da input solo testuali o multimodali | interlacciato o come parte dell'immagine | Solo streaming | ||||
|
Genera immagini (Gemini o Imagen) |
||||||
|
Modifica le immagini (Gemini o Imagen) |
||||||
| Genera audio | Solo streaming | |||||
|
Genera
output strutturato
(come JSON) |
||||||
|
Analizza documenti
(PDF o testo normale) |
||||||
| Analizza le immagini (visione) | ||||||
| Analizza video (visione) | ||||||
| Analizzare l'audio | Solo streaming | |||||
| Chat a più turni | ||||||
| Streaming multimodale bidirezionale | ||||||
| Chiamata di funzione | ||||||
| Esecuzione del codice | ||||||
| Grounding con la Ricerca Google | ||||||
| Istruzioni di sistema | ||||||
| Contare i token |
Specifiche e limitazioni
Di seguito sono riportate le specifiche e le limitazioni quando utilizzi ciascun modello con Firebase AI Logic:
| Proprietà |
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (genera) | Imagen (funzionalità) |
|---|---|---|---|---|---|---|
| Finestra contestuale * Limite totale di token (input + output combinati) |
1 milione di token | 1.048.576 token | 32.768 token | 32.768 token | 480 token | 480 token |
| Limite di token di output * | 64.000 token | 65.536 token | 8192 token | 8192 token | --- | --- |
| Data del knowledge cutoff | Gennaio 2025 | Gennaio 2025 | Giugno 2025 | Agosto 2024 | --- | --- |
| PDF (su richiesta) | ||||||
| Numero massimo di file PDF di input ** |
900 file | 3000 file | 3 file | --- | --- | --- |
| Numero massimo di pagine per file PDF di input ** |
900 pagine | 1000 pagine | 3 pagine | --- | --- | --- |
| Dimensioni massime per file PDF di input |
50 MB | 50 MB | 50 MB | --- | --- | --- |
| Immagini (per richiesta) | ||||||
| Numero massimo di immagini input |
1000 immagini | 3000 immagini | 3 immagini | --- | --- | 4 immagini |
| Numero massimo di immagini di output |
--- | --- | 10 immagini | --- | 4 immagini | 4 immagini |
| Dimensioni massime per immagine di input con codifica base64 |
7 MB | 7 MB | 7 MB | --- | --- | --- |
| Video (per richiesta) | ||||||
| Numero massimo di file video di input |
10 file | 10 file | --- | --- | --- | --- |
| Lunghezza massima di tutti i video di input (solo fotogrammi) |
~60 minuti | ~60 minuti | --- | --- | --- | --- |
| Lunghezza massima di tutti i video di input (frame + audio) |
45 minuti circa | 45 minuti circa | --- | --- | --- | --- |
| Audio (per richiesta) | ||||||
| Numero massimo di file audio di input |
1 file | 1 file | --- | --- | --- | --- |
| Numero massimo di file audio output |
--- | --- | --- | --- | --- | --- |
| Lunghezza massima dell'audio di input |
~8,4 ore | ~8,4 ore | ~8,4 ore | --- | --- | --- |
| Lunghezza massima di tutto l'audio output |
--- | --- | --- | --- | --- | --- |
*
Per tutti i modelli Gemini, un token equivale a circa 4 caratteri,
quindi 100 token corrispondono a circa 60-80 parole in inglese. Per i modelli Gemini, puoi
determinare il numero totale di token nelle tue richieste utilizzando
countTokens.
** I PDF vengono trattati come immagini, quindi una singola pagina di un PDF viene trattata come un'immagine. Il numero di pagine consentite in una richiesta è limitato al numero di immagini supportate dal modello.
Trovare informazioni dettagliate aggiuntive
Quote e prezzi sono diversi per ogni modello. I prezzi dipendono anche dall'input e dall'output.
Scopri di più sui tipi di file di input supportati, su come specificare il tipo MIME e su come assicurarti che i file di input e le richieste multimodali soddisfino i requisiti e seguano le best practice in File di input e requisiti supportati.
Modelli di controllo delle versioni e denominazione
I modelli sono disponibili nelle versioni stabile, anteprima e sperimentale. Per comodità, sono supportati gli alias senza valori di versione espliciti.
Per trovare nomi di modelli specifici da utilizzare nel codice, consulta la sezione "Nomi dei modelli disponibili" più avanti in questa pagina.
| Tipo di versione / Fase di rilascio |
Descrizione | Pattern del nome del modello | |
|---|---|---|---|
| Stabile |
Le versioni stabili sono disponibili e supportate
per l'uso in produzione a partire dalla data di rilascio.
|
|
|
| Alias stabile aggiornato automaticamente (solo modelli Gemini 2.0) |
Gli alias stabili aggiornati automaticamente puntano sempre
all'ultima versione stabile del modello.
|
Solo modelli Gemini 2.0
Esempio: |
|
| Anteprima |
Le versioni anteprima hanno nuove funzionalità e
sono considerate non stabili.
|
Ai nomi dei modelli delle versioni di anteprima vengono aggiunti
Esempi: |
|
| Sperimentale |
Le versioni sperimentali hanno nuove funzionalità
e sono considerate non stabili.
|
I nomi dei modelli delle versioni sperimentali sono seguiti da
Esempio: |
|
| In pensione |
Le versioni ritirate hanno superato la data di ritiro
e sono state disattivate definitivamente.
|
--- |
|
Nomi dei modelli disponibili
I nomi dei modelli sono i valori espliciti che includi nel codice durante l'inizializzazione del modello.
Vai ai nomi dei modelli Gemini Vai ai nomi dei modelli Imagen
Elencare a livello di programmazione tutti i modelli disponibili
Puoi elencare tutti i nomi dei modelli disponibili utilizzando l'API REST:
Gemini Developer API: chiama l'endpoint
models.listVertex AI Gemini API: chiama l'endpoint
publishers.models.list
Tieni presente che l'elenco restituito includerà tutti i modelli supportati dai
provider API, ma Firebase AI Logic supporta solo i modelli
Gemini e Imagen descritti in questa pagina.
Tieni presente inoltre che gli alias aggiornati automaticamente (ad esempio gemini-2.0-flash) non sono
elencati perché sono un alias pratico per il modello di base.
Gemini nomi dei modelli
Per esempi di inizializzazione per la tua piattaforma, consulta la guida introduttiva.
Per informazioni dettagliate sulle fasi di rilascio (in particolare per casi d'uso, fatturazione e ritiro), vedi Versioning e pattern di denominazione dei modelli.
Gemini 3 Pro nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
gemini-3-pro-preview |
Versione di anteprima di Gemini 3 Pro | Anteprima | 2025-11-18 | Da stabilire |
Gemini 2.5 Pro nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
gemini-2.5-pro |
Versione stabile di Gemini 2.5 Pro | Stabile | 2025-06-17 | Non prima del 17/06/2026 |
Gemini 2.5 Flash nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
gemini-2.5-flash |
Versione stabile di Gemini 2.5 Flash | Stabile | 2025-06-17 | Non prima del 17/06/2026 |
Gemini 2.5 Flash‑Lite nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Versione stabile di Gemini 2.5 Flash‑Lite | Stabile | 2025-07-22 | Non prima del giorno 2026-07-22 |
Nomi dei modelli Gemini 2.5 Flash Image (ovvero "nano banana")
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
gemini-2.5-flash-image |
Versione stabile per Gemini 2.5 Flash Image (nota anche come "nano banana") | Stabile | 2025-10-02 | Non prima del giorno 2026-10-02 |
Gemini 2.5 Flash Live nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
gemini-live-2.5-flash |
Versione stabile per Gemini 2.5 Flash Live | Stabile (GA privato) 1 |
2025-06-01 | Non prima del giorno 2026-06-01 |
gemini-live-2.5-flash-preview 2 |
Versione di anteprima per Gemini 2.5 Flash Live | Anteprima | 2025-06-01 | Da stabilire |
Firebase AI Logic non supporta ancora i modelli audio nativi (come gemini-2.5-flash-native-audio-preview-09-2025).
1 Contatta il rappresentante del team dell'account Google Cloud per richiedere l'accesso. 2 Non supportato da Vertex AI Gemini API, indipendentemente da come vi accedi.
Gemini 2.0 Flash Live nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
Versione stabile per Gemini 2.0 Flash Live | Stabile | 2025-04-01 | Non prima del giorno 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 |
Versione di anteprima per Gemini 2.0 Flash Live | Anteprima | 2025-04-09 | Da stabilire |
2 Non supportato da Vertex AI Gemini API, indipendentemente da come vi accedi.
Imagen nomi dei modelli
Per esempi di inizializzazione per la tua piattaforma, consulta la guida alla generazione di immagini con Imagen.
Per informazioni dettagliate sulle fasi di rilascio (in particolare per casi d'uso, fatturazione e ritiro), vedi Versioning e pattern di denominazione dei modelli.
Imagen 4 nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Versione stabile di Imagen 4 | Stabile | 2025-08-14 | Non prima del 14/08/2026 |
Imagen 4 Fast nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Versione stabile di Imagen 4 Fast | Stabile | 2025-08-14 | Non prima del 14/08/2026 |
Imagen 4 Ultra nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Versione stabile di Imagen 4 Ultra | Stabile | 2025-08-14 | Non prima del 14/08/2026 |
Imagen 3 Capability nomi dei modelli
| Nome modello | Descrizione | Fase di rilascio | Data di uscita | Data di ritiro |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Versione stabile iniziale di Imagen 3 Capability | Stabile | 2024-12-10 | Non prima del 10/12/2025 |
3 Non supportato da Gemini Developer API, indipendentemente da come vi accedi.
Lingue supportate
Gemini
Tutti i modelli Gemini possono comprendere e rispondere nelle seguenti lingue:
Arabo (ar), bengalese (bn), bulgaro (bg), cinese semplificato e tradizionale (zh), croato (hr), ceco (cs), danese (da), olandese (nl), inglese (en), estone (et), finlandese (fi), francese (fr), tedesco (de), greco (el), ebraico (iw), hindi (hi), ungherese (hu), indonesiano (id), italiano (it), giapponese (ja), coreano (ko), lettone (lv), lituano (lt), norvegese (no), polacco (pl), portoghese (pt), rumeno (ro), russo (ru), serbo (sr), slovacco (sk), sloveno (sl), spagnolo (es), swahili (sw), svedese (sv), tailandese (th), turco (tr), ucraino (uk), vietnamita (vi)
I modelli Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash possono comprendere e rispondere nelle seguenti lingue aggiuntive:
Afrikaans (af), amarico (am), assamese (as), azero (az), bielorusso (be), bosniaco (bs), catalano (ca), cebuano (ceb), corso (co), gallese (cy), maldiviano (dv), esperanto (eo), basco (eu), persiano (fa), filippino (tagalog) (fil), frisone (fy), irlandese (ga), gaelico scozzese (gd), galiziano (gl), gujarati (gu), hausa (ha), hawaiano (haw), hmong (hmn), creolo haitiano (ht), armeno (hy), igbo (ig), islandese (is), giavanese (jv), georgiano (ka), kazako (kk), khmer (km), kannada (kn), krio (kri), curdo (ku), kirghiso (ky), latino (la), lussemburghese (lb), lao (lo), malgascio (mg), maori (mi), macedone (mk), malayalam (ml), mongolo (mn), meitei (manipuri) (mni-Mtei), marathi (mr), malese (ms), maltese (mt), birmano (my), nepalese (ne), nyanja (chichewa) (ny), odia (oriya) (or), punjabi (pa), pashto (ps), sindhi (sd), singalese (si), samoano (sm), shona (sn), somalo (so), albanese (sq), sesotho (st), sundanese (su), tamil (ta), telugu (te), tagiko (tg), uiguro (ug), urdu (ur), uzbeko (uz), xhosa (xh), yiddish (yi), yoruba (yo), zulu (zu)
Imagen
Disponibilità generale: inglese
Anteprima: cinese (semplificato), cinese (tradizionale), coreano, giapponese, hindi, portoghese, spagnolo
Informazioni sui modelli precedenti
I seguenti sono modelli attivi, ma di generazione precedente. Ti consigliamo di utilizzare uno dei modelli più recenti, se possibile.
Gemini modelli
| Modello | Input | Output | Descrizione |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
testo, codice, PDF, immagini, video, audio | testo, codice, JSON | Il nostro modello multimodale con funzionalità di nuova generazione e capacità migliorate, tra cui velocità superiore, utilizzo di strumenti integrati e una finestra contestuale da 1 milione di token |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
testo, codice, PDF, immagini, video, audio | testo, codice, JSON | Il nostro modello Flash più veloce ed economico. È un percorso di upgrade per gli utenti di 1.5 Flash che vogliono una qualità migliore allo stesso prezzo e alla stessa velocità. |
Imagen modelli
| Modello | Input | Output | Descrizione |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
testo | immagini | Genera immagini realistiche e di alta qualità da prompt di testo in linguaggio naturale |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
testo | immagini | Genera immagini per la prototipazione o i casi d'uso a bassa latenza |
2 Non supportato da Gemini Developer API, indipendentemente da come vi accedi.
Passaggi successivi
Prova le funzionalità di Gemini API
- Crea conversazioni multi-turno (chat).
- Genera testo da prompt solo di testo.
- Genera testo utilizzando prompt con vari tipi di file, ad esempio immagini, PDF, video e audio.
- Genera output strutturato (come JSON) da prompt di testo e multimodali.
- Genera immagini da prompt di testo (Gemini o Imagen).
- Input e output di stream (incluso l'audio) utilizzando Gemini Live API.
- Utilizza strumenti (come la chiamata di funzioni e l'ancoraggio con la Ricerca Google) per connettere un modello Gemini ad altre parti della tua app e a sistemi e informazioni esterni.