Scopri di più sui modelli supportati

Per le app web e mobile, gli SDK Firebase AI Logic ti consentono di interagire con i modelli Gemini e Imagen supportati direttamente dalla tua app.

I modelli Gemini sono considerati multimodali perché sono in grado di elaborare e persino generare più modalità, tra cui testo, codice, PDF, immagini, video e audio. I modelli Imagen possono essere richiesti con testo per generare immagini.

Consulta anche le nostre domande frequenti su tutti i modelli supportati e non supportati da Firebase AI Logic.

Vai ai confronti tra i modelli

IL NOSTRO MODELLO PIÙ INTELLIGENTE

gemini-3-pro-preview

Il nostro miglior modello per la comprensione multimodale e il nostro modello più potente per la codifica di agenti e vibrazioni, che offre immagini più ricche e un'interattività più profonda, il tutto basato su una base di ragionamento all'avanguardia. (fatturazione obbligatoria)


IL NOSTRO MODELLO DI PENSIERO AVANZATO

gemini-2.5-pro

Il nostro modello di pensiero all'avanguardia, in grado di ragionare su problemi complessi di programmazione, matematica e materie STEM, nonché di analizzare grandi set di dati, codebase e documenti utilizzando il contesto lungo.

VELOCE E INTELLIGENTE

gemini-2.5-flash

Il nostro miglior modello in termini di rapporto prezzo/prestazioni, che offre funzionalità complete. 2.5 Flash è ideale per l'elaborazione su larga scala, per attività a bassa latenza e ad alto volume che richiedono ragionamento e per casi d'uso con agenti.

ULTRA FAST

gemini-2.5-flash-lite

Il nostro modello flash più veloce, ottimizzato per l'efficienza dei costi e l'elevato throughput.

Modelli di generazione di immagini

Puoi generare immagini con i modelli Gemini o Imagen.

Vai ai confronti dei modelli

Gemini

gemini-2.5-flash-image

Il nostro modello Flash standard aggiornato per workflow rapidi e creativi con funzionalità di generazione di immagini e di modifica conversazionale in più passaggi. (fatturazione obbligatoria)

Imagen

imagen-4.0-generate-001

Genera immagini realistiche di alta qualità da prompt di testo in linguaggio naturale. (fatturazione obbligatoria)

imagen-4.0-fast-generate-001

Genera immagini per la prototipazione o per casi d'uso a bassa latenza. (fatturazione obbligatoria)

imagen-4.0-ultra-generate-001

Genera immagini realistiche di alta qualità da prompt di testo in linguaggio naturale. (fatturazione obbligatoria)

Modelli di generazione precedente

I seguenti sono modelli attivi, ma di generazione precedente. Ti consigliamo di utilizzare uno dei modelli più recenti, se possibile.

Vai ai confronti tra i modelli

Modelli Gemini

IL NOSTRO MODELLO DI SECONDA GENERAZIONE

gemini-2.0-flash-001

Il nostro modello di seconda generazione, con una finestra contestuale da 1 milione di token. Offre funzionalità di nuova generazione e capacità migliorate, tra cui velocità superiore e utilizzo di strumenti nativi.

IL NOSTRO MODELLO VELOCE DI SECONDA GENERAZIONE

gemini-2.0-flash-lite-001

Il nostro modello di seconda generazione, piccolo ma potente, con una finestra contestuale da 1 milione di token. Ottimizzato per l'efficienza dei costi e la bassa latenza.


Il resto di questa pagina fornisce informazioni dettagliate sui modelli supportati da Firebase AI Logic.

  • Confronta i modelli:

    • Input e output supportati
    • Confronto di alto livello delle funzionalità supportate
    • Specifiche e limitazioni, ad esempio numero massimo di token di input o lunghezza massima del video di input
  • Descrizione di come vengono versionati i modelli, in particolare le versioni stabile, aggiornata automaticamente, anteprima e sperimentale

  • Elenchi di nomi di modelli disponibili da includere nel codice durante l'inizializzazione

  • Elenchi delle lingue supportate per i modelli

In fondo a questa pagina, puoi visualizzare informazioni dettagliate sui modelli di generazione precedente.



Confronta i modelli

Ogni modello ha funzionalità diverse per supportare vari casi d'uso. Tieni presente che ciascuna tabella in questa sezione descrive ogni modello se utilizzato con Firebase AI Logic. Ogni modello potrebbe avere funzionalità aggiuntive che non sono disponibili quando si utilizzano i nostri SDK.

Se non riesci a trovare le informazioni che cerchi nelle seguenti sottosezioni, puoi trovare ancora più informazioni nella documentazione del fornitore di API che hai scelto:

Input e output supportati

Di seguito sono riportati i tipi di input e output supportati quando utilizzi ciascun modello con Firebase AI Logic:

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (genera) Imagen (funzionalità)
Tipi di input
Testo
Testo (streaming)
Codice
Documenti
(PDF o testo normale)
Immagini
Video
Audio
Audio (streaming)
Tipi di output
Testo
Testo (streaming)
Codice
Output strutturato
(come JSON)
Immagini
Audio
Audio (streaming)

Per informazioni sui tipi di file supportati, consulta File di input e requisiti supportati.

Funzionalità e capacità supportate

Di seguito sono riportate le funzionalità e le capacità supportate quando utilizzi ciascun modello con Firebase AI Logic:

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (genera) Imagen (funzionalità)
Pensando
Genera testo da input solo testuali o multimodali interlacciato o come parte dell'immagine Solo streaming
Genera immagini
(Gemini o Imagen)
Modifica le immagini
(Gemini o Imagen)
Genera audio Solo streaming
Genera output strutturato
(come JSON)
Analizza documenti
(PDF o testo normale)
Analizza le immagini (visione)
Analizza video (visione)
Analizzare l'audio Solo streaming
Chat a più turni
Streaming multimodale bidirezionale
Chiamata di funzione
Esecuzione del codice
Grounding con la Ricerca Google
Istruzioni di sistema
Contare i token

Specifiche e limitazioni

Di seguito sono riportate le specifiche e le limitazioni quando utilizzi ciascun modello con Firebase AI Logic:

Proprietà <span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (genera) Imagen (funzionalità)
Finestra contestuale *
Limite totale di token
(input + output combinati)
1 milione di token 1.048.576 token 32.768 token 32.768 token 480 token 480 token
Limite di token di output * 64.000 token 65.536 token 8192 token 8192 token --- ---
Data del knowledge cutoff Gennaio 2025 Gennaio 2025 Giugno 2025 Agosto 2024 --- ---
PDF (su richiesta)
Numero massimo
di file PDF di input **
900 file 3000 file 3 file --- --- ---
Numero massimo
di pagine
per file PDF di input **
900 pagine 1000 pagine 3 pagine --- --- ---
Dimensioni massime
per file PDF di input
50 MB 50 MB 50 MB --- --- ---
Immagini (per richiesta)
Numero massimo
di immagini input
1000 immagini 3000 immagini 3 immagini --- --- 4 immagini
Numero massimo
di immagini di output
--- --- 10 immagini --- 4 immagini 4 immagini
Dimensioni massime
per immagine di input con codifica base64
7 MB 7 MB 7 MB --- --- ---
Video (per richiesta)
Numero massimo
di file video di input
10 file 10 file --- --- --- ---
Lunghezza massima
di tutti i video di input
(solo fotogrammi)
~60 minuti ~60 minuti --- --- --- ---
Lunghezza massima
di tutti i video di input
(frame + audio)
45 minuti circa 45 minuti circa --- --- --- ---
Audio (per richiesta)
Numero massimo
di file audio di input
1 file 1 file --- --- --- ---
Numero massimo
di file audio output
--- --- --- --- --- ---
Lunghezza massima
dell'audio di input
~8,4 ore ~8,4 ore ~8,4 ore --- --- ---
Lunghezza massima
di tutto l'audio output
--- --- --- --- --- ---

* Per tutti i modelli Gemini, un token equivale a circa 4 caratteri, quindi 100 token corrispondono a circa 60-80 parole in inglese. Per i modelli Gemini, puoi determinare il numero totale di token nelle tue richieste utilizzando countTokens.

** I PDF vengono trattati come immagini, quindi una singola pagina di un PDF viene trattata come un'immagine. Il numero di pagine consentite in una richiesta è limitato al numero di immagini supportate dal modello.

Trovare informazioni dettagliate aggiuntive

  • Quote e prezzi sono diversi per ogni modello. I prezzi dipendono anche dall'input e dall'output.

  • Scopri di più sui tipi di file di input supportati, su come specificare il tipo MIME e su come assicurarti che i file di input e le richieste multimodali soddisfino i requisiti e seguano le best practice in File di input e requisiti supportati.



Modelli di controllo delle versioni e denominazione

I modelli sono disponibili nelle versioni stabile, anteprima e sperimentale. Per comodità, sono supportati gli alias senza valori di versione espliciti.

Per trovare nomi di modelli specifici da utilizzare nel codice, consulta la sezione "Nomi dei modelli disponibili" più avanti in questa pagina.

Tipo di versione /
Fase di rilascio
Descrizione Pattern del nome del modello
Stabile Le versioni stabili sono disponibili e supportate per l'uso in produzione a partire dalla data di rilascio.
  • Una versione stabile del modello viene in genere rilasciata con una data di ritiro, che indica l'ultimo giorno in cui il modello è disponibile. Dopo questa data, il modello non è più accessibile o supportato da Google.
  • Modelli Gemini 2.5
    I nomi dei modelli delle versioni stabili non hanno suffissi

    Esempio: gemini-2.5-pro

  • Modelli Gemini 2.0 e Imagen
    Ai nomi dei modelli delle versioni stabili viene aggiunto un numero di versione specifico di tre cifre.

    Esempio: gemini-2.0-flash-001
    Esempio: imagen-3.0-generate-002

Alias stabile aggiornato automaticamente
(solo modelli Gemini 2.0)
Gli alias stabili aggiornati automaticamente puntano sempre all'ultima versione stabile del modello.
  • Se viene rilasciata una nuova versione stabile, l'alias aggiornato automaticamente inizia automaticamente a puntare a quella nuova versione stabile.

Solo modelli Gemini 2.0
I nomi dei modelli degli alias non hanno suffissi

Esempio: gemini-2.0-flash

Anteprima Le versioni anteprima hanno nuove funzionalità e sono considerate non stabili.
  • Questi modelli non sono consigliati per l'uso in produzione, sono soggetti a limiti di frequenza più restrittivi e potrebbero avere requisiti di fatturazione.
  • Questi modelli vengono ritirati entro poche settimane o mesi dal rilascio della versione stabile associata.
  • Per Vertex AI Gemini API, i modelli di anteprima rilasciati dopo giugno 2025 di solito richiedono di impostare la posizione del modello su global.

Ai nomi dei modelli delle versioni di anteprima vengono aggiunti -preview e spesso la data di rilascio del modello (-MM-DD per i modelli precedenti o -MM-YYYY per i modelli più recenti).

Esempi:
gemini-2.5-flash-preview-04-17
(rilasciato il 17 aprile 2025)
o
gemini-2.5-flash-preview-09-2025
(rilasciato a settembre 2025)
o
gemini-3-pro-preview
(rilasciato a novembre 2025)

Sperimentale Le versioni sperimentali hanno nuove funzionalità e sono considerate non stabili.
  • Questi modelli non sono consigliati per l'uso in produzione e sono soggetti a limiti di frequenza più restrittivi. I modelli sperimentali sono pensati per raccogliere feedback e consentire la sperimentazione delle nostre funzionalità più recenti.
  • Questi modelli vengono ritirati entro poche settimane o mesi dal rilascio della versione stabile associata.
  • Per Vertex AI Gemini API, i modelli sperimentali rilasciati dopo giugno 2025 richiedono di impostare la posizione del modello su global.

I nomi dei modelli delle versioni sperimentali sono seguiti da -exp e dalla data di rilascio del modello (-MM-DD).

Esempio: gemini-2.5-pro-exp-03-25
(rilasciato il 25 marzo 2025)

In pensione Le versioni ritirate hanno superato la data di ritiro e sono state disattivate definitivamente.
  • I modelli ritirati non sono più accessibili o supportati da Google e una richiesta che utilizza il nome di un modello ritirato restituisce un errore 404.

---



Nomi dei modelli disponibili

I nomi dei modelli sono i valori espliciti che includi nel codice durante l'inizializzazione del modello.

Vai ai nomi dei modelli Gemini Vai ai nomi dei modelli Imagen

Elencare a livello di programmazione tutti i modelli disponibili

Puoi elencare tutti i nomi dei modelli disponibili utilizzando l'API REST:

Tieni presente che l'elenco restituito includerà tutti i modelli supportati dai provider API, ma Firebase AI Logic supporta solo i modelli Gemini e Imagen descritti in questa pagina. Tieni presente inoltre che gli alias aggiornati automaticamente (ad esempio gemini-2.0-flash) non sono elencati perché sono un alias pratico per il modello di base.

Gemini nomi dei modelli

Per esempi di inizializzazione per la tua piattaforma, consulta la guida introduttiva.

Per informazioni dettagliate sulle fasi di rilascio (in particolare per casi d'uso, fatturazione e ritiro), vedi Versioning e pattern di denominazione dei modelli.

Gemini 3 Pro nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
gemini-3-pro-preview Versione di anteprima di Gemini 3 Pro Anteprima 2025-11-18 Da stabilire

Gemini 2.5 Pro nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
gemini-2.5-pro Versione stabile di Gemini 2.5 Pro Stabile 2025-06-17 Non prima del 17/06/2026

Gemini 2.5 Flash nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
gemini-2.5-flash Versione stabile di Gemini 2.5 Flash Stabile 2025-06-17 Non prima del 17/06/2026

Gemini 2.5 Flash‑Lite nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
gemini-2.5-flash-lite Versione stabile di Gemini 2.5 Flash‑Lite Stabile 2025-07-22 Non prima del giorno
2026-07-22

Nomi dei modelli Gemini 2.5 Flash Image (ovvero "nano banana")

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
gemini-2.5-flash-image Versione stabile per Gemini 2.5 Flash Image (nota anche come "nano banana") Stabile 2025-10-02 Non prima del giorno
2026-10-02

Gemini 2.5 Flash Live nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
gemini-live-2.5-flash Versione stabile per Gemini 2.5 Flash Live Stabile
(GA privato) 1
2025-06-01 Non prima del giorno
2026-06-01
gemini-live-2.5-flash-preview 2 Versione di anteprima per Gemini 2.5 Flash Live Anteprima 2025-06-01 Da stabilire

Firebase AI Logic non supporta ancora i modelli audio nativi (come gemini-2.5-flash-native-audio-preview-09-2025).

1 Contatta il rappresentante del team dell'account Google Cloud per richiedere l'accesso. 2 Non supportato da Vertex AI Gemini API, indipendentemente da come vi accedi.

Gemini 2.0 Flash Live nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
gemini-2.0-flash-live-001 2 Versione stabile per Gemini 2.0 Flash Live Stabile 2025-04-01 Non prima del giorno
2026-04-01
gemini-2.0-flash-live-preview-04-09 Versione di anteprima per Gemini 2.0 Flash Live Anteprima 2025-04-09 Da stabilire

2 Non supportato da Vertex AI Gemini API, indipendentemente da come vi accedi.

Imagen nomi dei modelli

Per esempi di inizializzazione per la tua piattaforma, consulta la guida alla generazione di immagini con Imagen.

Per informazioni dettagliate sulle fasi di rilascio (in particolare per casi d'uso, fatturazione e ritiro), vedi Versioning e pattern di denominazione dei modelli.

Imagen 4 nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
imagen-4.0-generate-001 Versione stabile di Imagen 4 Stabile 2025-08-14 Non prima del 14/08/2026

Imagen 4 Fast nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
imagen-4.0-fast-generate-001 Versione stabile di Imagen 4 Fast Stabile 2025-08-14 Non prima del 14/08/2026

Imagen 4 Ultra nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
imagen-4.0-ultra-generate-001 Versione stabile di Imagen 4 Ultra Stabile 2025-08-14 Non prima del 14/08/2026

Imagen 3 Capability nomi dei modelli

Nome modello Descrizione Fase di rilascio Data di uscita Data di ritiro
imagen-3.0-capability-001 3 Versione stabile iniziale di Imagen 3 Capability Stabile 2024-12-10 Non prima del 10/12/2025

3 Non supportato da Gemini Developer API, indipendentemente da come vi accedi.



Lingue supportate

Gemini

  • Tutti i modelli Gemini possono comprendere e rispondere nelle seguenti lingue:

    Arabo (ar), bengalese (bn), bulgaro (bg), cinese semplificato e tradizionale (zh), croato (hr), ceco (cs), danese (da), olandese (nl), inglese (en), estone (et), finlandese (fi), francese (fr), tedesco (de), greco (el), ebraico (iw), hindi (hi), ungherese (hu), indonesiano (id), italiano (it), giapponese (ja), coreano (ko), lettone (lv), lituano (lt), norvegese (no), polacco (pl), portoghese (pt), rumeno (ro), russo (ru), serbo (sr), slovacco (sk), sloveno (sl), spagnolo (es), swahili (sw), svedese (sv), tailandese (th), turco (tr), ucraino (uk), vietnamita (vi)

  • I modelli Gemini 2.0 Flash, Gemini 1.5 Pro e Gemini 1.5 Flash possono comprendere e rispondere nelle seguenti lingue aggiuntive:

    Afrikaans (af), amarico (am), assamese (as), azero (az), bielorusso (be), bosniaco (bs), catalano (ca), cebuano (ceb), corso (co), gallese (cy), maldiviano (dv), esperanto (eo), basco (eu), persiano (fa), filippino (tagalog) (fil), frisone (fy), irlandese (ga), gaelico scozzese (gd), galiziano (gl), gujarati (gu), hausa (ha), hawaiano (haw), hmong (hmn), creolo haitiano (ht), armeno (hy), igbo (ig), islandese (is), giavanese (jv), georgiano (ka), kazako (kk), khmer (km), kannada (kn), krio (kri), curdo (ku), kirghiso (ky), latino (la), lussemburghese (lb), lao (lo), malgascio (mg), maori (mi), macedone (mk), malayalam (ml), mongolo (mn), meitei (manipuri) (mni-Mtei), marathi (mr), malese (ms), maltese (mt), birmano (my), nepalese (ne), nyanja (chichewa) (ny), odia (oriya) (or), punjabi (pa), pashto (ps), sindhi (sd), singalese (si), samoano (sm), shona (sn), somalo (so), albanese (sq), sesotho (st), sundanese (su), tamil (ta), telugu (te), tagiko (tg), uiguro (ug), urdu (ur), uzbeko (uz), xhosa (xh), yiddish (yi), yoruba (yo), zulu (zu)

Imagen

  • Disponibilità generale: inglese

  • Anteprima: cinese (semplificato), cinese (tradizionale), coreano, giapponese, hindi, portoghese, spagnolo



Informazioni sui modelli precedenti

I seguenti sono modelli attivi, ma di generazione precedente. Ti consigliamo di utilizzare uno dei modelli più recenti, se possibile.

Gemini modelli

Modello Input Output Descrizione
Gemini 2.0 Flash
gemini-2.0-flash-001
testo, codice, PDF, immagini, video, audio testo, codice, JSON Il nostro modello multimodale con funzionalità di nuova generazione e capacità migliorate, tra cui velocità superiore, utilizzo di strumenti integrati e una finestra contestuale da 1 milione di token
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
testo, codice, PDF, immagini, video, audio testo, codice, JSON Il nostro modello Flash più veloce ed economico. È un percorso di upgrade per gli utenti di 1.5 Flash che vogliono una qualità migliore allo stesso prezzo e alla stessa velocità.

Imagen modelli

Modello Input Output Descrizione
Imagen 3
imagen-3.0-generate-002
testo immagini Genera immagini realistiche e di alta qualità da prompt di testo in linguaggio naturale
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
testo immagini Genera immagini per la prototipazione o i casi d'uso a bassa latenza

2 Non supportato da Gemini Developer API, indipendentemente da come vi accedi.



Passaggi successivi

Prova le funzionalità di Gemini API