Cette page a été traduite par l'API Cloud Translation.

En savoir plus sur les modèles compatibles

Pour les applications mobiles et Web, les SDK Firebase AI Logic vous permettent d'interagir avec les modèles Gemini et modèles Imagen compatibles directement depuis votre application.

Les modèles Gemini sont considérés comme multimodaux, car ils sont capables de traiter et même de générer plusieurs modalités, y compris du texte, du code, des PDF, des images, des vidéos et de l'audio. Les modèles Imagen peuvent être sollicités avec du texte pour générer des images.

Le tableau suivant présente brièvement les modèles compatibles avec Firebase AI Logic et les noms de leurs derniers modèles stables. Ce tableau liste également les modèles expérimentaux et en version preview disponibles pour les cas d'utilisation de prototypage.

Consultez également nos questions fréquentes pour connaître tous les modèles compatibles et non compatibles avec Firebase AI Logic.

Gemini modèles

Modèle	Entrée	Sortie	Description
Modèles Gemini avec des versions stables
Gemini 2.5 Pro `gemini-2.5-pro`	texte, code, PDF, images, vidéo, audio	texte, code, JSON	Notre modèle de raisonnement le plus avancé, capable de résoudre des problèmes complexes.
Gemini 2.5 Flash `gemini-2.5-flash`	texte, code, PDF, images, vidéo, audio	texte, code, JSON	Notre modèle de réflexion qui offre des capacités excellentes et complètes. Elle est conçue pour offrir un équilibre entre prix et performances.
Gemini 2.5 Flash‑Lite `gemini-2.5-flash-lite`	texte, code, PDF, images, vidéo, audio	texte, code, JSON	Notre modèle Gemini le plus équilibré, optimisé pour les cas d'utilisation à faible latence.
Gemini 2.0 Flash `gemini-2.0-flash-001`	texte, code, PDF, images, vidéo, audio	texte, code, JSON	Notre modèle multimodal doté de fonctionnalités de nouvelle génération et de capacités améliorées, y compris une vitesse supérieure, l'utilisation d'outils intégrés et une fenêtre de contexte d'un million de jetons
Gemini 2.0 Flash‑Lite `gemini-2.0-flash-lite-001`	texte, code, PDF, images, vidéo, audio	texte, code, JSON	Notre modèle Flash le plus rapide et le plus économique. Il s'agit d'une mise à niveau pour les utilisateurs de Flash 1.5 qui souhaitent bénéficier d'une meilleure qualité pour le même prix et la même vitesse.
Modèles Gemini avec des versions preview et expérimentales uniquement(recommandé pour les cas d'utilisation de prototypage uniquement)
Gemini 2.0 Flash Image Generation `gemini-2.0-flash-preview-image-generation`	texte, code, PDF, images, vidéo, audio	images, texte et images	Notre modèle multimodal qui accepte les entrées multimodales et les sorties d'images.
Gemini 2.0 Flash Live ¹ `gemini-2.0-flash-live-preview-04-09`	texte (streaming), audio (streaming)	texte (streaming), audio (streaming)	Notre modèle multimodal qui prend en charge le streaming en temps réel à faible latence des entrées et sorties multimodales.

^{1 Non compatible avec l'utilisation de Gemini Developer API avec les SDK Firebase AI Logic.}

Imagen modèles

Modèle	Entrée	Sortie	Description
Modèles Imagen avec des versions stables
Imagen 3 `imagen-3.0-generate-002`	texte	images	Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel
Imagen 3 Fast ² `imagen-3.0-fast-generate-001`	texte	images	Génère des images pour le prototypage ou les cas d'utilisation à faible latence
Modèles Imagen avec des versions preview et expérimentales uniquement(recommandé pour les cas d'utilisation de prototypage uniquement)
Imagen 4 `imagen-4.0-generate-preview-06-06`	texte	images	Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel
Imagen 4 Fast ² `imagen-4.0-fast-generate-preview-06-06`	texte	images	Génère des images pour le prototypage ou les cas d'utilisation à faible latence
Imagen 4 Ultra `imagen-4.0-ultra-generate-preview-06-06`	texte	images	Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel

^{2 Ce modèle Imagen n'est pas compatible avec Gemini Developer API, quelle que soit la façon dont vous accédez à l'API.}

Le reste de cette page fournit des informations détaillées sur les modèles compatibles avec Firebase AI Logic.

Comparer des modèles :
- Entrées et sorties acceptées
- Comparaison générale des fonctionnalités compatibles
- Spécifications et limites, par exemple le nombre maximal de jetons d'entrée ou la longueur maximale de la vidéo d'entrée
Description du versionnage des modèles, en particulier de leurs versions stable, mise à jour automatique, preview et expérimentale
Listes des noms de modèles disponibles à inclure dans votre code lors de l'initialisation
Listes des langues disponibles pour les modèles

En bas de cette page, vous pouvez afficher des informations détaillées sur les anciens modèles.

Comparer des modèles

Chaque modèle possède des fonctionnalités différentes pour prendre en charge divers cas d'utilisation. Notez que chaque tableau de cette section décrit chaque modèle lorsqu'il est utilisé avec Firebase AI Logic. Chaque modèle peut disposer de fonctionnalités supplémentaires qui ne sont pas disponibles lorsque vous utilisez nos SDK.

Si vous ne trouvez pas les informations que vous recherchez dans les sous-sections suivantes, vous pouvez en trouver d'autres dans la documentation du fournisseur d'API de votre choix :

Gemini Developer API : Gemini modèles et Imagen modèles
Vertex AI Gemini API : Gemini modèles et Imagen modèles

Entrées et sorties acceptées

Voici les types d'entrées et de sorties compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic :

	<span="notranslate">Gemini 2.5 Pro </span="notranslate">	<span="notranslate">Gemini 2.5 Flash </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Gemini 2.0 Flash Génération d'images </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen
Types d'entrée
Texte
Texte (streaming)
Code
Documents (PDF ou texte brut)
Images
Vidéo
Audio
Audio (streaming)
Types de sortie
Texte
Texte (streaming)
Code
Sortie structurée (comme JSON)
Images
Audio
Audio (streaming)

Pour en savoir plus sur les types de fichiers acceptés, consultez Fichiers d'entrée et exigences acceptés.

Fonctionnalités et caractéristiques compatibles

Voici les fonctionnalités et les capacités compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic :

	<span="notranslate">Gemini 2.0 Flash Génération d'images </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">
Raisonnement
Générer du texte à partir d'entrées textuelles ou multimodales	entrelacé ou intégré à l'image	streaming uniquement
Générer des images (Gemini ou Imagen)
Générer de l'audio		streaming uniquement
Générer une sortie structurée (comme JSON)
Analyser des documents (PDF ou texte brut)
Analyser des images (vision)
Analyser une vidéo (vision)
Analyser l'audio		streaming uniquement
Chat multitour
Streaming multimodal bidirectionnel ¹
Appel de fonction
Ancrage avec la recherche Google
Instructions système
Compter les jetons

^{1 Non compatible avec l'utilisation de Gemini Developer API avec les SDK Firebase AI Logic.}

Spécifications et limites

Voici les spécifications et les limites lorsque vous utilisez chaque modèle avec Firebase AI Logic :

Propriété	<span="notranslate">Gemini 2.5 Pro </span="notranslate">	<span="notranslate">Gemini 2.5 Flash </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate">	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">	<span="notranslate">Gemini 2.0 Flash Génération d'images </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen
Fenêtre de contexte* Limite totale de jetons (entrée et sortie combinées)	1 048 576 jetons	1 048 576 jetons	1 048 576 jetons	1 048 576 jetons	1 048 576 jetons	32 768 jetons	32 768 jetons	480 jetons
Limite de jetons de sortie*	65 536 jetons	65 536 jetons	65 536 jetons	8 192 jetons	8 192 jetons	8 192 jetons	8 192 jetons	---
Date limite des connaissances	Janvier 2025	Janvier 2025	Janvier 2025	Juin 2024	Juin 2024	Août 2024	Août 2024	---
PDF (sur demande)
Nombre maximal de fichiers PDF d'entrée**	3 000 fichiers	3 000 fichiers	3 000 fichiers	3 000 fichiers	3 000 fichiers	3 000 fichiers	---	---
Nombre maximal de pages par fichier PDF d'entrée**	1 000 pages	1 000 pages	1 000 pages	1 000 pages	1 000 pages	1 000 pages	---	---
Taille maximale de chaque fichier PDF d'entrée :	50 Mo	50 Mo	50 Mo	50 Mo	50 Mo	50 Mo	---	---
Images (par demande)
Nombre maximal d'images d'entrée	3 000 images	3 000 images	3 000 images	3 000 images	3 000 images	3 000 images	---	---
Nombre maximal d'images de sortie	---	---	---	---	---	10 images	---	4 images
Taille maximale par image d'entrée encodée en base64	7 Mo	7 Mo	7 Mo	7 Mo	7 Mo	7 Mo	---	---
Vidéo (par demande)
Nombre maximal de fichiers vidéo d'entrée	10 fichiers	10 fichiers	10 fichiers	10 fichiers	10 fichiers	10 fichiers	---	---
Durée maximale de toutes les vidéos (images uniquement)	Environ 60 minutes	Environ 60 minutes	Environ 60 minutes	Environ 60 minutes	Environ 60 minutes	Environ 60 minutes	---	---
Durée maximale de toutes les vidéos saisies (images et audio)	45 minutes environ	45 minutes environ	45 minutes environ	45 minutes environ	45 minutes environ	45 minutes environ	---	---
Audio (par demande)
Nombre maximal de fichiers audio d'entrée	1 fichier	1 fichier	1 fichier	1 fichier	1 fichier	1 fichier	---	---
Nombre maximal de fichiers audio de sortie	---	---	---	---	---	---	---	---
Longueur maximale de tous les éléments audio d'entrée	~8,4 heures	~8,4 heures	~8,4 heures	~8,4 heures	~8,4 heures	~8,4 heures	---	---
Longueur maximale de l'ensemble de l'audio de sortie	---	---	---	---	---	---	---	---

^{*
Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. 100 jetons correspondent donc à environ 60 à 80 mots en anglais. Pour les modèles Gemini, vous pouvez déterminer le nombre total de jetons dans vos requêtes à l'aide de countTokens.}

^{**
Les PDF sont traités comme des images. Ainsi, une seule page d'un PDF est traitée comme une seule image. Le nombre de pages autorisées dans une requête est limité au nombre d'images que le modèle peut accepter.}

Obtenir des informations détaillées supplémentaires

Les quotas et les tarifs varient selon les modèles. La tarification dépend également des entrées et des sorties.
Découvrez les types de fichiers d'entrée acceptés, comment spécifier le type MIME et comment vous assurer que vos fichiers d'entrée et vos requêtes multimodales répondent aux exigences et suivent les bonnes pratiques décrites dans Fichiers d'entrée et exigences acceptés.

Important : La taille totale de la requête est limitée à 20 Mo. Pour envoyer des fichiers volumineux, consultez les options permettant de fournir des fichiers dans les requêtes multimodales.

Gestion des versions et schémas de dénomination des modèles

Les modèles sont proposés en versions stable, preview et expérimentale. Pour plus de commodité, les alias sans valeurs de version explicites sont acceptés.

Pour trouver des noms de modèles spécifiques à utiliser dans votre code, consultez la section Noms de modèles disponibles plus loin sur cette page.

Type de version / Étape de lancement		Description	Format du nom du modèle
Stable		Les versions *stables* sont disponibles et compatibles avec une utilisation en production à partir de la date de sortie. Une version stable d'un modèle est généralement publiée avec une date d'arrêt, qui indique le dernier jour où le modèle est disponible. Après cette date, le modèle ne sera plus accessible ni pris en charge par Google.	Modèles Gemini 2.5 Les noms des versions stables ne comportent aucun suffixe. Exemple : `gemini-2.5-pro` Modèles Gemini 2.0 et Imagen Les noms des versions stables sont suivis d'un numéro de version spécifique à trois chiffres. Exemple : `gemini-2.0-flash-001` Exemple : `imagen-3.0-generate-002`
	Alias stable mis à jour automatiquement (modèles Gemini 2.0 uniquement)	Les alias stables *mis à jour automatiquement* pointent toujours vers la dernière version stable de ce modèle. Si une nouvelle version stable est publiée, l'alias mis à jour automatiquement commence automatiquement à pointer vers cette nouvelle version stable.	Modèles Gemini 2.0 uniquement Les noms d'alias de modèle ne comportent aucun suffixe. Exemple : `gemini-2.0-flash`
Aperçu		Les versions *Preview* disposent de nouvelles fonctionnalités et sont considérées comme instables. Ces modèles ne sont pas recommandés pour une utilisation en production. Ils sont soumis à des limites de fréquence plus restrictives et peuvent être soumis à des exigences de facturation. Pour les modèles d'aperçu Vertex AI Gemini API publiés après juin 2025, vous devez généralement définir la région du modèle sur `global`.	Les noms de modèle des versions Preview sont suivis de `-preview` et de la date de sortie du modèle (`-MM-DD`). Exemple : `gemini-2.5-flash-preview-04-17` (publié le 17 avril 2025)
Expérimental		Les versions *expérimentales* disposent de nouvelles fonctionnalités et sont considérées comme instables. Ces modèles ne sont pas recommandés pour une utilisation en production et sont soumis à des limites de fréquence plus restrictives. Les modèles expérimentaux sont destinés à recueillir des commentaires et à permettre de tester nos dernières fonctionnalités. Pour les Vertex AI Gemini API, les modèles expérimentaux publiés après juin 2025 vous obligent à définir la région du modèle sur `global`.	Le nom des versions expérimentales des modèles est suivi de `-exp` et de la date de sortie du modèle (`-MM-DD`). Exemple : `gemini-2.5-pro-exp-03-25` (sorti le 25 mars 2025)
Retraité(e)		Les versions *abandonnées* ont dépassé leur date d'abandon et ont été définitivement désactivées. Les modèles abandonnés ne sont plus accessibles ni pris en charge par Google. Les requêtes faisant référence à un ID de modèle abandonné renvoient généralement une erreur 404.	---

Noms de modèles disponibles

Les noms de modèles sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle.

Lister tous les modèles disponibles de manière programmatique

Vous pouvez lister tous les noms de modèles disponibles à l'aide de l'API REST :

Gemini Developer API : appelle le point de terminaison models.list.
Vertex AI Gemini API : appelle le point de terminaison publishers.models.list.

Notez que la liste renvoyée inclura tous les modèles compatibles avec les fournisseurs d'API, mais que Firebase AI Logic n'est compatible qu'avec les modèles Gemini et Imagen décrits sur cette page. Notez également que les alias mis à jour automatiquement (par exemple, gemini-2.0-flash) ne sont pas listés, car il s'agit d'un alias pratique pour le modèle de base.

Noms des modèles Gemini

Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de démarrage.

Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation et la facturation), consultez Modèles de nommage et de versionnage des modèles.

Important : Les noms de modèles stables Gemini 2.5 n'ont pas de suffixe à trois chiffres et n'ont pas d'alias mis à jour automatiquement. De plus, si vous utilisez Vertex AI Gemini API, tous les modèles d'aperçu Gemini 2.5 publiés après juin 2025 ne seront disponibles que dans la région global.

Noms des modèles Gemini 2.5 Pro

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`gemini-2.5-pro`	Dernière version stable de Gemini 2.5 Pro	Stable	2025-06-17	Au plus tôt le 2026-06-17
`gemini-2.5-pro-preview-06-05`	*(OBSOLÈTE)* Version bêta pointant vers la dernière version stable de Gemini 2.5 Pro (actuellement `gemini-2.5-pro`)	Aperçu	2025-06-05	2025-07-15
`gemini-2.5-pro-preview-05-06`	*(OBSOLÈTE)* Version bêta pointant vers la dernière version stable de Gemini 2.5 Pro (actuellement `gemini-2.5-pro`)	Aperçu	2025-05-06	2025-07-15
`gemini-2.5-pro-preview-03-25`	*(OBSOLÈTE)* Version bêta pointant vers la dernière version stable de Gemini 2.5 Pro (actuellement `gemini-2.5-pro`)	Aperçu	25/03/2025	2025-07-15

Noms des modèles Gemini 2.5 Flash

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`gemini-2.5-flash`	Dernière version stable de Gemini 2.5 Flash	Stable	2025-06-17	Au plus tôt le 2026-06-17
`gemini-2.5-flash-preview-05-20`	*(OBSOLÈTE)* Version bêta pointant vers la dernière version stable de Gemini 2.5 Flash (actuellement `gemini-2.5-flash`)	Aperçu	2025-05-20	2025-07-15
`gemini-2.5-flash-preview-04-17`	*(OBSOLÈTE)* Version bêta pointant vers la dernière version stable de Gemini 2.5 Flash (actuellement `gemini-2.5-flash`)	Aperçu	2025-04-17	2025-07-15

Noms des modèles Gemini 2.5 Flash‑Lite

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`gemini-2.5-flash-lite`	Dernière version stable de Gemini 2.5 Flash‑Lite	Stable	2025-07-22	Au plus tôt le 2026-07-22
`gemini-2.5-flash-lite-preview-06-17`	Version Preview pointant vers la dernière version stable de Gemini 2.5 Flash‑Lite (actuellement `gemini-2.5-flash-lite`)	Aperçu	2025-06-17	2025-08-21

Noms des modèles Gemini 2.0 Flash

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`gemini-2.0-flash-001`	Dernière version stable de Gemini 2.0 Flash	Stable	2025-02-05	Au plus tôt le 2026-02-05
`gemini-2.0-flash`	Alias mis à jour automatiquement pointant vers la dernière version stable de Gemini 2.0 Flash (actuellement `gemini-2.0-flash-001`)	Stable	2025-02-10	---

Noms des modèles Gemini 2.0 Flash‑Lite

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`gemini-2.0-flash-lite-001`	Dernière version stable de Gemini 2.0 Flash‑Lite	Stable	2025-02-25	Au plus tôt le 2026-02-25
`gemini-2.0-flash-lite`	Alias mis à jour automatiquement pointant vers la dernière version stable de Gemini 2.0 Flash‑Lite (actuellement `gemini-2.0-flash-lite-001`)	Stable	2025-02-25	---

Noms des modèles Gemini 2.0 Flash Image Generation

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`gemini-2.0-flash-preview-image-generation` ¹	Version bêta de Gemini 2.0 Flash Image Generation	Aperçu	2025-05-06	À déterminer

Noms des modèles Gemini 2.0 Flash Live

Disponible uniquement lorsque vous utilisez Vertex AI Gemini API comme fournisseur d'API.

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`gemini-2.0-flash-live-preview-04-09` ¹	Version bêta de Gemini 2.0 Flash Live	Aperçu	2025-04-09	À déterminer

^{1 Non compatible avec l'utilisation de Gemini Developer API avec les SDK Firebase AI Logic.}

Noms des modèles Imagen

Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de génération d'images avec Imagen.

Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation et la facturation), consultez Modèles de nommage et de versionnage des modèles.

Noms des modèles Imagen 4

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`imagen-4.0-generate-preview-06-06`	Version preview de Imagen 4	Aperçu	2025-06-06	À déterminer
`imagen-4.0-generate-preview-05-20` ²	Version preview de Imagen 4	Aperçu	2025-05-20	Au plus tôt le 7 juillet 2025

Noms des modèles Imagen 4 Fast

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`imagen-4.0-fast-generate-preview-06-06` ²	Version preview de Imagen 4 Fast	Aperçu	2025-06-06	À déterminer

Noms des modèles Imagen 4 Ultra

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`imagen-4.0-ultra-generate-preview-06-06`	Version preview de Imagen 4 Ultra	Aperçu	2025-06-06	À déterminer
`imagen-4.0-ultra-generate-exp-05-20` ²	Version expérimentale de Imagen 4 Ultra	Expérimentation	2025-05-20	Au plus tôt le 7 juillet 2025

Noms des modèles Imagen 3

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`imagen-3.0-generate-002`	Dernière version stable de Imagen 3	Stable	2025-01-23	Au plus tôt le 23 janvier 2026
`imagen-3.0-generate-001` ²	Première version stable de Imagen 3	Stable	2024-07-31	Au plus tôt le 31 juillet 2025

Noms des modèles Imagen 3 Fast

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
`imagen-3.0-fast-generate-001` ²	Première version stable de Imagen 3 Fast	Stable	2024-07-31	Au plus tôt le 31 juillet 2025

^{2 Non compatible avec Gemini Developer API, quelle que soit la façon dont vous accédez à l'API.}

Langues disponibles

Gemini

Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)
Les modèles Gemini 2.0 Flash, Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes :

Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)

Imagen

Disponibilité générale : anglais
Aperçu : chinois (simplifié), chinois (traditionnel), coréen, espagnol, hindi, japonais, portugais

Informations sur les anciens modèles

Firebase AI Logic est compatible avec les anciens modèles actifs Gemini (comme les modèles Gemini 1.5).

Firebase AI Logic n'est pas compatible avec les anciens modèles Imagen (comme Imagen 2).

Modèle	Entrée	Sortie	Optimisé pour
Gemini 1.5 Pro `gemini-1.5-pro-002`	texte, code, PDF, images, vidéo, audio	texte, code, JSON	Prend en charge les tâches de raisonnement complexes nécessitant plus d'intelligence ; Contexte long de 2 millions de jetons
Gemini 1.5 Flash `gemini-1.5-flash-002`	texte, code, PDF, images, vidéo, audio	texte, code, JSON	Offre des performances rapides et polyvalentes pour une grande variété de tâches
Gemini 1.0 Pro Vision `gemini-1.0-pro-vision-001`	~~texte, code, PDF, images, vidéo (images uniquement)~~	~~texte, code~~	~~Traite le texte, les images et les vidéos pour les réponses textuelles ou de code. Ne peut pas être utilisé pour le chat.~~
Gemini 1.0 Pro `gemini-1.0-pro-002`	~~texte, code~~	~~texte, code~~	~~Tâches en langage naturel, chat textuel et de code multitour, et génération de code~~

Afficher les entrées et sorties compatibles des anciens modèles

Voici les types d'entrée et de sortie lors de l'utilisation de chaque modèle avec Firebase AI Logic :

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Types d'entrée
Texte
Code
Documents (PDF ou texte brut)
Images
Vidéo
Audio
Audio (streaming)
Types de sortie
Texte
Code
Sortie structurée (comme JSON)
Images, vidéos et contenus audio

Fonctionnalités et caractéristiques compatibles des anciens modèles

Voici les capacités et les fonctionnalités lorsque vous utilisez chaque modèle avec Firebase AI Logic :

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Générer du texte à partir d'une entrée texte uniquement
Générer du texte à partir d'une entrée multimodale
Générer des images
Générer de l'audio
Générer une sortie structurée (comme JSON)
Analyser des documents (PDF ou texte brut)
Analyser des images (vision)
Analyser une vidéo (vision)
Analyser l'audio
Chat multitour
Appel de fonction (outils)
Compter les jetons et les caractères facturables
Instructions système
Streaming multimodal bidirectionnel

Spécifications et limites des anciens modèles

Voici les spécifications et les limites lorsque vous utilisez chaque modèle avec Firebase AI Logic :

	<span="notranslate">Gemini 1.5 Pro </span="notranslate">	<span="notranslate">Gemini 1.5 Flash </span="notranslate">	<span="notranslate">Gemini 1.0 Pro Vision </span="notranslate">	<span="notranslate">Gemini 1.0 Pro </span="notranslate">
Fenêtre de contexte* Limite totale de jetons (entrée et sortie combinées)	2 097 152 jetons	1 048 576 jetons	16 384 jetons	32 760 jetons
Limite de jetons de sortie*	8 192 jetons	8 192 jetons	2 048 jetons	8 192 jetons
Date limite des connaissances	Mai 2024	Mai 2024	Février 2023	Février 2023
PDF (sur demande)
Nombre maximal de fichiers PDF d'entrée**	3 000 fichiers	3 000 fichiers	16 fichiers	---
Nombre maximal de pages par fichier PDF d'entrée**	1 000 pages	1 000 pages	16 pages	---
Taille maximale de chaque fichier PDF d'entrée :	50 Mo	50 Mo	50 Mo	---
Images (par demande)
Nombre maximal d'images d'entrée	3 000 images	3 000 images	16 images	---
Nombre maximal d'images de sortie	---	---	---	---
Taille maximale par image d'entrée encodée en base64	7 Mo	7 Mo	7 Mo	---
Vidéo (par demande)
Nombre maximal de fichiers vidéo d'entrée	10 fichiers	10 fichiers	1 fichier	---
Durée maximale de toutes les vidéos (images uniquement)	Environ 60 minutes	Environ 60 minutes	2 minutes	---
Durée maximale de toutes les vidéos saisies (images et audio)	45 minutes environ	45 minutes environ	---	---
Audio (par demande)
Nombre maximal de fichiers audio d'entrée	1 fichier	1 fichier	---	---
Nombre maximal de fichiers audio de sortie	---	---	---	---
Longueur maximale de tous les éléments audio d'entrée	~8,4 heures	~8,4 heures	---	---
Longueur maximale de l'ensemble de l'audio de sortie	---	---	---	---

Noms des anciens modèles disponibles (y compris les dates d'arrêt)

Les noms de modèles sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle.

Noms des modèles Gemini 1.5 Pro

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
Versions stables
`gemini-1.5-pro-002`	Dernière version stable de Gemini 1.5 Pro	Suppression à venir	2024-09-24	2025-09-24
`gemini-1.5-pro-001`	Première version stable de Gemini 1.5 Pro	Suppression à venir	2024-05-24	2025-05-24
Alias stable mis à jour automatiquement
`gemini-1.5-pro`	Pointe vers la dernière version stable de 1.5 Pro (actuellement `gemini-1.5-pro-002`)	Suppression à venir	2024-09-24	2025-09-24

Noms des modèles Gemini 1.5 Flash

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
Versions stables
`gemini-1.5-flash-002`	Dernière version stable de Gemini 1.5 Flash	Suppression à venir	2024-09-24	2025-09-24
`gemini-1.5-flash-001`	Première version stable de Gemini 1.5 Flash	Suppression à venir	2024-05-24	2025-05-24
Alias stable mis à jour automatiquement
`gemini-1.5-flash`	Pointe vers la dernière version stable de 1.5 Flash (actuellement `gemini-1.5-flash-002`)	Suppression à venir	2024-09-24	2025-09-24

Noms des modèles Gemini 1.0 Pro Vision

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
Versions stables
`gemini-1.0-pro-vision-001`	Dernière version stable de Gemini 1.0 Pro Vision	Retrait	2024-02-15	2025-04-21
Alias stable mis à jour automatiquement
`gemini-1.0-pro-vision`	Pointe vers la dernière version stable de Gemini 1.5 Pro Vision (actuellement `gemini-1.5-pro-vision-001`)	Retrait	2024-01-04	2025-04-21

Noms des modèles Gemini 1.0 Pro

Nom du modèle	Description	Étape de lancement	Date de disponibilité	Date d'arrêt
Versions stables
`gemini-1.0-pro-002`	Dernière version stable de Gemini 1.0 Pro	Retrait	2024-04-09	2025-04-21
`gemini-1.0-pro-001`	Version stable de Gemini 1.0 Pro	Retrait	2024-02-15	2025-04-21
Alias stable mis à jour automatiquement
`gemini-1.0-pro`	Pointe vers la dernière version stable de 1.0 Pro (actuellement `gemini-1.0-pro-002`)	Retrait	2024-02-15	2025-04-21

Étapes suivantes

Découvrez les fonctionnalités de Gemini API.

Créez des conversations multitours (chat).
Générez du texte à partir de requêtes textuelles uniquement.
Générez du texte en utilisant différents types de fichiers comme requêtes, par exemple des images, des PDF, des vidéos et des fichiers audio.
Générez des sorties structurées (comme JSON) à partir de requêtes textuelles et multimodales.
Générer des images à partir de requêtes textuelles (Gemini ou Imagen).
Entrées et sorties de flux (y compris audio) à l'aide de Gemini Live API.
Utilisez des outils (comme l'appel de fonction et l'ancrage avec la recherche Google) pour connecter un modèle Gemini à d'autres parties de votre application, ainsi qu'à des systèmes et informations externes.