Pour les applications mobiles et Web, les SDK Vertex AI in Firebase vous permettent d'interagir avec les modèles Gemini et modèles Imagen 3 compatibles directement depuis votre application.
Les modèles Gemini sont considérés comme multimodaux, car ils sont capables de traiter et même de générer plusieurs modalités, y compris du texte, du code, des PDF, des images, des vidéos et de l'audio. Les modèles Imagen 3 peuvent être invités à générer des images à partir de texte.
Le tableau suivant présente un bref aperçu des modèles compatibles avec Vertex AI in Firebase et leurs derniers noms de modèles stables. Ce tableau liste également les modèles en avant-première et expérimentaux disponibles pour le prototypage de cas d'utilisation.
Modèle | Entrée | Sortie | Description |
---|---|---|---|
Modèles Gemini avec versions stables | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON (images et audio bientôt disponibles) |
Offre des fonctionnalités et une vitesse de nouvelle génération pour une grande variété de tâches
(génération multimodale bientôt disponible) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Offre des performances économiques et à faible latence, et prend en charge un débit élevé |
Gemini 1.5 Progemini-1.5-pro-002 |
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Prend en charge les tâches de raisonnement complexes nécessitant plus d'intelligence ; contexte de 2 millions de jetons |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Offre des performances rapides et polyvalentes pour diverses tâches |
Modèles Gemini avec uniquement les versions preview et expérimentales (recommandé pour les cas d'utilisation de prototypage uniquement) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Offre la qualité de modèle la plus élevée, en particulier pour le code et les connaissances du monde ; contexte de 2 millions de jetons |
Gemini 2.0 Flash‑Thinkinggemini-2.0-flash-thinking-exp-01-21
|
texte, code, PDF, images | texte, code, JSON | Offre des capacités de raisonnement plus solides et inclut le processus de réflexion dans les réponses |
Modèles Imagen 3 (lorsque vous les utilisez avec Vertex AI in Firebase) | |||
Imagen 3imagen-3.0-generate-002 |
texte | images | Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel. |
Imagen 3 Fastimagen-3.0-fast-generate-001
|
texte | images | Génère des images pour le prototypage ou les cas d'utilisation à faible latence |
Le reste de cette page fournit des informations détaillées sur les modèles compatibles avec Vertex AI in Firebase:
-
- Entrée et sortie compatibles
- Comparaison générale des fonctionnalités compatibles
- Spécifications et limites, par exemple nombre maximal de jetons d'entrée ou durée maximale de la vidéo d'entrée
Description de la gestion des versions des modèles, en particulier de leurs versions stable, mise à jour automatique et preview
Listes des noms de modèles disponibles à inclure dans votre code lors de l'initialisation
Listes des langues acceptées pour les modèles
En bas de cette page, vous pouvez consulter des informations détaillées sur les anciens modèles.
Comparer des modèles
Chaque modèle dispose de fonctionnalités différentes pour prendre en charge différents cas d'utilisation. Notez que chacun des tableaux de cette section décrit chaque modèle lorsqu'il est utilisé avec Vertex AI in Firebase. Chaque modèle peut avoir des fonctionnalités supplémentaires qui ne sont pas disponibles lorsque vous utilisez nos SDK.
Si vous ne trouvez pas les informations que vous recherchez dans les sous-sections suivantes, vous trouverez encore plus d'informations sur les modèles Gemini et les modèles Imagen 3 dans la documentation Google Cloud.
Entrée et sortie compatibles
Voici les types d'entrée et de sortie compatibles lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Pensée flash Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
Types d'entrée | |||||||
Texte | |||||||
Code | |||||||
Documents (PDF ou texte brut) |
|||||||
Images | |||||||
Vidéo | |||||||
Audio | |||||||
Audio (streaming) | bientôt disponible | ||||||
Types de sortie | |||||||
Texte | |||||||
Code | |||||||
Sortie structurée (comme JSON) |
|||||||
Images | bientôt disponible | ||||||
Audio | bientôt disponible | ||||||
Audio (streaming) | bientôt disponible |
Pour en savoir plus sur les types de fichiers acceptés, consultez la section Fichiers d'entrée acceptés et conditions requises pour Vertex AI Gemini API.
Fonctionnalités et fonctionnalités compatibles
Voici les fonctionnalités et fonctionnalités compatibles lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Pensée flash Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
Générer du texte à partir d'entrées textuelles ou multimodales | |||||||
Générer des images (Imagen 3) |
bientôt disponible | ||||||
Générer un contenu audio | bientôt disponible | ||||||
Générer une sortie structurée
(comme JSON) |
|||||||
Analyser des documents
(PDF ou texte brut) |
|||||||
Analyser des images (vision) | |||||||
Analyser des vidéos (vision) | |||||||
Analyser l'audio | |||||||
Chat multitour | |||||||
Appel de fonction (outils) | |||||||
Compter les jetons et les caractères facturables | |||||||
Instructions système | |||||||
API Multimodal Live (streaming bidirectionnel) |
bientôt disponible |
Spécifications et limites
Voici les spécifications et les limites lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:
Propriété |
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Pensée flash Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
---|---|---|---|---|---|---|---|
Fenêtre de contexte * Limite totale de jetons (entrée + sortie combinées) |
2 097 152 jetons | 1 048 576 jetons | 1 048 576 jetons | 1 048 576 jetons | 2 097 152 jetons | 1 048 576 jetons | 480 jetons |
Limite de jetons de sortie * | 8 192 jetons | 8 192 jetons | 8 192 jetons | 8 192 jetons | 8 192 jetons | 8 192 jetons | --- |
Date limite de connaissance | Juin 2024 | Juin 2024 | Juin 2024 | Juin 2024 | mai 2024 | mai 2024 | --- |
PDF (sur demande) | |||||||
Nombre maximal de fichiers PDF d'entrée ** |
3 000 fichiers | 3 000 fichiers | 3 000 fichiers | 3 000 fichiers | 3 000 fichiers | 3 000 fichiers | --- |
Nombre maximal de pages par fichier PDF d'entrée ** |
1 000 pages | 1 000 pages | 1 000 pages | 1 000 pages | 1 000 pages | 1 000 pages | --- |
Taille maximale par fichier PDF d'entrée |
50 Mo | 50 Mo | 50 Mo | 50 Mo | 50 Mo | 50 Mo | --- |
Images (par requête) | |||||||
Nombre maximal d'images d'entrée |
3 000 images | 3 000 images | 3 000 images | 3 000 images | 3 000 images | 3 000 images | --- |
Nombre maximal d'images de sortie |
--- | bientôt disponible | --- | --- | --- | --- | 4 images |
Taille maximale par image encodée en base64 d'entrée |
7 Mo | 7 Mo | 7 Mo | 7 Mo | 7 Mo | 7 Mo | --- |
Vidéo (par demande) | |||||||
Nombre maximal de fichiers vidéo d'entrée |
10 fichiers | 10 fichiers | 10 fichiers | --- | 10 fichiers | 10 fichiers | --- |
Longueur maximale de toutes les vidéos d'entrée (images uniquement) |
60 minutes environ | 60 minutes environ | 60 minutes environ | --- | 60 minutes environ | 60 minutes environ | --- |
Durée maximale de toutes les vidéos d'entrée (images + audio) |
45 minutes environ | 45 minutes environ | 45 minutes environ | --- | 45 minutes environ | 45 minutes environ | --- |
Audio (sur demande) | |||||||
Nombre maximal de fichiers audio d'entrée |
1 fichier | 1 fichier | 1 fichier | --- | 1 fichier | 1 fichier | --- |
Nombre maximal de fichiers audio de sortie |
--- | bientôt disponible | --- | --- | --- | --- | --- |
Longueur maximale de tous les éléments audio d'entrée |
~8,4 heures | ~8,4 heures | ~8,4 heures | --- | ~8,4 heures | ~8,4 heures | --- |
Longueur maximale de tous les éléments audio de sortie |
--- | bientôt disponible | --- | --- | --- | --- | --- |
*
Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. Par conséquent, 100 jetons correspondent à environ 60 à 80 mots en anglais. Pour les modèles Gemini, vous pouvez déterminer le nombre total de jetons dans vos requêtes à l'aide de countTokens
.
** Les PDF sont traités comme des images. Ainsi, une page individuelle d'un PDF est traitée comme une image individuelle. Le nombre de pages autorisées dans une requête est limité au nombre d'images que le modèle peut accepter.
Obtenir des informations détaillées supplémentaires
Les quotas et la tarification sont différents pour chaque modèle. La tarification dépend également des entrées et des sorties.
Découvrez les types de fichiers d'entrée compatibles, comment spécifier le type MIME, et comment vous assurer que vos fichiers d'entrée et vos requêtes multimodales répondent aux exigences et respectent les bonnes pratiques dans la section Fichiers d'entrée compatibles et exigences concernant Vertex AI Gemini API.
Modèles de gestion des versions et de dénomination des modèles
Les modèles sont proposés en versions stable, preview et expérimentale. Pour plus de commodité, les alias sans valeurs de version explicites sont acceptés.
Pour trouver des noms de modèles spécifiques à utiliser dans votre code, consultez la section "Noms de modèles disponibles" plus loin sur cette page.
Type de version | Description | Format de nom de modèle | |
---|---|---|---|
Stable | Les versions stables sont considérées comme disponibles pour tous les utilisateurs. |
Les noms de modèle des versions stables sont suivis d'un numéro de version à trois chiffres spécifique.
Exemple: |
|
Alias stable mis à jour automatiquement | Les alias stables mis à jour automatiquement pointent toujours vers la dernière version stable de ce modèle. Si une nouvelle version stable est publiée, l'alias mis à jour automatiquement commence automatiquement à pointer vers cette nouvelle version stable. |
Les noms de modèle des alias ne comportent aucun suffixe.
Exemple: |
|
Aperçu |
Les versions preview incluent de nouvelles fonctionnalités et sont considérées comme non stables.
Les versions preview pointent toujours vers la dernière version preview de ce modèle. Si une nouvelle version preview est publiée, toute version preview existante commence automatiquement à pointer vers cette nouvelle version preview. |
Le nom des modèles des versions preview est suivi de
Exemple: |
|
Expérimental |
Les versions expérimentales disposent de nouvelles fonctionnalités et sont considérées comme non stables. Elles ne suivent pas le plan de cycle de vie et le schéma de gestion des versions standards de Google.
En savoir plus sur les modèles expérimentaux |
Le nom des modèles des versions expérimentales est suivi de
Exemple: |
Pour en savoir plus sur les versions de modèle disponibles et leur cycle de vie (Gemini) ou Imagen, consultez la documentation Google Cloud.
Noms de modèles disponibles
Les noms de modèle sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle.
Vous pouvez utiliser le point de terminaison publishers.models.list
pour lister tous les noms de modèles disponibles. Notez que cette liste renvoyée inclura tous les modèles compatibles avec Vertex AI, mais Vertex AI in Firebase n'est compatible qu'avec les modèles Gemini et Imagen décrits sur cette page.
Notez également que les alias mis à jour automatiquement (par exemple, gemini-2.0-flash
) ne sont pas listés, car il s'agit d'un alias pratique pour le modèle de base.
Noms des modèles Gemini
Pour obtenir des exemples d'initialisation dans votre langue, consultez le guide de démarrage.
Noms des modèles Gemini 2.0 Pro
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
Aucune version stable disponible | --- | --- | --- | --- |
Alias stable mis à jour automatiquement | ||||
Aucun alias stable mis à jour automatiquement disponible | --- | --- | --- | --- |
Versions Preview | ||||
Aucune version preview disponible | --- | --- | --- | --- |
Versions expérimentales | ||||
gemini-2.0-pro-exp-02-05 |
Version expérimentale de Gemini 2.0 Pro | Expérimentation | 2025-02-05 | À déterminer |
Noms des modèles Gemini 2.0 Flash
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
gemini-2.0-flash-001 |
Dernière version stable de Gemini 2.0 Flash | Disponibilité générale | 2025-02-05 | Au plus tôt le 05/02/2026 |
Alias stable mis à jour automatiquement | ||||
gemini-2.0-flash |
Pointe vers la dernière version stable de Flash 2.0 (actuellement gemini-2.0-flash-001 |
Disponibilité générale | 2025-02-10 | --- |
Versions Preview | ||||
Aucune version preview disponible | --- | --- | --- | --- |
Versions expérimentales | ||||
Aucune version expérimentale disponible | --- | --- | --- | --- |
Noms des modèles Gemini 2.0 Flash‑Lite
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
gemini-2.0-flash-lite-001 |
Dernière version stable de Gemini 2.0 Flash‑Lite | Disponibilité générale | 2025-02-25 | Au plus tôt le 25/02/2026 |
Alias stable mis à jour automatiquement | ||||
gemini-2.0-flash-lite |
Pointe vers la dernière version stable de Flash-Lite 2.0 (actuellement gemini-2.0-flash-lite-001 |
Disponibilité générale | 2025-02-25 | --- |
Versions Preview | ||||
gemini-2.0-flash-lite-preview-02-05 |
Version preview de Gemini 2.0 Flash‑Lite | Aperçu | 2025-02-05 | À déterminer |
Versions expérimentales | ||||
Aucune version expérimentale disponible | --- | --- | --- | --- |
Noms des modèles Gemini 2.0 Flash‑Thinking
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
Aucune version stable disponible | --- | --- | --- | --- |
Alias stable mis à jour automatiquement | ||||
Aucun alias stable mis à jour automatiquement disponible | --- | --- | --- | --- |
Versions Preview | ||||
Aucune version preview disponible | --- | --- | --- | --- |
Versions expérimentales | ||||
gemini-2.0-flash-thinking-exp-01-21 |
Version expérimentale de Gemini 2.0 Flash‑Thinking | Expérimentation | 2025-01-21 | À déterminer |
Noms des modèles Gemini 1.5 Pro
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
gemini-1.5-pro-002 |
Dernière version stable de Gemini 1.5 Pro | Disponibilité générale | 2024-09-24 | Au plus tôt le 24/09/2025 |
gemini-1.5-pro-001 |
Version stable initiale de Gemini 1.5 Pro | Disponibilité générale | 2024-05-24 | Au plus tôt le 24 mai 2025 |
Alias stable mis à jour automatiquement | ||||
gemini-1.5-pro |
Pointe vers la dernière version stable de 1.5 Pro (actuellement gemini-1.5-pro-002 |
Disponibilité générale | 2024-09-24 | --- |
Versions Preview | ||||
Aucune version preview disponible | --- | --- | --- | --- |
Versions expérimentales | ||||
Aucune version expérimentale disponible | --- | --- | --- | --- |
Noms des modèles Gemini 1.5 Flash
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
gemini-1.5-flash-002 |
Dernière version stable de Gemini 1.5 Flash | Disponibilité générale | 2024-09-24 | Au plus tôt le 24/09/2025 |
gemini-1.5-flash-001 |
Version stable initiale de Gemini 1.5 Flash | Disponibilité générale | 2024-05-24 | Au plus tôt le 24 mai 2025 |
Alias stable mis à jour automatiquement | ||||
gemini-1.5-flash |
Pointe vers la dernière version stable de Gemini 1.5 Flash (actuellement gemini-1.5-flash-002 |
Disponibilité générale | 2024-09-24 | --- |
Versions Preview | ||||
Aucune version preview disponible | --- | --- | --- | --- |
Versions expérimentales | ||||
Aucune version expérimentale disponible | --- | --- | --- | --- |
Noms des modèles Imagen
Pour obtenir des exemples d'initialisation pour votre langue, consultez le guide de génération d'images avec Imagen.
Pour le moment, aucune version Preview ou expérimentale n'est disponible pour les modèles Imagen 3.
Noms des modèles Imagen 3
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
imagen-3.0-generate-002 |
Dernière version stable de Imagen 3 | Disponibilité générale | 2025-01-23 | Au plus tôt le 23 janvier 2026 |
imagen-3.0-generate-001 |
Version stable initiale de Imagen 3 | Disponibilité générale | 2024-07-31 | Au plus tôt le 31/07/2025 |
Noms des modèles Imagen 3 Fast
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
imagen-3.0-fast-generate-001 |
Version stable initiale de Imagen 3 Fast | Disponibilité générale | 2024-07-31 | Au plus tôt le 31/07/2025 |
Langues acceptées
Gemini
Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes:
Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)
Les modèles Gemini 2.0 Flash, Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes:
Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)
Imagen
Disponibilité générale: anglais
Aperçu: chinois (simplifié), chinois (traditionnel), hindi, japonais, coréen, portugais et espagnol
Informations sur les anciens modèles
Vertex AI in Firebase est compatible avec tous les modèles Gemini, y compris les modèles plus anciens tels que Gemini 1.0 Pro et Gemini 1.0 Pro Vision. Toutefois, nous vous recommandons vivement d'utiliser un modèle plus récent avec nos SDK. Ces anciens modèles Gemini approchent de la date d'arrêt de leur commercialisation et n'offrent pas toutes les fonctionnalités des modèles plus récents.
Vertex AI in Firebase n'est compatible qu'avec les modèles Imagen 3. Il n'est pas compatible avec les anciens modèles Imagen (comme Imagen 2).
Étapes suivantes
Essayer les fonctionnalités de Gemini API
- Créez des conversations multitours (chat).
- Générez du texte à partir de requêtes textuelles uniquement.
- Générer du texte à partir de requêtes multimodales (y compris du texte, des images, des PDF, des vidéos et de l'audio)
- Générez une sortie structurée (comme JSON) à partir d'invites textuelles et multimodales.
- Utilisez l'appel de fonction pour connecter les modèles génératifs à des systèmes et des informations externes.