En savoir plus sur les modèles compatibles

Pour les applications mobiles et Web, les SDK Vertex AI in Firebase vous permettent d'interagir avec les modèles Gemini compatibles directement depuis votre application.

Les modèles Gemini sont considérés comme multimodaux, car ils sont capables de traiter et même de générer plusieurs modalités, y compris du texte, du code, des PDF, des images, de la vidéo et de l'audio.

Voici un bref aperçu des modèles compatibles avec Vertex AI in Firebase et de leurs dernières versions stables. Les sections suivantes de cette page fournissent des comparaisons et des informations plus détaillées.

Modèle Entrée Sortie Optimisé pour
Modèles Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
texte, code, PDF, images, vidéo, audio texte, code, JSON
(images et audio bientôt disponibles)
Fonctionnalités de nouvelle génération, vitesse et génération multimodale pour une grande variété de tâches
Gemini 1.5 Pro
gemini-1.5-pro-002
texte, code, PDF, images, vidéo, audio texte, code, JSON Tâches de raisonnement complexes nécessitant plus d'intelligence
Gemini 1.5 Flash
gemini-1.5-flash-002
texte, code, PDF, images, vidéo, audio texte, code, JSON Performances rapides et polyvalentes pour diverses tâches


Le reste de cette page fournit des informations détaillées sur les modèles compatibles avec Vertex AI in Firebase:

En bas de cette page, vous pouvez consulter des informations détaillées sur les anciens modèles.



Comparer des modèles

Chaque modèle dispose de fonctionnalités différentes pour prendre en charge différents cas d'utilisation. Notez que chacun des tableaux de cette section décrit chaque modèle lorsqu'il est utilisé avec Vertex AI in Firebase. Chaque modèle peut avoir des fonctionnalités supplémentaires qui ne sont pas disponibles lorsque vous utilisez nos SDK.

Pour en savoir plus sur chacun des modèles Gemini, consultez la documentation Google Cloud.

Entrée et sortie compatibles

Voici les types d'entrée et de sortie compatibles lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Types d'entrée
Texte
Code
Documents (PDF ou texte brut)
Images, vidéo et audio
Audio (streaming) bientôt disponible
Types de sortie
Texte
Sortie structurée (comme JSON)
Code
Images bientôt disponible
Audio bientôt disponible
Audio (streaming) bientôt disponible

Pour en savoir plus sur les types de fichiers acceptés, consultez la section Fichiers d'entrée acceptés et conditions requises pour Vertex AI Gemini API.

Fonctionnalités et fonctionnalités compatibles

Voici les fonctionnalités et fonctionnalités compatibles lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Générer du texte à partir d'entrées de type texte ou multimodal
Générer des images bientôt disponible
Générer un contenu audio bientôt disponible
Générer une sortie structurée (comme JSON)
Analyser des images et des vidéos (vision)
Analyser l'audio
Analyser des documents (PDF ou texte brut)
Chat multitour
Appel de fonction (outils)
Appel de fonction de base
Appel de fonction en parallèle
Mode d'appel de fonction
Compter les jetons et les caractères facturables
Instructions système
API Multimodal Live (streaming bidirectionnel) bientôt disponible

Spécifications et limites

Voici les spécifications et les limites lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:

Propriété Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Fenêtre de contexte *
Limite totale de jetons (entrée et sortie combinées)
1 048 576 jetons 2 097 152 jetons 1 048 576 jetons
Limite de jetons de sortie * 8 192 jetons 8 192 jetons 8 192 jetons
Date limite de la connaissance Juin 2024 mai 2024 mai 2024
Images (par requête)
Nombre maximal d'images d'entrée 3 000 images 3 000 images 3 000 images
Nombre maximal d'images de sortie bientôt disponible --- ---
Taille maximale par image encodée en base64 7 Mo 7 Mo 7 Mo
PDF (sur demande)
Nombre maximal de fichiers PDF d'entrée ** 3 000 fichiers 3 000 fichiers 3 000 fichiers
Nombre maximal de pages par fichier PDF d'entrée ** 1 000 pages 1 000 pages 1 000 pages
Taille maximale par fichier PDF d'entrée 50 Mo 50 Mo 50 Mo
Vidéo (par demande)
Nombre maximal de fichiers vidéo d'entrée 10 fichiers 10 fichiers 10 fichiers
Durée maximale de toutes les vidéos d'entrée (images uniquement) 60 minutes environ 60 minutes environ 60 minutes environ
Durée maximale de toutes les vidéos d'entrée (images et audio) 45 minutes environ 45 minutes environ 45 minutes environ
Audio (sur demande)
Nombre maximal de fichiers audio d'entrée 1 fichier 1 fichier 1 fichier
Nombre maximal de fichiers audio de sortie bientôt disponible --- ---
Longueur maximale de tous les entrées audio ~8,4 heures ~8,4 heures ~8,4 heures
Longueur maximale de toutes les sorties audio bientôt disponible --- ---

* Pour tous les modèles, un jeton équivaut à environ quatre caractères. Par conséquent, 100 jetons correspondent à environ 60 à 80 mots en anglais. Pour les modèles Gemini, vous pouvez déterminer le nombre total de jetons dans vos requêtes à l'aide de countTokens.

** Les PDF sont traités comme des images. Ainsi, une page individuelle d'un PDF est traitée comme une image individuelle. Le nombre de pages autorisées dans une requête est limité au nombre d'images que le modèle peut accepter.

Obtenir des informations détaillées supplémentaires



Modèles de gestion des versions et de dénomination des modèles

Les modèles sont proposés en versions stable, mise à jour automatiquement et preview.

  • Les versions stables sont considérées comme disponibles pour tous les utilisateurs.

    • Les noms de modèle des versions stables sont suivis d'un numéro de version à trois chiffres spécifique, par exemple gemini-2.0-flash-001.
  • Les versions mises à jour automatiquement pointent toujours vers la dernière version stable de ce modèle. Si une nouvelle version stable est publiée, la version mise à jour automatiquement commence automatiquement à pointer vers cette nouvelle version stable.

    • Les versions mises à jour automatiquement comportent des noms de modèle sans suffixe, par exemple gemini-2.0-flash.
  • Les versions preview proposent de nouvelles fonctionnalités et sont considérées comme non stables. Notez que les versions preview pointent toujours vers la dernière version preview de ce modèle. Si une nouvelle version preview est publiée, toute version preview existante commence automatiquement à pointer vers cette nouvelle version preview.

    • Les noms de modèle des versions preview sont suivis de -preview, ainsi que de la date de sortie initiale du modèle (-MMDD), par exemple gemini-1.5-pro-preview-0409 (publié le 9 avril 2024).

Pour en savoir plus sur les versions de modèle disponibles et leur cycle de vie (Gemini), consultez la documentation Google Cloud.



Noms de modèles disponibles

Les noms de modèle sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle génératif (étape obligatoire pour appeler Gemini API).

Vous pouvez utiliser le point de terminaison publishers.models.list pour lister tous les noms de modèles disponibles. Notez que cette liste renvoyée inclura tous les modèles compatibles avec Vertex AI, mais Vertex AI in Firebase n'est compatible qu'avec les modèles Gemini décrits sur cette page. Notez également que les versions mises à jour automatiquement (par exemple, gemini-2.0-flash) ne sont pas listées, car il s'agit d'un alias pratique pour le modèle stable de base.

Noms des modèles Gemini

Pour obtenir des exemples d'initialisation dans votre langue, consultez le guide de démarrage.

Noms des modèles Gemini 2.0 Flash

Nom du modèle Description Étape de version Date de disponibilité initiale Date d'arrêt
Versions stables
gemini-2.0-flash-001 Dernière version stable de Gemini 2.0 Flash Disponibilité générale 2025-02-05 À déterminer
Version mise à jour automatiquement
gemini-2.0-flash Pointe vers la dernière version stable de Flash
 2.0 (actuellement gemini-2.0-flash-001)
Disponibilité générale 2025-02-10 ---

Noms des modèles Gemini 1.5 Pro

Nom du modèle Description Étape de version Date de disponibilité initiale Date d'arrêt
Versions stables
gemini-1.5-pro-002 Dernière version stable de Gemini 1.5 Pro Disponibilité générale 2024-09-24 Au plus tôt le 24/09/2025
gemini-1.5-pro-001 Version stable initiale de Gemini 1.5 Pro Disponibilité générale 2024-05-24 Au plus tôt le 24 mai 2025
Version mise à jour automatiquement
gemini-1.5-pro Pointe vers la dernière version stable de 1.5 Pro
(actuellement gemini-1.5-pro-002)
Disponibilité générale 2024-09-24 ---

Noms des modèles Gemini 1.5 Flash

Nom du modèle Description Étape de version Date de disponibilité initiale Date d'arrêt
Versions stables
gemini-1.5-flash-002 Dernière version stable de Gemini 1.5 Flash Disponibilité générale 2024-09-24 Au plus tôt le 24/09/2025
gemini-1.5-flash-001 Version stable initiale de Gemini 1.5 Flash Disponibilité générale 2024-05-24 Au plus tôt le 24 mai 2025
Version mise à jour automatiquement
gemini-1.5-flash Pointe vers la dernière version stable de Gemini 1.5 Flash
(actuellement gemini-1.5-flash-002)
Disponibilité générale 2024-09-24 ---



Langues acceptées

Gemini

  • Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes:

    Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)

  • Les modèles Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes:

    Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)



Informations sur les anciens modèles

Vertex AI in Firebase est compatible avec tous les modèles Gemini, y compris les modèles plus anciens tels que Gemini 1.0 Pro et Gemini 1.0 Pro Vision. Toutefois, nous vous recommandons vivement d'utiliser un modèle plus récent avec nos SDK. Ces anciens modèles Gemini approchent de la date d'arrêt de leur commercialisation et n'offrent pas toutes les fonctionnalités des modèles plus récents.



Étapes suivantes

Essayer les fonctionnalités de Gemini API