Pour les applications mobiles et Web, les SDK Vertex AI in Firebase vous permettent d'interagir avec les modèles Gemini compatibles directement depuis votre application.
Les modèles Gemini sont considérés comme multimodaux, car ils sont capables de traiter et même de générer plusieurs modalités, y compris du texte, du code, des PDF, des images, de la vidéo et de l'audio.
Voici un bref aperçu des modèles compatibles avec Vertex AI in Firebase et de leurs dernières versions stables. Les sections suivantes de cette page fournissent des comparaisons et des informations plus détaillées.
Modèle | Entrée | Sortie | Optimisé pour |
---|---|---|---|
Modèles Gemini | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON (images et audio bientôt disponibles) |
Fonctionnalités de nouvelle génération, vitesse et génération multimodale pour une grande variété de tâches |
Gemini 1.5 Progemini-1.5-pro-002 |
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Tâches de raisonnement complexes nécessitant plus d'intelligence |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Performances rapides et polyvalentes pour diverses tâches |
Le reste de cette page fournit des informations détaillées sur les modèles compatibles avec Vertex AI in Firebase:
-
- Entrée et sortie compatibles
- Comparaison générale des fonctionnalités compatibles
- Spécifications et limites, par exemple nombre maximal de jetons d'entrée ou durée maximale de la vidéo d'entrée
Description de la gestion des versions des modèles, en particulier de leurs versions stable, mise à jour automatique et preview
Listes des noms de modèles disponibles à inclure dans votre code lors de l'initialisation
Listes des langues acceptées pour les modèles
En bas de cette page, vous pouvez consulter des informations détaillées sur les anciens modèles.
Comparer des modèles
Chaque modèle dispose de fonctionnalités différentes pour prendre en charge différents cas d'utilisation. Notez que chacun des tableaux de cette section décrit chaque modèle lorsqu'il est utilisé avec Vertex AI in Firebase. Chaque modèle peut avoir des fonctionnalités supplémentaires qui ne sont pas disponibles lorsque vous utilisez nos SDK.
Pour en savoir plus sur chacun des modèles Gemini, consultez la documentation Google Cloud.
Entrée et sortie compatibles
Voici les types d'entrée et de sortie compatibles lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Types d'entrée | ||||
Texte | ||||
Code | ||||
Documents (PDF ou texte brut) | ||||
Images, vidéo et audio | ||||
Audio (streaming) | bientôt disponible | |||
Types de sortie | ||||
Texte | ||||
Sortie structurée (comme JSON) | ||||
Code | ||||
Images | bientôt disponible | |||
Audio | bientôt disponible | |||
Audio (streaming) | bientôt disponible |
Pour en savoir plus sur les types de fichiers acceptés, consultez la section Fichiers d'entrée acceptés et conditions requises pour Vertex AI Gemini API.
Fonctionnalités et fonctionnalités compatibles
Voici les fonctionnalités et fonctionnalités compatibles lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Générer du texte à partir d'entrées de type texte ou multimodal | ||||
Générer des images | bientôt disponible | |||
Générer un contenu audio | bientôt disponible | |||
Générer une sortie structurée (comme JSON) | ||||
Analyser des images et des vidéos (vision) | ||||
Analyser l'audio | ||||
Analyser des documents (PDF ou texte brut) | ||||
Chat multitour | ||||
Appel de fonction (outils) | ||||
Appel de fonction de base | ||||
Appel de fonction en parallèle | ||||
Mode d'appel de fonction | ||||
Compter les jetons et les caractères facturables | ||||
Instructions système | ||||
API Multimodal Live (streaming bidirectionnel) | bientôt disponible |
Spécifications et limites
Voici les spécifications et les limites lorsque vous utilisez chaque modèle avec Vertex AI in Firebase:
Propriété | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
Fenêtre de contexte * Limite totale de jetons (entrée et sortie combinées) |
1 048 576 jetons | 2 097 152 jetons | 1 048 576 jetons |
Limite de jetons de sortie * | 8 192 jetons | 8 192 jetons | 8 192 jetons |
Date limite de la connaissance | Juin 2024 | mai 2024 | mai 2024 |
Images (par requête) | |||
Nombre maximal d'images d'entrée | 3 000 images | 3 000 images | 3 000 images |
Nombre maximal d'images de sortie | bientôt disponible | --- | --- |
Taille maximale par image encodée en base64 | 7 Mo | 7 Mo | 7 Mo |
PDF (sur demande) | |||
Nombre maximal de fichiers PDF d'entrée ** | 3 000 fichiers | 3 000 fichiers | 3 000 fichiers |
Nombre maximal de pages par fichier PDF d'entrée ** | 1 000 pages | 1 000 pages | 1 000 pages |
Taille maximale par fichier PDF d'entrée | 50 Mo | 50 Mo | 50 Mo |
Vidéo (par demande) | |||
Nombre maximal de fichiers vidéo d'entrée | 10 fichiers | 10 fichiers | 10 fichiers |
Durée maximale de toutes les vidéos d'entrée (images uniquement) | 60 minutes environ | 60 minutes environ | 60 minutes environ |
Durée maximale de toutes les vidéos d'entrée (images et audio) | 45 minutes environ | 45 minutes environ | 45 minutes environ |
Audio (sur demande) | |||
Nombre maximal de fichiers audio d'entrée | 1 fichier | 1 fichier | 1 fichier |
Nombre maximal de fichiers audio de sortie | bientôt disponible | --- | --- |
Longueur maximale de tous les entrées audio | ~8,4 heures | ~8,4 heures | ~8,4 heures |
Longueur maximale de toutes les sorties audio | bientôt disponible | --- | --- |
* Pour tous les modèles, un jeton équivaut à environ quatre caractères. Par conséquent, 100 jetons correspondent à environ 60 à 80 mots en anglais. Pour les modèles Gemini, vous pouvez déterminer le nombre total de jetons dans vos requêtes à l'aide de countTokens
.
** Les PDF sont traités comme des images. Ainsi, une page individuelle d'un PDF est traitée comme une image individuelle. Le nombre de pages autorisées dans une requête est limité au nombre d'images que le modèle peut accepter.
Obtenir des informations détaillées supplémentaires
Les quotas et la tarification sont différents pour chaque modèle. La tarification dépend également des entrées et des sorties.
Découvrez les types de fichiers d'entrée compatibles, comment spécifier le type MIME, et comment vous assurer que vos fichiers d'entrée et vos requêtes multimodales répondent aux exigences et respectent les bonnes pratiques dans la section Fichiers d'entrée compatibles et exigences concernant Vertex AI Gemini API.
Modèles de gestion des versions et de dénomination des modèles
Les modèles sont proposés en versions stable, mise à jour automatiquement et preview.
Les versions stables sont considérées comme disponibles pour tous les utilisateurs.
- Les noms de modèle des versions stables sont suivis d'un numéro de version à trois chiffres spécifique, par exemple
.gemini-2.0-flash-001
- Les noms de modèle des versions stables sont suivis d'un numéro de version à trois chiffres spécifique, par exemple
Les versions mises à jour automatiquement pointent toujours vers la dernière version stable de ce modèle. Si une nouvelle version stable est publiée, la version mise à jour automatiquement commence automatiquement à pointer vers cette nouvelle version stable.
- Les versions mises à jour automatiquement comportent des noms de modèle sans suffixe, par exemple
.gemini-2.0-flash
- Les versions mises à jour automatiquement comportent des noms de modèle sans suffixe, par exemple
Les versions preview proposent de nouvelles fonctionnalités et sont considérées comme non stables. Notez que les versions preview pointent toujours vers la dernière version preview de ce modèle. Si une nouvelle version preview est publiée, toute version preview existante commence automatiquement à pointer vers cette nouvelle version preview.
- Les noms de modèle des versions preview sont suivis de
, ainsi que de la date de sortie initiale du modèle (-preview
), par exemple-MMDD
(publié le 9 avril 2024).gemini-1.5-pro-preview-0409
- Les noms de modèle des versions preview sont suivis de
Pour en savoir plus sur les versions de modèle disponibles et leur cycle de vie (Gemini), consultez la documentation Google Cloud.
Noms de modèles disponibles
Les noms de modèle sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle génératif (étape obligatoire pour appeler Gemini API).
Vous pouvez utiliser le point de terminaison publishers.models.list
pour lister tous les noms de modèles disponibles. Notez que cette liste renvoyée inclura tous les modèles compatibles avec Vertex AI, mais Vertex AI in Firebase n'est compatible qu'avec les modèles Gemini décrits sur cette page.
Notez également que les versions mises à jour automatiquement (par exemple, gemini-2.0-flash
) ne sont pas listées, car il s'agit d'un alias pratique pour le modèle stable de base.
Noms des modèles Gemini
Pour obtenir des exemples d'initialisation dans votre langue, consultez le guide de démarrage.
Noms des modèles Gemini 2.0 Flash
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
gemini-2.0-flash-001 |
Dernière version stable de Gemini 2.0 Flash | Disponibilité générale | 2025-02-05 | À déterminer |
Version mise à jour automatiquement | ||||
gemini-2.0-flash |
Pointe vers la dernière version stable de Flash 2.0 (actuellement gemini-2.0-flash-001 |
Disponibilité générale | 2025-02-10 | --- |
Noms des modèles Gemini 1.5 Pro
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
gemini-1.5-pro-002 |
Dernière version stable de Gemini 1.5 Pro | Disponibilité générale | 2024-09-24 | Au plus tôt le 24/09/2025 |
gemini-1.5-pro-001 |
Version stable initiale de Gemini 1.5 Pro | Disponibilité générale | 2024-05-24 | Au plus tôt le 24 mai 2025 |
Version mise à jour automatiquement | ||||
gemini-1.5-pro |
Pointe vers la dernière version stable de 1.5 Pro (actuellement gemini-1.5-pro-002 |
Disponibilité générale | 2024-09-24 | --- |
Noms des modèles Gemini 1.5 Flash
Nom du modèle | Description | Étape de version | Date de disponibilité initiale | Date d'arrêt |
---|---|---|---|---|
Versions stables | ||||
gemini-1.5-flash-002 |
Dernière version stable de Gemini 1.5 Flash | Disponibilité générale | 2024-09-24 | Au plus tôt le 24/09/2025 |
gemini-1.5-flash-001 |
Version stable initiale de Gemini 1.5 Flash | Disponibilité générale | 2024-05-24 | Au plus tôt le 24 mai 2025 |
Version mise à jour automatiquement | ||||
gemini-1.5-flash |
Pointe vers la dernière version stable de Gemini 1.5 Flash (actuellement gemini-1.5-flash-002 |
Disponibilité générale | 2024-09-24 | --- |
Langues acceptées
Gemini
Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes:
Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)
Les modèles Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes:
Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)
Informations sur les anciens modèles
Vertex AI in Firebase est compatible avec tous les modèles Gemini, y compris les modèles plus anciens tels que Gemini 1.0 Pro et Gemini 1.0 Pro Vision. Toutefois, nous vous recommandons vivement d'utiliser un modèle plus récent avec nos SDK. Ces anciens modèles Gemini approchent de la date d'arrêt de leur commercialisation et n'offrent pas toutes les fonctionnalités des modèles plus récents.
Étapes suivantes
Essayer les fonctionnalités de Gemini API
- Créez des conversations multitours (chat).
- Générez du texte à partir de requêtes textuelles uniquement.
- Générer du texte à partir de requêtes multimodales (y compris du texte, des images, des PDF, des vidéos et de l'audio)
- Générez une sortie structurée (comme JSON) à partir d'invites textuelles et multimodales.
- Utilisez l'appel de fonction pour connecter des modèles génératifs à des systèmes et des informations externes.