Gemini API usando Firebase AI Logic

Compila apps y funciones web y para dispositivos móviles potenciadas por IA con los modelos Gemini y Imagen usando Firebase AI Logic

Firebase AI Logic te brinda acceso a los modelos de IA generativa más recientes de Google: los modelos Gemini y los modelos Imagen.

Si necesitas llamar a Gemini API o Imagen API directamente desde tu app web o para dispositivos móviles (en lugar de hacerlo desde el servidor), puedes usar los SDK de cliente de Firebase AI Logic. Estos SDKs de cliente se compilan específicamente para su uso con apps web y para dispositivos móviles, y ofrecen opciones de seguridad contra clientes no autorizados, así como integraciones con otros servicios de Firebase.

Estos SDKs de cliente están disponibles en Swift para las plataformas de Apple, Kotlin y Java para Android, JavaScript para la Web, Dart para Flutter y Unity.

Con estos SDKs de cliente, puedes agregar personalización basada en IA a las apps, crear una experiencia de chat con IA, crear optimizaciones y automatización impulsadas por IA, y mucho más.

Comenzar


¿Necesitas más flexibilidad o integración del servidor?
Genkit es el framework de código abierto de Firebase para el desarrollo sofisticado de IA del servidor con amplio acceso a modelos de Google, OpenAI, Anthropic y muchos más. Incluye funciones de IA más avanzadas y herramientas locales específicas.

Funciones clave

Entrada multimodal y de lenguaje natural Los modelos Gemini son multimodales, por lo que las instrucciones enviadas a Gemini API pueden incluir texto, imágenes, PDFs, video y audio. Algunos modelos Gemini también pueden generar salidas multimodales.

Se puede solicitar a los modelos Gemini y Imagen que respondan con entradas en lenguaje natural.

Conjunto creciente de capacidades Con los SDKs, puedes llamar a Gemini API o Imagen API directamente desde tu app para dispositivos móviles o web para crear experiencias de chat con IA, generar imágenes, usar herramientas (como llamadas a funciones y fundamentación con la Búsqueda de Google), transmitir entrada y salida multimodales (incluido el audio) y mucho más.
Seguridad y prevención de abusos para apps de producción Usa Firebase App Check para proteger las APIs que acceden a los modelos Gemini y Imagen del abuso por parte de clientes no autorizados.

Firebase AI Logic también tiene límites de frecuencia por usuario de forma predeterminada, y estos límites de frecuencia por usuario son completamente configurables.

Infraestructura sólida Aprovecha la infraestructura escalable creada para usarse con apps para dispositivos móviles y web, como administrar archivos con Cloud Storage for Firebase, administrar datos estructurados con las ofertas de bases de datos de Firebase (como Cloud Firestore) y establecer de forma dinámica la configuración del tiempo de ejecución con Firebase Remote Config.

¿Cómo funciona?

Firebase AI Logic proporciona SDKs de cliente, un servicio de proxy y otras funciones que te permiten acceder a los modelos de IA generativa de Google para compilar funciones basadas en IA en tus apps para dispositivos móviles y web.

Compatibilidad con los modelos de Google y los proveedores de "Gemini API"

Admitimos todos los modelos Gemini y Imagen 3 más recientes, y tú eliges tu proveedor de "Gemini API" preferido para acceder a estos modelos. Admitimos Gemini Developer API y Vertex AI Gemini API. Obtén más información sobre las diferencias entre el uso de los dos proveedores de API.

Además, si decides usar Gemini Developer API, puedes aprovechar su "nivel gratuito" para comenzar a usarlo rápidamente.

SDKs de clientes para dispositivos móviles y la Web

Envías solicitudes a los modelos directamente desde tu app web o para dispositivos móviles con nuestros SDKs cliente de Firebase AI Logic, disponibles en Swift para plataformas de Apple, Kotlin y Java para Android, JavaScript para la Web, Dart para Flutter y Unity.

Si tienes configurados ambos proveedores de Gemini API en tu proyecto de Firebase, puedes cambiar de proveedor de API con solo habilitar la otra API y cambiar algunas líneas de código de inicialización.

Además, nuestro SDK cliente para la Web ofrece acceso experimental a la inferencia híbrida y en el dispositivo para apps web que se ejecutan en Chrome en computadoras de escritorio. Esta configuración permite que tu app use el modelo integrado en el dispositivo cuando esté disponible, pero que vuelva sin problemas al modelo alojado en la nube cuando sea necesario.

Servicio de proxy

Nuestro servicio de proxy actúa como una puerta de enlace entre el cliente y el proveedor de Gemini API que elijas (y los modelos de Google). Proporciona servicios e integraciones importantes para las apps móviles y web. Por ejemplo, puedes configurar Firebase App Check para proteger a tu proveedor de API elegido y tus recursos de backend contra abusos de clientes no autorizados.

Esto es especialmente importante si elegiste usar Gemini Developer API, ya que nuestro servicio de proxy y esta integración de Gemini Developer API garantizan que tu clave de API de Gemini permanezca en el servidor y no se incorpore en la base de código de tus apps.App Check

Ruta de implementación

Configura tu proyecto de Firebase y conecta tu app a Firebase Usa el flujo de trabajo guiado en la página Firebase AI Logic de la consola de Firebase para configurar tu proyecto (incluida la habilitación de las APIs requeridas para el proveedor de Gemini API que elegiste), registrar tu app en tu proyecto de Firebase y, luego, agregar tu configuración de Firebase a la app.
Instala el SDK y, luego, inicialízalo Instala el SDK de Firebase AI Logic específico para la plataforma de tu app y, luego, inicializa el servicio y crea una instancia del modelo en tu app.
Envía solicitudes de instrucciones a los modelos Gemini y Imagen Usa los SDKs para enviar instrucciones solo de texto o multimodales a un modelo Gemini y generar texto y código, resultados estructurados (como JSON) y imágenes. Como alternativa, también puedes solicitarle a un modelo de Imagen que genere imágenes.

Crea experiencias más enriquecidas con chat de varios turnos, transmisión bidireccional de texto y audio y llamadas a funciones.

Preparación para la producción Implementa integraciones importantes para apps web y para dispositivos móviles, como proteger la API contra el abuso con Firebase App Check y usar Firebase Remote Config para actualizar parámetros en tu código de forma remota (como el nombre del modelo).

Próximos pasos

Comienza a acceder a un modelo desde tu app para dispositivos móviles o web

Ir a la guía de introducción

Más información sobre los modelos compatibles

Obtén información sobre los modelos disponibles para diversos casos de uso, sus cuotas y sus precios.