Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

Ta strona została przetłumaczona przez Cloud Translation API.

Informacje o obsługiwanych modelach

W przypadku aplikacji mobilnych i internetowych pakiety SDK Firebase AI Logic umożliwiają interakcję z obsługiwanymi Gemini modelami i Imagen modelami bezpośrednio z aplikacji.

Modele Gemini są uważane za wielomodalne, ponieważ potrafią przetwarzać, a nawet generować różne typy treści, w tym tekst, kod, pliki PDF, obrazy, filmy i dźwięk. Imagen można poprosić o wygenerowanie obrazów na podstawie tekstu.

Zapoznaj się też z naszymi najczęstszymi pytaniami dotyczącymi wszystkich modeli, które Firebase AI Logic obsługuje i których nie obsługuje.

Modele ogólnego zastosowania

Przejdź do porównań modeli

NASZ NAJBARDZIEJ INTELIGENTNY MODEL

Gemini 3 Pro

gemini-3-pro-preview

Nasz najlepszy model do rozumienia multimodalnego i nasz najpotężniejszy model agentowy i model do vibe codingu, zapewniający bogatsze wizualizacje i głębszą interaktywność – zbudowany na fundamencie najnowocześniejszego rozumowania. (wymagane rozliczenia)

NASZ ZAAWANSOWANY MODEL MYŚLENIA

Gemini 2.5 Pro

gemini-2.5-pro

Nasz najnowocześniejszy model myślenia, który potrafi rozwiązywać złożone problemy związane z kodowaniem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty przy użyciu długiego kontekstu.

SZYBKOŚĆ I INTELIGENCJA

Gemini 2.5 Flash

gemini-2.5-flash

Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości. 2.5 Flash najlepiej sprawdza się w przypadku przetwarzania na dużą skalę, zadań o krótkim czasie oczekiwania i dużej liczbie, które wymagają myślenia, oraz zastosowań opartych na agentach.

ULTRA FAST

Gemini 2.5 Flash-Lite

gemini-2.5-flash-lite

Nasz najszybszy model flash zoptymalizowany pod kątem niskich kosztów i wysokiej przepustowości.

Modele generujące obrazy

Obrazy możesz generować za pomocą modeli Gemini lub Imagen.

Przejdź do porównań modeli

Gemini

Gemini 3 Pro Image (czyli nano banana pro)

gemini-3-pro-image-preview

Zaprojektowany do profesjonalnego tworzenia komponentów i złożonych instrukcji. Wykorzystuje ona grounding w rzeczywistym świecie za pomocą wyszukiwarki Google, domyślny proces „myślenia”, który udoskonala kompozycję przed wygenerowaniem obrazu, i może generować obrazy w rozdzielczości do 4K. (wymagane rozliczenia)

Gemini 2.5 Flash Image (czyli nano banana)

gemini-2.5-flash-image

Zaprojektowany z myślą o szybkości i wydajności. Jest zoptymalizowany pod kątem zadań o dużej liczbie zapytań i niskim opóźnieniu, a generowane przez niego obrazy mają rozdzielczość 1024 pikseli. (wymagane rozliczenia)

Imagen

Imagen 4

imagen-4.0-generate-001

Generuje realistyczne obrazy wysokiej jakości na podstawie promptów w języku naturalnym. (wymagane rozliczenia)

Imagen 4 Fast

imagen-4.0-fast-generate-001

Generuje obrazy do prototypowania lub zastosowań wymagających krótkiego czasu oczekiwania. (wymagane rozliczenia)

Imagen 4 Ultra

imagen-4.0-ultra-generate-001

Generuje realistyczne obrazy wysokiej jakości na podstawie promptów tekstowych w języku naturalnym. (wymagane rozliczenia)

Modele poprzedniej generacji

Są one aktywne, ale należą do modeli poprzedniej generacji. Zalecamy korzystanie w miarę możliwości z jednego z najnowszych modeli.

Przejdź do porównań modeli

Modele Gemini

NASZ MODEL ROBOCZY DRUGIEJ GENERACJI

Gemini 2.0 Flash

gemini-2.0-flash-001

Nasz model drugiej generacji, który obsługuje okno kontekstu o wielkości 1 mln tokenów. Zapewnia funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość i natywne korzystanie z narzędzi.

NASZ MODEL SZYBKIEGO GENEROWANIA DRUGIEJ GENERACJI

Gemini 2.0 Flash-Lite

gemini-2.0-flash-lite-001

Nasz model drugiej generacji, który jest małym, ale wydajnym narzędziem z oknem kontekstu obejmującym milion tokenów. Zoptymalizowany pod kątem efektywności kosztowej i niskiego opóźnienia.

W dalszej części tej strony znajdziesz szczegółowe informacje o modelach obsługiwanych przez Firebase AI Logic.

Porównanie modeli:
- Obsługiwane wejścia i wyjścia
- Ogólne porównanie obsługiwanych funkcji
- Specyfikacje i ograniczenia, np. maksymalna liczba tokenów wejściowych lub maksymalna długość filmu wejściowego
Opis wersjonowania modeli, a w szczególności ich wersji stabilnych, aktualizowanych automatycznie, wersji testowych i eksperymentalnych.
Listy dostępnych nazw modeli, które można uwzględnić w kodzie podczas inicjowania.
Listy obsługiwanych języków w przypadku modeli

U dołu tej strony możesz wyświetlić szczegółowe informacje o modelach poprzedniej generacji.

Porównanie modeli

Każdy model ma inne możliwości, które pozwalają obsługiwać różne przypadki użycia. Pamiętaj, że każda tabela w tej sekcji opisuje poszczególne modele w przypadku użycia z Firebase AI Logic. Każdy model może mieć dodatkowe możliwości, które nie są dostępne podczas korzystania z naszych pakietów SDK.

Jeśli nie możesz znaleźć potrzebnych informacji w kolejnych podsekcjach, więcej informacji znajdziesz w dokumentacji wybranego dostawcy interfejsu API:

Gemini Developer API:Gemini – modele i Imagen – modele
Vertex AI Gemini API:Gemini i Imagen

Obsługiwane wejścia i wyjścia

Oto obsługiwane typy danych wejściowych i wyjściowychw przypadku korzystania z poszczególnych modeli w Firebase AI Logic:

	<span="notranslate">Gemini 3 Pro </span="notranslate">	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen (wygeneruj)	Imagen (możliwość)
Typy danych wejściowych
Tekst
Tekst (strumieniowanie)
Kod
Dokumenty (pliki PDF lub zwykły tekst)
Obrazy
Wideo
Dźwięk
Audio (streaming)
Typy wyjściowe
Tekst
Tekst (strumieniowanie)
Kod
Uporządkowane dane wyjściowe (np. JSON)
Obrazy
Dźwięk
Audio (streaming)

Więcej informacji o obsługiwanych typach plików znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.

Obsługiwane funkcje

Oto obsługiwane funkcje i możliwości w przypadku korzystania z poszczególnych modeli z Firebase AI Logic:

	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">
Myślenie
Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst lub danych multimodalnych	przeplatane lub jako część obrazu	przeplatane lub jako część obrazu	tylko streaming
Generowanie obrazów (Gemini lub Imagen)
Edytowanie obrazów (Gemini lub Imagen)
Wygeneruj dźwięk			tylko streaming
Generowanie danych strukturalnych (np. w formacie JSON)
Analizowanie dokumentów (pliki PDF lub zwykły tekst)
Analizowanie obrazów (vision)
Analizowanie filmu (widzenie)
Analizowanie dźwięku			tylko streaming
Czat wieloetapowy
Dwukierunkowa transmisja multimodalna
Wywoływanie funkcji
Wykonanie kodu
Powiązanie ze źródłem informacji przy użyciu wyszukiwarki Google
Instrukcje systemowe
Licz tokeny

Specyfikacje i ograniczenia

Oto specyfikacje i ograniczenia dotyczące korzystania z poszczególnych modeli z parametrem Firebase AI Logic:

Właściwość	<span="notranslate">Gemini 3 Pro </span="notranslate">	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate">	Imagen (wygeneruj)	Imagen (możliwość)
Limit tokenów wejściowych*	1 048 576 tokenów	65 536 tokenów	1 048 576 tokenów	32 768 tokenów	32 768 tokenów	480 tokenów	480 tokenów
Limit tokenów wyjściowych*	65 536 tokenów	32 768 tokenów	65 536 tokenów	8192 tokeny	8192 tokeny	---	---
Data granicy wiedzy	Styczeń 2025 r.	Styczeń 2025 r.	Styczeń 2025 r.	czerwca 2025 r.	Sierpień 2024 r.	---	---
Pliki PDF (na żądanie)
Maksymalna liczba wejściowych plików PDF **	900 plików	14 plików	3000 plików	3 pliki	---	---	---
Maksymalna liczba stron w pliku PDF **	900 stron	14 stron	1000 stron	3 strony	---	---	---
Maksymalny rozmiar wejściowego pliku PDF	50 MB	50 MB	50 MB	50 MB	---	---	---
Obrazy (z uwzględnieniem żądań)
Maksymalna liczba obrazów wejściowych	1000 obrazów	14 obrazów	3000 obrazów	3 obrazy	---	---	4 obrazy
Maksymalna liczba obrazów wyjściowych	---	10 obrazów	---	10 obrazów	---	4 obrazy	4 obrazy
Maksymalny rozmiar na wejściowy obraz zakodowany w formacie base64	7 MB	7 MB	7 MB	7 MB	---	---	---
Wideo (z uwzględnieniem żądań)
Maksymalna liczba plików wideo wejściowych	10 plików	---	10 plików	---	---	---	---
Maksymalna długość wszystkich filmów wejściowych (tylko klatki)	~60 minut	---	~60 minut	---	---	---	---
Maksymalna długość wszystkich filmów wejściowych (klatki + audio)	~45 minut	---	~45 minut	---	---	---	---
Dźwięk (z uwzględnieniem żądań)
Maksymalna liczba wejściowych plików audio	1 plik	---	1 plik	---	---	---	---
Maksymalna liczba wyjściowych plików audio	---	---	---	---	---	---	---
Maksymalna długość wszystkich wejściowych plików audio	Ok.8,4 godziny	---	Ok.8,4 godziny	---	---	---	---
Maksymalna długość wszystkich wyjściowych plików audio	---	---	---	---	---	---	---

^{*
W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom, więc 100 tokenów to około 60–80 słów w języku angielskim. W przypadku modeli Gemini możesz określić łączną liczbę tokenów w swoich żądaniach za pomocą countTokens.}

^{**
Pliki PDF są traktowane jako obrazy, więc jedna strona pliku PDF jest traktowana jako jeden obraz. Liczba stron dozwolonych w żądaniu jest ograniczona do liczby obrazów, które może obsługiwać model.}

Znajdowanie dodatkowych szczegółowych informacji

Limity i ceny są różne w przypadku poszczególnych modeli. Ceny zależą też od danych wejściowych i wyjściowych.
Więcej informacji o obsługiwanych typach plików wejściowych, sposobie określania typu MIME oraz o tym, jak zadbać o to, aby pliki wejściowe i żądania multimodalne spełniały wymagania i były zgodne ze sprawdzonymi metodami, znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.

Ważne: łączny limit rozmiaru żądania wynosi 20 MB. Aby wysyłać duże pliki, zapoznaj się z opcjami przesyłania plików w żądaniach multimodalnych.

Wersje modeli i wzorce nazewnictwa

Modele są dostępne w wersjach stabilnej, testowej i eksperymentalnej. Dla wygody obsługiwane są aliasy bez jawnych wartości wersji.

Aby znaleźć konkretne nazwy modeli do użycia w kodzie, zapoznaj się z sekcją „Dostępne nazwy modeli” poniżej.

Typ wersji / Etap publikacji		Opis	Wzorzec nazwy modelu
Stabilna		*Stabilne* wersje są dostępne i obsługiwane w środowisku produkcyjnym od daty premiery. Stabilna wersja modelu jest zwykle udostępniana z datą wycofania, która oznacza ostatni dzień, w którym model jest dostępny. Po tej dacie model nie będzie już dostępny ani obsługiwany przez Google.	Gemini 2.5 Nazwy modeli w stabilnych wersjach nie mają sufiksu. Przykład: `gemini-2.5-pro` Modele Gemini 2.0 i Imagen Nazwy modeli w stabilnych wersjach mają na końcu określony trzycyfrowy numer wersji. Przykład: `gemini-2.0-flash-001` Przykład: `imagen-3.0-generate-002`
	Automatycznie aktualizowany alias wersji stabilnej (tylko modele Gemini 2.0)	*Automatycznie aktualizowane* aliasy stabilne zawsze wskazują najnowszą stabilną wersję danego modelu. Jeśli zostanie opublikowana nowa wersja stabilna, alias automatycznie aktualizowany automatycznie zacznie wskazywać tę nową wersję stabilną.	Gemini 2.0 tylko modele Nazwy modeli aliasów nie mają sufiksu Przykład: `gemini-2.0-flash`
Podgląd		Wersje *przedpremierowe* mają nowe funkcje i są uważane za niestabilne. Te modele nie są zalecane do użytku w środowisku produkcyjnym, mają bardziej restrykcyjne limity żądań i mogą podlegać wymaganiom dotyczącym płatności. Modele te są wycofywane w ciągu kilku tygodni lub miesięcy od udostępnienia powiązanej z nimi wersji stabilnej. W przypadku Vertex AI Gemini API modele w wersji podglądowej wydane po czerwcu 2025 r. zwykle wymagają ustawienia lokalizacji modelu na `global`.	Nazwy modeli w wersji testowej są uzupełniane o symbol `-preview`, a często także o datę wydania modelu (`-MM-DD` w przypadku starszych modeli lub `-MM-YYYY` w przypadku nowszych modeli). Przykłady: `gemini-2.5-flash-preview-04-17` (wydany 17 kwietnia 2025 r.) lub `gemini-2.5-flash-preview-09-2025` (wydany we wrześniu 2025 r.) lub `gemini-3-pro-preview` (wydany w listopadzie 2025 r.)
Eksperymentalne		Wersje *eksperymentalne* mają nowe funkcje i są uważane za niestabilne. Te modele nie są zalecane do użytku w środowisku produkcyjnym i mają bardziej restrykcyjne limity żądań. Modele eksperymentalne służą do zbierania opinii i umożliwiają testowanie naszych najnowszych funkcji. Modele te są wycofywane w ciągu kilku tygodni lub miesięcy od udostępnienia powiązanej z nimi wersji stabilnej. W przypadku Vertex AI Gemini API modele eksperymentalne udostępnione po czerwcu 2025 r. wymagają ustawienia lokalizacji modelu na `global`.	Nazwy modeli wersji eksperymentalnych są uzupełniane o `-exp` oraz datę wydania modelu (`-MM-DD`). Przykład: `gemini-2.5-pro-exp-03-25` (opublikowano 25 marca 2025 r.)
Jestem na emeryturze		Wersje *wycofane* są po dacie wycofania i zostały trwale wyłączone. Wycofane modele nie są już dostępne ani obsługiwane przez Google, a żądanie z użyciem nazwy wycofanego modelu zwraca błąd 404.	---

Dostępne nazwy modeli

Nazwy modeli to konkretne wartości, które umieszczasz w kodzie podczas inicjowania modelu.

Przejdź do Gemini nazw modeli Przejdź do Imagen nazw modeli

Programowe wyświetlanie listy wszystkich dostępnych modeli

Za pomocą interfejsu API REST możesz wyświetlić listę nazw wszystkich dostępnych modeli:

Gemini Developer API: wywołaj models.listpunkt końcowy
Vertex AI Gemini API: wywołaj publishers.models.listpunkt końcowy

Pamiętaj, że zwrócona lista będzie zawierać wszystkie modele obsługiwane przez dostawców interfejsów API, ale Firebase AI Logic obsługuje tylko modele Gemini i Imagen opisane na tej stronie. Pamiętaj też, że automatycznie aktualizowane aliasy (np. gemini-2.0-flash) nie są wymienione, ponieważ są aliasami ułatwiającymi korzystanie z modelu podstawowego.

Gemini nazwy modeli

Przykłady inicjowania na Twojej platformie znajdziesz w przewodniku dla początkujących.

Szczegółowe informacje o etapach udostępniania (zwłaszcza przypadki użycia, rozliczenia i wycofanie) znajdziesz w artykule Wersje modeli i wzorce nazewnictwa.

Ważne: nazwy modeli stabilnych Gemini 2.5 nie mają trzycyfrowego sufiksu ani nie mają automatycznie aktualizowanego aliasu.

Jeśli używasz Vertex AI Gemini API, wszystkie modele Gemini 3 i Gemini 2.5 wersji podglądowej wydane po czerwcu 2025 r. są dostępne tylko w lokalizacji global.

Gemini 3 Pro nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-3-pro-preview`	Wersja podglądowa: Gemini 3 Pro	Podgląd	2025-11-18	Jeszcze nieznany

Gemini 3 Pro Image nazwy modeli (np. „nano banana pro”)

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-3-pro-image-preview`	Wersja podglądowa Gemini 3 Pro Image (czyli „nano banana pro”)	Podgląd	2025-11-20	Jeszcze nieznany

Gemini 2.5 Pro nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-pro`	Stabilna wersja Gemini 2.5 Pro	Stabilny	2025-06-17	Nie wcześniej niż 17 czerwca 2026 r.

Gemini 2.5 Flash nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-flash`	Stabilna wersja Gemini 2.5 Flash	Stabilny	2025-06-17	Nie wcześniej niż 17 czerwca 2026 r.

Gemini 2.5 Flash‑Lite nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-flash-lite`	Stabilna wersja Gemini 2.5 Flash‑Lite	Stabilny	2025-07-22	Nie wcześniej niż 22 lipca 2026 r.

Gemini 2.5 Flash Image nazwy modeli (znane też jako „nano banana”)

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-flash-image`	Wersja stabilna dla Gemini 2.5 Flash Image (czyli „nano banana”)	Stabilny	2025-10-02	Nie wcześniej niż 2026-10-02

Gemini 2.5 Flash Live nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-live-2.5-flash`	Wersja stabilna dla Gemini 2.5 Flash Live	Stabilna (prywatna GA) ¹	2025-06-01	Nie wcześniej niż 1 czerwca 2026 r.
`gemini-live-2.5-flash-preview` ²	Wersja podglądu: Gemini 2.5 Flash Live	Podgląd	2025-06-01	Jeszcze nieznany

Firebase AI Logic nie obsługuje jeszcze natywnych modeli audio (np. gemini-2.5-flash-native-audio-preview-09-2025).

^{1 Skontaktuj się z przedstawicielem zespołu ds. konta Google Cloud, aby poprosić o dostęp.} ^{2. Nie jest obsługiwane przez Vertex AI Gemini API niezależnie od sposobu dostępu.}

Gemini 2.0 Flash Live nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.0-flash-live-001` ²	Wersja stabilna dla Gemini 2.0 Flash Live	Stabilny	2025-04-01	Nie wcześniej niż 1 kwietnia 2026 r.
`gemini-2.0-flash-live-preview-04-09`	Wersja podglądu: Gemini 2.0 Flash Live	Podgląd	2025-04-09	Jeszcze nieznany

^{2 Nie jest obsługiwane przez Vertex AI Gemini API niezależnie od sposobu dostępu.}

Imagen nazwy modeli

Przykłady inicjowania na Twojej platformie znajdziesz w przewodniku generowania obrazów za pomocą Imagen.

Szczegółowe informacje o etapach udostępniania (zwłaszcza w przypadku przypadków użycia, płatności i wycofania) znajdziesz w artykule Wersje modeli i wzorce nazewnictwa.

Imagen 4 nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-4.0-generate-001`	Stabilna wersja Imagen 4	Stabilny	2025-08-14	Nie wcześniej niż 14 sierpnia 2026 r.

Imagen 4 Fast nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-4.0-fast-generate-001`	Stabilna wersja Imagen 4 Fast	Stabilny	2025-08-14	Nie wcześniej niż 14 sierpnia 2026 r.

Imagen 4 Ultra nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-4.0-ultra-generate-001`	Stabilna wersja Imagen 4 Ultra	Stabilny	2025-08-14	Nie wcześniej niż 14 sierpnia 2026 r.

Imagen 3 Capability nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-3.0-capability-001` ³	Początkowa stabilna wersja Imagen 3 Capability	Stabilny	2024-12-10	Nie wcześniej niż 10 grudnia 2025 r.

^{3 Nie jest obsługiwane przez Gemini Developer API niezależnie od sposobu dostępu.}

Obsługiwane języki

Gemini

Wszystkie modele Gemini rozumieją te języki i mogą w nich odpowiadać:

arabski (ar), bengalski (bn), bułgarski (bg), chiński uproszczony i tradycyjny (zh), chorwacki (hr), czeski (cs), duński (da), angielski (en), estoński (et), fiński (fi), francuski (fr), grecki (el), hebrajski (iw), hindi (hi), hiszpański (es), indonezyjski (id), japoński (ja), koreański (ko), litewski (lt), łotewski (lv), niemiecki (de), norweski (no), polski (pl), portugalski (pt), rosyjski (ru), rumuński (ro), serbski (sr), słowacki (sk), słoweński (sl), suahili (sw), szwedzki (sv), tajski (th), turecki (tr), ukraiński (uk), węgierski (hu), wietnamski (vi), włoski (it).
Modele Gemini 2.0 Flash, Gemini 1.5 Pro i Gemini 1.5 Flash rozumieją i mogą odpowiadać w tych dodatkowych językach:

afrikaans (af), amharski (am), asamski (as), azerbejdżański (az), białoruski (be), bośniacki (bs), kataloński (ca), cebuański (ceb), korsykański (co), walijski (cy), malediwski (dv), esperanto (eo), baskijski (eu), perski (fa), filipiński (tagalski) (fil), fryzyjski (fy), irlandzki (ga), szkocki gaelicki (gd), galicyjski (gl), gudżarati (gu), hausa (ha), hawajski (haw), hmong (hmn), kreolski haitański (ht), ormiański (hy), igbo (ig), islandzki (is), jawajski (jv), gruziński (ka), kazachski (kk), khmerski (km), kannada (kn), krio (kri), kurdyjski (ku), kirgiski (ky), łaciński (la), luksemburski (lb), laotański (lo), malgaski (mg), maoryski (mi), macedoński (mk), malajalam (ml), mongolski (mn), meitei (manipuri) (mni-Mtei), marathi (mr), malajski (ms), maltański (mt), birmański (my), nepalski (ne), nyanja (chichewa) (ny), odia (orija) (or), pendżabski (pa), paszto (ps), sindhi (sd), syngaleski (si), samoański (sm), shona (sn), somalijski (so), albański (sq), sotho (st), sundajski (su), tamilski (ta), telugu (te), tadżycki (tg), ujgurski (ug), urdu (ur), uzbecki (uz), xhosa (xh), jidysz (yi), joruba (yo), zulu (zu)

Imagen

Ogólna dostępność: język angielski
Podgląd: chiński (uproszczony), chiński (tradycyjny), hiszpański, japoński, koreański, hindi, portugalski

Informacje o poprzednich modelach

Są one aktywne, ale należą do modeli poprzedniej generacji. W miarę możliwości zalecamy korzystanie z jednego z najnowszych modeli.

Gemini modelu

Model	Dane wejściowe	Wyniki	Opis
Gemini 2.0 Flash `gemini-2.0-flash-001`	tekst, kod, pliki PDF, obrazy, filmy, dźwięk;	tekst, kod, JSON	Nasz model multimodalny z funkcjami nowej generacji i ulepszonymi możliwościami, w tym doskonałą szybkością, wbudowanym narzędziem i oknem kontekstu z milionem tokenów
Gemini 2.0 Flash‑Lite `gemini-2.0-flash-lite-001`	tekst, kod, pliki PDF, obrazy, filmy, dźwięk;	tekst, kod, JSON	Nasz najszybszy i najbardziej ekonomiczny model Flash. Jest to ścieżka uaktualnienia dla użytkowników modelu 1.5 Flash, którzy chcą uzyskać lepszą jakość w tej samej cenie i przy tej samej szybkości.

Imagen modelu

Model	Dane wejściowe	Wyniki	Opis
Imagen 3 `imagen-3.0-generate-002`	tekst	obrazy	generuje realistyczne obrazy wysokiej jakości na podstawie promptów tekstowych w języku naturalnym;
Imagen 3 Fast ² `imagen-3.0-fast-generate-001`	tekst	obrazy	Generuje obrazy na potrzeby prototypowania lub zastosowań wymagających krótkiego czasu oczekiwania

^{2 Nie jest obsługiwane przez Gemini Developer API niezależnie od sposobu dostępu.}

Wszystkie modele Gemini 1.0 i Gemini 1.5 zostały wycofane, a wszystkie żądania wysyłane do tych modeli zwracają błąd 404. Aby uniknąć przerw w działaniu usługi, przejdź na nowszy model (np. gemini-2.5-flash-lite). Więcej informacji

Gdy zaczniesz poważnie rozwijać aplikację, zalecamy używanie Firebase Remote Config, aby zdalnie zmieniać model i wersję w aplikacji bez publikowania jej nowej wersji.

Wyświetlanie obsługiwanych danych wejściowych i wyjściowych modeli poprzedniej generacji

Oto typy danych wejściowych i wyjściowych w przypadku używania poszczególnych modeli z Firebase AI Logic:

	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Typy danych wejściowych
Tekst
Tekst (strumieniowanie)
Kod
Dokumenty (pliki PDF lub zwykły tekst)
Obrazy
Wideo
Dźwięk
Audio (streaming)
Typy wyjściowe
Tekst
Tekst (strumieniowanie)
Kod
Uporządkowane dane wyjściowe (np. JSON)
Obrazy
Dźwięk
Audio (streaming)

Obsługiwane funkcje modeli poprzedniej generacji

Oto możliwości i funkcje przy korzystaniu z poszczególnych modeli z Firebase AI Logic:

	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Myślenie
Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst lub danych multimodalnych
Generowanie obrazów (Gemini lub Imagen)
Edytowanie obrazów (Gemini lub Imagen)
Wygeneruj dźwięk
Generowanie danych wyjściowych w formacie strukturalnym (np. JSON)
Analizowanie dokumentów (pliki PDF lub zwykły tekst)
Analizowanie obrazów (vision)
Analizowanie filmu (vision)
Analizowanie dźwięku
Czat wieloetapowy
Dwukierunkowa transmisja multimodalna
Wywoływanie funkcji
Wykonanie kodu
Grounding z użyciem wyszukiwarki Google
Instrukcje systemowe
Licz tokeny

Specyfikacje i ograniczenia modeli poprzedniej generacji

Oto specyfikacje i ograniczenia dotyczące korzystania z poszczególnych modeli z parametrem Firebase AI Logic:

Właściwość	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Okno kontekstu* Łączny limit tokenów (dane wejściowe + wyjściowe)	1 048 576 tokenów	1 048 576 tokenów
Limit tokenów wyjściowych*	8192 tokeny	8192 tokeny
Data granicy wiedzy	Czerwiec 2024 r.	Czerwiec 2024 r.
Pliki PDF (na żądanie)
Maksymalna liczba wejściowych plików PDF **	3000 plików	3000 plików
Maksymalna liczba stron w pliku PDF **	1000 stron	1000 stron
Maksymalny rozmiar wejściowego pliku PDF	50 MB	50 MB
Obrazy (z uwzględnieniem żądań)
Maksymalna liczba obrazów wejściowych	3000 obrazów	3000 obrazów
Maksymalna liczba obrazów wyjściowych	---	---
Maksymalny rozmiar na wejściowy obraz zakodowany w formacie base64	7 MB	7 MB
Wideo (z uwzględnieniem żądań)
Maksymalna liczba plików wideo wejściowych	10 plików	10 plików
Maksymalna długość wszystkich filmów wejściowych (tylko klatki)	~60 minut	~60 minut
Maksymalna długość wszystkich filmów wejściowych (klatki + audio)	~45 minut	~45 minut
Dźwięk (z uwzględnieniem żądań)
Maksymalna liczba wejściowych plików audio	1 plik	1 plik
Maksymalna liczba wyjściowych plików audio	---	---
Maksymalna długość wszystkich wejściowych plików audio	Ok.8,4 godziny	Ok.8,4 godziny
Maksymalna długość wszystkich wyjściowych plików audio	---	---

Dostępne nazwy modeli poprzedniej generacji (wraz z datami wycofania)

Nazwy modeli to konkretne wartości, które umieszczasz w kodzie podczas inicjowania modelu.

Modele Gemini

Gemini 2.0 Flash nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.0-flash-001`	Najnowsza stabilna wersja Gemini 2.0 Flash	Stabilny	2025-02-05	Nie wcześniej niż 5 lutego 2026 r.
`gemini-2.0-flash`	Automatycznie aktualizowany alias wskazujący najnowszą stabilną wersję Gemini 2.0 Flash (obecnie `gemini-2.0-flash-001`)	Stabilny	2025-02-10	---

Gemini 2.0 Flash‑Lite nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.0-flash-lite-001`	Najnowsza stabilna wersja Gemini 2.0 Flash‑Lite	Stabilny	2025-02-25	Nie wcześniej niż 2026-02-25
`gemini-2.0-flash-lite`	Automatycznie aktualizowany alias wskazujący najnowszą stabilną wersję Gemini 2.0 Flash‑Lite (obecnie `gemini-2.0-flash-lite-001`)	Stabilny	2025-02-25	---

Modele Imagen

Imagen 3 nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-3.0-generate-002`	Najnowsza stabilna wersja Imagen 3	Stabilny	2025-01-23	Nie wcześniej niż 23 stycznia 2026 r.
`imagen-3.0-generate-001` ³	Początkowa stabilna wersja Imagen 3	Stabilny	2024-07-31	Nie wcześniej niż 31 lipca 2025 r.

Imagen 3 Fast nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-3.0-fast-generate-001` ³	Początkowa stabilna wersja Imagen 3 Fast	Stabilny	2024-07-31	Nie wcześniej niż 31 lipca 2025 r.

^{3 Nie jest obsługiwane przez Gemini Developer API niezależnie od sposobu dostępu.}

Dalsze kroki

Wypróbuj możliwości Gemini API

Twórz rozmowy wieloetapowe (czat).
Generowanie tekstu na podstawie promptów zawierających tylko tekst.
Generuj tekst, podając różne typy plików, takie jak obrazy, pliki PDF, filmy i pliki audio.
Generowanie danych wyjściowych w formacie strukturalnym (np. JSON) na podstawie promptów tekstowych i multimodalnych.
generować obrazy na podstawie promptów tekstowych (Gemini lub Imagen);
Przesyłanie strumieniowe danych wejściowych i wyjściowych (w tym audio) za pomocą Gemini Live API.
Używaj narzędzi (takich jak wywoływanie funkcji i uzyskiwanie dostępu do informacji z wyszukiwarki Google), aby połączyć model Gemini z innymi częściami aplikacji oraz zewnętrznymi systemami i informacjami.

Informacje o obsługiwanych modelach Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Modele ogólnego zastosowania

Gemini 3 Pro

Gemini 2.5 Pro

Gemini 2.5 Flash

Gemini 2.5 Flash-Lite

Modele generujące obrazy

Gemini

Gemini 3 Pro Image (czyli nano banana pro)

Gemini 2.5 Flash Image (czyli nano banana)

Imagen

Imagen 4

Imagen 4 Fast

Imagen 4 Ultra

Modele poprzedniej generacji

Modele Gemini

Gemini 2.0 Flash

Gemini 2.0 Flash-Lite

Porównanie modeli

Obsługiwane wejścia i wyjścia

Obsługiwane funkcje

Specyfikacje i ograniczenia

Znajdowanie dodatkowych szczegółowych informacji

Wersje modeli i wzorce nazewnictwa

Dostępne nazwy modeli

Programowe wyświetlanie listy wszystkich dostępnych modeli

Gemini nazwy modeli

Gemini 3 Pro nazwy modeli

Gemini 3 Pro Image nazwy modeli (np. „nano banana pro”)

Gemini 2.5 Pro nazwy modeli

Gemini 2.5 Flash nazwy modeli

Gemini 2.5 Flash‑Lite nazwy modeli

Gemini 2.5 Flash Image nazwy modeli (znane też jako „nano banana”)

Gemini 2.5 Flash Live nazwy modeli

Gemini 2.0 Flash Live nazwy modeli

Imagen nazwy modeli

Imagen 4 nazwy modeli

Imagen 4 Fast nazwy modeli

Imagen 4 Ultra nazwy modeli

Imagen 3 Capability nazwy modeli

Obsługiwane języki

Gemini

Imagen

Informacje o poprzednich modelach

Gemini modelu

Imagen modelu

Modele Gemini

Gemini 2.0 Flash nazwy modeli

Gemini 2.0 Flash‑Lite nazwy modeli

Modele Imagen

Imagen 3 nazwy modeli

Imagen 3 Fast nazwy modeli

Dalsze kroki

Wypróbuj możliwości Gemini API

Informacje o obsługiwanych modelach