Узнайте о поддерживаемых моделях,Узнайте о поддерживаемых моделях,Узнайте о поддерживаемых моделях,Узнайте о поддерживаемых моделях.

Что касается мобильных и веб-приложений, Vertex AI in Firebase SDK позволяет вам взаимодействовать с поддерживаемыми моделями Gemini непосредственно из вашего приложения.

Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF-файлы, изображения, видео и аудио.

Вот краткий обзор поддерживаемых моделей Vertex AI in Firebase и их последних стабильных версий. В разделах ниже на этой странице представлены более подробные сравнения и информация.

Модель Вход Выход Оптимизирован для
Модели Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON
(изображения и аудио скоро появятся!)
Функции нового поколения, скорость и мультимодальная генерация для самых разных задач.
Gemini 1.5 Pro
gemini-1.5-pro-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Сложные логические задачи, требующие большего интеллекта
Gemini 1.5 Flash
gemini-1.5-flash-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Быстрая и универсальная производительность при выполнении широкого спектра задач.


Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Vertex AI in Firebase :

Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .



Сравнить модели

Каждая модель имеет разные возможности для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Vertex AI in Firebase . Каждая модель может иметь дополнительные возможности, недоступные при использовании наших SDK.

Подробнее о каждой модели Gemini можно узнать в документации Google Cloud .

Поддерживаемый ввод и вывод

Ниже приведены поддерживаемые типы ввода и вывода при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Типы ввода
Текст
Код
Документы (PDF или обычный текст)
Изображения, видео и аудио
Аудио (потоковое) вскоре!
Типы вывода
Текст
Структурированный вывод (например, JSON)
Код
Изображения вскоре!
Аудио вскоре!
Аудио (потоковое) вскоре!

Дополнительные сведения о поддерживаемых типах файлов см. в разделе Поддерживаемые входные файлы и требования к Vertex AI Gemini API .

Поддерживаемые возможности и функции

Вот поддерживаемые возможности и функции при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Генерация текста из текстовых или мультимодальных входных данных
Создание изображений вскоре!
Создать аудио вскоре!
Генерировать структурированный вывод (например, JSON)
Анализ изображений и видео (зрение)
Анализируйте аудио
Анализ документов (PDF или обычный текст)
Многоходовой чат
Вызов функций (инструменты)
Вызов основной функции
Параллельный вызов функций
Режим вызова функций
Подсчет токенов и оплачиваемых персонажей
Системные инструкции
Мультимодальный Live API (двунаправленная потоковая передача) вскоре!

Технические характеристики и ограничения

Вот характеристики и ограничения при использовании каждой модели с Vertex AI in Firebase :

Свойство Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Контекстное окно *
Общий лимит токенов (комбинированный ввод+вывод)
1 048 576 токенов 2 097 152 жетона 1 048 576 токенов
Лимит выходных токенов * 8 192 жетона 8 192 жетона 8 192 жетона
Дата прекращения знаний июнь 2024 г. май 2024 г. май 2024 г.
Изображения (по запросу)
Максимальное количество входных изображений 3000 изображений 3000 изображений 3000 изображений
Максимальное количество выходных изображений вскоре! --- ---
Максимальный размер входного изображения в кодировке Base64 7 МБ 7 МБ 7 МБ
PDF-файлы (по запросу)
Максимальное количество входных PDF-файлов ** 3000 файлов 3000 файлов 3000 файлов
Максимальное количество страниц во входном PDF-файле ** 1000 страниц 1000 страниц 1000 страниц
Максимальный размер входного PDF-файла 50 МБ 50 МБ 50 МБ
Видео (по запросу)
Максимальное количество входных видеофайлов 10 файлов 10 файлов 10 файлов
Максимальная длина всего входного видео (только кадры) ~60 минут ~60 минут ~60 минут
Максимальная длина всего входного видео (кадры+аудио) ~45 минут ~45 минут ~45 минут
Аудио (по запросу)
Максимальное количество входных аудиофайлов 1 файл 1 файл 1 файл
Максимальное количество выходных аудиофайлов вскоре! --- ---
Максимальная длина всего входного аудио ~8,4 часа ~8,4 часа ~8,4 часа
Максимальная длина всего выходного звука вскоре! --- ---

* Для всех моделей токен эквивалентен примерно 4 символам, поэтому 100 токенов — это примерно 60–80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens .

** PDF-файлы рассматриваются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.

Найти дополнительную подробную информацию

  • Квоты и цены различны для каждой модели. Цена также зависит от ввода и вывода.

  • Узнайте о поддерживаемых типах входных файлов, о том, как указать тип MIME и как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям, и следуйте рекомендациям в разделе Поддерживаемые входные файлы и требования для Vertex AI Gemini API .



Модели управления версиями и шаблоны именования

Модели предлагаются в стабильной , автоматически обновляемой и предварительной версиях.

  • Стабильные версии считаются общедоступными.

    • В стабильных версиях к названиям моделей добавляется определенный трехзначный номер версии, например gemini-2.0-flash-001 .
  • Автоматически обновляемые версии всегда указывают на последнюю стабильную версию этой модели; если выпускается новая стабильная версия, автоматически обновляемая версия автоматически начинает указывать на эту новую стабильную версию.

    • Автоматически обновляемые версии имеют названия моделей без придатков, например gemini-2.0-flash .
  • Предварительные версии имеют новые возможности и считаются нестабильными . Обратите внимание, что предварительные версии всегда указывают на последнюю предварительную версию этой модели; если выпущена новая предварительная версия, любая существующая предварительная версия автоматически начинает указывать на эту новую предварительную версию.

    • В предварительных версиях к названиям моделей добавляется -preview вместе с первоначальной датой выпуска модели ( -MMDD ), например gemini-1.5-pro-preview-0409 (выпущен 9 апреля 2024 г.).

Узнайте больше о доступных версиях моделей и их жизненном цикле ( Gemini ) в документации Google Cloud .



Доступные названия моделей

Имена моделей — это явные значения, которые вы включаете в свой код во время инициализации генеративной модели (что является обязательным шагом для вызова Gemini API ).

Вы можете использовать конечную publishers.models.list для вывода списка всех доступных названий моделей. Обратите внимание, что этот возвращаемый список будет включать все модели, которые поддерживает Vertex AI , но Vertex AI in Firebase поддерживает только модели Gemini , описанные на этой странице. Также обратите внимание, что автоматически обновляемые версии (например, gemini-2.0-flash ) не указаны, поскольку они представляют собой удобный псевдоним базовой стабильной модели.

Названия моделей Gemini

Примеры инициализации для вашего языка см. в руководстве по началу работы .

Названия моделей Gemini 2.0 Flash

Название модели Описание Стадия релиза Дата первоначального выпуска Дата прекращения
Стабильные версии
gemini-2.0-flash-001 Последняя стабильная версия Gemini 2.0 Flash Общая доступность 2025-02-05 Будет определено
Автоматически обновляемая версия
gemini-2.0-flash Указывает на последнюю стабильную версию 2.0 Flash.
(в настоящее время gemini-2.0-flash-001 )
Общая доступность 2025-02-10 ---

Названия моделей Gemini 1.5 Pro

Название модели Описание Стадия релиза Дата первоначального выпуска Дата прекращения
Стабильные версии
gemini-1.5-pro-002 Последняя стабильная версия Gemini 1.5 Pro Общая доступность 2024-09-24 Не ранее 24 сентября 2025 г.
gemini-1.5-pro-001 Начальная стабильная версия Gemini 1.5 Pro Общая доступность 2024-05-24 Не ранее 24 мая 2025 г.
Автоматически обновляемая версия
gemini-1.5-pro Указывает на последнюю стабильную версию 1.5 Pro.
(в настоящее время gemini-1.5-pro-002 )
Общая доступность 2024-09-24 ---

Названия моделей Gemini 1.5 Flash

Название модели Описание Стадия релиза Дата первоначального выпуска Дата прекращения
Стабильные версии
gemini-1.5-flash-002 Последняя стабильная версия Gemini 1.5 Flash Общая доступность 2024-09-24 Не ранее 24 сентября 2025 г.
gemini-1.5-flash-001 Начальная стабильная версия Gemini 1.5 Flash Общая доступность 2024-05-24 Не ранее 24 мая 2025 г.
Автоматически обновляемая версия
gemini-1.5-flash Указывает на последнюю стабильную версию 1.5 Flash.
(в настоящее время gemini-1.5-flash-002 )
Общая доступность 2024-09-24 ---



Поддерживаемые языки

Gemini

  • Все модели Gemini понимают и отвечают на следующих языках:

    Арабский (ar), бенгальский (bn), болгарский (bg), китайский упрощенный и традиционный (zh), хорватский (hr), чешский (cs), датский (da), голландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), иврит (iw), хинди (hi), венгерский (hu), индонезийский (id), итальянский (it), японский (ja), корейский (ko), латышский (lv), литовский (lt), норвежский (no), польский (pl), португальский (pt), румынский (ro), русский (ru), сербский (ср), словацкий (sk), словенский (sl), испанский (es), суахили (sw), шведский (sv), тайский (th), турецкий (tr), украинский (uk), вьетнамский (vi)

  • Модели Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:

    Африкаанс (af), амхарский (am), ассамский (as), азербайджанский (az), белорусский (be), боснийский (bs), каталанский (ca), кебуанский (ceb), корсиканский (co), валлийский (cy), дивехи (dv), эсперанто (eo), баскский (eu), персидский (fa), филиппинский (тагальский) (fil), фризский (fy), ирландский (ga), шотландский гэльский (gd), галисийский (gl), гуджарати (gu), хауса (ha), гавайский (haw), хмонг (hmn), гаитянский креольский (ht), армянский (hy), игбо (ig), исландский (is), яванский (jv), грузинский (ka), казахский (kk), кхмерский (km), каннада (kn), крио (kri), курдский (ku), кыргызский (ky), латынь (la), люксембургский (lb), лаосский (lo), Малагасийский (mg), маори (mi), македонский (mk), малаялам (ml), монгольский (mn), мейтейлон (манипури) (mni-Mtei), маратхи (mr), малайский (ms), мальтийский (mt), мьянма (бирманский) (my), непальский (ne), ньянджа (чичева) (ny), одиа (ория) (или), панджаби (pa), пушту (ps), Синдхи (sd), сингальский (сингальский) (si), самоанский (sm), шона (sn), сомалийский (so), албанский (sq), сесото (st), суданский (su), тамильский (ta), телугу (te), таджикский (tg), уйгурский (ug), урду (ur), узбекский (uz), коса (xh), идиш (yi), йоруба (yo), зулу (zu)



Информация о старых моделях

Vertex AI in Firebase поддерживает все модели Gemini , включая более старые модели, такие как Gemini 1.0 Pro и Gemini 1.0 Pro Vision . Однако мы настоятельно рекомендуем использовать с нашими SDK более новую модель. Эти старые модели Gemini приближаются к дате прекращения производства и не предлагают всех возможностей новых моделей.



Следующие шаги

Опробуйте возможности Gemini API

,

Что касается мобильных и веб-приложений, Vertex AI in Firebase SDK позволяет вам взаимодействовать с поддерживаемыми моделями Gemini непосредственно из вашего приложения.

Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF-файлы, изображения, видео и аудио.

Вот краткий обзор поддерживаемых моделей Vertex AI in Firebase и их последних стабильных версий. В разделах ниже на этой странице представлены более подробные сравнения и информация.

Модель Вход Выход Оптимизирован для
Модели Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON
(изображения и аудио скоро появятся!)
Функции нового поколения, скорость и мультимодальная генерация для самых разных задач.
Gemini 1.5 Pro
gemini-1.5-pro-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Сложные логические задачи, требующие большего интеллекта
Gemini 1.5 Flash
gemini-1.5-flash-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Быстрая и универсальная производительность при выполнении широкого спектра задач.


Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Vertex AI in Firebase :

Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .



Сравнить модели

Каждая модель имеет разные возможности для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Vertex AI in Firebase . Каждая модель может иметь дополнительные возможности, недоступные при использовании наших SDK.

Подробнее о каждой модели Gemini можно узнать в документации Google Cloud .

Поддерживаемый ввод и вывод

Ниже приведены поддерживаемые типы ввода и вывода при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Типы ввода
Текст
Код
Документы (PDF или обычный текст)
Изображения, видео и аудио
Аудио (потоковое) вскоре!
Типы вывода
Текст
Структурированный вывод (например, JSON)
Код
Изображения вскоре!
Аудио вскоре!
Аудио (потоковое) вскоре!

Дополнительные сведения о поддерживаемых типах файлов см. в разделе Поддерживаемые входные файлы и требования к Vertex AI Gemini API .

Поддерживаемые возможности и функции

Вот поддерживаемые возможности и функции при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Генерация текста из текстовых или мультимодальных входных данных
Создание изображений вскоре!
Создать аудио вскоре!
Генерировать структурированный вывод (например, JSON)
Анализ изображений и видео (зрение)
Анализируйте аудио
Анализ документов (PDF или обычный текст)
Многоходовой чат
Вызов функций (инструменты)
Вызов основной функции
Параллельный вызов функций
Режим вызова функций
Подсчет токенов и оплачиваемых персонажей
Системные инструкции
Мультимодальный Live API (двунаправленная потоковая передача) вскоре!

Технические характеристики и ограничения

Вот характеристики и ограничения при использовании каждой модели с Vertex AI in Firebase :

Свойство Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Контекстное окно *
Общий лимит токенов (комбинированный ввод+вывод)
1 048 576 токенов 2 097 152 жетона 1 048 576 токенов
Лимит выходных токенов * 8 192 жетона 8 192 жетона 8 192 жетона
Дата прекращения знаний июнь 2024 г. май 2024 г. май 2024 г.
Изображения (по запросу)
Максимальное количество входных изображений 3000 изображений 3000 изображений 3000 изображений
Максимальное количество выходных изображений вскоре! --- ---
Максимальный размер входного изображения в кодировке Base64 7 МБ 7 МБ 7 МБ
PDF-файлы (по запросу)
Максимальное количество входных PDF-файлов ** 3000 файлов 3000 файлов 3000 файлов
Максимальное количество страниц во входном PDF-файле ** 1000 страниц 1000 страниц 1000 страниц
Максимальный размер входного PDF-файла 50 МБ 50 МБ 50 МБ
Видео (по запросу)
Максимальное количество входных видеофайлов 10 файлов 10 файлов 10 файлов
Максимальная длина всего входного видео (только кадры) ~60 минут ~60 минут ~60 минут
Максимальная длина всего входного видео (кадры+аудио) ~45 минут ~45 минут ~45 минут
Аудио (по запросу)
Максимальное количество входных аудиофайлов 1 файл 1 файл 1 файл
Максимальное количество выходных аудиофайлов вскоре! --- ---
Максимальная длина всего входного аудио ~8,4 часа ~8,4 часа ~8,4 часа
Максимальная длина всего выходного звука вскоре! --- ---

* Для всех моделей токен эквивалентен примерно 4 символам, поэтому 100 токенов — это примерно 60–80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens .

** PDF-файлы рассматриваются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.

Найти дополнительную подробную информацию

  • Квоты и цены различны для каждой модели. Цена также зависит от ввода и вывода.

  • Узнайте о поддерживаемых типах входных файлов, о том, как указать тип MIME и как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям, и следуйте рекомендациям в разделе Поддерживаемые входные файлы и требования для Vertex AI Gemini API .



Модели управления версиями и шаблоны именования

Модели предлагаются в стабильной , автоматически обновляемой и предварительной версиях.

  • Стабильные версии считаются общедоступными.

    • В стабильных версиях к названиям моделей добавляется определенный трехзначный номер версии, например gemini-2.0-flash-001 .
  • Автоматически обновляемые версии всегда указывают на последнюю стабильную версию этой модели; если выпускается новая стабильная версия, автоматически обновляемая версия автоматически начинает указывать на эту новую стабильную версию.

    • Автоматически обновляемые версии имеют названия моделей без придатков, например gemini-2.0-flash .
  • Предварительные версии имеют новые возможности и считаются нестабильными . Обратите внимание, что предварительные версии всегда указывают на последнюю предварительную версию этой модели; если выпущена новая предварительная версия, любая существующая предварительная версия автоматически начинает указывать на эту новую предварительную версию.

    • В предварительных версиях к названиям моделей добавляется -preview вместе с первоначальной датой выпуска модели ( -MMDD ), например gemini-1.5-pro-preview-0409 (выпущен 9 апреля 2024 г.).

Узнайте больше о доступных версиях моделей и их жизненном цикле ( Gemini ) в документации Google Cloud .



Доступные названия моделей

Имена моделей — это явные значения, которые вы включаете в свой код во время инициализации генеративной модели (что является обязательным шагом для вызова Gemini API ).

Вы можете использовать конечную publishers.models.list для вывода списка всех доступных названий моделей. Обратите внимание, что этот возвращаемый список будет включать все модели, которые поддерживает Vertex AI , но Vertex AI in Firebase поддерживает только модели Gemini , описанные на этой странице. Также обратите внимание, что автоматически обновляемые версии (например, gemini-2.0-flash ) не указаны, поскольку они представляют собой удобный псевдоним базовой стабильной модели.

Названия моделей Gemini

Примеры инициализации для вашего языка см. в руководстве по началу работы .

Названия моделей Gemini 2.0 Flash

Название модели Описание Стадия релиза Дата первоначального выпуска Дата прекращения
Стабильные версии
gemini-2.0-flash-001 Последняя стабильная версия Gemini 2.0 Flash Общая доступность 2025-02-05 Будет определено
Автоматически обновляемая версия
gemini-2.0-flash Указывает на последнюю стабильную версию 2.0 Flash.
(в настоящее время gemini-2.0-flash-001 )
Общая доступность 2025-02-10 ---

Названия моделей Gemini 1.5 Pro

Название модели Описание Стадия релиза Дата первоначального выпуска Дата прекращения
Стабильные версии
gemini-1.5-pro-002 Последняя стабильная версия Gemini 1.5 Pro Общая доступность 2024-09-24 Не ранее 24 сентября 2025 г.
gemini-1.5-pro-001 Начальная стабильная версия Gemini 1.5 Pro Общая доступность 2024-05-24 Не ранее 24 мая 2025 г.
Автоматически обновляемая версия
gemini-1.5-pro Указывает на последнюю стабильную версию 1.5 Pro.
(в настоящее время gemini-1.5-pro-002 )
Общая доступность 2024-09-24 ---

Названия моделей Gemini 1.5 Flash

Название модели Описание Стадия релиза Дата первоначального выпуска Дата прекращения
Стабильные версии
gemini-1.5-flash-002 Последняя стабильная версия Gemini 1.5 Flash Общая доступность 2024-09-24 Не ранее 24 сентября 2025 г.
gemini-1.5-flash-001 Начальная стабильная версия Gemini 1.5 Flash Общая доступность 2024-05-24 Не ранее 24 мая 2025 г.
Автоматически обновляемая версия
gemini-1.5-flash Указывает на последнюю стабильную версию 1.5 Flash.
(в настоящее время gemini-1.5-flash-002 )
Общая доступность 2024-09-24 ---



Поддерживаемые языки

Gemini

  • Все модели Gemini понимают и отвечают на следующих языках:

    Арабский (ar), бенгальский (bn), болгарский (bg), китайский упрощенный и традиционный (zh), хорватский (hr), чешский (cs), датский (da), голландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), иврит (iw), хинди (hi), венгерский (hu), индонезийский (id), итальянский (it), японский (ja), корейский (ko), латышский (lv), литовский (lt), норвежский (no), польский (pl), португальский (pt), румынский (ro), русский (ru), сербский (ср), словацкий (sk), словенский (sl), испанский (es), суахили (sw), шведский (sv), тайский (th), турецкий (tr), украинский (uk), вьетнамский (vi)

  • Модели Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:

    Африкаанс (af), амхарский (am), ассамский (as), азербайджанский (az), белорусский (be), боснийский (bs), каталанский (ca), кебуанский (ceb), корсиканский (co), валлийский (cy), дивехи (dv), эсперанто (eo), баскский (eu), персидский (fa), филиппинский (тагальский) (fil), фризский (fy), ирландский (ga), шотландский гэльский (gd), галисийский (gl), гуджарати (gu), хауса (ha), гавайский (haw), хмонг (hmn), гаитянский креольский (ht), армянский (hy), игбо (ig), исландский (is), яванский (jv), грузинский (ka), казахский (kk), кхмерский (km), каннада (kn), крио (kri), курдский (ku), кыргызский (ky), латынь (la), люксембургский (lb), лаосский (lo), Малагасийский (mg), маори (mi), македонский (mk), малаялам (ml), монгольский (mn), мейтейлон (манипури) (mni-Mtei), маратхи (mr), малайский (ms), мальтийский (mt), мьянма (бирманский) (my), непальский (ne), ньянджа (чичева) (ny), одиа (ория) (или), панджаби (pa), пушту (ps), Синдхи (sd), сингальский (сингальский) (si), самоанский (sm), шона (sn), сомалийский (so), албанский (sq), сесото (st), суданский (su), тамильский (ta), телугу (te), таджикский (tg), уйгурский (ug), урду (ur), узбекский (uz), коса (xh), идиш (yi), йоруба (yo), зулу (zu)



Информация о старых моделях

Vertex AI in Firebase поддерживает все модели Gemini , включая более старые модели, такие как Gemini 1.0 Pro и Gemini 1.0 Pro Vision . Однако мы настоятельно рекомендуем использовать более новую модель с нашими SDK. Эти старые модели Gemini приближаются к дате прекращения производства и не предлагают всех возможностей новых моделей.



Следующие шаги

Опробуйте возможности Gemini API

,

Что касается мобильных и веб-приложений, Vertex AI in Firebase SDK позволяет вам взаимодействовать с поддерживаемыми моделями Gemini непосредственно из вашего приложения.

Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF-файлы, изображения, видео и аудио.

Вот краткий обзор поддерживаемых моделей Vertex AI in Firebase и их последних стабильных версий. В разделах ниже на этой странице представлены более подробные сравнения и информация.

Модель Вход Выход Оптимизирован для
Модели Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON
(изображения и аудио скоро появятся!)
Функции нового поколения, скорость и мультимодальная генерация для самых разных задач.
Gemini 1.5 Pro
gemini-1.5-pro-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Сложные логические задачи, требующие большего интеллекта
Gemini 1.5 Flash
gemini-1.5-flash-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Быстрая и универсальная производительность в разнообразных задачах


Остальная часть этой страницы содержит подробную информацию о моделях, поддерживаемых Vertex AI in Firebase :

  • Сравните модели :

    • Поддерживаемый вход и вывод
    • Высокое сравнение поддерживаемых возможностей
    • Технические характеристики и ограничения, например, максимальные входные токены или максимальная длина входного видео
  • Описание того, как модели представлены , в частности, их стабильные , автоматические обновления и предварительные версии

  • Списки доступных имен моделей для включения в ваш код во время инициализации

  • Списки поддерживаемых языков для моделей

Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .



Сравнить модели

Каждая модель имеет разные возможности для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Vertex AI in Firebase . Каждая модель может иметь дополнительные возможности, которые недоступны при использовании наших SDK.

Вы можете узнать больше о каждой из моделей Gemini в документации Google Cloud .

Поддерживаемый вход и вывод

Это поддерживаемые типы ввода и вывода при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Типы ввода
Текст
Код
Документы (PDFS или простой текст)
Изображения, видео и аудио
Аудио (потоковая передача) вскоре!
Типы вывода
Текст
Структурированный выход (например, JSON)
Код
Изображения вскоре!
Аудио вскоре!
Аудио (потоковая передача) вскоре!

Чтобы узнать о поддерживаемых типах файлов, см. Поддерживаемые входные файлы и требования для Vertex AI Gemini API .

Поддерживаемые возможности и функции

Это поддерживаемые возможности и функции при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Создать текст из текста или мультимодальных входов
Генерировать изображения вскоре!
Генерировать аудио вскоре!
Генерировать структурированный выход (например, JSON)
Анализировать изображения и видео (видение)
Проанализировать аудио
Анализировать документы (PDFS или простой текст)
Многообразовательный чат
Функция вызова (инструменты)
Базовая функция вызов
Параллельная функция вызов
Режим вызова функции
Считайте токены и оплачиваемые персонажи
Системные инструкции
Мультимодальный живой API (двунаправленная потоковая передача) вскоре!

Спецификации и ограничения

Это спецификации и ограничения при использовании каждой модели с Vertex AI in Firebase :

Свойство Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Контекст окна *
Общий предел тона (комбинированный вход+вывод)
1 048 576 токенов 2 097 152 токена 1 048 576 токенов
Предел вывода токена * 8 192 жетонов 8 192 жетонов 8 192 жетонов
Дата отсечения знаний июнь 2024 г. май 2024 г. май 2024 г.
Изображения (по запросу)
Максимальное количество входных изображений 3000 изображений 3000 изображений 3000 изображений
Максимальное количество выходных изображений вскоре! --- ---
Максимальный размер на входной базовый 64-кодированный изображение 7 МБ 7 МБ 7 МБ
PDFS (по запросу)
Максимальное количество входных файлов PDF ** 3000 файлов 3000 файлов 3000 файлов
Максимальное количество страниц на входной файл PDF ** 1000 страниц 1000 страниц 1000 страниц
Максимальный размер на входной файл PDF 50 МБ 50 МБ 50 МБ
Видео (по запросу)
Максимальное количество входных видеофайлов 10 файлов 10 файлов 10 файлов
Максимальная длина всего входного видео (только кадры) ~ 60 минут ~ 60 минут ~ 60 минут
Максимальная длина всего входного видео (кадры+аудио) ~ 45 минут ~ 45 минут ~ 45 минут
Аудио (по запросу)
Максимальное количество входных аудиофайлов 1 файл 1 файл 1 файл
Максимальное количество выходных аудиофайлов вскоре! --- ---
Максимальная длина всего входного звука ~ 8,4 часа ~ 8,4 часа ~ 8,4 часа
Максимальная длина всего выходного звука вскоре! --- ---

* Для всех моделей токен эквивалентен примерно 4 символам, поэтому 100 токенов составляют около 60-80 английских слов. Для моделей Близнецов вы можете определить общее количество токенов в ваших запросах, используя countTokens .

** PDF рассматриваются как изображения, поэтому одна страница PDF рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые модель может поддержать.

Найдите дополнительную подробную информацию



Модель версий и шаблоны именования

Модели предлагаются в стабильных , автоматических и предварительных версиях.

  • Стабильные версии считаются в целом доступными.

    • Стабильные версии имеют имена моделей , добавленные с конкретным трехзначным номером версии, например, gemini-2.0-flash-001 .
  • Автоматические версии всегда указывают на последнюю стабильную версию этой модели; Если выпускается новая стабильная версия, версия с автоматическим обновлением автоматически начинает указывать на эту новую стабильную версию.

    • Версии с автоматическим обновлением имеют имена моделей без придатка, например, gemini-2.0-flash .
  • Предварительные версии имеют новые возможности и считаются не стабильными . Обратите внимание, что версии предварительного просмотра всегда указывают на последнюю версию предварительного просмотра этой модели; Если выпускается новая версия предварительного просмотра, любая существующая версия предварительного просмотра автоматически начинает указывать на эту новую версию предварительного просмотра.

    • Предварительные версии имеют имена моделей , добавленные с -preview вместе с начальной датой выпуска модели ( -MMDD ), например gemini-1.5-pro-preview-0409 (выпущен 9 апреля 2024 года).

Узнайте больше о доступных модельных версиях и их жизненном цикле ( Gemini ) в документации Google Cloud .



Доступные названия моделей

Имена моделей - это явные значения, которые вы включаете в свой код во время инициализации генеративной модели (который является необходимым шагом для вызова Gemini API ).

Вы можете использовать Endpoint publishers.models.list , чтобы перечислить все доступные имена моделей. Обратите внимание, что этот возвращенный список будет включать все модели, которые поддерживает Vertex AI , но Vertex AI in Firebase поддерживает только модели Gemini , описанные на этой странице. Также обратите внимание, что версии с автоматическим обновлением (например, gemini-2.0-flash ) не перечислены, потому что они являются псевдонимом для базовой стабильной модели.

Имена моделей Gemini

Для примеров инициализации для вашего языка см. Руководство по началу работы .

Имена модели Gemini 2.0 Flash

Название модели Описание Стадия выпуска Первоначальная дата выпуска Дата прекращения
Стабильные версии
gemini-2.0-flash-001 Последняя стабильная версия Gemini 2.0 Flash Общая доступность 2025-02-05 Быть определенным
Автоматическая версия
gemini-2.0-flash Указывает на последнюю стабильную версию 2.0 Flash
(в настоящее время gemini-2.0-flash-001 )
Общая доступность 2025-02-10 ---

Имена моделей Gemini 1.5 Pro

Название модели Описание Стадия выпуска Первоначальная дата выпуска Дата прекращения
Стабильные версии
gemini-1.5-pro-002 Последняя стабильная версия Gemini 1.5 Pro Общая доступность 2024-09-24 Не раньше 2025-09-24
gemini-1.5-pro-001 Первоначальная стабильная версия Gemini 1.5 Pro Общая доступность 2024-05-24 Не раньше 2025-05-24
Автоматическая версия
gemini-1.5-pro Указывает на последнюю стабильную версию 1.5 Pro
(в настоящее время gemini-1.5-pro-002 )
Общая доступность 2024-09-24 ---

Имена модели Gemini 1.5 Flash

Название модели Описание Стадия выпуска Первоначальная дата выпуска Дата прекращения
Стабильные версии
gemini-1.5-flash-002 Последняя стабильная версия Gemini 1.5 Flash Общая доступность 2024-09-24 Не раньше 2025-09-24
gemini-1.5-flash-001 Начальная стабильная версия Gemini 1.5 Flash Общая доступность 2024-05-24 Не раньше 2025-05-24
Автоматическая версия
gemini-1.5-flash Указывает на последнюю стабильную версию 1,5 Flash
(в настоящее время gemini-1.5-flash-002 )
Общая доступность 2024-09-24 ---



Поддерживаемые языки

Gemini

  • Все модели Gemini могут понимать и реагировать на следующих языках:

    Арабский (AR), бенгальский (BN), болгарский (BG), китайский упрощенный и традиционный (ZH), хорватский (HR), чешский (CS), датский (DA), голландский (NL), английский (EN), эстонский , Итальянский (IT), японский (JA), корейский (KO), латвийский (LV), литовский (LT), норвежский (no), польский (PL), португальский (Pt), румынский (Ro), русский (ru), сербский (SR), Словацкий (SK), Словвенский (SL), Испанский (ES), Swahili (SW), шведский (SV), тайский (TH), турецкий (TR), украинский (Великобритания), Вьетнамцы (VI)

  • Модели флэш -модели Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:

    Afrikaans (AF), Amharic (AM), Ассамсе (AS), Азербайджани (AZ), Belarusian (BE), боснийский (BS), каталонский (CA), Cebuano (Ceb), Corsican (Co), Welsh (Cy), Dhivehi (DV), Esperanto (EO), FARIINININO (EO), FARIINININO (EU), FARIINININO (EU), FARIINININO (EU). (FIL), фризский (FY), ирландский (GA), шотландский гэльский (GD), галиц (GL), Гуджарати (Гу), Хауса (Ха), Гавайский (Хоу), Хмон (Хмн), Гаитянский Креол (ХТ), Армян (Хи), Игбо (Иг), исландский (И.С.), Яванский (СП), Георгиан (Ка), Казак (казак (Кан U), Кыргыз (KY), латынь (LA), люксембургиш (LB), Лао (Ло), Малагасийский (Mg), маори (MI), македониан (MK), малаялам (ML), монгольский (MN), Meiteilon (Manipuri) (Mni-Mtei), Marathi (MR), малай YA) (или), пенджаби (PA), пушту (PS), Sindhi (SD), сингальский (сингальский) (SI), Самоан (SM), Шона (SN), сомали (SO), албанский (SQ), Sesotho (ST), сунданский (SU), тамильский Iddish (Yi), йоруба (yo), Zulu (Zu)



Информация о старых моделях

Vertex AI in Firebase поддерживает все модели Gemini , в том числе старые модели, такие как Gemini 1.0 Pro и Gemini 1.0 Pro Vision . Тем не менее, мы настоятельно рекомендуем использовать более новую модель с нашими SDK. Эти более старые модели Gemini приближаются к дате их прекращения и не предлагают все возможности новых моделей.



Следующие шаги

Попробуйте возможности Gemini API

,

Для мобильных и веб -приложений Vertex AI in Firebase SDK позволяет вам взаимодействовать с поддерживаемыми моделями Gemini непосредственно из вашего приложения.

Модели Gemini считаются мультимодальными , потому что они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF, изображения, видео и аудио.

Вот краткий обзор поддерживаемых моделей для Vertex AI in Firebase и их последних стабильных версий. В разделах позже на этой странице предоставлены более подробные сравнения и информацию.

Модель Вход Выход Оптимизирован для
Модели Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
Текст, код, pdfs, изображения, видео, аудио Текст, код, json
(Изображения и аудио скоро появятся!)
Особенности, скорость и мультимодальное поколение следующего поколения для разнообразия задач
Gemini 1.5 Pro
gemini-1.5-pro-002
Текст, код, pdfs, изображения, видео, аудио Текст, код, json Сложные рассуждения, требующие большего интеллекта
Gemini 1.5 Flash
gemini-1.5-flash-002
Текст, код, pdfs, изображения, видео, аудио Текст, код, json Быстрая и универсальная производительность в разнообразных задачах


Остальная часть этой страницы содержит подробную информацию о моделях, поддерживаемых Vertex AI in Firebase :

  • Сравните модели :

    • Поддерживаемый вход и вывод
    • Высокое сравнение поддерживаемых возможностей
    • Технические характеристики и ограничения, например, максимальные входные токены или максимальная длина входного видео
  • Описание того, как модели представлены , в частности, их стабильные , автоматические обновления и предварительные версии

  • Списки доступных имен моделей для включения в ваш код во время инициализации

  • Списки поддерживаемых языков для моделей

Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .



Сравнить модели

Каждая модель имеет разные возможности для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Vertex AI in Firebase . Каждая модель может иметь дополнительные возможности, которые недоступны при использовании наших SDK.

Вы можете узнать больше о каждой из моделей Gemini в документации Google Cloud .

Поддерживаемый вход и вывод

Это поддерживаемые типы ввода и вывода при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Типы ввода
Текст
Код
Документы (PDFS или простой текст)
Изображения, видео и аудио
Аудио (потоковая передача) вскоре!
Типы вывода
Текст
Структурированный выход (например, JSON)
Код
Изображения вскоре!
Аудио вскоре!
Аудио (потоковая передача) вскоре!

Чтобы узнать о поддерживаемых типах файлов, см. Поддерживаемые входные файлы и требования для Vertex AI Gemini API .

Поддерживаемые возможности и функции

Это поддерживаемые возможности и функции при использовании каждой модели с Vertex AI in Firebase :

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Создать текст из текста или мультимодальных входов
Генерировать изображения вскоре!
Генерировать аудио вскоре!
Генерировать структурированный выход (например, JSON)
Анализировать изображения и видео (видение)
Проанализировать аудио
Анализировать документы (PDFS или простой текст)
Многообразовательный чат
Функция вызова (инструменты)
Базовая функция вызов
Параллельная функция вызов
Режим вызова функции
Считайте токены и оплачиваемые персонажи
Системные инструкции
Мультимодальный живой API (двунаправленная потоковая передача) вскоре!

Спецификации и ограничения

Это спецификации и ограничения при использовании каждой модели с Vertex AI in Firebase :

Свойство Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Контекст окна *
Общий предел тона (комбинированный вход+вывод)
1 048 576 токенов 2 097 152 токена 1 048 576 токенов
Предел вывода токена * 8 192 жетонов 8 192 жетонов 8 192 жетонов
Дата отсечения знаний июнь 2024 г. май 2024 г. май 2024 г.
Изображения (по запросу)
Максимальное количество входных изображений 3000 изображений 3000 изображений 3000 изображений
Максимальное количество выходных изображений вскоре! --- ---
Максимальный размер на входной базовый 64-кодированный изображение 7 МБ 7 МБ 7 МБ
PDFS (по запросу)
Максимальное количество входных файлов PDF ** 3000 файлов 3000 файлов 3000 файлов
Максимальное количество страниц на входной файл PDF ** 1000 страниц 1000 страниц 1000 страниц
Максимальный размер на входной файл PDF 50 МБ 50 МБ 50 МБ
Видео (по запросу)
Максимальное количество входных видеофайлов 10 файлов 10 файлов 10 файлов
Максимальная длина всего входного видео (только кадры) ~ 60 минут ~ 60 минут ~ 60 минут
Максимальная длина всего входного видео (кадры+аудио) ~ 45 минут ~ 45 минут ~ 45 минут
Аудио (по запросу)
Максимальное количество входных аудиофайлов 1 файл 1 файл 1 файл
Максимальное количество выходных аудиофайлов вскоре! --- ---
Максимальная длина всего входного звука ~ 8,4 часа ~ 8,4 часа ~ 8,4 часа
Максимальная длина всего выходного звука вскоре! --- ---

* Для всех моделей токен эквивалентен примерно 4 символам, поэтому 100 токенов составляют около 60-80 английских слов. Для моделей Близнецов вы можете определить общее количество токенов в ваших запросах, используя countTokens .

** PDF рассматриваются как изображения, поэтому одна страница PDF рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые модель может поддержать.

Найдите дополнительную подробную информацию



Модель версий и шаблоны именования

Модели предлагаются в стабильных , автоматических и предварительных версиях.

  • Стабильные версии считаются в целом доступными.

    • Стабильные версии имеют имена моделей , добавленные с конкретным трехзначным номером версии, например, gemini-2.0-flash-001 .
  • Автоматические версии всегда указывают на последнюю стабильную версию этой модели; Если выпускается новая стабильная версия, версия с автоматическим обновлением автоматически начинает указывать на эту новую стабильную версию.

    • Версии с автоматическим обновлением имеют имена моделей без придатка, например, gemini-2.0-flash .
  • Предварительные версии имеют новые возможности и считаются не стабильными . Обратите внимание, что версии предварительного просмотра всегда указывают на последнюю версию предварительного просмотра этой модели; Если выпускается новая версия предварительного просмотра, любая существующая версия предварительного просмотра автоматически начинает указывать на эту новую версию предварительного просмотра.

    • Предварительные версии имеют имена моделей , добавленные с -preview вместе с начальной датой выпуска модели ( -MMDD ), например gemini-1.5-pro-preview-0409 (выпущен 9 апреля 2024 года).

Узнайте больше о доступных модельных версиях и их жизненном цикле ( Gemini ) в документации Google Cloud .



Доступные названия моделей

Имена моделей - это явные значения, которые вы включаете в свой код во время инициализации генеративной модели (который является необходимым шагом для вызова Gemini API ).

Вы можете использовать Endpoint publishers.models.list , чтобы перечислить все доступные имена моделей. Обратите внимание, что этот возвращенный список будет включать все модели, которые поддерживает Vertex AI , но Vertex AI in Firebase поддерживает только модели Gemini , описанные на этой странице. Также обратите внимание, что версии с автоматическим обновлением (например, gemini-2.0-flash ) не перечислены, потому что они являются псевдонимом для базовой стабильной модели.

Имена моделей Gemini

Для примеров инициализации для вашего языка см. Руководство по началу работы .

Имена модели Gemini 2.0 Flash

Название модели Описание Стадия выпуска Первоначальная дата выпуска Дата прекращения
Стабильные версии
gemini-2.0-flash-001 Последняя стабильная версия Gemini 2.0 Flash Общая доступность 2025-02-05 Быть определенным
Автоматическая версия
gemini-2.0-flash Указывает на последнюю стабильную версию 2.0 Flash
(в настоящее время gemini-2.0-flash-001 )
Общая доступность 2025-02-10 ---

Имена моделей Gemini 1.5 Pro

Название модели Описание Стадия выпуска Первоначальная дата выпуска Дата прекращения
Стабильные версии
gemini-1.5-pro-002 Последняя стабильная версия Gemini 1.5 Pro Общая доступность 2024-09-24 Не раньше 2025-09-24
gemini-1.5-pro-001 Первоначальная стабильная версия Gemini 1.5 Pro Общая доступность 2024-05-24 Не раньше 2025-05-24
Автоматическая версия
gemini-1.5-pro Указывает на последнюю стабильную версию 1.5 Pro
(в настоящее время gemini-1.5-pro-002 )
Общая доступность 2024-09-24 ---

Имена модели Gemini 1.5 Flash

Название модели Описание Стадия выпуска Первоначальная дата выпуска Дата прекращения
Стабильные версии
gemini-1.5-flash-002 Последняя стабильная версия Gemini 1.5 Flash Общая доступность 2024-09-24 Не раньше 2025-09-24
gemini-1.5-flash-001 Начальная стабильная версия Gemini 1.5 Flash Общая доступность 2024-05-24 Не раньше 2025-05-24
Автоматическая версия
gemini-1.5-flash Указывает на последнюю стабильную версию 1,5 Flash
(в настоящее время gemini-1.5-flash-002 )
Общая доступность 2024-09-24 ---



Поддерживаемые языки

Gemini

  • Все модели Gemini могут понимать и реагировать на следующих языках:

    Арабский (AR), бенгальский (BN), болгарский (BG), китайский упрощенный и традиционный (ZH), хорватский (HR), чешский (CS), датский (DA), голландский (NL), английский (EN), эстонский , Итальянский (IT), японский (JA), корейский (KO), латвийский (LV), литовский (LT), норвежский (no), польский (PL), португальский (Pt), румынский (Ro), русский (ru), сербский (SR), Словацкий (SK), Словвенский (SL), Испанский (ES), Swahili (SW), шведский (SV), тайский (TH), турецкий (TR), украинский (Великобритания), Вьетнамцы (VI)

  • Модели флэш -модели Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:

    Afrikaans (AF), Amharic (AM), Ассамсе (AS), Азербайджани (AZ), Belarusian (BE), боснийский (BS), каталонский (CA), Cebuano (Ceb), Corsican (Co), Welsh (Cy), Dhivehi (DV), Esperanto (EO), FARIINININO (EO), FARIINININO (EU), FARIINININO (EU), FARIINININO (EU). (FIL), фризский (FY), ирландский (GA), шотландский гэльский (GD), галиц (GL), Гуджарати (Гу), Хауса (Ха), Гавайский (Хоу), Хмон (Хмн), Гаитянский Креол (ХТ), Армян (Хи), Игбо (Иг), исландский (И.С.), Яванский (СП), Георгиан (Ка), Казак (казак (Кан U), Кыргыз (KY), латынь (LA), люксембургиш (LB), Лао (Ло), Малагасийский (Mg), маори (MI), македониан (MK), малаялам (ML), монгольский (MN), Meiteilon (Manipuri) (Mni-Mtei), Marathi (MR), малай YA) (или), пенджаби (PA), пушту (PS), Sindhi (SD), сингальский (сингальский) (SI), Самоан (SM), Шона (SN), сомали (SO), албанский (SQ), Sesotho (ST), сунданский (SU), тамильский Iddish (Yi), йоруба (yo), Zulu (Zu)



Информация о старых моделях

Vertex AI in Firebase поддерживает все модели Gemini , в том числе старые модели, такие как Gemini 1.0 Pro и Gemini 1.0 Pro Vision . Тем не менее, мы настоятельно рекомендуем использовать более новую модель с нашими SDK. Эти более старые модели Gemini приближаются к дате их прекращения и не предлагают все возможности новых моделей.



Следующие шаги

Попробуйте возможности Gemini API