Tìm hiểu về các mô hình được hỗ trợ

Đối với ứng dụng di động và web, SDK Vertex AI in Firebase cho phép bạn tương tác với các mô hình Gemini được hỗ trợ ngay trong ứng dụng.

Mô hình Gemini được coi là đa phương thức vì có khả năng xử lý và thậm chí tạo nhiều phương thức, bao gồm văn bản, mã, tệp PDF, hình ảnh, video và âm thanh.

Bảng sau đây là thông tin tổng quan ngắn gọn về các mô hình được hỗ trợ cho Vertex AI in Firebase và tên mô hình ổn định mới nhất của các mô hình đó. Bảng này cũng liệt kê các mô hình xem trước và thử nghiệm có sẵn cho các trường hợp sử dụng nguyên mẫu.

Mô hình Mục nhập Đầu ra Mô tả
Mô hình Gemini có phiên bản ổn định
Gemini 2.0 Flash
gemini-2.0-flash-001
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON
(hình ảnh và âm thanh sắp ra mắt!)
Cung cấp các tính năng và tốc độ thế hệ mới cho nhiều loại tác vụ
(sẽ sớm tạo ra nhiều phương thức!)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Cung cấp hiệu suất hiệu quả về chi phí và độ trễ thấp; hỗ trợ thông lượng cao
Gemini 1.5 Pro
gemini-1.5-pro-002
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Hỗ trợ các tác vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn; Ngữ cảnh dài 2 triệu
Gemini 1.5 Flash
gemini-1.5-flash-002
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Cung cấp hiệu suất nhanh và linh hoạt trên nhiều tác vụ
Các mô hình Geminichỉ các phiên bản xem trước và thử nghiệm (chỉ nên dùng cho các trường hợp sử dụng nguyên mẫu)
Gemini 2.0 Pro
gemini-2.0-pro-exp-02-05
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Cung cấp chất lượng mô hình tốt nhất, đặc biệt là đối với mã và kiến thức về thế giới; ngữ cảnh dài 2 triệu
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
văn bản, mã, tệp PDF, hình ảnh văn bản, mã, JSON Cung cấp khả năng suy luận mạnh mẽ hơn và đưa quy trình suy nghĩ vào câu trả lời


Phần còn lại của trang này cung cấp thông tin chi tiết về các mô hình mà Vertex AI in Firebase hỗ trợ:

  • So sánh các mô hình:

    • Đầu vào và đầu ra được hỗ trợ
    • So sánh tổng quan về các chức năng được hỗ trợ
    • Thông số kỹ thuật và giới hạn, ví dụ: số lượng mã thông báo đầu vào tối đa hoặc thời lượng tối đa của video đầu vào
  • Nội dung mô tả cách tạo phiên bản cho mô hình, cụ thể là các phiên bản ổn định, tự động cập nhậtxem trước

  • Danh sách tên mô hình có sẵn để đưa vào mã của bạn trong quá trình khởi chạy

  • Danh sách ngôn ngữ được hỗ trợ cho các mẫu

Ở cuối trang này, bạn có thể xem thông tin chi tiết về các mẫu cũ.



So sánh các mô hình

Mỗi mô hình có các chức năng khác nhau để hỗ trợ nhiều trường hợp sử dụng. Xin lưu ý rằng mỗi bảng trong phần này mô tả từng mô hình khi được sử dụng với Vertex AI in Firebase. Mỗi mô hình có thể có các tính năng bổ sung không có sẵn khi sử dụng SDK của chúng tôi.

Nếu không tìm thấy thông tin mình cần trong các tiểu mục sau, bạn có thể tìm thêm thông tin về mô hình Gemini trong tài liệu về Google Cloud.

Đầu vào và đầu ra được hỗ trợ

Đây là các loại đầu vào và đầu ra được hỗ trợ khi sử dụng từng mô hình với Vertex AI in Firebase:

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
Loại dữ liệu đầu vào
Văn bản
Tài liệu
(PDF hoặc văn bản thuần tuý)
Hình ảnh
Video
Âm thanh
Âm thanh (truyền trực tuyến) sắp ra mắt!
Loại đầu ra
Văn bản
Đầu ra có cấu trúc
(như JSON)
Hình ảnh sắp ra mắt!
Âm thanh sắp ra mắt!
Âm thanh (truyền trực tuyến) sắp ra mắt!

Để tìm hiểu về các loại tệp được hỗ trợ, hãy xem phần Các tệp đầu vào được hỗ trợ và yêu cầu đối với Vertex AI Gemini API.

Các tính năng và chức năng được hỗ trợ

Sau đây là các tính năng và chức năng được hỗ trợ khi sử dụng từng mô hình với Vertex AI in Firebase:

<span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
Tạo văn bản từ dữ liệu đầu vào văn bản hoặc đa phương thức
Tạo hình ảnh sắp ra mắt!
Tạo âm thanh sắp ra mắt!
Tạo đầu ra có cấu trúc
(chẳng hạn như JSON)
Phân tích tài liệu
(PDF hoặc văn bản thuần tuý)
Phân tích hình ảnh (thị giác)
Phân tích video (thị giác)
Phân tích âm thanh
Cuộc trò chuyện nhiều lượt
Gọi hàm (công cụ)
Đếm mã thông báo và ký tự có thể tính phí
Hướng dẫn về hệ thống
API Trực tiếp đa phương thức
(truyền trực tuyến hai chiều)
sắp ra mắt!

Thông số kỹ thuật và giới hạn

Dưới đây là thông số kỹ thuật và giới hạn khi sử dụng từng mô hình với Vertex AI in Firebase:

Tài sản <span="notranslate">Gemini
2.0 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
<span="notranslate">Gemini
1.5 Pro </span="notranslate">
<span="notranslate">Gemini
1.5 Flash </span="notranslate">
Cửa sổ ngữ cảnh *
Giới hạn mã thông báo tổng cộng
(kết hợp đầu vào+đầu ra)
2.097.152 mã thông báo 1.048.576 mã thông báo 1.048.576 mã thông báo 1.048.576 mã thông báo 2.097.152 mã thông báo 1.048.576 mã thông báo
Giới hạn mã thông báo đầu ra * 8.192 mã thông báo 8.192 mã thông báo 8.192 mã thông báo 8.192 mã thông báo 8.192 mã thông báo 8.192 mã thông báo
Ngày cắt bớt kiến thức Tháng 6 năm 2024 Tháng 6 năm 2024 Tháng 6 năm 2024 Tháng 6 năm 2024 Tháng 5 năm 2024 Tháng 5 năm 2024
Tệp PDF (theo yêu cầu)
Số lượng tệp PDF đầu vào
tối đa **
3.000 tệp 3.000 tệp 3.000 tệp 3.000 tệp 3.000 tệp 3.000 tệp
Số trang
tối đa trên mỗi tệp PDF đầu vào **
1.000 trang 1.000 trang 1.000 trang 1.000 trang 1.000 trang 1.000 trang
Kích thước tối đa
cho mỗi tệp PDF đầu vào
50 MB 50 MB 50 MB 50 MB 50 MB 50 MB
Hình ảnh (mỗi yêu cầu)
Số lượng hình ảnh đầu vào tối đa
3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh
Số lượng hình ảnh đầu ra
tối đa
--- sắp ra mắt! --- --- --- ---
Kích thước tối đa
cho mỗi hình ảnh đầu vào được mã hoá base64
7 MB 7 MB 7 MB 7 MB 7 MB 7 MB
Video (theo yêu cầu)
Số lượng tệp video đầu vào
tối đa
10 tệp 10 tệp 10 tệp --- 10 tệp 10 tệp
Độ dài tối đa
của tất cả video đầu vào
(chỉ khung hình)
Khoảng 60 phút Khoảng 60 phút Khoảng 60 phút --- Khoảng 60 phút Khoảng 60 phút
Thời lượng tối đa
của tất cả video đầu vào
(khung hình + âm thanh)
Khoảng 45 phút Khoảng 45 phút Khoảng 45 phút --- Khoảng 45 phút Khoảng 45 phút
Âm thanh (theo mỗi yêu cầu)
Số lượng tệp âm thanh đầu vào tối đa
1 tệp 1 tệp 1 tệp --- 1 tệp 1 tệp
Số lượng tệp âm thanh đầu ra
tối đa
--- sắp ra mắt! --- --- --- ---
Độ dài tối đa
của tất cả âm thanh đầu vào
~8,4 giờ ~8,4 giờ ~8,4 giờ --- ~8,4 giờ ~8,4 giờ
Độ dài tối đa
của tất cả âm thanh đầu ra
--- sắp ra mắt! --- --- --- ---

* Đối với tất cả các mô hình, một mã thông báo tương đương với khoảng 4 ký tự, vì vậy, 100 mã thông báo tương đương với khoảng 60-80 từ tiếng Anh. Đối với các mô hình Gemini, bạn có thể xác định tổng số mã thông báo trong các yêu cầu của mình bằng cách sử dụng countTokens.

** Tệp PDF được coi là hình ảnh, vì vậy, một trang của tệp PDF được coi là một hình ảnh. Số trang được phép trong một yêu cầu bị giới hạn ở số lượng hình ảnh mà mô hình có thể hỗ trợ.

Tìm thêm thông tin chi tiết



Mẫu đặt tên và tạo phiên bản mô hình

Các mô hình được cung cấp ở phiên bản ổn định, xem trướcthử nghiệm. Để thuận tiện, các bí danh không có giá trị phiên bản rõ ràng sẽ được hỗ trợ.

Để tìm tên mô hình cụ thể để sử dụng trong mã, hãy xem phần "tên mô hình có sẵn" ở phần sau của trang này.

Loại phiên bản Mô tả Mẫu tên mô hình
Ổn định Các phiên bản Ổn định được coi là Phiên bản phát hành công khai.

Tên mô hình của các phiên bản ổn định được thêm vào bằng một số phiên bản gồm ba chữ số cụ thể

Ví dụ: gemini-2.0-flash-001

Tự động cập nhật bí danh ổn định Các bí danh ổn định tự động cập nhật luôn trỏ đến phiên bản ổn định mới nhất của mô hình đó. Nếu một phiên bản ổn định mới được phát hành, thì bí danh tự động cập nhật sẽ tự động bắt đầu trỏ đến phiên bản ổn định mới đó.

Tên mô hình của bí danh không có phần phụ

Ví dụ: gemini-2.0-flash

Xem trước Phiên bản Xem trước có các tính năng mới và được coi là không ổn định.

Các phiên bản xem trước luôn trỏ đến phiên bản xem trước mới nhất của mô hình đó. Nếu một phiên bản xem trước mới được phát hành, mọi phiên bản xem trước hiện có sẽ tự động bắt đầu trỏ đến phiên bản xem trước mới đó.

Tên mô hình của các phiên bản xem trước được thêm vào bằng -preview cùng với ngày phát hành ban đầu của mô hình (-MMDD)

Ví dụ: gemini-2.0-flash-lite-preview-02-05
(phát hành vào ngày 5 tháng 2 năm 2025)

Thử nghiệm Phiên bản Thử nghiệm có các tính năng mới và được coi là không ổn định cũng như không tuân theo kế hoạch vòng đời mô hình chuẩn và lược đồ phiên bản của Google.

Tìm hiểu thêm về mô hình thử nghiệm.

Tên mô hình của các phiên bản thử nghiệm được thêm vào bằng -exp cùng với ngày phát hành ban đầu của mô hình (-MMDD)

Ví dụ: gemini-2.0-pro-exp-02-05
(phát hành vào ngày 5 tháng 2 năm 2025)

Tìm hiểu thêm về các phiên bản mô hình hiện có và vòng đời của các phiên bản đó (Gemini) trong tài liệu về Google Cloud.



Tên mô hình hiện có

Tên mô hình là các giá trị rõ ràng mà bạn đưa vào mã của mình trong quá trình khởi chạy mô hình tạo sinh (đây là bước bắt buộc để gọi Gemini API).

Bạn có thể sử dụng điểm cuối publishers.models.list để liệt kê tất cả tên mô hình có sẵn. Xin lưu ý rằng danh sách được trả về này sẽ bao gồm tất cả các mô hình mà Vertex AI hỗ trợ, nhưng Vertex AI in Firebase chỉ hỗ trợ các mô hình Gemini được mô tả trên trang này. Ngoài ra, xin lưu ý rằng các bí danh được cập nhật tự động (ví dụ: gemini-2.0-flash) không được liệt kê vì đó là bí danh thuận tiện cho mô hình cơ sở.

Tên mô hình Gemini

Để biết ví dụ về cách khởi chạy cho ngôn ngữ của bạn, hãy xem hướng dẫn bắt đầu sử dụng.

Tên mô hình Gemini 2.0 Pro

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành lần đầu Ngày ngừng cung cấp
Phiên bản ổn định
Không có phiên bản ổn định nào --- --- --- ---
Tự động cập nhật bí danh ổn định
Không có bí danh ổn định được cập nhật tự động --- --- --- ---
Phiên bản xem trước
Không có phiên bản xem trước nào --- --- --- ---
Phiên bản thử nghiệm
gemini-2.0-pro-exp-02-05 Phiên bản thử nghiệm của Gemini 2.0 Pro Thử nghiệm 2025-02-05 Sẽ được xác định sau

Tên mô hình Gemini 2.0 Flash

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành lần đầu Ngày ngừng cung cấp
Phiên bản ổn định
gemini-2.0-flash-001 Phiên bản ổn định mới nhất của Gemini 2.0 Flash Giai đoạn phát hành rộng rãi 2025-02-05 Không sớm hơn
05/02/2026
Tự động cập nhật bí danh ổn định
gemini-2.0-flash Chỉ đến phiên bản ổn định mới nhất của Flash 2.0
(hiện là gemini-2.0-flash-001)
Giai đoạn phát hành rộng rãi 2025-02-10 ---
Phiên bản xem trước
Không có phiên bản xem trước nào --- --- --- ---
Phiên bản thử nghiệm
Không có phiên bản thử nghiệm nào --- --- --- ---

Tên mô hình Gemini 2.0 Flash‑Lite

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành lần đầu Ngày ngừng cung cấp
Phiên bản ổn định
gemini-2.0-flash-lite-001 Phiên bản ổn định mới nhất của Gemini 2.0 Flash‑Lite Giai đoạn phát hành rộng rãi 2025-02-25 Không sớm hơn
25/2/2026
Tự động cập nhật bí danh ổn định
gemini-2.0-flash-lite Chỉ đến phiên bản chính thức mới nhất của 2.0 Flash-Lite
(hiện là gemini-2.0-flash-lite-001)
Giai đoạn phát hành rộng rãi 2025-02-25 ---
Phiên bản xem trước
gemini-2.0-flash-lite-preview-02-05 Phiên bản xem trước của Gemini 2.0 Flash‑Lite Xem trước 2025-02-05 Sẽ được xác định sau
Phiên bản thử nghiệm
Không có phiên bản thử nghiệm nào --- --- --- ---

Tên mô hình Gemini 2.0 Flash‑Thinking

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành lần đầu Ngày ngừng cung cấp
Phiên bản ổn định
Không có phiên bản ổn định nào --- --- --- ---
Tự động cập nhật bí danh ổn định
Không có bí danh ổn định được cập nhật tự động --- --- --- ---
Phiên bản xem trước
Không có phiên bản xem trước nào --- --- --- ---
Phiên bản thử nghiệm
gemini-2.0-flash-thinking-exp-01-21 Phiên bản thử nghiệm của Gemini 2.0 Flash‑Thinking Thử nghiệm 2025-01-21 Sẽ được xác định sau

Tên mô hình Gemini 1.5 Pro

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành lần đầu Ngày ngừng cung cấp
Phiên bản ổn định
gemini-1.5-pro-002 Phiên bản ổn định mới nhất của Gemini 1.5 Pro Giai đoạn phát hành rộng rãi 2024-09-24 Không sớm hơn ngày 24 tháng 9 năm 2025
gemini-1.5-pro-001 Phiên bản ổn định ban đầu của Gemini 1.5 Pro Giai đoạn phát hành rộng rãi 2024-05-24 Không sớm hơn ngày 24 tháng 5 năm 2025
Tự động cập nhật bí danh ổn định
gemini-1.5-pro Chỉ đến phiên bản ổn định mới nhất của 1.5 Pro
(hiện là gemini-1.5-pro-002)
Giai đoạn phát hành rộng rãi 2024-09-24 ---
Phiên bản xem trước
Không có phiên bản xem trước nào --- --- --- ---
Phiên bản thử nghiệm
Không có phiên bản thử nghiệm nào --- --- --- ---

Tên mô hình Gemini 1.5 Flash

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành lần đầu Ngày ngừng cung cấp
Phiên bản ổn định
gemini-1.5-flash-002 Phiên bản ổn định mới nhất của Gemini 1.5 Flash Giai đoạn phát hành rộng rãi 2024-09-24 Không sớm hơn ngày 24 tháng 9 năm 2025
gemini-1.5-flash-001 Phiên bản ổn định ban đầu của Gemini 1.5 Flash Giai đoạn phát hành rộng rãi 2024-05-24 Không sớm hơn ngày 24 tháng 5 năm 2025
Tự động cập nhật bí danh ổn định
gemini-1.5-flash Chỉ đến phiên bản ổn định mới nhất của Flash 1.5
(hiện là gemini-1.5-flash-002)
Giai đoạn phát hành rộng rãi 2024-09-24 ---
Phiên bản xem trước
Không có phiên bản xem trước nào --- --- --- ---
Phiên bản thử nghiệm
Không có phiên bản thử nghiệm nào --- --- --- ---



Ngôn ngữ được hỗ trợ

Gemini

  • Tất cả mô hình Gemini đều có thể hiểu và trả lời bằng các ngôn ngữ sau:

    Tiếng Ả Rập (ar), tiếng Bengali (bn), tiếng Bulgaria (bg), tiếng Trung giản thể và phồn thể (zh), tiếng Croatia (hr), tiếng Séc (cs), tiếng Đan Mạch (da), tiếng Hà Lan (nl), tiếng Anh (en), tiếng Estonia (et), tiếng Phần Lan (fi), tiếng Pháp (fr), tiếng Đức (de), tiếng Hy Lạp (el), tiếng Do Thái (iw), tiếng Hindi (hi), tiếng Hungary (hu), tiếng Indonesia (id), tiếng Ý (it), tiếng Nhật (ja), tiếng Hàn (ko), tiếng Latvia (lv), tiếng Lithuania (lt), tiếng Na Uy (no), tiếng Ba Lan (pl), tiếng Bồ Đào Nha (pt), tiếng Rumani (ro), tiếng Nga (ru), tiếng Serbia (sr), tiếng Slovak (sk), tiếng Slovenia (sl), tiếng Tây Ban Nha (es), tiếng Swahili (sw), tiếng Thuỵ Điển (sv), tiếng Thái (th), tiếng Thổ Nhĩ Kỳ (tr), tiếng Ukraina (uk), tiếng Việt (vi)

  • Mô hình Gemini 2.0 Flash, Gemini 1.5 ProGemini 1.5 Flash có thể hiểu và trả lời bằng các ngôn ngữ bổ sung sau:

    Tiếng Afrikaans (af), tiếng Amharic (am), tiếng Assamese (as), tiếng Azerbaijan (az), tiếng Belarus (be), tiếng Bosnia (bs), tiếng Catalan (ca), tiếng Cebuano (ceb), tiếng Corse (co), tiếng xứ Wales (cy), tiếng Dhivehi (dv), tiếng Esperanto (eo), tiếng Basque (eu), tiếng Ba Tư (fa), tiếng Philippines (Tagalog) (fil), tiếng Frisian (fy), tiếng Ireland (ga), tiếng Gael Scotland (gd), tiếng Galicia (gl), tiếng Gujarati (gu), tiếng Hausa (ha), tiếng Hawaii (haw), tiếng Hmong (hmn), tiếng Haiti Creole (ht), tiếng Armenia (hy), tiếng Igbo (ig), tiếng Iceland (is), tiếng Java (jv), tiếng Gruzia (ka), tiếng Kazakh (kk), tiếng Khmer (km), tiếng Kannada (kn), tiếng Krio (kri), tiếng Kurd (ku), tiếng Kyrgyzstan (ky), tiếng Latin (la), tiếng Luxembourg (lb), tiếng Lào (lo), tiếng Malagasy (mg), tiếng Maori (mi), tiếng Macedonia (mk), tiếng Malayalam (ml), tiếng Mông Cổ (mn), tiếng Meiteilon (Manipuri) (mni-Mtei), tiếng Marathi (mr), tiếng Mã Lai (ms), tiếng Malta (mt), tiếng Myanmar (Miến Điện) (my), tiếng Nepal (ne), tiếng Nyanja (Chichewa) (ny), tiếng Odia (Oriya) (or), tiếng Punjabi (pa), tiếng Pashto (ps), tiếng Sindhi (sd), tiếng Sinhala (Sinhala) (si), tiếng Samoa (sm), tiếng Shona (sn), tiếng Somali (so), tiếng Albania (sq), tiếng Sesotho (st), tiếng Sunda (su), tiếng Tamil (ta), tiếng Telugu (te), tiếng Tajik (tg), tiếng Uyghur (ug), tiếng Urdu (ur), tiếng Uzbek (uz), tiếng Xhosa (xh), tiếng Yiddish (yi), tiếng Yoruba (yo), tiếng Zulu (zu)



Thông tin về các mô hình cũ

Vertex AI in Firebase hỗ trợ tất cả các mô hình Gemini, bao gồm cả các mô hình cũ như Gemini 1.0 ProGemini 1.0 Pro Vision. Tuy nhiên, bạn nên sử dụng một mẫu mới hơn với SDK của chúng tôi. Các mô hình Gemini cũ này sắp ngừng hoạt động và không cung cấp tất cả tính năng của các mô hình mới hơn.



Các bước tiếp theo

Thử các tính năng của Gemini API