Đối với ứng dụng di động và web, SDK Vertex AI in Firebase cho phép bạn tương tác với các mô hình Gemini được hỗ trợ ngay trong ứng dụng.
Mô hình Gemini được coi là đa phương thức vì có khả năng xử lý và thậm chí tạo nhiều phương thức, bao gồm văn bản, mã, tệp PDF, hình ảnh, video và âm thanh.
Dưới đây là thông tin tổng quan ngắn gọn về các mô hình được hỗ trợ cho Vertex AI in Firebase và các phiên bản ổn định mới nhất của các mô hình đó. Các phần sau trên trang này cung cấp thông tin và thông tin so sánh chi tiết hơn.
Mô hình | Mục nhập | Đầu ra | Được tối ưu hoá cho |
---|---|---|---|
Mô hình Gemini | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON (hình ảnh và âm thanh sắp ra mắt!) |
Các tính năng, tốc độ và phương thức tạo đa phương thức thế hệ mới cho nhiều loại tác vụ |
Gemini 1.5 Progemini-1.5-pro-002 |
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Các nhiệm vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn |
Gemini 1.5 Flashgemini-1.5-flash-002 |
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Hiệu suất nhanh và linh hoạt trên nhiều tác vụ |
Phần còn lại của trang này cung cấp thông tin chi tiết về các mô hình mà Vertex AI in Firebase hỗ trợ:
-
- Đầu vào và đầu ra được hỗ trợ
- So sánh tổng quan về các chức năng được hỗ trợ
- Thông số kỹ thuật và giới hạn, ví dụ: số lượng mã thông báo đầu vào tối đa hoặc thời lượng tối đa của video đầu vào
Nội dung mô tả cách tạo phiên bản cho mô hình, cụ thể là các phiên bản ổn định, tự động cập nhật và xem trước
Danh sách tên mô hình có sẵn để đưa vào mã của bạn trong quá trình khởi chạy
Danh sách ngôn ngữ được hỗ trợ cho các mẫu
Ở cuối trang này, bạn có thể xem thông tin chi tiết về các mẫu cũ.
So sánh các mô hình
Mỗi mô hình có các chức năng khác nhau để hỗ trợ nhiều trường hợp sử dụng. Xin lưu ý rằng mỗi bảng trong phần này mô tả từng mô hình khi được sử dụng với Vertex AI in Firebase. Mỗi mô hình có thể có các tính năng bổ sung không có sẵn khi sử dụng SDK của chúng tôi.
Bạn có thể tìm hiểu thêm về từng mô hình Gemini trong tài liệu về Google Cloud.
Đầu vào và đầu ra được hỗ trợ
Đây là các loại đầu vào và đầu ra được hỗ trợ khi sử dụng từng mô hình với Vertex AI in Firebase:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Loại dữ liệu đầu vào | ||||
Văn bản | ||||
Mã | ||||
Tài liệu (PDF hoặc văn bản thuần tuý) | ||||
Hình ảnh, video và âm thanh | ||||
Âm thanh (truyền trực tuyến) | sắp ra mắt! | |||
Loại đầu ra | ||||
Văn bản | ||||
Đầu ra có cấu trúc (như JSON) | ||||
Mã | ||||
Hình ảnh | sắp ra mắt! | |||
Âm thanh | sắp ra mắt! | |||
Âm thanh (truyền trực tuyến) | sắp ra mắt! |
Để tìm hiểu về các loại tệp được hỗ trợ, hãy xem phần Các tệp đầu vào được hỗ trợ và yêu cầu đối với Vertex AI Gemini API.
Các tính năng và chức năng được hỗ trợ
Sau đây là các tính năng và chức năng được hỗ trợ khi sử dụng từng mô hình với Vertex AI in Firebase:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Tạo văn bản từ dữ liệu đầu vào văn bản hoặc đa phương thức | ||||
Tạo hình ảnh | sắp ra mắt! | |||
Tạo âm thanh | sắp ra mắt! | |||
Tạo đầu ra có cấu trúc (như JSON) | ||||
Phân tích hình ảnh và video (thị giác) | ||||
Phân tích âm thanh | ||||
Phân tích tài liệu (PDF hoặc văn bản thuần tuý) | ||||
Cuộc trò chuyện nhiều lượt | ||||
Lệnh gọi hàm (công cụ) | ||||
Lệnh gọi hàm cơ bản | ||||
Lệnh gọi hàm song song | ||||
Chế độ gọi hàm | ||||
Đếm mã thông báo và ký tự có thể tính phí | ||||
Hướng dẫn về hệ thống | ||||
API Trực tiếp đa phương thức (truyền trực tuyến hai chiều) | sắp ra mắt! |
Thông số kỹ thuật và giới hạn
Dưới đây là thông số kỹ thuật và giới hạn khi sử dụng từng mô hình với Vertex AI in Firebase:
Thuộc tính | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
Cửa sổ ngữ cảnh * Giới hạn tổng số mã thông báo (kết hợp đầu vào + đầu ra) |
1.048.576 mã thông báo | 2.097.152 mã thông báo | 1.048.576 mã thông báo |
Giới hạn mã thông báo đầu ra * | 8.192 mã thông báo | 8.192 mã thông báo | 8.192 mã thông báo |
Ngày cắt bớt kiến thức | Tháng 6 năm 2024 | Tháng 5 năm 2024 | Tháng 5 năm 2024 |
Hình ảnh (mỗi yêu cầu) | |||
Số lượng hình ảnh đầu vào tối đa | 3.000 hình ảnh | 3.000 hình ảnh | 3.000 hình ảnh |
Số lượng hình ảnh đầu ra tối đa | sắp ra mắt! | --- | --- |
Kích thước tối đa cho mỗi hình ảnh đầu vào được mã hoá base64 | 7 MB | 7 MB | 7 MB |
Tệp PDF (theo yêu cầu) | |||
Số lượng tệp PDF đầu vào tối đa ** | 3.000 tệp | 3.000 tệp | 3.000 tệp |
Số trang tối đa trên mỗi tệp PDF đầu vào ** | 1.000 trang | 1.000 trang | 1.000 trang |
Kích thước tối đa của mỗi tệp PDF đầu vào | 50 MB | 50 MB | 50 MB |
Video (theo yêu cầu) | |||
Số lượng tệp video đầu vào tối đa | 10 tệp | 10 tệp | 10 tệp |
Thời lượng tối đa của tất cả video đầu vào (chỉ khung hình) | Khoảng 60 phút | Khoảng 60 phút | Khoảng 60 phút |
Thời lượng tối đa của tất cả video đầu vào (khung hình + âm thanh) | Khoảng 45 phút | Khoảng 45 phút | Khoảng 45 phút |
Âm thanh (theo mỗi yêu cầu) | |||
Số lượng tệp âm thanh đầu vào tối đa | 1 tệp | 1 tệp | 1 tệp |
Số tệp âm thanh đầu ra tối đa | sắp ra mắt! | --- | --- |
Thời lượng tối đa của tất cả âm thanh đầu vào | ~8,4 giờ | ~8,4 giờ | ~8,4 giờ |
Độ dài tối đa của tất cả âm thanh đầu ra | sắp ra mắt! | --- | --- |
* Đối với tất cả các mô hình, một mã thông báo tương đương với khoảng 4 ký tự, vì vậy, 100 mã thông báo tương đương với khoảng 60 đến 80 từ tiếng Anh. Đối với các mô hình Gemini, bạn có thể xác định tổng số mã thông báo trong các yêu cầu của mình bằng cách sử dụng countTokens
.
** Tệp PDF được coi là hình ảnh, vì vậy, một trang của tệp PDF được coi là một hình ảnh. Số trang được phép trong một yêu cầu bị giới hạn ở số lượng hình ảnh mà mô hình có thể hỗ trợ.
Tìm thêm thông tin chi tiết
Hạn mức và giá khác nhau tuỳ theo từng mô hình. Giá cũng phụ thuộc vào dữ liệu đầu vào và đầu ra.
Tìm hiểu về các loại tệp đầu vào được hỗ trợ, cách chỉ định loại MIME và cách đảm bảo rằng các tệp đầu vào và yêu cầu đa phương thức của bạn đáp ứng các yêu cầu và tuân theo các phương pháp hay nhất trong phần Các tệp đầu vào được hỗ trợ và yêu cầu đối với Vertex AI Gemini API.
Mẫu đặt tên và tạo phiên bản mô hình
Các mô hình được cung cấp ở phiên bản ổn định, tự động cập nhật và xem trước.
Phiên bản Ổn định được coi là Phát hành công khai.
- Các phiên bản ổn định có tên mô hình được thêm vào một số phiên bản gồm ba chữ số cụ thể, ví dụ:
.gemini-2.0-flash-001
- Các phiên bản ổn định có tên mô hình được thêm vào một số phiên bản gồm ba chữ số cụ thể, ví dụ:
Các phiên bản tự động cập nhật luôn trỏ đến phiên bản bản ổn định mới nhất của mô hình đó; nếu một phiên bản ổn định mới được phát hành, thì phiên bản tự động cập nhật sẽ tự động bắt đầu trỏ đến phiên bản ổn định mới đó.
- Các phiên bản tự động cập nhật có tên mô hình không có phần đuôi, ví dụ:
.gemini-2.0-flash
- Các phiên bản tự động cập nhật có tên mô hình không có phần đuôi, ví dụ:
Phiên bản Xem trước có các tính năng mới và được coi là chưa ổn định. Xin lưu ý rằng các phiên bản xem trước luôn trỏ đến phiên bản xem trước mới nhất của mô hình đó; nếu một phiên bản xem trước mới được phát hành, mọi phiên bản xem trước hiện có sẽ tự động bắt đầu trỏ đến phiên bản xem trước mới đó.
- Các phiên bản xem trước có tên mô hình được thêm vào bằng
cùng với ngày phát hành ban đầu của mô hình (-preview
), ví dụ:-MMDD
(phát hành vào ngày 9 tháng 4 năm 2024).gemini-1.5-pro-preview-0409
- Các phiên bản xem trước có tên mô hình được thêm vào bằng
Tìm hiểu thêm về các phiên bản mô hình hiện có và vòng đời của các phiên bản đó (Gemini) trong tài liệu về Google Cloud.
Tên mô hình hiện có
Tên mô hình là các giá trị rõ ràng mà bạn đưa vào mã của mình trong quá trình khởi chạy mô hình tạo sinh (đây là bước bắt buộc để gọi Gemini API).
Bạn có thể sử dụng điểm cuối publishers.models.list
để liệt kê tất cả tên mô hình có sẵn. Xin lưu ý rằng danh sách được trả về này sẽ bao gồm tất cả các mô hình mà Vertex AI hỗ trợ, nhưng Vertex AI in Firebase chỉ hỗ trợ các mô hình Gemini được mô tả trên trang này.
Ngoài ra, xin lưu ý rằng các phiên bản tự động cập nhật (ví dụ: gemini-2.0-flash
) không được liệt kê vì đây là bí danh thuận tiện cho mô hình ổn định cơ sở.
Tên mô hình Gemini
Để biết ví dụ về cách khởi chạy cho ngôn ngữ của bạn, hãy xem hướng dẫn bắt đầu sử dụng.
Tên mô hình Gemini 2.0 Flash
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành lần đầu | Ngày ngừng cung cấp |
---|---|---|---|---|
Phiên bản ổn định | ||||
gemini-2.0-flash-001 |
Phiên bản ổn định mới nhất của Gemini 2.0 Flash | Giai đoạn phát hành rộng rãi | 2025-02-05 | Sẽ được xác định sau |
Phiên bản tự động cập nhật | ||||
gemini-2.0-flash |
Chỉ đến phiên bản ổn định mới nhất của Flash 2.0 (hiện là gemini-2.0-flash-001 |
Giai đoạn phát hành rộng rãi | 2025-02-10 | --- |
Tên mô hình Gemini 1.5 Pro
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành lần đầu | Ngày ngừng cung cấp |
---|---|---|---|---|
Phiên bản ổn định | ||||
gemini-1.5-pro-002 |
Phiên bản ổn định mới nhất của Gemini 1.5 Pro | Giai đoạn phát hành rộng rãi | 2024-09-24 | Không sớm hơn ngày 24 tháng 9 năm 2025 |
gemini-1.5-pro-001 |
Phiên bản ổn định ban đầu của Gemini 1.5 Pro | Giai đoạn phát hành rộng rãi | 2024-05-24 | Không sớm hơn ngày 24 tháng 5 năm 2025 |
Phiên bản tự động cập nhật | ||||
gemini-1.5-pro |
Chỉ đến phiên bản ổn định mới nhất của 1.5 Pro (hiện là gemini-1.5-pro-002 |
Giai đoạn phát hành rộng rãi | 2024-09-24 | --- |
Tên mô hình Gemini 1.5 Flash
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành lần đầu | Ngày ngừng cung cấp |
---|---|---|---|---|
Phiên bản ổn định | ||||
gemini-1.5-flash-002 |
Phiên bản ổn định mới nhất của Gemini 1.5 Flash | Giai đoạn phát hành rộng rãi | 2024-09-24 | Không sớm hơn ngày 24 tháng 9 năm 2025 |
gemini-1.5-flash-001 |
Phiên bản ổn định ban đầu của Gemini 1.5 Flash | Giai đoạn phát hành rộng rãi | 2024-05-24 | Không sớm hơn ngày 24 tháng 5 năm 2025 |
Phiên bản tự động cập nhật | ||||
gemini-1.5-flash |
Chỉ đến phiên bản ổn định mới nhất của Flash 1.5 (hiện là gemini-1.5-flash-002 |
Giai đoạn phát hành rộng rãi | 2024-09-24 | --- |
Ngôn ngữ được hỗ trợ
Gemini
Tất cả mô hình Gemini đều có thể hiểu và trả lời bằng các ngôn ngữ sau:
Tiếng Ả Rập (ar), tiếng Bengali (bn), tiếng Bulgaria (bg), tiếng Trung giản thể và phồn thể (zh), tiếng Croatia (hr), tiếng Séc (cs), tiếng Đan Mạch (da), tiếng Hà Lan (nl), tiếng Anh (en), tiếng Estonia (et), tiếng Phần Lan (fi), tiếng Pháp (fr), tiếng Đức (de), tiếng Hy Lạp (el), tiếng Do Thái (iw), tiếng Hindi (hi), tiếng Hungary (hu), tiếng Indonesia (id), tiếng Ý (it), tiếng Nhật (ja), tiếng Hàn (ko), tiếng Latvia (lv), tiếng Lithuania (lt), tiếng Na Uy (no), tiếng Ba Lan (pl), tiếng Bồ Đào Nha (pt), tiếng Rumani (ro), tiếng Nga (ru), tiếng Serbia (sr), tiếng Slovak (sk), tiếng Slovenia (sl), tiếng Tây Ban Nha (es), tiếng Swahili (sw), tiếng Thuỵ Điển (sv), tiếng Thái (th), tiếng Thổ Nhĩ Kỳ (tr), tiếng Ukraina (uk), tiếng Việt (vi)
Mô hình Gemini 1.5 Pro và Gemini 1.5 Flash có thể hiểu và trả lời bằng các ngôn ngữ bổ sung sau:
Tiếng Afrikaans (af), tiếng Amharic (am), tiếng Assamese (as), tiếng Azerbaijan (az), tiếng Belarus (be), tiếng Bosnia (bs), tiếng Catalan (ca), tiếng Cebuano (ceb), tiếng Corse (co), tiếng xứ Wales (cy), tiếng Dhivehi (dv), tiếng Esperanto (eo), tiếng Basque (eu), tiếng Ba Tư (fa), tiếng Philippines (Tagalog) (fil), tiếng Frisian (fy), tiếng Ireland (ga), tiếng Gael Scotland (gd), tiếng Galicia (gl), tiếng Gujarati (gu), tiếng Hausa (ha), tiếng Hawaii (haw), tiếng Hmong (hmn), tiếng Haiti Creole (ht), tiếng Armenia (hy), tiếng Igbo (ig), tiếng Iceland (is), tiếng Java (jv), tiếng Gruzia (ka), tiếng Kazakh (kk), tiếng Khmer (km), tiếng Kannada (kn), tiếng Krio (kri), tiếng Kurd (ku), tiếng Kyrgyzstan (ky), tiếng Latin (la), tiếng Luxembourg (lb), tiếng Lào (lo), tiếng Malagasy (mg), tiếng Maori (mi), tiếng Macedonia (mk), tiếng Malayalam (ml), tiếng Mông Cổ (mn), tiếng Meiteilon (Manipuri) (mni-Mtei), tiếng Marathi (mr), tiếng Mã Lai (ms), tiếng Malta (mt), tiếng Myanmar (Miến Điện) (my), tiếng Nepal (ne), tiếng Nyanja (Chichewa) (ny), tiếng Odia (Oriya) (or), tiếng Punjabi (pa), tiếng Pashto (ps), tiếng Sindhi (sd), tiếng Sinhala (Sinhala) (si), tiếng Samoa (sm), tiếng Shona (sn), tiếng Somali (so), tiếng Albania (sq), tiếng Sesotho (st), tiếng Sunda (su), tiếng Tamil (ta), tiếng Telugu (te), tiếng Tajik (tg), tiếng Uyghur (ug), tiếng Urdu (ur), tiếng Uzbek (uz), tiếng Xhosa (xh), tiếng Yiddish (yi), tiếng Yoruba (yo), tiếng Zulu (zu)
Thông tin về các mô hình cũ
Vertex AI in Firebase hỗ trợ tất cả các mô hình Gemini, bao gồm cả các mô hình cũ như Gemini 1.0 Pro và Gemini 1.0 Pro Vision. Tuy nhiên, bạn nên sử dụng một mẫu mới hơn với SDK của chúng tôi. Các mô hình Gemini cũ này sắp ngừng hoạt động và không cung cấp tất cả chức năng của các mô hình mới hơn.
Các bước tiếp theo
Thử các tính năng của Gemini API
- Xây dựng cuộc trò chuyện nhiều lượt (trò chuyện).
- Tạo văn bản từ lời nhắc chỉ có văn bản.
- Tạo văn bản từ câu lệnh đa phương thức (bao gồm văn bản, hình ảnh, tệp PDF, video và âm thanh).
- Tạo kết quả có cấu trúc (như JSON) từ cả lời nhắc bằng văn bản và đa phương thức.
- Sử dụng tính năng gọi hàm để kết nối các mô hình tạo sinh với hệ thống và thông tin bên ngoài.