Watch demos on how to build & run AI-powered apps with Firebase at Demo Day '24. Watch now.

Ta strona została przetłumaczona przez Cloud Translation API.

Liczenie tokenów i znaków podlegających rozliczeniu

Modele generatywnej AI (takie jak modele Gemini) dzielą dane na jednostki zwane tokenami w celu ich przetwarzania. Każdy model Gemini ma maksymalną liczbę tokenów, które może obsłużyć w promptach i odpowiedziach.

Na tej stronie dowiesz się, jak oszacować liczbę tokenów i liczbę znaków podlegających rozliczeniu w prośbie.

Jakie informacje są podawane w liczbie?

Pamiętaj o tych kwestiach dotyczących zliczania tokenów i znaków podlegających opłacie:

Zliczanie łącznej liczby tokenów
- Ta liczba pomaga upewnić się, że żądania nie przekraczają dozwolonego okna kontekstu.
- Liczba tokenów będzie odzwierciedlać rozmiar wszystkich plików (np. obrazów), które są dostarczane w ramach danych wejściowych żądania. Nie będzie ona uwzględniać liczby obrazów ani liczby sekund w filmie.
- W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom. 100 tokenów to około 60–80 słów w języku angielskim.
Liczenie łącznej liczby znaków podlegających opłacie
- Ta liczba jest przydatna do zrozumienia i kontrolowania kosztów, ponieważ w przypadku Vertex AI liczba znaków jest uwzględniana w obliczeniach cen.
- Liczba znaków podlegających rozliczeniu będzie odpowiadać liczbie znaków w tekście podanym w ramach danych wejściowych żądania.

W przypadku Vertex AI tokeny nie są uwzględniane w obliczeniach cen. Dowiedz się więcej o limitach tokenów na model i cenach na model.

Ceny i limity dotyczące zliczania tokenów i znaków podlegających opłacie

Korzystanie z interfejsu API CountTokens nie wiąże się z opłatami ani ograniczeniami dotyczącymi limitu. Maksymalny limit interfejsu API CountTokens to 3000 żądań na minutę.

Liczenie tokenów i znaków podlegających rozliczeniu

Jakie informacje są podawane w liczbie?

Ceny i limity dotyczące zliczania tokenów i znaków podlegających opłacie

Przykładowe fragmenty kodu

Dane wejściowe tylko z tekstem

Dane wejściowe multimodalne