Liczenie tokenów i znaków podlegających rozliczeniu


Modele generatywnej AI (takie jak modele Gemini) rozkładają dane na jednostki nazywane tokeny do przetworzenia. Każdy model Gemini ma maksymalną liczbę tokenów, które może obsłużyć w promptach i odpowiedziach.

Na tej stronie dowiesz się, jak oszacować liczbę tokenów i liczbę płatne znaki w żądaniu.

Jakie informacje zawiera liczba?

Pamiętaj o liczeniu tokenów i znaków podlegających rozliczeniu:

  • Zliczanie łącznej liczby tokenów

    • Ta liczba pomaga upewnić się, że żądania nie przekraczają dozwolonego okna kontekstu.

    • Liczba tokenów będzie odzwierciedlać rozmiar wszystkich plików (np. obrazów), które są dostarczane jako część danych wejściowych żądania. Nie będzie ona uwzględniać liczby obrazów ani liczby sekund w filmie.

    • W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom. 100 tokeny składają się z około 60–80 słów w języku angielskim.

  • Liczenie łącznej liczby znaków podlegających opłacielności

    • Ta liczba jest przydatna do zrozumienia i kontrolowania kosztów, ponieważ w przypadku Vertex AI liczba znaków jest uwzględniana w obliczeniach cen.

    • Liczba znaków podlegających rozliczeniu będzie odpowiadać liczbie znaków w tekście podanym w ramach danych wejściowych żądania.

W przypadku Vertex AI tokeny nie są uwzględniane przy obliczaniu cen. Więcej informacji o limity tokenów na model i cenę dla danego modelu.

Ceny i limity dotyczące zliczania tokenów i znaków podlegających opłacie

Korzystanie z interfejsu API CountTokens nie wiąże się z żadnymi opłatami ani ograniczeniami. maksymalny limit dla interfejsu API CountTokens wynosi 3000 żądań na minutę.

Przykładowe fragmenty kodu

Dane tekstowe

Wprowadzanie wielomodalne