احتساب الرموز المميزة لنماذج Gemini

تعالج نماذج Gemini المدخلات والمخرجات في وحدات تُعرف باسم الرموز المميزة.

يمكن أن تكون الرموز المميزة أحرفًا مفردة مثل z أو كلمات كاملة مثل cat. يتم تقسيم الكلمات الطويلة إلى عدة رموز مميزة. تُعرف مجموعة جميع الرموز المميزة التي يستخدمها النموذج باسم المفردات، وتُعرف عملية تقسيم النص إلى رموز مميزة باسم التقطيع إلى رموز مميزة.

بالنسبة إلى طُرز Gemini، يعادل الرمز المميز حوالي 4 أحرف. يساوي 100 رمز مميز حوالي 60 إلى 80 كلمة إنجليزية.

يحتوي كل نموذج على الحد الأقصى لعدد الرموز المميزة التي يمكنه معالجتها في الطلب والاستجابة. من خلال معرفة عدد الرموز المميزة في طلبك، يمكنك معرفة ما إذا كنت قد تجاوزت هذا الحدّ. بالإضافة إلى ذلك، يتم تحديد تكلفة الطلب جزئيًا من خلال عدد الرموز المميزة للإدخال والإخراج، لذا قد يكون من المفيد معرفة كيفية احتساب الرموز المميزة.

يُرجى العِلم أنّ الطرازَين Gemini 1.0 و1.5 كانا يتيحان أيضًا احتساب "الأحرف القابلة للفوترة" وتحديد أسعارها، ولكن بما أنّ هذه الطُرز إما تم إيقافها نهائيًا أو سيتم إيقافها قريبًا، لا تتضمّن هذه الصفحة أي معلومات حول الأحرف القابلة للفوترة.

النماذج المتوافقة

  • gemini-2.5-pro
  • gemini-2.5-flash
  • gemini-2.5-flash-lite
  • gemini-2.0-flash-001 (والاسم المستعار gemini-2.0-flash الذي يتم تعديله تلقائيًا)
  • gemini-2.0-flash-lite-001 (والاسم المستعار الذي يتم تعديله تلقائيًا gemini-2.0-flash-lite)
  • gemini-2.0-flash-preview-image-generation

خيارات احتساب الرموز المميزة

يتم تقسيم جميع المدخلات والمخرجات الخاصة بـ Gemini API إلى رموز مميزة، بما في ذلك النصوص وملفات الصور وغيرها من الوسائط غير النصية. في ما يلي خيارات احتساب الرموز المميزة:

تحقَّق من عدد الرموز المميّزة لطلباتك فقط (قبل إرسالها إلى النموذج).
استدعِ الدالة countTokens مع إدخال الطلب قبل إرساله إلى النموذج. تعرض هذه الدالة ما يلي:
  • total_tokens: عدد الرموز المميزة للمدخلات فقط
تحقَّق من عدد الرموز المميزة لكلّ من طلباتك وردودك.
استخدِم السمة usageMetadata في عنصر الردّ. ويشمل ذلك:
  • prompt_token_count: عدد الرموز المميزة في الإدخال فقط
  • candidates_token_count: عدد الرموز المميزة في الناتج فقط (لا يشمل الرموز المميزة الخاصة بالتفكير)
  • thoughts_token_count: عدد الرموز المميزة الخاصة بالتفكير المستخدَمة لإنشاء الرد
  • total_token_count: إجمالي عدد الرموز المميّزة لكلّ من الإدخال والإخراج (بما في ذلك أي رموز مميّزة خاصة بالتفكير)

عند بث الناتج، لا تظهر السمة usageMetadata إلا في آخر جزء من البث. يتم استخدام nil مع الأجزاء المتوسطة.

تجدُر الإشارة إلى النقاط التالية بشأن الخيارات المذكورة أعلاه:

  • لن يتم احتساب عدد الصور المدخلة أو عدد الثواني في ملفات الفيديو أو الملفات الصوتية المدخلة. ومع ذلك، فإنّ عدد الرموز المميزة لكل من هذه الوسائط سيتناسب طرديًا مع هذه القيم.
  • يشمل عدد الرموز المميزة للإدخال الطلب (النص وأي ملفات إدخال) بالإضافة إلى أي تعليمات وأدوات خاصة بالنظام.
  • لا يتضمّن عدد الرموز المميزة للناتج أي رموز مميزة خاصة بالتفكير، بل يتم توفيرها في حقل منفصل.
  • راجِع المعلومات الإضافية الخاصة بكل نوع من الطلبات لاحقًا في هذه الصفحة.

أسعار هذه الخيارات

  • الاتصال countTokens: لا يتم تحصيل أي رسوم مقابل الاتصال countTokens (واجهة برمجة التطبيقات Count Tokens). الحد الأقصى للحصة المتاحة لواجهة برمجة التطبيقات Count Tokens هو 3,000 طلب في الدقيقة.

  • استخدام السمة usageMetadata: يتم عرض هذه السمة دائمًا كجزء من الاستجابة ولا تتسبّب في أي رموز مميّزة أو رسوم.

معلومات إضافية

في ما يلي بعض المعلومات الإضافية عند التعامل مع أنواع معيّنة من الطلبات.

احتساب الرموز المميزة للإدخال النصي

لا تتوفّر معلومات إضافية.

احتساب الرموز المميزة المتعددة الدورات (المحادثة)

يُرجى ملاحظة ما يلي عند الاتصال بـ countTokens أثناء استخدام المحادثة:

  • إذا طلبت countTokens مع سجلّ المحادثات، سيتم عرض إجمالي عدد الرموز المميزة من كلا الدورين في المحادثة (total_tokens).
  • لمعرفة حجم المحادثة التالية، عليك إضافتها إلى السجلّ عند طلب countTokens.

عدّ الرموز المميزة للإدخال المتعدد الوسائط

تجدُر الإشارة إلى النقاط التالية حول احتساب الرموز المميزة باستخدام الإدخال المتعدّد الوسائط:

  • يمكنك اختياريًا استدعاء countTokens على النص والملف بشكل منفصل.
  • بالنسبة إلى خيارَي احتساب الرموز المميزة، ستحصل على عدد الرموز المميزة نفسه سواء قدّمت الملف كبيانات مضمّنة أو باستخدام عنوان URL الخاص به.

ملفات إدخال الصور

يتم تحويل ملفات إدخال الصور إلى رموز مميزة استنادًا إلى أبعادها:

  • مدخلات الصور التي يقل كلا بُعدَيها عن 384 بكسل أو يساويهما: يتم احتساب 258 رمزًا مميزًا لكل صورة.
  • مدخلات الصور التي تكون أكبر في أحد البُعدَين أو كليهما: يتم اقتصاص كل صورة وتغيير حجمها حسب الحاجة إلى مربعات بحجم 768 × 768 بكسل، ثم يتم احتساب كل مربع على أنّه 258 رمزًا مميزًا.

ملفات إدخال الفيديو والصوت

يتم تحويل ملفات إدخال الفيديو والصوت إلى رموز مميزة بمعدلات ثابتة على النحو التالي:

  • الفيديو: 263 رمزًا مميزًا في الثانية
  • الصوت: 32 رمزًا مميزًا في الثانية

ملفات إدخال المستندات (مثل ملفات PDF)

يتم التعامل مع ملفات PDF المدخلة على أنّها صور، لذا يتم تقسيم كل صفحة من ملف PDF إلى رموز مميزة بالطريقة نفسها التي يتم بها تقسيم الصور.