ভাবছেন

জেমিনি 2.5 মডেলগুলি একটি অভ্যন্তরীণ "চিন্তা প্রক্রিয়া" ব্যবহার করতে পারে যা তাদের যুক্তি এবং বহু-পদক্ষেপ পরিকল্পনা ক্ষমতাকে উল্লেখযোগ্যভাবে উন্নত করে, যা কোডিং, উন্নত গণিত এবং ডেটা বিশ্লেষণের মতো জটিল কাজগুলির জন্য অত্যন্ত কার্যকর করে তোলে।

চিন্তাভাবনা বাজেট ব্যবহার করে একটি মডেল কতটা চিন্তাভাবনা করতে পারে তা আপনি কনফিগার করতে পারেন। এই কনফিগারেশনটি বিশেষভাবে গুরুত্বপূর্ণ যদি লেটেন্সি বা খরচ কমানো একটি অগ্রাধিকার হয়। এছাড়াও, একটি মডেলের চিন্তা করার ক্ষমতা কতটা প্রয়োজন হতে পারে তা নির্ধারণ করতে কাজের অসুবিধাগুলির তুলনা পর্যালোচনা করুন।

একটি চিন্তা মডেল ব্যবহার করুন

আপনি যেমন অন্য যেমিনি মডেল ব্যবহার করেন ঠিক তেমনি একটি চিন্তার মডেল ব্যবহার করুন (আপনার নির্বাচিত জেমিনি API প্রদানকারীকে শুরু করুন, একটি GenerativeModel উদাহরণ তৈরি করুন ইত্যাদি)। এই মডেলগুলি পাঠ্য বা কোড তৈরির কাজগুলির জন্য ব্যবহার করা যেতে পারে, যেমন কাঠামোগত আউটপুট তৈরি করা বা মাল্টিমোডাল ইনপুট বিশ্লেষণ করা (যেমন ছবি , ভিডিও , অডিও , বা পিডিএফ )। আপনি যখন আউটপুট স্ট্রিম করছেন তখন আপনি চিন্তার মডেলগুলিও ব্যবহার করতে পারেন।

সমর্থিত মডেল

শুধুমাত্র জেমিনি 2.5 মডেল এই ক্ষমতা সমর্থন করে।

  • gemini-2.5-pro
  • gemini-2.5-flash
  • gemini-2.5-flash-lite-preview-06-17

চিন্তা মডেল ব্যবহার করার জন্য সর্বোত্তম অনুশীলন

আমরা Google AI স্টুডিও বা Vertex AI স্টুডিওতে আপনার প্রম্পট পরীক্ষা করার পরামর্শ দিই যেখানে আপনি সম্পূর্ণ চিন্তা প্রক্রিয়া দেখতে পারেন। আপনি যেকোন ক্ষেত্র সনাক্ত করতে পারেন যেখানে মডেলটি বিপথে চলে গেছে যাতে আপনি আরও সামঞ্জস্যপূর্ণ এবং সঠিক প্রতিক্রিয়া পেতে আপনার প্রম্পটগুলিকে পরিমার্জন করতে পারেন৷

একটি সাধারণ প্রম্পট দিয়ে শুরু করুন যা পছন্দসই ফলাফল বর্ণনা করে, এবং এটি কীভাবে প্রতিক্রিয়া নির্ধারণ করে সে সম্পর্কে মডেলের প্রাথমিক চিন্তাভাবনাগুলি পর্যবেক্ষণ করুন। প্রতিক্রিয়া আশানুরূপ না হলে, নিম্নলিখিত প্রম্পটিং কৌশলগুলি ব্যবহার করে মডেলটিকে আরও ভাল প্রতিক্রিয়া তৈরি করতে সহায়তা করুন:

  • ধাপে ধাপে নির্দেশাবলী প্রদান করুন
  • ইনপুট-আউটপুট জোড়ার কয়েকটি উদাহরণ দিন
  • আউটপুট এবং প্রতিক্রিয়াগুলি কীভাবে বাক্যাংশ করা উচিত এবং ফর্ম্যাট করা উচিত তার জন্য নির্দেশিকা প্রদান করুন
  • নির্দিষ্ট যাচাইকরণ পদক্ষেপ প্রদান করুন

অনুরোধ করার পাশাপাশি, এই সুপারিশগুলি ব্যবহার করার কথা বিবেচনা করুন:

  • সিস্টেম নির্দেশাবলী সেট করুন, যেটি একটি "প্রস্তাবনা" এর মতো যা আপনি মডেলটি প্রম্পট বা শেষ ব্যবহারকারীর কাছ থেকে আরও নির্দেশাবলীর সংস্পর্শে আসার আগে যোগ করেন৷ তারা আপনাকে আপনার নির্দিষ্ট চাহিদা এবং ব্যবহারের ক্ষেত্রের উপর ভিত্তি করে মডেলের আচরণ পরিচালনা করতে দেয়।

  • মডেলটি কতটা চিন্তাভাবনা করতে পারে তা কনফিগার করতে একটি চিন্তার বাজেট সেট করুন। যদি আপনি একটি কম বাজেট সেট করেন, তাহলে মডেলটি তার প্রতিক্রিয়া "অতিরিক্ত চিন্তা" করবে না। আপনি যদি একটি উচ্চ বাজেট নির্ধারণ করেন, তাহলে প্রয়োজনে মডেলটি আরও চিন্তা করতে পারে। একটি চিন্তা বাজেট সেট করা প্রকৃত প্রতিক্রিয়ার জন্য মোট টোকেন আউটপুট সীমার বেশি সংরক্ষণ করে।

  • (যদি Vertex AI Gemini API ব্যবহার করেন) Firebase কনসোলে AI মনিটরিং সক্ষম করার বিষয়টি নিশ্চিত করুন যাতে আপনি আপনার অনুরোধগুলির লেটেন্সি নিরীক্ষণ করতে পারেন যাতে চিন্তাভাবনা সক্ষম হয়েছে৷ মনে রাখবেন যে মনিটরিং ড্যাশবোর্ডগুলিতে চিন্তার টোকেনগুলি এখনও প্রদর্শিত হয় না৷

চিন্তার বাজেট নিয়ন্ত্রণ করুন

মডেলটি তার প্রতিক্রিয়া তৈরি করতে কতটা চিন্তাভাবনা করতে পারে তা নিয়ন্ত্রণ করতে, আপনি এটি ব্যবহার করার জন্য অনুমোদিত বাজেট টোকেনের সংখ্যা নির্দিষ্ট করতে পারেন।

আপনি এমন পরিস্থিতিতে ম্যানুয়ালি চিন্তার বাজেট সেট করতে পারেন যেখানে আপনার ডিফল্ট চিন্তা বাজেটের চেয়ে বেশি বা কম টোকেনের প্রয়োজন হতে পারে। এই বিভাগে পরে টাস্ক জটিলতা এবং প্রস্তাবিত বাজেট সম্পর্কে আরও বিস্তারিত নির্দেশিকা খুঁজুন। এখানে কিছু উচ্চ-স্তরের নির্দেশিকা রয়েছে:

  • লেটেন্সি গুরুত্বপূর্ণ হলে বা কম জটিল কাজের জন্য কম চিন্তার বাজেট সেট করুন
  • আরও জটিল কাজের জন্য একটি উচ্চ চিন্তার বাজেট সেট করুন

চিন্তা করে বাজেট সেট করুন

এই পৃষ্ঠায় প্রদানকারী-নির্দিষ্ট সামগ্রী এবং কোড দেখতে আপনার Gemini API প্রদানকারীতে ক্লিক করুন।

GenerativeModel উদাহরণ তৈরির অংশ হিসাবে একটি GenerationConfig এ চিন্তার বাজেট সেট করুন। কনফিগারেশনটি দৃষ্টান্তের আজীবনের জন্য বজায় রাখা হয়। আপনি যদি বিভিন্ন অনুরোধের জন্য ভিন্ন চিন্তার বাজেট ব্যবহার করতে চান, তাহলে প্রতিটি বাজেটের সাথে কনফিগার করা GenerativeModel দৃষ্টান্ত তৈরি করুন।

এই বিভাগে পরে সমর্থিত চিন্তা বাজেট মান সম্পর্কে জানুন।

সুইফট

একটি GenerationConfig এ একটি GenerativeModel উদাহরণ তৈরির অংশ হিসাবে চিন্তা বাজেট সেট করুন।


// ...

// Set the thinking configuration
// Use a thinking budget value appropriate for your model (example value shown here)
let generationConfig = GenerationConfig(
  thinkingConfig: ThinkingConfig(thinkingBudget: 1024)
)

// Specify the config as part of creating the `GenerativeModel` instance
let model = FirebaseAI.firebaseAI(backend: .googleAI()).generativeModel(
  modelName: "GEMINI_MODEL_NAME",
  generationConfig: generationConfig
)

// ...

Kotlin

একটি GenerativeModel উদাহরণ তৈরির অংশ হিসাবে একটি GenerationConfig এ পরামিতিগুলির মান সেট করুন।


// ...

// Set the thinking configuration
// Use a thinking budget value appropriate for your model (example value shown here)
val generationConfig = generationConfig {
  thinkingConfig = thinkingConfig {
      thinkingBudget = 1024
  }
}

// Specify the config as part of creating the `GenerativeModel` instance
val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
  modelName = "GEMINI_MODEL_NAME",
  generationConfig,
)

// ...

Java

একটি GenerativeModel উদাহরণ তৈরির অংশ হিসাবে একটি GenerationConfig এ পরামিতিগুলির মান সেট করুন।


// ...

// Set the thinking configuration
// Use a thinking budget value appropriate for your model (example value shown here)
ThinkingConfig thinkingConfig = new ThinkingConfig.Builder()
    .setThinkingBudget(1024)
    .build();

GenerationConfig generationConfig = GenerationConfig.builder()
    .setThinkingConfig(thinkingConfig)
    .build();

// Specify the config as part of creating the `GenerativeModel` instance
GenerativeModelFutures model = GenerativeModelFutures.from(
        FirebaseAI.getInstance(GenerativeBackend.googleAI())
                .generativeModel(
                  /* modelName */ "<var>GEMINI_MODEL_NAME</var>",
                  /* generationConfig */ generationConfig
                );
);

// ...

Web

একটি GenerativeModel উদাহরণ তৈরির অংশ হিসাবে একটি GenerationConfig এ পরামিতিগুলির মান সেট করুন।


// ...

const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Set the thinking configuration
// Use a thinking budget value appropriate for your model (example value shown here)
const generationConfig = {
  thinkingConfig: {
    thinkingBudget: 1024
  }
};

// Specify the config as part of creating the `GenerativeModel` instance
const model = getGenerativeModel(ai, { model: "GEMINI_MODEL_NAME", generationConfig });

// ...

Dart

একটি GenerativeModel উদাহরণ তৈরির অংশ হিসাবে একটি GenerationConfig এ পরামিতিগুলির মান সেট করুন।


// ...

// Set the thinking configuration
// Use a thinking budget value appropriate for your model (example value shown here)
final thinkingConfig = ThinkingConfig(thinkingBudget: 1024);

final generationConfig = GenerationConfig(
  // ...
  thinkingConfig: thinkingConfig
);

// Specify the config as part of creating the `GenerativeModel` instance
final model = FirebaseAI.googleAI().generativeModel(
  model: 'GEMINI_MODEL_NAME',
  config: generationConfig,
);

// ...

ঐক্য

ইউনিটির জন্য চিন্তাভাবনা বাজেট সেট করার জন্য সমর্থন তার পরবর্তী প্রকাশে আসছে।

সমর্থিত চিন্তা বাজেট মান

নিম্নলিখিত সারণীটি চিন্তার বাজেটের মানগুলি তালিকাভুক্ত করে যা আপনি মডেলের thinkingBudget কনফিগার করে প্রতিটি মডেলের জন্য সেট করতে পারেন।

মডেল ডিফল্ট মান চিন্তা বাজেটের জন্য উপলব্ধ পরিসীমা মান
চিন্তা অক্ষম করুন
মান
গতিশীল চিন্তা সক্রিয়
সর্বনিম্ন মান সর্বোচ্চ মান
Gemini 2.5 Pro 8,192 128 32,768 বন্ধ করা যাবে না -1
মিথুন 2.5 ফ্ল্যাশ 8,192 1 24,576 0 -1
Gemini 2.5 Flash-Lite 0
(চিন্তা ডিফল্টরূপে অক্ষম করা হয়)
512 24,576 0
(বা মোটেও চিন্তাভাবনা বাজেট কনফিগার করবেন না)
-1

চিন্তা অক্ষম করুন

কিছু সহজ কাজের জন্য, চিন্তা করার ক্ষমতা প্রয়োজন হয় না, এবং ঐতিহ্যগত অনুমানই যথেষ্ট। অথবা যদি লেটেন্সি হ্রাস করা একটি অগ্রাধিকার হয়, তাহলে আপনি মডেলটিকে প্রতিক্রিয়া তৈরি করতে প্রয়োজনের চেয়ে বেশি সময় নিতে চান না।

এই পরিস্থিতিতে, আপনি চিন্তা অক্ষম (বা বন্ধ) করতে পারেন:

  • Gemini 2.5 Pro : চিন্তা অক্ষম করা যাবে না
  • জেমিনি 2.5 ফ্ল্যাশ : thinkingBudget 0 টোকেনে সেট করুন
  • Gemini 2.5 Flash-Lite : চিন্তা ডিফল্টরূপে অক্ষম করা হয়৷

গতিশীল চিন্তা সক্রিয় করুন

thinkingBudget -1 এ সেট করে আপনি মডেলটিকে কখন এবং কতটা চিন্তা করেন (যাকে গতিশীল চিন্তা বলে) সিদ্ধান্ত নিতে দিতে পারেন। উপরে তালিকাভুক্ত সর্বোচ্চ টোকেন মান পর্যন্ত মডেলটি যতগুলো টোকেন ব্যবহার করতে পারে তা উপযুক্ত বলে সিদ্ধান্ত নেয়।

টাস্ক জটিলতা

  • সহজ কাজগুলি - চিন্তাভাবনা বন্ধ করা যেতে পারে
    সহজবোধ্য অনুরোধ যেখানে জটিল যুক্তির প্রয়োজন হয় না, যেমন সত্য পুনরুদ্ধার বা শ্রেণীবিভাগ। উদাহরণ:

    • "ডিপমাইন্ড কোথায় প্রতিষ্ঠিত হয়েছিল?"
    • "এই ইমেলটি কি মিটিংয়ের জন্য বলছে নাকি শুধু তথ্য দিচ্ছে?"
  • মাঝারি কাজ - ডিফল্ট বাজেট বা কিছু অতিরিক্ত চিন্তা বাজেট প্রয়োজন
    সাধারণ অনুরোধ যা ধাপে ধাপে প্রসেসিং বা গভীরতর বোঝাপড়া থেকে উপকৃত হয়। উদাহরণ:

    • "সালোকসংশ্লেষণ এবং বেড়ে ওঠার মধ্যে একটি সাদৃশ্য তৈরি করুন।"
    • "বৈদ্যুতিক গাড়ি এবং হাইব্রিড গাড়ির তুলনা এবং বৈসাদৃশ্য।"
  • কঠিন কাজ - সর্বাধিক চিন্তা বাজেট প্রয়োজন হতে পারে
    সত্যিই জটিল চ্যালেঞ্জ, যেমন জটিল গণিত সমস্যা সমাধান বা কোডিং কাজ। এই ধরনের কাজগুলির জন্য মডেলটিকে তার পূর্ণ যুক্তি এবং পরিকল্পনার ক্ষমতাকে নিযুক্ত করতে হবে, প্রায়শই উত্তর দেওয়ার আগে অনেকগুলি অভ্যন্তরীণ পদক্ষেপ জড়িত থাকে। উদাহরণ:

    • "AIME 2025-এ সমস্যা 1 সমাধান করুন: b > 9 সমস্ত পূর্ণসংখ্যা বেসের যোগফল খুঁজুন যার জন্য 17b হল 97b এর একটি ভাজক।"
    • "একটি ওয়েব অ্যাপ্লিকেশনের জন্য পাইথন কোড লিখুন যা ব্যবহারকারীর প্রমাণীকরণ সহ রিয়েল-টাইম স্টক মার্কেট ডেটা ভিজ্যুয়ালাইজ করে। এটিকে যতটা সম্ভব দক্ষ করুন।"

মূল্য নির্ধারণ এবং চিন্তা টোকেন গণনা

চিন্তা টোকেন টেক্সট-আউটপুট টোকেন হিসাবে একই মূল্য ব্যবহার করে.

আপনি প্রতিক্রিয়ার usageMetadata অ্যাট্রিবিউটে thoughtsTokenCount ফিল্ড থেকে মোট চিন্তা টোকেনের সংখ্যা পেতে পারেন:

সুইফট

// ...

let response = try await model.generateContent("Why is the sky blue?")

if let usageMetadata = response.usageMetadata {
  print("Thoughts Token Count: \(usageMetadata.thoughtsTokenCount)")
}

Kotlin

// ...

val response = model.generateContent("Why is the sky blue?")

response.usageMetadata?.let { usageMetadata ->
    println("Thoughts Token Count: ${usageMetadata.thoughtsTokenCount}")
}

Java

// ...

ListenableFuture<GenerateContentResponse> response =
    model.generateContent("Why is the sky blue?");

Futures.addCallback(response, new FutureCallback<GenerateContentResponse>() {
    @Override
    public void onSuccess(GenerateContentResponse result) {
        String usageMetadata = result.getUsageMetadata();
        if (usageMetadata != null) {
            System.out.println("Thoughts Token Count: " +
                usageMetadata.getThoughtsTokenCount());
        }
    }

    @Override
    public void onFailure(Throwable t) {
        t.printStackTrace();
    }
}, executor);

Web

// ...

const response = await model.generateContent("Why is the sky blue?");

if (response?.usageMetadata?.thoughtsTokenCount != null) {
    console.log(`Thoughts Token Count: ${response.usageMetadata.thoughtsTokenCount}`);
}

Dart

// ...

final response = await model.generateContent(
  Content.text("Why is the sky blue?"),
]);

if (response?.usageMetadata case final usageMetadata?) {
  print("Thoughts Token Count: ${usageMetadata.thoughtsTokenCount}");
}

ঐক্য

ইউনিটির জন্য চিন্তার টোকেন গণনা করার জন্য সমর্থন তার পরবর্তী প্রকাশে আসছে।

গণনা টোকেন গাইডে টোকেন সম্পর্কে আরও জানুন।