Beta: Firebase Genkit is in Beta, which means that it is not subject to any SLA or deprecation policy and could change in backwards-incompatible ways. Throughout the Beta period, Firebase Genkit and its documentation will be updated and improved.

Ta strona została przetłumaczona przez Cloud Translation API.

Wywołania narzędzi

Wywoływanie narzędzia, czyli wywoływanie funkcji, to uporządkowany sposób na umożliwienie LLM wysyłania żądań do aplikacji, która je wywołała. Ty określasz narzędzia, które chcesz udostępnić modelowi, a model będzie wysyłać do Twojej aplikacji żądania użycia narzędzia w miarę potrzeby, aby zrealizować prompty.

Przypadki użycia wywoływania narzędzi można ogólnie podzielić na kilka tematów:

Udzielanie LLM dostępu do informacji, na podstawie których nie został on trenowany

często zmieniające się informacje, takie jak cena akcji lub aktualna pogoda;
informacje dotyczące Twojej domeny aplikacji, takie jak informacje o produkcie lub profilach użytkowników;

Zwróć uwagę na pokrywanie się z generowaniem rozszerzonym przez wyszukiwanie w zapisanych informacjach (RAG), które jest też sposobem na to, aby model LLM integrował informacje oparte na faktach w ramach generowania. RAG to bardziej złożone rozwiązanie, które najlepiej sprawdza się, gdy masz dużą ilość informacji lub informacje najbardziej trafne dla promptu są niejednoznaczne. Jeśli jednak pobranie informacji, których potrzebuje LLM, wymaga prostego wywołania funkcji lub sprawdzenia w bazie danych, odpowiedniejsze jest wywołanie narzędzia.

Wprowadzanie pewnego stopnia determinizmu w przepływie pracy LLM

wykonywanie obliczeń, których LLM nie może wykonać samodzielnie;
Wymuszanie generowania dosłownego tekstu przez model LLM w określonych okolicznościach, np. podczas udzielania odpowiedzi na pytanie dotyczące warunków korzystania z aplikacji.

Wykonywanie działania po jego zainicjowaniu przez LLM

Włączanie i wyłączanie światła za pomocą asystenta domowego opartego na LLM
Rezerwowanie stolików w usługach agenta restauracji opartych na LLM

Zanim zaczniesz

Jeśli chcesz uruchomić przykłady kodu na tej stronie, najpierw wykonaj czynności opisane w przewodniku Początkujący. Wszystkie przykłady zakładają, że masz już skonfigurowany projekt z zainstalowanymi zależnościami Genkit.

Na tej stronie omawiamy jedną z zaawansowanych funkcji abstrakcji modeli w Genkit, dlatego zanim zaczniesz się zagłębiać w tą tematykę, zapoznaj się z treścią na stronie Generowanie treści za pomocą modeli AI. Musisz też znać system Genkit do definiowania schematów wejścia i wyjścia, który opisany jest na stronie Procesy.

Omówienie wywoływania narzędzi

Ogólnie rzecz biorąc, typowa interakcja z LLM polegająca na wywołaniu narzędzia wygląda tak:

Aplikacja wywołująca przesyła do LLM żądanie, a także zawiera w promptzie listę narzędzi, których LLM może użyć do wygenerowania odpowiedzi.
Model LLM generuje pełną odpowiedź lub żądanie wywołania narzędzia w określonym formacie.
Jeśli rozmówca otrzyma pełną odpowiedź, żądanie zostanie spełnione, a interakcja zakończy się. Jeśli jednak otrzyma wywołanie narzędzia, wykona odpowiednią logikę i wyśle nowe żądanie do LLM, zawierające pierwotny prompt lub jego wariant, a także wynik wywołania narzędzia.
LLM obsługuje nowy prompt w sposób opisany w kroku 2.

Aby to działało, musisz spełnić kilka wymagań:

Model musi być wytrenowany, aby wysyłać żądania do narzędzia, gdy jest to potrzebne do wykonania promptu. Większość większych modeli udostępnianych przez interfejsy API w internecie, takich jak Gemini i Claude, może to zrobić, ale mniejsze i bardziej wyspecjalizowane modele często nie. Jeśli spróbujesz udostępnić narzędzia modelowi, który ich nie obsługuje, Genkit wygeneruje błąd.
Aplikacja wywołująca musi przekazać model definicje narzędzi w oczekiwanym formacie.
Aplikacja wywołująca musi poprosić model o wygenerowanie żądań wywołania narzędzia w oczekiwanym przez aplikację formacie.

Narzędzia do wykonywania połączeń w Genkit

Genkit udostępnia jeden interfejs do wywoływania narzędzi w modelach, które go obsługują. Każdy wtyczka modelu zapewnia spełnienie 2 ostatnich kryteriów wymienionych powyżej, a funkcja generate() instancji Genkit automatycznie wykonuje opisaną wcześniej pętlę wywoływania narzędzia.

Obsługa modelu

Obsługa wywoływania narzędzi zależy od modelu, interfejsu API modelu i wtyczki Genkit. Aby sprawdzić, czy narzędzie obsługuje wywoływanie, zapoznaj się z odpowiednią dokumentacją. Dodatkowo:

Jeśli spróbujesz udostępnić narzędzia modelowi, który ich nie obsługuje, Genkit wygeneruje błąd.
Jeśli wtyczka eksportuje odwołania do modelu, właściwość info.supports.tools wskazuje, czy obsługuje wywoływanie narzędzia.

Definiowanie narzędzi

Aby zapisać definicje narzędzi, użyj funkcji defineTool() instancji Genkit:

import { genkit, z } from 'genkit';
import { googleAI, gemini15Flash } from '@genkit-ai/google-ai';

const ai = genkit({
  plugins: [googleAI()],
  model: gemini15Flash,
});

const getWeather = ai.defineTool(
  {
    name: 'getWeather',
    description: 'Gets the current weather in a given location',
    inputSchema: z.object({ 
      location: z.string().describe('The location to get the current weather for')
    }),
    outputSchema: z.string(),
  },
  async (input) => {
    // Here, we would typically make an API call or database query. For this
    // example, we just return a fixed value.
    return 'The current weather in ${input.location} is 63°F and sunny.';
  }
);

Składnia jest podobna do składni funkcji defineFlow(), ale wymagane są wszystkie 4 parametry: name, description, inputSchema i outputSchema. Podczas definiowania narzędzia należy z szczególną uwagą dobierać słowa i opisywać parametry, ponieważ są one kluczowe dla skutecznego korzystania z dostępnych narzędzi.

Korzystanie z narzędzi

Uwzględniaj zdefiniowane narzędzia w promptach, aby generować treści.

Wygeneruj

const response = await ai.generate({
  prompt: 'What is the weather in Baltimore?',
  tools: [getWeather],
});

definePrompt

const weatherPrompt = ai.definePrompt(
  {
    name: 'weatherPrompt',
    tools: [getWeather],
  },
  'What is the weather in {{location}}?'
);

const response = await weatherPrompt({ location: 'Baltimore' });

Plik z promptami

---
system: "Answer questions using the tools you have."
tools: [getWeather]
input:
  schema:
    location: string
---

What is the weather in {{location}}?

Następnie możesz uruchomić prompt w kodzie w ten sposób:

// assuming prompt file is named weatherPrompt.prompt
const weatherPrompt = ai.prompt('weatherPrompt');

const response = await weatherPrompt({ location: 'Baltimore' });

Czat

const chat = ai.chat({
  system: 'Answer questions using the tools you have.',
  tools: [getWeather],
});

const response = await chat.send('What is the weather in Baltimore?');

// Or, specify tools that are message-specific 
const response = await chat.send({
  prompt: 'What is the weather in Baltimore?',
  tools: [getWeather],
});

Genkit automatycznie obsłuży wywołanie narzędzia, jeśli LLM będzie musiał użyć narzędzia getWeather, aby odpowiedzieć na prompt.

Wyraźne obsługiwanie wywołań narzędzia

Domyślnie Genkit wielokrotnie wywołuje LLM, dopóki nie zostaną rozwiązane wszystkie wywołania narzędzia. Jeśli chcesz mieć większą kontrolę nad tym narzędziem wywołującym pętlę, np. aby zastosować bardziej skomplikowaną logikę, ustaw parametr returnToolRequests na true. Teraz Twoim obowiązkiem jest dopilnowanie, aby wszystkie żądania dotyczące narzędzi zostały spełnione:

const getWeather = ai.defineTool(
  {
    // ... tool definition ...
  },
  async ({ location }) => {
    // ... tool implementation ...
  },
);

const generateOptions: GenerateOptions = {
  prompt: "What's the weather like in Baltimore?",
  tools: [getWeather],
  returnToolRequests: true,
};

let llmResponse;
while (true) {
  llmResponse = await ai.generate(generateOptions);
  const toolRequests = llmResponse.toolRequests;
  if (toolRequests.length < 1) {
    break;
  }
  const toolResponses: ToolResponsePart[] = await Promise.all(
    toolRequests.map(async (part) => {
      switch (part.toolRequest.name) {
        case 'specialTool':
          return {
            toolResponse: {
              name: part.toolRequest.name,
              ref: part.toolRequest.ref,
              output: await getWeather(part.toolRequest.input),
            },
          };
        default:
          throw Error('Tool not found');
      }
    })
  );
  generateOptions.messages = llmResponse.messages;
  generateOptions.prompt = toolResponses;
}