Generuję treści

Firebase Genkit zapewnia prosty interfejs do generowania treści przy użyciu modeli LLM.

Modele

Modele w Firebase Genkit to biblioteki i abstrakcje, które zapewniają dostęp do z wieloma modelami LLM od Google i innych firm.

Modele są w pełni przystrojone pod kątem dostrzegalności i mają narzędzia dostępnych w interfejsie programisty Genkit – możesz wypróbować dowolny model, czyli biegacza modelu.

Podczas pracy z modelami w Genkit musisz najpierw skonfigurować model, z którymi chcesz współpracować. Konfiguracja modelu jest wykonywana przez system wtyczek. W w tym przykładzie konfigurujesz wtyczkę Vertex AI, która udostępnia Gemini modeli ML.

import {
	"github.com/firebase/genkit/go/ai"
	"github.com/firebase/genkit/go/plugins/vertexai"
}
// Default to the value of GCLOUD_PROJECT for the project,
// and "us-central1" for the location.
// To specify these values directly, pass a vertexai.Config value to Init.
if err := vertexai.Init(ctx, nil); err != nil {
	return err
}

Aby używać modeli dostarczanych przez wtyczkę, musisz mieć odniesienie do konkretnego modelu i wersja:

model := vertexai.Model("gemini-1.5-flash")

Obsługiwane modele

Genkit zapewnia obsługę modelu przez system wtyczek. Te wtyczki są oficjalnie obsługiwane:

Wtyczka Modele
Generatywna AI od Google Gemini Pro, Gemini Pro Vision
Google Vertex AI Gemini Pro, Gemini Pro Vision, Gemini 1.5 Flash, Gemini 1.5 Pro, Imagen2
Ollama Wiele modeli lokalnych, w tym Gemma, Llama 2 czy Mistral

W dokumentacji każdej wtyczki znajdziesz informacje o jej konfiguracji i korzystaniu.

Jak generować treści

Genkit udostępnia prostą funkcję pomocniczą do generowania treści za pomocą modeli.

Aby po prostu wywołać model:

responseText, err := ai.GenerateText(ctx, model, ai.WithTextPrompt("Tell me a joke."))
if err != nil {
	return err
}
fmt.Println(responseText)

Opcje możesz przekazywać wraz z wywołaniem modelu. Obsługiwane opcje zależą od modelu i jego interfejsu API.

response, err := ai.Generate(ctx, model,
	ai.WithTextPrompt("Tell me a joke about dogs."),
	ai.WithConfig(ai.GenerationCommonConfig{
		Temperature:     1.67,
		StopSequences:   []string{"cat"},
		MaxOutputTokens: 3,
	}))

Strumieniowanie odpowiedzi

Genkit obsługuje strumieniowanie odpowiedzi modelu podzielone na fragmenty. Aby użyć przesyłania kawałkowego: przekaż funkcję wywołania zwrotnego do Generate():

response, err := ai.Generate(ctx, gemini15pro,
	ai.WithTextPrompt("Tell a long story about robots and ninjas."),
	// stream callback
	ai.WithStreaming(
		func(ctx context.Context, grc *ai.GenerateResponseChunk) error {
			fmt.Printf("Chunk: %s\n", grc.Text())
			return nil
		}))
if err != nil {
	return err
}

// You can also still get the full response.
fmt.Println(response.Text())

Wprowadzanie wielomodalne

Jeśli model obsługuje dane wejściowe multimodalne, możesz przekazywać prompty dotyczące obrazów:

imageBytes, err := os.ReadFile("img.jpg")
if err != nil {
	return err
}
encodedImage := base64.StdEncoding.EncodeToString(imageBytes)

resp, err := ai.Generate(ctx, gemini15pro, ai.WithMessages(
	ai.NewUserMessage(
		ai.NewTextPart("Describe the following image."),
		ai.NewMediaPart("", "data:image/jpeg;base64,"+encodedImage))))

Dokładny format promptu dotyczącego obrazu (URL https, URL gs, identyfikator URI data) to w zależności od modelu.

Wywoływanie funkcji (narzędzia)

Modele Genkit udostępniają interfejs do wywoływania funkcji w przypadku modeli, które obsługują .

myJokeTool := ai.DefineTool(
	"myJoke",
	"useful when you need a joke to tell",
	func(ctx context.Context, input *any) (string, error) {
		return "haha Just kidding no joke! got you", nil
	},
)

response, err := ai.Generate(ctx, gemini15pro,
	ai.WithTextPrompt("Tell me a joke."),
	ai.WithTools(myJokeTool))

Spowoduje to automatyczne wywołanie narzędzi w celu spełnienia promptu użytkownika.

Rejestrowanie historii wiadomości

Modele Genkit obsługują przechowywanie historii wiadomości wysyłanych do modelu i odpowiedzi na nie, które można wykorzystać do tworzenia interaktywnych treści, czatboty.

W pierwszym prompcie sesji „historia” jest po prostu prompt dla użytkownika:

history := []*ai.Message{{
	Content: []*ai.Part{ai.NewTextPart(prompt)},
	Role:    ai.RoleUser,
}}

response, err := ai.Generate(context.Background(), gemini15pro, ai.WithMessages(history...))

Gdy otrzymasz odpowiedź, dodaj ją do historii:

history = append(history, response.Candidates[0].Message)

Możesz zserializować tę historię i utrwalić ją w bazie danych lub pamięci sesji. W kolejnych prośbach użytkownika dodaj je do historii, zanim zadzwonisz Generate():

history = append(history, &ai.Message{
	Content: []*ai.Part{ai.NewTextPart(prompt)},
	Role:    ai.RoleUser,
})

response, err = ai.Generate(ctx, gemini15pro, ai.WithMessages(history...))

Jeśli używany model obsługuje rolę systemową, możesz użyć parametru początkowego w historii, aby ustawić komunikat systemowy:

history = []*ai.Message{{
	Content: []*ai.Part{ai.NewTextPart("Talk like a pirate.")},
	Role:    ai.RoleSystem,
}}