Wyszukiwanie podobieństw wektorowych za pomocą Vertex AI

Witamy w usłudze wyszukiwania podobieństw wektorowych Firebase SQL Connect – implementacji wyszukiwania semantycznego w Firebase, która jest zintegrowana z Google Vertex AI.

Podstawą tej funkcji są wektory dystrybucyjne, czyli tablice liczb zmiennoprzecinkowych reprezentujące znaczenie semantyczne tekstu lub multimediów. Przeprowadzając wyszukiwanie najbliższych sąsiadów za pomocą wektora dystrybucyjnego, możesz znaleźć wszystkie treści podobne pod względem semantycznym. SQL Connect korzysta z rozszerzenia PostgreSQLpgvector.

To zaawansowane wyszukiwanie semantyczne może być przydatne w przypadku systemów rekomendacji i wyszukiwarek. Jest to też kluczowy komponent generowania z wyszukiwaniem w przepływach generatywnej AI. Więcej informacji znajdziesz w dokumentacji Vertex AI. Dowiedz się więcej

Możesz korzystać z wbudowanej obsługi SQL Connect, aby automatycznie generować wektory dystrybucyjne za pomocą interfejsu Vertex AI Embeddings API, lub używać tego interfejsu API do ręcznego generowania wektorów.

Wymagania wstępne

Skonfiguruj SQL Connect w projekcie.

Uwaga: podczas procesu konfiguracji pamiętaj, że integracja z Vertex AI w SQL Connect jest obsługiwana tylko w przypadku niektórych lokalizacji Cloud SQL for PostgreSQL. Zobacz listę lokalizacji.
Włącz interfejsy Vertex AI API.

Uwaga: nie musisz tworzyć oddzielnego projektu Google Cloud ani instalować Google Cloud CLI.

Konfiguracja

Możesz wybrać lokalny proces tworzenia (jeśli jesteś deweloperem stron internetowych, aplikacji na Androida w języku Kotlin lub aplikacji na iOS) lub proces IDX (dla deweloperów stron internetowych). Do celów programistycznych możesz używać lokalnej bazy danych lub projektu produkcyjnego SQL Connect i jego instancji Cloud SQL for PostgreSQL.

W tych instrukcjach przyjęto założenie, że SQL Connectprojektzostał utworzony zgodnie z krótkim przewodnikiem.

Integracja z lokalną bazą danych PostgreSQL

Skonfiguruj lokalną instancję PostgreSQL.
Przyznaj sobie rolę użytkownika Vertex AI w IAM.
Skonfiguruj w swoim środowisku domyślne uwierzytelnianie aplikacji Google Cloud.
Zainstaluj pgvectorrozszerzenie w lokalnej instancji PostgreSQL.
Włącz rozszerzenie za pomocą CREATE EXTENSION vector zgodnie z instrukcjami w pgvectorrepozytorium.

Integracja z IDX

Skonfiguruj obszar roboczy IDX za pomocą SQL Connectszablonu.
Przyznaj sobie rolę użytkownika Vertex AI w IAM.
Włącz rozszerzenie za pomocą CREATE EXTENSION vector zgodnie z instrukcjami w pgvectorrepozytorium.

Projektowanie schematu

Aby przeprowadzić wyszukiwanie wektorowe, dodaj do schematu nowe pole typu Vector. Jeśli na przykład chcesz przeprowadzić wyszukiwanie semantyczne za pomocą opisów filmów, dodaj pole do przechowywania wektorów dystrybucyjnych powiązanych z opisem filmu. W tym schemacie dodano pole descriptionEmbedding do przechowywania wektorów dystrybucyjnych dla pola description.

type Movie @table {
 id: ID! @col(name: "movie_id") @default(id: ID! @col(name: "movie_id") @default(expr: "uuidV4()")
 title: String!
 description: String
 descriptionEmbedding: Vector! @col(size:768)
 // ...
}

Generowanie i pobieranie wektorów dystrybucyjnych

SQL Connect zapewnia zintegrowaną obsługę wektorów dystrybucyjnych z wartością serwera _embed. Powoduje to, że SQL Connect generuje wektory dystrybucyjne, wewnętrznie wywołując interfejsy API do tworzenia wektorów dystrybucyjnych Vertex AI. Wartość _embed serwera może być używana zarówno w mutacjach, jak i w zapytaniach.

Mutacje

Generowanie i przechowywanie wektora dystrybucyjnego za pomocą SQL Connect

W aplikacji do wyszukiwania wektorowego prawdopodobnie zechcesz poprosić o wygenerowanie wektorów dystrybucyjnych od razu po dodaniu rekordów do bazy danych. Oto createMoviemutacja, która dodaje rekord filmu do tabeli Movie, a także przekazuje opis filmu z określonym osadzeniem model.

mutation createMovie($title: String!, $description: String!) {
  movie_insert(data: {
    title: $title,
    description: $description,
    descriptionEmbedding_embed: {model: "textembedding-gecko@003", text: $description}
  })
}

W niektórych przypadkach możesz chcieć zaktualizować opis filmu i osadzanie.

mutation updateDescription($id: String!, $description: String!) {
  movie_update(id: $id, data: {
    description: $description,
    descriptionEmbedding_embed: {model: "textembedding-gecko@003", text: $description}
  })
}

Aby wywołać tę drugą mutację z poziomu klienta:

import { updateMovieDescription } from 'lib/dataconnect-sdk/';

await updateMovieDescription({ id: movieId, description: description});

// Use the response

Zapytania

Pobierz wektory dystrybucyjne za pomocą zapytania podobnego do tego poniżej. Pamiętaj, że wartość descriptionEmbedding zwrócona przez zapytanie to tablica liczb zmiennoprzecinkowych, która zwykle nie jest czytelna dla człowieka. Dlatego SQL Connect wygenerowane pakiety SDK nie obsługują bezpośredniego zwracania tego parametru.

Zwrócone wektory dystrybucyjne możesz wykorzystać do wyszukiwania podobieństw, jak opisano w następnej sekcji.

query getMovieDescription($id: String!) @auth(level: PUBLIC) {
 movie(id: $id)
   id
   description
   descriptionEmbedding
}

Wyszukiwanie podobieństw

Teraz możemy przeprowadzić wyszukiwanie podobieństwa.

W przypadku każdego pola Vector funkcja SQL Connect generuje funkcję GraphQL, która implementuje wyszukiwanie podobieństw. Nazwa tej wygenerowanej funkcji to ${pluralType}_${vectorFieldName}_similarity. Obsługuje kilka parametrów, co widać w przykładach poniżej i na liście referencyjnej.

Możesz zdefiniować funkcję GraphQL, która wywołuje wyszukiwanie podobieństw. Jak wspomnieliśmy powyżej, wartość _embed serwera kieruje SQL Connect do generowania wektorów dystrybucyjnych za pomocą interfejsów Embedding API w Vertex AI, w tym przypadku do tworzenia wektorów dystrybucyjnych dla ciągu wyszukiwania używanego do porównywania z wektorami dystrybucyjnymi opisu filmu.

W tym przykładzie wyszukiwanie podobieństw zwróci maksymalnie 5 filmów, których opis jest semantycznie najbardziej zbliżony do zapytania wejściowego. Zestaw wyników jest posortowany w kolejności rosnącej według odległości – od najbliższej do najdalszej.

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "textembedding-gecko@003", text: $query},
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
      }
  }

Dostosowywanie zapytania o podobieństwo

Wartości domyślne parametrów wyszukiwania, takich jak method i within, sprawdzają się w większości przypadków użycia. Jeśli jednak zauważysz, że zapytanie zwraca zbyt odmienne wyniki lub brakuje w nich tych, które chcesz uwzględnić, spróbuj dostosować te parametry.

Aby znaleźć odpowiednią wartość dla within, możemy dodać _metadata.distance do wybranych pól, aby sprawdzić, jak daleko od wektora zapytania znajduje się każdy wynik. Na podstawie zwróconych wartości distance możemy ustawić parametr within. Uwzględnione zostaną tylko wyniki, których odległość jest mniejsza niż wartość within:

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "textembedding-gecko@003", text: $query},
      within: 2,
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
        _metadata {
          distance
        }
      }
  }

Możesz też eksperymentować z różnymi funkcjami odległości, ustawiając parametr method.

query searchMovieDescriptionUsingL2Similarity ($query: String!) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare_embed: {model: "textembedding-gecko@003", text: $query},
      within: .5,
      method: COSINE,
      where: {content: {ne: "No info available for this movie."}}, limit: 5)
      {
        id
        title
        description
        _metadata {
          distance
        }
      }
  }

Pamiętaj, że różne metody zwracają bardzo różne wartości odległości: jeśli masz ustawioną wartość within, po zmianie method musisz ją ponownie dostosować.

Wywołaj zapytanie o podobieństwo

Aby wywołać wyszukiwanie podobieństw z kodu klienta:

import { searchMovieDescriptionUsingL2similarity} from 'lib/dataconnect-sdk';

const response = await searchMovieDescriptionUsingL2similarity({ query });

// Use the response

Używanie niestandardowych wektorów dystrybucyjnych

SQL Connect umożliwia też bezpośrednią pracę z osadzonymi elementami jako Vectors, a nie generowanie ich za pomocą wartości serwera _embed.

Przechowywanie niestandardowego osadzania

Za pomocą interfejsu Vertex Embeddings API określ model dopasowywania i poproś o wyniki wektorów dystrybucyjnych o odpowiednim wymiarze.

Następnie przekształć zwróconą tablicę liczb zmiennoprzecinkowych w Vector, aby przekazać ją do operacji aktualizacji na potrzeby przechowywania.

mutation updateDescription($id: String!, $description: String!, $descriptionEmbedding: Vector!) {
  movie_update(id: $id, data: {
    // title, genre...
    description: $description,
    descriptionEmbedding: $descriptionEmbedding
  })
}

Przeprowadzanie wyszukiwania podobieństw za pomocą niestandardowych wektorów dystrybucyjnych

Wykonaj tę samą operację, aby pobrać wektory dystrybucyjne dla wyszukiwanych haseł i obsady filmu, a następnie przekształć je w Vectors.

Następnie wywołaj zapytanie _similarity, aby przeprowadzić każde wyszukiwanie.

query searchMovieDescriptionUsingL2Similarity($compare: Vector!, $within: Float, $excludesContent: String, $limit: Int) @auth(level: PUBLIC) {
    movies_descriptionEmbedding_similarity(
      compare: $compare,
      method: L2,
      within: $within,
      where: {content: {ne: $excludesContent}}, limit: $limit)
      {
        id
        title
        description
      }
  }

Wdrażanie w środowisku produkcyjnym

Wdróż schemat i oprogramowanie sprzęgające

Ostatnim krokiem typowej SQL Connect iteracji jest wdrożenie zasobów w środowisku produkcyjnym.

Podczas wdrażania schematu zawierającego typy Vector w Cloud SQL za pomocą polecenia firebase deploy interfejs wiersza poleceń Firebase wykonuje niezbędne czynności, aby włączyć generowanie wektorów dystrybucyjnych oparte na Vertex AI w instancji Cloud SQL.

firebase deploy --only dataconnect

Jeśli chcesz ręcznie włączyć obsługę osadzania w instancji Cloud SQL lub napotkasz błąd interfejsu CLI, postępuj zgodnie z tymi instrukcjami.

Składnia wyszukiwania wektorowego

Rozszerzenia schematu

Typ danych SQL Connect's Vector jest mapowany na typ vector PostgreSQL zgodnie z definicją pgvector rozszerzenia. Typ vector pgvector jest przechowywany jako tablica liczb zmiennoprzecinkowych pojedynczej precyzji w PostgreSQL.

W SQL Connect typ Vector jest reprezentowany jako tablica liczb JSON. Dane wejściowe są przekształcane w tablicę wartości float32. Jeśli konwersja się nie powiedzie, pojawi się błąd.

Użyj parametru size dyrektywy @col, aby ustawić wymiary wektora.

type Question @table {
    text: String!
    category: String!
    textEmbedding: Vector! @col(size: 768)
}

size jest obsługiwany tylko w przypadku typów Vector. Vector, takie jak wyszukiwanie podobieństw, wymagają, aby wszystkie Vector miały tę samą liczbę wymiarów.

directive @col(
  # … existing args
  """
  Defines a fixed column size for certain scalar types.

  - For Vector, size is required.
  - For all other types, size is currently unsupported and hence supplying it will result in a schema error.
  """
  size: Int
) on FIELD_DEFINITION

`_embed` wartość serwera w przypadku zapytań i mutacji;

_embed

Ta wartość serwera nakazuje usłudze SQL Connect generowanie i przechowywanie wektorów dystrybucyjnych za pomocą interfejsów Embedding API w Vertex AI. Ta wartość serwera może być używana zarówno w zapytaniach, jak i w mutacjach.

Parametry wyszukiwania podobieństw

method: COSINE|INNER_PRODUCT|L2

Funkcja odległości używana do wyszukiwania najbliższych sąsiadów. Obecnie obsługiwane algorytmy stanowią podzbiór algorytmów wyszukiwania pgvector.

within: float

Ograniczenie odległości, w której przeprowadzane jest wyszukiwanie najbliższych sąsiadów.

where: FDC filter condition

Zapoznaj się z przewodnikiem po schematach, zapytaniach i mutacjach.

limit: int

Liczba wyników do zwrócenia.