Systemy uczące się Firebase

Używaj w swoich aplikacjach systemów uczących się, aby rozwiązywać rzeczywiste problemy.

Uczenie maszynowe Firebase to mobilny pakiet SDK, dzięki któremu możesz wykorzystać wiedzę Google z zakresu systemów uczących się w aplikacjach na Androida i Apple w ramach zaawansowanego i łatwego w użyciu pakietu. Niezależnie od tego, czy dopiero zaczynasz swoją przygodę z systemami uczącymi się, czy masz już doświadczenie z systemami uczącymi się, możesz wdrożyć potrzebne funkcje za pomocą kilku linijek kodu. Aby rozpocząć, nie trzeba mieć dogłębnej wiedzy o sieciach neuronowych ani optymalizacji modeli. Z drugiej strony, jeśli jesteś doświadczonym programistą ML, Firebase ML udostępnia wygodne interfejsy API, które pomagają używać niestandardowych modeli TensorFlow Lite w aplikacjach mobilnych.

Najważniejsze funkcje

Hostowanie i wdrażanie modeli niestandardowych

używać własnych modeli TensorFlow Lite do wnioskowania na urządzeniu; Wystarczy, że wdrożysz model w Firebase, a my zajmiemy się hostingiem i udostępnianiem Twojej aplikacji. Firebase będzie dynamicznie udostępniać użytkownikom najnowszą wersję modelu, co pozwoli Ci je regularnie aktualizować bez konieczności udostępniania użytkownikom nowej wersji aplikacji.

Gdy używasz Firebase ML w połączeniu ze Zdalną konfiguracją, możesz udostępniać różne modele różnym segmentom użytkowników, a za pomocą Testów A/B możesz przeprowadzać eksperymenty, aby znaleźć najskuteczniejszy model (zapoznaj się z przewodnikami po Apple i Androidzie).

Gotowość do wdrożenia w typowych przypadkach użycia

Firebase ML zawiera zestaw gotowych do użycia interfejsów API do typowych zastosowań na urządzeniach mobilnych: do rozpoznawania tekstu, oznaczania obrazów etykietami i identyfikowania punktów orientacyjnych. Wystarczy, że przekażesz dane do biblioteki systemów uczących się w Firebase, aby uzyskać potrzebne informacje. Te interfejsy API wykorzystują możliwości systemów uczących się Google Cloud, aby zapewnić najwyższy poziom dokładności.

Chmura a na urządzeniu

Firebase ML ma interfejsy API, które działają w chmurze lub na urządzeniu. Gdy określamy interfejs ML API jako interfejs Cloud API lub interfejs API na urządzeniu, określamy, która maszyna przeprowadza wnioskowanie, czyli która maszyna używa modelu systemów uczących się do odkrywania statystyk dotyczących danych, które do niego dostarczasz. W Firebase ML odbywa się to w Google Cloud lub na urządzeniach mobilnych użytkowników.

Interfejsy API do rozpoznawania tekstu, oznaczania obrazów etykietami i rozpoznawania punktów orientacyjnych służą do wnioskowania w chmurze. Modele te mają większą moc obliczeniową i pamięć niż porównywalny model na urządzeniu, dzięki czemu mogą wnioskować z większą dokładnością i precyzją niż model na urządzeniu. Z drugiej strony każde żądanie wysłane do tych interfejsów API wymaga przesyłania danych w obie strony, co sprawia, że nie nadają się one do aplikacji działających w czasie rzeczywistym i z małym opóźnieniem, takich jak przetwarzanie wideo.

Interfejsy API modeli niestandardowych obsługują modele ML, które działają na urządzeniu. Modele wykorzystywane i tworzone przez te funkcje to modele TensorFlow Lite, które są zoptymalizowane pod kątem działania na urządzeniach mobilnych. Największą zaletą tych modeli jest to, że nie wymagają połączenia sieciowego i działają bardzo szybko – na przykład do przetwarzania klatek filmu w czasie rzeczywistym.

Firebase ML umożliwia wdrażanie niestandardowych modeli na urządzeniach użytkowników przez przesyłanie ich na nasze serwery. Aplikacja z obsługą Firebase pobierze model na urządzenie na żądanie. Dzięki temu rozmiar początkowej instalacji aplikacji będzie niewielki i będzie można zamienić model ML bez konieczności ponownego publikowania aplikacji.

ML Kit: gotowe do użycia modele na urządzeniu

Jeśli szukasz już wytrenowanych modeli, które działają na urządzeniu, sprawdź ML Kit. Jest dostępny na iOS i Androida i ma interfejsy API przydatne w wielu przypadkach:

  • Rozpoznawanie tekstu
  • Dodawanie etykiet do obrazów
  • Wykrywanie i śledzenie obiektów
  • Wykrywanie twarzy i śledzenie konturów
  • Skanowanie kodów kreskowych
  • Identyfikacja języka
  • Tłumaczenie
  • Inteligentna odpowiedź

Dalsze kroki