1. לפני שמתחילים
בקודלאב הזה תלמדו איך להשתמש ב-Firebase Genkit כדי לשלב בינה מלאכותית גנרטיבית באפליקציה שלכם. Firebase Genkit הוא מסגרת קוד פתוח שבעזרתה אפשר ליצור, לפרוס ולנטר אפליקציות מבוססות-AI שיהיו מוכנות לייצור.
Genkit מיועד למפתחי אפליקציות, ומאפשר לכם לשלב בקלות יכולות AI מתקדמות באפליקציות שלכם באמצעות דפוסים ותבניות מוכרים. הוא נוצר על ידי צוות Firebase, תוך ניצול הניסיון שלנו ביצירת כלים שמשמשים מיליוני מפתחים ברחבי העולם.
דרישות מוקדמות
- היכרות עם Firestore , Node.js ו-TypeScript.
מה תלמדו
- איך לפתח אפליקציות חכמות יותר עם היכולות המתקדמות של Firestore לחיפוש באמצעות דמיון וקטורי.
- איך להטמיע בפועל AI גנרטיבי באפליקציות באמצעות Firebase Genkit.
- מכינים את הפתרון לפריסה ולשילוב.
מה צריך להכין
- דפדפן לבחירתך, כגון Google Chrome
- סביבת פיתוח עם עורך קוד וטרמינל
- חשבון Google ליצירה ולניהול של פרויקט Firebase
2. בדיקה של אפליקציית האינטרנט ושירותי הענן שבהם נעשה שימוש
בקטע הזה נסביר על אפליקציית האינטרנט שתבנו באמצעות Codelab הזה, וגם נסביר על שירותי הענן שבהם תשתמשו.
אפליקציית אינטרנט
ב-Codelab הזה תעבוד ב-codebase של אפליקציה שנקראת Compass – אפליקציה לתכנון חופשות. המשתמשים יכולים לבחור יעד, לעיין בפעילויות היעד וליצור מסלול נסיעה לנסיעה.
ב-Codelab הזה תטמיעו שתי תכונות חדשות שנועדו לשפר את התעניינות המשתמשים בדף הבית של האפליקציה. שתי התכונות האלה מבוססות על AI גנרטיבי:
- נכון לעכשיו, באפליקציה מוצגת רשימה סטטית של יעדים. הוא ישתנה לדינמי!
- אתם תטמיעו מסלול נסיעה שמאוכלס באופן אוטומטי כדי לשפר את הנאמנות.
השירותים שבהם נעשה שימוש
ב-Codelab הזה נעשה שימוש בתכונות ובשירותים רבים של Firebase ו-Cloud, ורוב הקוד לתחילת העבודה עבורם יסופק לכם. בטבלה הבאה מפורטים השירותים שבהם תשתמשו והסיבות לשימוש בהם.
שירות | הסיבה לשימוש |
אתם משתמשים ב-Genkit כדי לשלב בינה מלאכותית גנרטיבית לאפליקציה של Node.js או Next.js. | |
אתם מאחסנים נתונים ב-Cloud Firestore, ולאחר מכן משתמשים בהם לחיפוש דמיון בין וקטורים. | |
אתם משתמשים במודלים בסיסיים מ-Vertex AI (כמו Gemini) כדי להפעיל את תכונות ה-AI. | |
אפשר גם להשתמש בגרסה החדשה והיעילה של אירוח האפליקציות ב-Firebase כדי להציג את אפליקציית האינטרנט של Next.js הדינמית (שמחוברת למאגר GitHub). |
3. הגדרת סביבת הפיתוח
אימות הגרסה של Node.js
- בטרמינל, מוודאים שגרסת Node.js מותקנת בגרסה 20.0.0 ואילך:
node -v
- אם אין לכם את Node.js מגרסה 20.0.0 ואילך, צריך להוריד את גרסת ה-LTS האחרונה ולהתקין אותה.
קבלת קוד המקור של ה-Codelab
אם יש לכם חשבון GitHub:
- אפשר ליצור מאגר חדש באמצעות התבנית שלנו בכתובת github.com/FirebaseExtended/codelab-ai-genkit-rag
- יוצרים עותק מקומי (clone) של מאגר GitHub של הקודלמאב שיצרתם:
git clone https://github.com/<your-github-handle>/codelab-ai-genkit-rag
אם לא התקנתם את git או שאתם מעדיפים לא ליצור מאגר חדש:
מורידים את מאגר GitHub כקובץ zip.
בדיקת מבנה התיקיות
במכונה המקומית, מחפשים את המאגר המשובץ ובודקים את מבנה התיקיות:
תיקייה | תיאור |
| קוד Genkit העורפי |
| כלי שורת הפקודה של העוזר הדיגיטלי לאכלוס מראש במהירות את האוסף ב-Firestore |
*כל השאר | קוד של אפליקציית האינטרנט Next.js |
תיקיית הבסיס כוללת קובץ README.md
שמאפשר להתחיל להריץ את אפליקציית האינטרנט במהירות, באמצעות הוראות פשוטות. עם זאת, אם אתם לומדים את הנושא בפעם הראשונה, כדאי להשלים את הקודלהב הזה (במקום המדריך למתחילים) כי הוא מכיל את קבוצת ההוראות המקיפות ביותר.
אם אתם לא בטוחים שהטמעתם את הקוד בצורה נכונה לפי ההוראות במהלך הקודלאב הזה, תוכלו למצוא את קוד הפתרון בהסתעפות end
ב-Git.
התקנת ה-CLI של Firebase
- מוודאים ש-Firebase CLI מותקן ושגרסתו היא 13.6 ואילך:
firebase --version
- אם התקנתם את Firebase CLI אבל הגרסה שלו היא לא 13.6 ואילך, עליכם לעדכן אותו:
npm update -g firebase-tools
- אם ה-CLI של Firebase לא מותקן, מתקינים אותו:
npm install -g firebase-tools
אם אתם לא מצליחים לעדכן או להתקין את Firebase CLI בגלל שגיאות הרשאה, תוכלו לעיין במסמכי התיעוד של npm או להשתמש באפשרות התקנה אחרת.
כניסה ל-Firebase
- בטרמינל, מתחברים ל-Firebase:
אם במסוף מוצגת ההודעה שכבר נכנסתם ל-Firebase, תוכלו לדלג לקטע הגדרת פרויקט Firebase בקודלאב הזה.firebase login
- במסוף, בהתאם לאפשרות איסוף הנתונים ב-Firebase, מזינים
Y
אוN
. (אחת מהאפשרויות פועלת ב-Codelab הזה) - בדפדפן, בוחרים את חשבון Google ולוחצים על אישור.
התקנת ה-CLI של gcloud ב-Google Cloud
- מתקינים את ה-CLI של gcloud.
- נכנסים ל-Google Cloud במסוף:
gcloud auth login
4. הגדרת פרויקט Firebase
בקטע הזה צריך להגדיר פרויקט Firebase ולרשום בו אפליקציית אינטרנט של Firebase. בהמשך, ב-Codelab הזה, יופעלו גם כמה שירותים שמשמשים את אפליקציית האינטרנט לדוגמה.
כל השלבים בקטע הזה מתבצעים במסוף Firebase.
יוצרים פרויקט Firebase
- נכנסים למסוף Firebase עם אותו חשבון Google שבו השתמשתם בשלב הקודם.
- לוחצים על Create a project (יצירת פרויקט) ומזינים שם פרויקט (לדוגמה,
Compass Codelab
).
חשוב לזכור את מזהה הפרויקט שהוקצה באופן אוטומטי לפרויקט ב-Firebase (או ללחוץ על הסמל Edit (עריכה) כדי להגדיר את מזהה הפרויקט המועדף). המזהה הזה ישמש אתכם מאוחר יותר כדי לזהות את פרויקט Firebase ב-CLI של Firebase. אם תשכחו את המזהה, תוכלו למצוא אותו מאוחר יותר בקטע הגדרות הפרויקט. - לוחצים על המשך.
- אם מופיעה בקשה, קוראים את התנאים של Firebase ומאשרים אותם, ואז לוחצים על המשך.
- לצורך השימוש ב-Codelab הזה, לא צריך את Google Analytics, לכן משביתים את האפשרות של Google Analytics.
- לוחצים על יצירת פרויקט, ממתינים עד להקצאת הפרויקט ולאחר מכן לוחצים על המשך.
הוספת אפליקציית אינטרנט לפרויקט Firebase
- עוברים למסך Project Overview (סקירה כללית של הפרויקט) בפרויקט Firebase ולוחצים על Web (אינטרנט).
- בתיבת הטקסט App nickname (כינוי לאפליקציה), מזינים כינוי לאפליקציה שקל לזכור, כמו
My Compass Codelab App
. אתם יכולים להשאיר את תיבת הסימון להגדרת אירוח ב-Firebase לא מסומנת, כי תוכלו להגדיר שירות אירוח אופציונלי בשלב האחרון של הקודלה. - לוחצים על רישום האפליקציה > המשך למסוף.
מעולה! רשמתם עכשיו אפליקציית אינטרנט בפרויקט Firebase החדש.
שדרוג תוכנית התמחור והתשלומים ב-Firebase
כדי להשתמש ב-Firebase Genkit וב-Vertex AI (ובשירותי הענן הבסיסיים שלהם), הפרויקט ב-Firebase צריך להיות בתוכנית תשלום לפי שימוש (Blaze). כלומר, הוא מקושר לחשבון לחיוב ב-Cloud.
- כדי להשתמש בחשבון לחיוב ב-Cloud, צריך להוסיף אמצעי תשלום, למשל כרטיס אשראי.
- אם אתם משתמשים חדשים ב-Firebase וב-Google Cloud, כדאי לבדוק אם אתם זכאים לקרדיט בסך 300$ ולחשבון לחיוב ב-Cloud בתקופת ניסיון בחינם.
- אם אתם מבצעים את הקודלאב הזה כחלק מאירוע, כדאי לשאול את המארגן אם יש זיכויים ב-Cloud שזמינים.
מידע נוסף על התמחור של Vertex AI
כדי לשדרג את הפרויקט לתוכנית Blaze:
- במסוף Firebase, בוחרים באפשרות שדרוג התוכנית.
- בוחרים את תוכנית Blaze. פועלים לפי ההוראות במסך כדי לקשר חשבון לחיוב ב-Cloud לפרויקט.
אם נדרשת יצירת חשבון לחיוב ב-Cloud כחלק מהשדרוג, יכול להיות שתצטרכו לחזור לתהליך השדרוג במסוף Firebase כדי להשלים את השדרוג.
הגדרת Cloud Firestore
- בחלונית הימנית של מסוף Firebase, מרחיבים את Build ובוחרים באפשרות Firestore database.
- לוחצים על Create dataset.
- משאירים את הערך
(default)
בשדה Database ID. - בוחרים מיקום למסד הנתונים ולוחצים על הבא.
באפליקציה אמיתית, כדאי לבחור מיקום קרוב למשתמשים. - לוחצים על הפעלה במצב בדיקה. קוראים את כתב הוויתור לגבי כללי האבטחה.
לא מפיצים או חושפים אפליקציה באופן ציבורי בלי להוסיף כללי אבטחה למסד הנתונים. - לוחצים על יצירה.
הפעלה של Vertex AI
משתמשים ב-CLI של gcloud
כדי להגדיר את Vertex AI. בכל הפקודות בדף הזה, חשוב להחליף את YOUR_PROJECT_ID
במזהה של פרויקט Firebase.
- במסוף, מגדירים את פרויקט ברירת המחדל ל-Google Cloud SDK:
gcloud config set project YOUR_PROJECT_ID
- אם מופיעה הודעת האזהרה "WARNING: Your active project does not match the quota project in your local Application Default Credentials file. כתוצאה מכך, יכולות להיות בעיות בלתי צפויות במכסות", ולאחר מכן מריצים את הפקודה הבאה כדי להגדיר את פרויקט המכסה:
gcloud auth application-default set-quota-project YOUR_PROJECT_ID
- מפעילים את שירות Vertex AI בפרויקט:
gcloud services enable aiplatform.googleapis.com
5. הגדרת אפליקציית האינטרנט
כדי להריץ את אפליקציית האינטרנט, צריך להריץ פקודות בטרמינל ולהוסיף קוד בעורך הקוד. בכל הפקודות בדף הזה, חשוב להחליף את YOUR_PROJECT_ID
במזהה של פרויקט Firebase.
הגדרת ה-CLI של Firebase לטירגוט הפרויקט
- בטרמינל, עוברים לספריית הבסיס (root) של פרויקט Codelab.
- כדי לגרום ל-CLI של Firebase להפעיל את כל הפקודות בפרויקט Firebase, מריצים את הפקודה הבאה:
firebase use YOUR_PROJECT_ID
ייבוא נתונים לדוגמה ל-Firestore
כדי שתוכלו להתחיל לעבוד במהירות, ה-Codelab הזה מספק לכם נתונים לדוגמה שנוצרו מראש עבור Firestore.
- כדי לאפשר ל-codebase המקומי להריץ קוד שבדרך כלל משתמש בחשבון שירות, מריצים את הפקודה הבאה בטרמינל:
תיפתח כרטיסייה חדשה בדפדפן. נכנסים לאותו חשבון Google שבו השתמשתם בשלבים הקודמים.gcloud auth application-default login
- כדי לייבא את נתוני Firestore לדוגמה, מריצים את הפקודות הבאות:
cd load-firestore-data npm ci node index.js YOUR_PROJECT_ID cd ..
- כדי לוודא שהנתונים נוספו למסד הנתונים, עוברים לקטע Firestore בפרויקט Firebase במסוף Firebase.אתם אמורים לראות את סכימת הנתונים המיובאים ואת התוכן שלה.
קישור אפליקציית האינטרנט לפרויקט Firebase
כדי להשתמש בשירותים של Firebase, כמו מסד הנתונים, קוד האפליקציה שלכם לאפליקציית האינטרנט צריך להיות משויך לפרויקט Firebase הנכון. כדי לעשות זאת, צריך להוסיף את הגדרות Firebase לקוד של האפליקציה. ההגדרות האישיות האלה כוללות ערכים חיוניים כמו מזהה הפרויקט, מפתח ה-API ומזהה האפליקציה של האפליקציה, וגם ערכים אחרים שמאפשרים לאפליקציה לקיים אינטראקציה עם Firebase.
- מקבלים את הגדרת Firebase של האפליקציה:
- במסוף Firebase, עוברים אל פרויקט Firebase.
- בחלונית הימנית, לוחצים על סמל גלגל השיניים לצד סקירה כללית של הפרויקט ובוחרים באפשרות הגדרות הפרויקט.
- בכרטיס 'האפליקציות שלך', בוחרים את אפליקציית האינטרנט הרצויה.
- בקטע 'הגדרה והגדרה של SDK', בוחרים באפשרות הגדרה.
- העתק את הקוד. הוא מתחיל ב-
const firebaseConfig ...
.
- מוסיפים את ההגדרה של Firebase ל-codebase של אפליקציית האינטרנט:
- בעורך הקוד, פותחים את הקובץ
src/lib/genkit/genkit.config.ts
. - מחליפים את הקטע הרלוונטי בקוד שהעתקתם.
- שומרים את הקובץ.
- בעורך הקוד, פותחים את הקובץ
הצגת תצוגה מקדימה של אפליקציית האינטרנט בדפדפן
- בטרמינל, מתקינים את יחסי התלות ומריצים את אפליקציית האינטרנט:
npm install npm run dev
- בדפדפן, עוברים אל כתובת ה-URL של אירוח שמתארחת באופן מקומי כדי להציג את אפליקציית האינטרנט. לדוגמה, ברוב המקרים, כתובת ה-URL היא http://localhost:3000/ או משהו דומה.
Compass היא אפליקציית Next.js שמשתמשת ב-React Server Components, ודף הבית שלה נראה כך.
לוחצים על חיפוש הנסיעה של החלומות שלי. אפשר לראות שכרגע מוצגים בו נתונים שהוגדרו מראש ליעדים קבועים מסוימים:
אתם מוזמנים להתנסות. כשהכול מוכן, לוחצים על הלחצן הראשי (בפינה השמאלית העליונה).
6. התנסות ב-AI גנרטיבי עם Genkit
עכשיו הכול מוכן ואפשר להתחיל להשתמש ביכולות של ה-AI הגנרטיבי באפליקציה שלכם! בקטע הזה של הקודלהב נסביר איך מטמיעים תכונה שמציעה יעדים על סמך השראה שהמשתמשים מספקים. תשתמשו ב-Firebase Genkit וב-Vertex AI של Google Cloud כספק של המודל הגנרטיבי (תשתמשו ב-Gemini).
Genkit יכול לאחסן את מצב המעקב ומצב הזרימה (כדי לאפשר לכם לבדוק את התוצאה של ביצוע תהליכים של Genkit). ב-codelab הזה נשתמש ב-Firestore כדי לאחסן את הנתונים האלה.
בשלב האחרון ב-Codelab הזה, צריך לפרוס את אפליקציית Genkit באירוח אפליקציות ב-Firebase.
חיבור אפליקציית Genkit לפרויקט Firebase
כדי שתוכלו להפעיל את Genkit, צריך לשייך את ה-codebase שלכם לפרויקט Firebase הנכון כדי להשתמש בשירותים שלו, כמו מסד הנתונים. כדי לעשות זאת, צריך להוסיף את ההגדרה של Firebase ל-codebase של אפליקציית Genkit. ההגדרות האישיות האלה כוללות ערכים חיוניים כמו מזהה הפרויקט, מפתח ה-API ומזהה האפליקציה של האפליקציה, וגם ערכים אחרים שמאפשרים לאפליקציה לקיים אינטראקציה עם Firebase.
- מקבלים את הגדרת Firebase של האפליקציה:
- במסוף Firebase, עוברים אל פרויקט Firebase.
- בחלונית הימנית, לוחצים על סמל גלגל השיניים שלצד הקטע סקירה כללית של הפרויקט ובוחרים באפשרות הגדרות הפרויקט.
- בכרטיס 'האפליקציות שלך', בוחרים את אפליקציית האינטרנט הרצויה.
- בקטע 'הגדרה והגדרה של SDK', בוחרים באפשרות הגדרה.
- העתק את הקוד. הוא מתחיל ב-
const firebaseConfig ...
.
- מוסיפים את הגדרת Firebase של האפליקציה ל-codebase של אפליקציית Genkit:
- בעורך הקוד, פותחים את הקובץ
genkit-functions/src/lib/genkit.config.ts
. - מחליפים את הקטע הרלוונטי בקוד שהעתקתם.
- שומרים את הקובץ.
- בעורך הקוד, פותחים את הקובץ
הפעלת ממשק המשתמש למפתחים של Genkit
Genkit כולל ממשק משתמש מבוסס-אינטרנט שמאפשר ליצור אינטראקציה עם מודלים גדולים של שפה, תהליכים של Genkit , רטריבר ורכיבי AI אחרים.
- פותחים את ממשק המשתמש למפתחים של Genkit:
- פותחים חלון טרמינל חדש.
- עוברים לרמה הבסיסית (root) של ספריית
genkit-functions
. - מריצים את הפקודה הבאה כדי להפעיל את ממשק המשתמש למפתחים של Genkit:
cd genkit-functions npx genkit start
- בדפדפן, עוברים לכתובת ה-URL של Genkit שמתארחת באופן מקומי. ברוב המקרים, הכתובת היא http://localhost:4000/.
אינטראקציה עם Gemini
עכשיו אפשר להשתמש בממשק המשתמש למפתחים של Genkit כדי לבצע אינטראקציה עם כל אחד מהמודלים הנתמכים או עם כל אחד מרכיבי ה-AI האחרים, כמו ההנחיות, רטריבר ותהליכים של Genkit.
לדוגמה, אפשר לבקש מ-Gemini להציע חופשה לחג. שימו לב איך אפשר להשתמש בהוראות המערכת כדי לקבוע את התנהגות המודל בהתאם לצרכים הספציפיים שלכם. מקשי הקיצור האלה פועלים גם בדגמים שלא תומכים בהוראות המערכת במקור.
ניהול ההנחיות
Firebase Genkit מציג את Dotprompt, פלאגין ופורמט טקסט שנועדו לייעל את היצירה והניהול של ההנחיות של ה-AI הגנרטיבי. הרעיון העיקרי שעומד מאחורי Dotprompt הוא התייחסות להנחיות כמו קוד, שמאפשר לכתוב אותן, לתחזק אותן ולשלוט בהן בגרסאות לצד קוד האפליקציה שלכם.
כדי להשתמש ב-Dotprompt, מתחילים עם hello-world:
- פותחים את הקובץ
genkit-functions/prompts/1-hello-world.prompt
בכלי לעריכת קוד. - בממשק המשתמש של Genkit Developer, פותחים את
dotprompt/1-hello-world
. - אפשר להשתמש בשם או בקוד שפה שאתם מכירים, או להשאיר אותם כמחרוזת ריקה.
- לוחצים על הפעלה.
- אפשר לנסות כמה ערכים שונים. מודלים גדולים של שפה (LLM) מבינים היטב הנחיות מקוצרות, עם שגיאות כתיב או חלקיות בשאילתות פשוטות כמו זו.
העשרת הפלט באמצעות נתונים מובְנים
מעבר ליצירת טקסט פשוט, Genkit מאפשר לכם לבנות את הפלט כדי לשפר את המצגת והשילוב בתוך ממשק המשתמש של האפליקציה. הגדרת סכימה מאפשרת לכם להורות ל-LLM ליצור נתונים מובְנים שתואמים לפורמט הרצוי.
סקירה כללית של סכימות פלט
אפשר גם לציין את הסכימה של הפלט של קריאה ל-LLM.
- בעורך הקוד, בודקים את קובץ ההנחיות:
- פותחים את הקובץ
dotprompt/2-simple-itinerary
. - בודקים את הסכימות שהוגדרו לקלט ולפלט.
- פותחים את הקובץ
- אינטראקציה עם ממשק המשתמש:
- בממשק המשתמש של Genkit למפתחים, עוברים לקטע
dotprompt/2-simple-itinerary
. - כדי לספק קלט, צריך לאכלס את השדות
place
ו-interests
בנתונים לדוגמה:{ "interests": [ "Museums" ], "place": "Paris" }
- לוחצים על Run.
- בממשק המשתמש של Genkit למפתחים, עוברים לקטע
הסבר על פלט מבוסס-סכימה
שימו לב איך הפלט שנוצר תואם לסכימה שהוגדרה. כשמציינים את המבנה הרצוי, מורים ל-LLM ליצור נתונים שקל לנתח ולשלב באפליקציה. Genkit מאמת את הפלט באופן אוטומטי בהתאם לסכימה, כדי להבטיח את תקינות הנתונים.
אפשר גם להגדיר את Genkit לנסות שוב או לנסות לתקן את הפלט אם הוא לא תואם לסכימה.
היתרונות העיקריים של סכימות פלט
- שילוב פשוט יותר: אפשר לשלב בקלות נתונים מובְנים ברכיבי ממשק המשתמש של האפליקציה.
- אימות נתונים: מוודאים את הדיוק והעקביות של הפלט שנוצר.
- טיפול בשגיאות: הטמעת מנגנונים לטיפול בחוסר התאמה בין סכימות.
השימוש בסכימות פלט ישפר את חוויית השימוש ב-Genkit, ויאפשר לך ליצור נתונים מובְנים מותאמים אישית לחוויית משתמש עשירה ודינמית יותר.
שימוש בקלט במגוון דרכים
נניח שהאפליקציה שלכם מציעה יעדים מותאמים אישית לחופשה על סמך תמונות שהמשתמשים שלכם מוצאים מעוררות השראה. Genkit, בשילוב עם מודל גנרטיבי רב-מודלי, מאפשר לכם להפוך את החזון הזה למציאות.
- בעורך הקוד, בודקים את קובץ ההנחיות:
- פותחים את הקובץ
genkit-functions/prompts/imgDescription.prompt
. - שימו לב להכללה של
{{media url=this}}
, שהוא רכיב התחביר של סרגלי כלים שמאפשר לשלב תמונות בהנחיה.
- פותחים את הקובץ
- אינטראקציה עם ממשק המשתמש:
- בממשק המשתמש של Genkit למפתחים, פותחים את ההנחיה
dotprompt/imgDescription
. - מזינים כתובת URL של תמונה בשדה
imageUrls
על ידי הדבקת כתובת URL של תמונה. לדוגמה, אפשר להשתמש בתמונה ממוזערת מתוך ויקיפדיה, שמציגה את מגדל אייפל:{ "imageUrls": [ "https://upload.wikimedia.org/wikipedia/commons/thumb/4/4b/La_Tour_Eiffel_vue_de_la_Tour_Saint-Jacques%2C_Paris_ao%C3%BBt_2014_%282%29.jpg/556px-La_Tour_Eiffel_vue_de_la_Tour_Saint-Jacques%2C_Paris_ao%C3%BBt_2014_%282%29.jpg" ] }
- לוחצים על Run.
- בממשק המשתמש של Genkit למפתחים, פותחים את ההנחיה
7. הטמעת אחזור עם חיפוש דמיון וקטורי
יצירת תוכן יצירתי באמצעות מודלים של AI היא מרשים, אבל במקרים רבים אפליקציות מעשיות מצריכות ביסוס הפלט בהקשר ספציפי.
במקרה של ה-Codelab הזה, יש לכם מסד נתונים של יעדים (מקומות ופעילויות) ואתם רוצים לוודא שההצעות שנוצרות במודל Gemini מתייחסות רק לרשומות במסד הנתונים הזה.
כדי לגשר על הפער בין שאילתות לא מובנות לבין תוכן רלוונטי, תוכלו להשתמש ביכולות של חיפוש דמיון בין וקטורים על הטמעות (embeddings) שנוצרו.
הסבר על הטמעות ועל דמיון בין וקטורים
- ווקטורים: וקטורים הם ייצוגים מספריים של נקודות נתונים, שמשמשים לרוב ליצירת מודלים של מידע מורכב כמו טקסט או תמונות. כל מאפיין בווקטור מתאים לתכונה מסוימת של הנתונים.
- מודלים להטמעה (Embedding): מודלים מיוחדים של AI שממירים נתוני קלט, כמו טקסט, לווקטורים בממדים גבוהים. ההיבט המרתק הוא שקלט דומה ממופה לווקטורים שקרובים זה לזה במרחב המתקדם הזה.
- חיפוש דמיון וקטורי: בשיטה הזו נעשה שימוש בקרבה של ווקטורים מוטמעים כדי לזהות נקודות נתונים רלוונטיות. כשנותנים לה שאילתה של קלט, היא מוצאת במסד הנתונים רשומות עם וקטורי הטמעה דומים, שמעידים על קשרים סמנטיים.
הבנת האופן שבו פועל תהליך האחזור
- הטמעת השאילתה: הקלט של המשתמש (לדוגמה, 'ארוחת ערב רומנטית בפריז') מועבר דרך מודל הטמעה, ויוצר וקטור של שאילתה.
- הטמעות של מסדי נתונים: באופן אידיאלי, ביצעת עיבוד מראש של מסד הנתונים של היעדים ויצירת וקטורים של הטמעה לכל רשומה.
- חישוב הדמיון: וקטור השאילתה מושווה לכל וקטור הטמעה במסד הנתונים באמצעות מדד דמיון (למשל, דמיון קוסינוס).
- אחזור: הרשומות הדומות ביותר ממסד הנתונים, על סמך הקרבה שלהן לווקטור השאילתה, מאוחזרות כהצעות רלוונטיות.
שילוב מנגנון האחזור הזה באפליקציה מאפשר לכם להשתמש במודל Gemini כדי ליצור הצעות שהן לא רק יצירתיות, אלא גם מבוססות היטב על מערך הנתונים הספציפי שלכם. הגישה הזו מבטיחה שהפלט שנוצר יישאר רלוונטי בהקשר ותואם למידע שזמין במסד הנתונים שלכם.
הפעלת חיפוש דמיון וקטורי ב-Firestore
בשלב קודם ב-Codelab הזה, אכלסת את מסד הנתונים של Firestore עם מקומות ופעילויות לדוגמה. כל רשומה של מקום כוללת שדה טקסט knownFor
שמתאר את המאפיינים הבולטים שלו, יחד עם שדה embedding
תואם שמכיל את ייצוג הווקטור של התיאור הזה.
כדי לנצל את היתרונות של חיפוש דמיון וקטורי בהטמעות האלה, צריך ליצור אינדקס ב-Firestore. האינדקס הזה מאפשר אחזור יעיל של מקומות על סמך הדמיון של וקטורי הטמעת הנתונים שלהם לשאילתה נתונה.
- בטרמינל, מריצים את הפקודה הבאה כדי להתקין את רכיב אלפא העדכני ביותר. נדרשת גרסה
2024.05.03
ואילך:gcloud components install alpha
- יוצרים את האינדקס ומקפידים להחליף את
YOUR_PROJECT_ID
במזהה הפרויקט.gcloud alpha firestore indexes composite create --project=YOUR_PROJECT_ID --collection-group=places --query-scope=COLLECTION --field-config=vector-config='{"dimension":"768","flat": "{}"}',field-path=embedding
- בממשק המשתמש של Genkit Developer, פותחים את
placesRetriever
. - לוחצים על Run. צפו באובייקט העמוד באמצעות טקסט placeholder, שמציין את המיקום שבו תטמיעו את לוגיקת הרטריבר.
- פותחים את הקובץ
genkit-functions/src/lib/placesRetriever.ts
בכלי לעריכת קוד. - גוללים למטה עד הסוף ומחליפים את ה-placeholder
placesRetriever
בערך הבא:export const placesRetriever = defineFirestoreRetriever({ name: 'placesRetriever', firestore, collection: 'places', contentField: 'knownFor', vectorField: 'embedding', embedder: textEmbeddingGecko, distanceMeasure: 'COSINE', });
בדיקת האחזור
- בממשק המשתמש של Genkit למפתחים, פותחים את האחזור
placesRetriever
. - מזינים את השאילתה הבאה:
{ "content": [ { "text": "UNESCO" } ] }
- אפשר גם לספק אפשרויות. לדוגמה, כך מציינים כמה מסמכים האחזור צריך להחזיר:
{ "limit": 4 }
- לוחצים על Run.
אפשר לבצע סינון נוסף של הנתונים מעבר לדמיון, על ידי הוספת סעיפי where
לאפשרויות.
8. אחזור של יצירה מורחבת (RAG) באמצעות Genkit
בחלקים הקודמים, פיתחתם הנחיות נפרדות שמסוגלות לטפל בטקסט, בקובץ JSON ובתמונות, וליצור יעדי חופשה ותוכן מעניין אחר עבור המשתמשים שלכם. הטמעתם גם הנחיה שמאחזרת את היעדים הרלוונטיים ממסד הנתונים של Firestore. עכשיו הגיע הזמן לתזמור את הרכיבים האלה לתהליך אחזור משולב (RAG) עקבי.
בקטע הזה נסביר על מושג חשוב ב-Genkit שנקרא תהליכים. זרועות הן פונקציות עם הקלדה חזקה, שניתן להפעיל אותן בסטרימינג באופן מקומי וגם מרחוק, עם ניראות (observability) מלאה. אפשר לנהל ולהפעיל תהליכים גם מה-CLI של Genkit וגם מממשק המשתמש של Genkit למפתחים.
- בעורך הקוד, בודקים את ההנחיה של מסלול הנסיעה:
- פותחים את הקובץ
genkit-functions/prompts/itineraryGen.prompt
. - שימו לב איך ההנחיה הורחבה כדי לקבל קלטים נוספים, במיוחד את הנתונים של הפעילויות שמקורם בשליפה.
- פותחים את הקובץ
- בממשק המשתמש של Genkit למפתחים, אפשר להציג תהליך של Genkit בקובץ
genkit-functions/src/lib/itineraryFlow.ts
.
טיפ: כדי לייעל את תהליך ניפוי הבאגים, כדאי לפרק תהליכים ארוכים לשלבים קטנים יותר שניתן לנהל. - משפרים את התהליך באמצעות שילוב שלב של 'תיאור תמונה':
- מחפשים את התגובה
TODO: 2
(בשורה 70). זהו המקום שבו תשתפרו את התהליך. - מחליפים את ה-placeholder הריק של
imgDescription
בפלט שנוצר על ידי הפעלת ההנחיהimgDescription
.
- מחפשים את התגובה
- בודקים את הזרימה:
- עוברים אל
itineraryFlow
. - השתמשו בקלט הבא כדי לבדוק אם הרצתם את
itineraryFlow
בהצלחה עם השלב החדש שהוספתם:{ "request": "Sightseeing in Paris", "imageUrls": [ "https://upload.wikimedia.org/wikipedia/commons/thumb/4/4b/La_Tour_Eiffel_vue_de_la_Tour_Saint-Jacques%2C_Paris_ao%C3%BBt_2014_%282%29.jpg/556px-La_Tour_Eiffel_vue_de_la_Tour_Saint-Jacques%2C_Paris_ao%C3%BBt_2014_%282%29.jpg" ] }
- לוחצים על Run.
- חשוב לצפות בפלט שנוצר, שבו צריך לשלב את תיאור התמונה בהצעה למסלול.
- עוברים אל
- אם נתקלים בשגיאות או בהתנהגויות לא צפויות, אפשר לעיין בכרטיסייה בדיקה לקבלת פרטים. אפשר להשתמש בכרטיסייה הזו גם כדי לעיין בהיסטוריית ההפעלות מחנות נתוני המעקב.
RAG לאפליקציית האינטרנט שלכם
- יש לוודא שאפליקציית האינטרנט עדיין פועלת. לשם כך, נכנסים אל http://localhost:3000/ בדפדפן.
- אם אפליקציית האינטרנט לא פועלת יותר, מריצים את הפקודות הבאות בטרמינל:
npm install npm run dev
- אפשר לעיין בדף של אפליקציית האינטרנט Dream Your Vacation (http://localhost:3000/gemini).
- כדי לראות דוגמה לשילוב של Next.js, אפשר לעיין בקוד המקור שלו (
src/app/gemini/page.tsx
).
9. פריסה של האפליקציה באמצעות Firebase App Hosting
השלב האחרון בתהליך הוא פריסת אפליקציית האינטרנט. תשתמשו ב-Firebase App Hosting, פתרון אירוח שמותאם למסגרות, שנועד לפשט את הפריסה של אפליקציות Next.js ו-Angular לקצה עורפי ללא שרת.
- שומרים את השינויים במאגר ה-git המקומי ומבצעים push ל-GitHub.
- במסוף Firebase, עוברים אל אירוח אפליקציות בפרויקט Firebase.
- לוחצים על Get started (תחילת העבודה) > Connect to GitHub.
- בוחרים את GitHub account ואת Repository. לוחצים על Next.
- בקטע Deployment settings > Root library (הגדרת Deployment > ספריית Root) משאירים את ערך ברירת המחדל.
- בשדה Live branch, בוחרים את ההסתעפות main במאגר ב-GitHub. לוחצים על הבא.
- צריך להזין מזהה לקצה העורפי (לדוגמה,
compass
). - כשמוצגת השאלה אם יצירה או שיוך של אפליקציית אינטרנט ב-Firebase, בוחרים באפשרות בחירה של אפליקציית אינטרנט קיימת ב-Firebase ואז בוחרים את האפליקציה שיצרתם בשלב מוקדם יותר ב-Codelab הזה.
- לוחצים על Finish and Deploy (סיום ופריסה).
מעקב אחר סטטוס הפריסה
תהליך הפריסה יימשך כמה דקות. אפשר לעקוב אחרי ההתקדמות בקטע 'אירוח אפליקציות' במסוף Firebase.
מתן הרשאות לחשבון השירות
כדי שקצוות העורפי של Node.js יוכלו לגשת למשאבי Vertex AI, צריך להקצות את התפקיד aiplatform.user
לחשבון השירות של האפליקציה:
gcloud projects add-iam-policy-binding YOUR_PROJECT_ID \
--member "serviceAccount:firebase-app-hosting-compute@YOUR_PROJECT_ID.iam.gserviceaccount.com" \
--role "roles/aiplatform.user"
בסיום התהליך, אפליקציית האינטרנט תהיה נגישה למשתמשים.
פריסה מחדש אוטומטית
אירוח אפליקציות ב-Firebase מאפשר לבצע עדכונים עתידיים בצורה יעילה יותר. בכל פעם שדוחפים שינויים בהסתעפות הראשית של מאגר GitHub שלכם, אירוח אפליקציות ב-Firebase יבנה ותפרס מחדש את האפליקציה שלכם באופן אוטומטי, כדי להבטיח שהמשתמשים תמיד יחוו את הגרסה האחרונה.
10. סיכום
כל הכבוד על השלמת ה-codelab המקיף הזה!
השתמשתם בהצלחה ב-Firebase Genkit, ב-Firestore וב-Vertex AI כדי ליצור 'תהליך' מתוחכם שיוצר המלצות מותאמות אישית לחופשות על סמך ההשראה וההעדפות של המשתמשים, תוך התבססות על הנתונים של האפליקציה.
לאורך המסע הזה צברתם ניסיון מעשי בדפוסים חיוניים של הנדסת תוכנה שחיוניים לפיתוח אפליקציות עוצמתיות של AI גנרטיבי. הדפוסים האלה כוללים:
- ניהול הנחיות: ארגון ותחזוקה של הנחיות כקוד לשיפור שיתוף הפעולה וניהול הגרסאות.
- תוכן מרובה מצבים: שילוב של סוגי נתונים מגוונים, כמו תמונות וטקסט, כדי לשפר אינטראקציות עם AI.
- סכימות קלט/פלט: בניית הנתונים לצורך אינטגרציה חלקה ואימות באפליקציה שלכם.
- מאגרי וקטורים: שימוש בהטמעות וקטורים (vector embedding) לחיפוש יעיל של דמיון ולאחזור מידע רלוונטי.
- אחזור נתונים: הטמעה של מנגנונים לאחזור נתונים ממסדי נתונים ולשילוב שלהם בתוכן שנוצר על ידי AI.
- יצירה משופרת של אחזור (RAG): שילוב של שיטות אחזור עם AI גנרטיבי כדי ליצור פלט מדויק ורלוונטי להקשר.
- אינסטרומנטציה של זרימה: יצירה ותזמור של תהליכי עבודה מורכבים ב-AI לביצוע חלק וגלוי.
שולטים במושגים האלה וליישם אותם בסביבה העסקית של Firebase, ומתחילים להרפתקאות בינה מלאכותית גנרטיבית. תוכלו לבדוק את האפשרויות הרבות, ליצור אפליקציות חדשניות ולהמשיך לפרוץ את הגבולות של מה שאפשר להשיג באמצעות בינה מלאכותית גנרטיבית.
בחינת אפשרויות פריסה חלופיות
Genkit מציע מגוון אפשרויות פריסת קוד בהתאם לצרכים הספציפיים שלכם, כולל:
- Cloud Functions for Firebase
- Cloud Run
- Next.js
- כל סביבה של Node.js
- Genkit תומך גם ב-Go
כדי לבחור את האפשרות שהכי מתאימה לך, מריצים את הפקודה הבאה בתיקיית הצמתים (package.json
):
npx genkit init
השלבים הבאים
- אפשר להתנסות בהנחיות ולהשתמש בחלונות ההקשר הגדולים ב-Google AI Studio או ב-Vertex AI Studio.
- מידע נוסף על חיפוש מבוסס-AI ליצירת תכונות משופרות (RAG)
- ניתן לעיין במסמכים הרשמיים של Firebase Genkit.
- מידע נוסף על יכולות של חיפוש דמיון ב-Firestore ועל Cloud SQL ל-PostgreSQL.
- מתעמקים בתהליכי העבודה ב-AI גנרטיבי בעזרת קריאות פונקציות.