פריסת תהליכים באמצעות Cloud Run

אפשר לפרוס תהליכים של Genkit כנקודות קצה מסוג HTTPS באמצעות Cloud Run. ל-Cloud Run יש כמה אפשרויות פריסת, כולל פריסה מבוססת-קונטיינר. בדף הזה מוסבר איך לפרוס את התהליכים ישירות מהקוד.

לפני שמתחילים

מתקינים את Google Cloud CLI.
כדאי שתכירו את המושג flows ב-Genkit ואת האופן שבו כותבים אותם. בדף הזה נניח שכבר יש לכם תהליכים שאתם רוצים לפרוס.
מומלץ, אבל לא חובה, שכבר השתמשתם ב-Google Cloud וב-Cloud Run.

1. הגדרת פרויקט ב-Google Cloud

אם עדיין לא הגדרתם פרויקט ב-Google Cloud, עליכם לפעול לפי השלבים הבאים:

יוצרים פרויקט חדש ב-Google Cloud באמצעות מסוף Cloud או בוחרים פרויקט קיים.
מקשרים את הפרויקט לחשבון לחיוב, שנדרש ל-Cloud Run.
מגדירים את Google Cloud CLI לשימוש בפרויקט:
```
gcloud init
```

2. הכנת פרויקט Node לפריסה

כדי שתוכלו לפרוס את התהליכים, תצטרכו לבצע כמה שינויים קטנים בקוד של הפרויקט:

הוספת סקריפטים להתחלה ול-build לקובץ package.json

כשפורסים פרויקט Node.js ב-Cloud Run, כלים לפריסה מצפים לפרויקט עם סקריפט start, ואפשר גם עם סקריפט build. בפרויקט TypeScript אופייני, הסקריפטים הבאים בדרך כלל מספיקים:

"scripts": {
  "start": "node lib/index.js",
  "build": "tsc"
},

הוספת קוד להגדרה ולהפעלה של שרת ה-flow

בקובץ שבו פועל הסקריפט start, מוסיפים קריאה ל-startFlowServer. השיטה הזו תפעיל שרת Express שמוגדר להציג את התהליכים שלכם בתור נקודות קצה באינטרנט.

כשמבצעים את הקריאה, מציינים את הפלואים שרוצים להציג:

יש גם:

import { startFlowServer } from '@genkit-ai/express';

startFlowServer({
  flows: [menuSuggestionFlow],
});

יש גם כמה פרמטרים אופציונליים שאפשר לציין:

port: יציאת הרשת שבה מתבצע האזנה. אם לא צוין יציאה, השרת מקשיב ביציאה שמוגדרת במשתנה הסביבה PORT. אם לא מגדירים את PORT, הערך שמוגדר כברירת מחדל הוא 3400.
cors: מדיניות ה-CORS של שרת התהליך. אם אתם מתכוונים לגשת לנקודות הקצה האלה מאפליקציית אינטרנט, סביר להניח שתצטרכו לציין זאת.
pathPrefix: תחילית נתיב אופציונלית שאפשר להוסיף לפני נקודות הקצה של התהליך.
jsonParserOptions: אפשרויות להעברה אל מנתח גוף ה-JSON של Express

אופציונלי: הגדרת מדיניות הרשאה

כל תהליכי העבודה שנפרסים צריכים לדרוש סוג כלשהו של הרשאה. אחרת, כל אחד יוכל להפעיל את תהליכי העבודה של ה-AI הגנרטיבי, שעשויים להיות יקרים.

כשפורסים את התהליכים באמצעות Cloud Run, יש שתי אפשרויות לאישור:

אימות מבוסס-IAM ב-Cloud: שימוש במתקני ניהול הגישה המקוריים של Google Cloud כדי לפקח על הגישה לנקודות הקצה. למידע נוסף על מסירת פרטי הכניסה האלה, תוכלו לעיין במאמר אימות במסמכי העזרה של Cloud Run.
מדיניות הרשאה שמוגדרת בקוד: משתמשים בתכונה של מדיניות ההרשאה בתוסף Genkit Express כדי לאמת את פרטי ההרשאה באמצעות קוד מותאם אישית. לרוב מדובר בהרשאה שמבוססת על אסימון, אבל לא תמיד.

אם רוצים להגדיר מדיניות הרשאה בקוד, משתמשים בפרמטר authPolicy בהגדרת התהליך:

// middleware for handling auth tokens in headers.
const authMiddleware = async (req, resp, next) => {
  // parse auth headers and convert to auth object.
  (req as RequestWithAuth).auth = {
    user: await verifyAuthToken(req.header('authorization')),
  };
  next();
};

app.post(
  '/simpleFlow',
  authMiddleware,
  expressHandler(simpleFlow, {
    authPolicy: ({ auth }) => {
      if (!auth.user) {
        throw new Error('not authorized');
      }
    },
  })
);

הפרמטר auth של מדיניות ההרשאה מגיע מהמאפיין auth של אובייקט הבקשה. בדרך כלל מגדירים את המאפיין הזה באמצעות שכבת הביניים של Express. למידע נוסף, ראו הרשאה ותקינות.

פרטים נוספים זמינים במסמכי העזרה של הפלאגין של Express.

איך מאפשרים לפרטי כניסה ל-API להיות זמינים לתהליכים שנפרסו

אחרי הפריסה, תצטרכו למצוא דרך לאמת את התהליכים עם השירותים המרוחקים שהם מסתמכים עליהם. ברוב התהליכים נדרשים לפחות פרטי כניסה כדי לגשת לשירות ה-API של המודל שבו נעשה שימוש.

בדוגמה הזו, מבצעים אחת מהפעולות הבאות, בהתאם לספק המודל שבחרתם:

Gemini (AI מבית Google)Gemini‏ (Vertex AI)

מוודאים ש-Google AI זמין באזור שלכם.
יוצרים מפתח API ל-Gemini API באמצעות Google AI Studio.
מאפשרים את מפתח ה-API בסביבת Cloud Run:
1. במסוף Cloud, מפעילים את Secret Manager API.
2. בדף Secret Manager יוצרים סוד חדש שמכיל את מפתח ה-API.
3. אחרי שיוצרים את הסוד, באותו דף מקצים לחשבון השירות שמוגדרת לו כברירת מחדל ב-Compute גישה לסוד באמצעות התפקיד Secret Manager Secret Accessor. (אפשר למצוא את השם של חשבון שירות ברירת המחדל של Compute בדף IAM).
בשלב מאוחר יותר, כשפורסים את השירות, צריך להפנות לשם הסוד הזה.

במסוף Cloud, מפעילים את Vertex AI API בפרויקט.
בדף IAM, מוודאים שלחשבון השירות המוגדר כברירת מחדל ל-Compute הוקצה התפקיד Vertex AI User.

הסוד היחיד שצריך להגדיר במדריך הזה הוא של ספק המודל, אבל באופן כללי צריך לעשות משהו דומה לכל שירות שבו נעשה שימוש בתהליך.

3. פריסת תהליכים ב-Cloud Run

אחרי שמכינים את הפרויקט לפריסה, אפשר לפרוס אותו באמצעות הכלי gcloud.

Gemini (AI מבית Google)Gemini‏ (Vertex AI)

gcloud run deploy --update-secrets=GEMINI_API_KEY=<your-secret-name>:latest

gcloud run deploy

כלי הפריסה יציג לכם בקשה למידע הנדרש.

כשמתבקשים לאשר הפעלות לא מאומתות:

משיבים Y אם אתם לא משתמשים ב-IAM ובמקום זאת הגדרתם מדיניות הרשאה בקוד.
משיבים N כדי להגדיר את השירות כך שיחייב פרטי כניסה ל-IAM.

אופציונלי: ניסיון בתהליך הפריסה

בסיום הפריסה, הכלי ידפיס את כתובת ה-URL של השירות. אפשר לבדוק את זה באמצעות curl:

curl -X POST https://<service-url>/menuSuggestionFlow \
  -H "Authorization: Bearer $(gcloud auth print-identity-token)" \
  -H "Content-Type: application/json" -d '{"data": "banana"}'