Imagen을 사용하여 이미지 생성

Vertex AI in Firebase SDK를 사용하면 Imagen API를 통해 Imagen 3 모델에 액세스하여 텍스트 프롬프트에서 이미지를 생성할 수 있습니다. 이 기능을 사용하면 다음과 같은 작업을 할 수 있습니다.

자연어로 작성된 프롬프트에서 이미지 생성
다양한 형식과 스타일로 이미지 생성
이미지의 텍스트 렌더링

Vertex AI in Firebase는 아직 Imagen 모델에서 사용할 수 있는 모든 기능을 지원하지 않습니다. 이 페이지의 뒷부분에 있는 지원되는 기능 및 기능에서 자세히 알아보세요.

텍스트 전용 입력 코드로 이동

시작하기 전에

아직 완료하지 않았다면 시작 가이드를 완료하세요. 여기에는 Firebase 프로젝트 설정, 앱을 Firebase에 연결, SDK 추가, Vertex AI 서비스 초기화가 포함됩니다. 이러한 작업은 모두 Vertex AI in Firebase SDK를 사용하여 Imagen 모델에 프롬프트 요청을 전송하기 전에 필요한 작업입니다.

Imagen 모델을 사용하여 이미지를 생성하려면 다음을 실행합니다.

최소한 다음 Firebase 라이브러리 버전을 사용하고 있는지 확인하세요.
iOS+: v11.9.1 이상 | Android: v16.2.0 이상 (BoM: v33.10.0 이상) | 웹: v11.4.1 이상 | Flutter: v1.4.0 이상 (BoM: v3.8.0 이상)
ImagenModel 초기화(GenerativeModel 아님)
generateImages() 호출(generateContent() 또는 generateContentStream() 호출 아님)에서 프롬프트를 전송합니다.

이 ImagenModel 초기화 및 generateImages() 사용은 이 페이지의 예에 나와 있습니다.

이 기능을 지원하는 모델

이미지 생성은 Imagen 3 모델에서 지원됩니다. Gemini 2.0 모델의 이미지 생성 지원이 곧 제공될 예정입니다.

텍스트 전용 입력에서 이미지 생성

텍스트로 프롬프트하여 Imagen 모델에 이미지를 생성해 달라고 요청할 수 있습니다. 하나의 이미지 또는 여러 이미지를 생성할 수 있습니다.

텍스트 전용 입력에서 이미지 1개 생성

이 샘플을 사용하기 전에 이 가이드의 시작하기 전에 섹션을 완료했는지 확인하세요.

텍스트로 프롬프트하여 Imagen 모델에 단일 이미지를 생성하도록 요청할 수 있습니다.

import FirebaseVertexAI

// Initialize the Vertex AI service
let vertex = VertexAI.vertexAI()

// Initialize with an Imagen 3 model that supports your use case
let model = vertex.imagenModel(modelName: "imagen-3.0-generate-002")

// Provide an image generation prompt
let prompt = "An astronaut riding a horse"

// To generate an image, call `generateImages` with the text prompt
let response = try await model.generateImages(prompt: prompt)

// Handle the generated image
guard let image = response.images.first else {
  fatalError("No image in the response.")
}
let uiImage = UIImage(data: image.data)

사용 사례 및 앱에 적합한 모델과 원하는 경우 위치를 선택하는 방법을 알아보세요.

텍스트 전용 입력에서 여러 이미지 생성

이 샘플을 사용하기 전에 이 가이드의 시작하기 전에 섹션을 완료했는지 확인하세요.

기본적으로 Imagen 3 모델은 요청당 하나의 이미지만 생성합니다. 하지만 모델 초기화 중에 generationConfig를 제공하여 Imagen 모델에 요청당 여러 이미지를 생성하도록 요청할 수 있습니다.

import FirebaseVertexAI

// Initialize the Vertex AI service
let vertex = VertexAI.vertexAI()

// Initialize with an Imagen 3 model that supports your use case
let model = vertex.imagenModel(
  modelName: "imagen-3.0-generate-002",
  // Configure the model to generate multiple images for each request
  // See: https://firebase.google.com/docs/vertex-ai/model-parameters
  generationConfig: ImagenGenerationConfig(numberOfImages: 4)
)

// Provide an image generation prompt
let prompt = "An astronaut riding a horse"

// To generate images, call `generateImages` with the text prompt
let response = try await model.generateImages(prompt: prompt)

// If fewer images were generated than were requested,
// then `filteredReason` will describe the reason they were filtered out
if let filteredReason = response.filteredReason {
  print(filteredReason)
}

// Handle the generated images
let uiImages =  response.images.compactMap { UIImage(data: $0.data) }

사용 사례 및 앱에 적합한 모델과 원하는 경우 위치를 선택하는 방법을 알아보세요.

지원되는 기능 및 요구사항

Imagen 3 모델은 이미지 생성과 관련된 다양한 기능을 제공합니다. 이 섹션에서는 Vertex AI in Firebase와 함께 모델을 사용할 때 지원되는 항목을 설명합니다.

지원되는 기능

Vertex AI in Firebase는 Imagen 3 모델의 다음 기능을 지원합니다.

사람 및 얼굴 생성 (Firebase 프로젝트에 Google Cloud의 승인이 있는 경우)
생성된 이미지 내에서 텍스트 생성
생성된 이미지에 워터마크 추가
생성된 이미지 수, 가로세로 비율, 워터마킹과 같은 이미지 생성 매개변수 구성
안전 설정 구성

Vertex AI in Firebase는 Imagen 3 모델의 이러한 고급 기능을 지원하지 않습니다.

이러한 기능의 대부분은 서버 측에서 Imagen 모델을 사용하는 경우에도 승인된 사용자 목록에 있어야 합니다.

이미지 편집 또는 조작 기능(이미지 확대 포함)
모델에 대한 요청에 이미지 포함 (예: 퓨샷 학습)
SDK를 사용하여 디지털 워터마크 확인
이미지에 워터마크가 있는지 확인하려면 미디어 탭을 사용하여 이미지를 Vertex AI Studio에 업로드하면 됩니다.
텍스트에서 '실시간 이미지' 생성 (MP4 생성)
사전 정의된 스타일을 사용하여 이미지 생성
입력 텍스트의 언어 설정
includeSafetyAttributes를 사용 설정하면 safetyAttributes.categories 및 safetyAttributes.scores를 반환할 수 없습니다.
프롬프트 개선(enhancePrompt 매개변수)을 사용 중지합니다. 즉, LLM 기반 프롬프트 재작성 도구는 항상 제공된 프롬프트에 더 많은 세부정보를 자동으로 추가하여 제공된 프롬프트를 더 잘 반영하는 고품질 이미지를 제공합니다.
생성된 이미지를 모델의 응답 (storageUri 매개변수)의 일부로 Google Cloud Storage에 직접 씁니다. 대신 이미지는 항상 응답에서 base64로 인코딩된 이미지 바이트로 반환됩니다.
생성된 이미지를 Cloud Storage에 업로드하려면 Cloud Storage for Firebase를 사용하면 됩니다.

사양 및 제한사항

한도 (요청당)	Imagen 3	Imagen 3 빠름
최대 입력 토큰 수	토큰 480개	토큰 480개
최대 출력 이미지 수	이미지 4개	이미지 4개
지원되는 출력 이미지 해상도 (픽셀)	1024x1024픽셀(가로세로 비율 1:1) 896x1280(가로세로 비율 3:4) 1280x896(가로세로 비율 4:3) 768x1408(가로세로 비율 9:16) 1408x768(가로세로 비율 16:9)	1024x1024픽셀(가로세로 비율 1:1) 896x1280(가로세로 비율 3:4) 1280x896(가로세로 비율 4:3) 768x1408(가로세로 비율 9:16) 1408x768(가로세로 비율 16:9)

할 수 있는 다른 조치

앱에서 사용하는 API를 승인되지 않은 클라이언트의 악용으로부터 보호하기 위한 Firebase App Check 설정을 비롯한 프로덕션 준비에 관해 생각해 보세요. 또한 프로덕션 체크리스트를 검토하세요.

콘텐츠 생성을 제어하는 방법 알아보기

권장사항, 전략, 프롬프트 예시를 포함하여 프롬프트 설계 이해하기
가로세로 비율, 인물 생성, 워터마킹과 같은 Imagen 모델 매개변수를 구성합니다.
안전 설정을 사용하여 유해하다고 간주될 수 있는 대답이 표시될 가능성을 조정합니다.

지원되는 모델 자세히 알아보기

다양한 사용 사례에 사용할 수 있는 모델과 할당량, 가격에 대해 알아보세요.

Vertex AI in Firebase 사용 경험에 관한 의견 보내기