Gemini 제품군은 이미지, 동영상, 텍스트를 비롯한 여러 모달리티의 정보를 처리할 수 있으므로 멀티모달으로 간주됩니다. 예를 들어 Gemini 모델에 쿠키 접시 사진을 보내고 쿠키 레시피를 제공하도록 요청할 수 있습니다.
프롬프트 | 응답 |
이 쿠키의 레시피를 알려주세요. |
**재료** - 1컵. (2 스틱) 무염 버터, 실온 - 3/4컵 정제 설탕 - 3/4컵 갈색 설탕, 팩 - 1티스푼 바닐라 추출물 - 큰 계란 2개 - 2와 1/4컵 다목적 밀가루 - 1티스푼 베이킹 소다 - 1티스푼 소금 ... |
Google Cloud의 Vertex AI에서 제공하는 Gemini API를 사용하여 Gemini 모델 제품군과 상호작용할 수 있습니다. 모바일 및 웹 앱의 경우 Firebase용 Vertex AI SDK를 사용하여 Gemini API를 호출하고 앱에서 직접 Gemini 모델과 상호작용할 수 있습니다.
이 페이지에서는 Gemini 모델에 관한 다음 정보를 제공합니다.
지원되는 입력 유형을 포함하여 다양한 Gemini 모델의 사용 사례를 개략적으로 비교
각 모델의 세부정보 비교(예: 최대 입력 토큰, 동영상의 최대 길이)
Gemini 모델의 버전 관리 방식(특히 안정화, 자동 업데이트, 미리보기 버전)에 관한 설명
초기화 중에 코드에 포함할 수 있는 사용 가능한 모델 이름 목록.
Gemini 모델에서 지원되는 언어 목록
사용 가능한 모델
Firebase용 Vertex AI와 함께 다음 Gemini 모델을 사용할 수 있습니다.
Gemini 1.5 Flash: 1.5 Pro와 동일한 입력 및 출력 유형 (총 토큰 수 포함)을 지원하지만 1.5 Flash는 비용 효율이 높은 대용량 애플리케이션을 위해 특별히 설계되었습니다.
Gemini 1.5 Pro: 텍스트 또는 코드 응답을 위한 텍스트 또는 채팅 프롬프트에 이미지, 오디오, 동영상, PDF 파일을 추가할 수 있는 멀티모달 모델입니다. 또한 최대 100만 개의 토큰으로 장기 컨텍스트 이해를 지원합니다.
Gemini 1.0 Pro Vision: 텍스트 또는 코드 응답을 위해 텍스트와 이미지, 동영상을 처리하도록 설계된 멀티모달 모델입니다. 채팅에 사용할 수 없습니다.
Gemini 1.0 Pro: 자연어 작업, 텍스트 및 코드를 사용한 멀티턴 채팅, 코드 생성을 처리하도록 설계된 모델입니다.
각 모델의 사용 사례
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|
입력 유형 | |||
텍스트 | |||
코드 | |||
이미지 | |||
동영상 (프레임만) | |||
동영상 (프레임 및 오디오) | |||
오디오 | |||
출력 유형 | |||
텍스트 | |||
코드 | |||
일반적인 사용 사례 | |||
다중 모달 요청 | |||
멀티턴 채팅 |
Google Cloud 문서에서 Gemini 모델의 사용 사례에 대해 자세히 알아보세요.
각 모델에 대한 세부정보
모든 Gemini 모델에서 토큰은 약 4자(영문 기준)에 해당합니다. 토큰 100개는 약 60~80개의 영어 단어입니다. countTokens
를 사용하여 요청에 포함된 총 토큰 수를 확인할 수 있습니다.
속성 |
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|
총 토큰 한도 (입력 및 출력 결합) | 토큰 100만 개 | 토큰 16,384개 | 토큰 32,760개 |
출력 토큰 한도 | 토큰 8,192개 | 토큰 2,048개 | 토큰 8,192개 |
요청당 최대 이미지 수 | 이미지 3,000개 | 이미지 16개 | 해당 사항 없음 |
base64로 인코딩된 최대 이미지 크기 | 7 MB | 7 MB | 해당 사항 없음 |
최대 PDF 크기 | 30MB | 30MB | 해당 사항 없음 |
요청당 최대 동영상 파일 수 | 동영상 파일 10개 | 동영상 파일 1개 | 해당 사항 없음 |
최대 동영상 길이 (프레임만 해당) | 동영상 길이: 60분 | 2분 | 해당 사항 없음 |
최대 동영상 길이 (프레임 및 오디오) | 동영상 약 45분 | 해당 사항 없음 | 해당 사항 없음 |
요청당 최대 오디오 파일 수 | 오디오 파일 1개 | 해당 사항 없음 | 해당 사항 없음 |
최대 오디오 길이 | 최대 8.4시간의 오디오 | 해당 사항 없음 | 해당 사항 없음 |
다음 위치에서 모델 및 입력 파일에 대한 보다 자세한 정보를 확인할 수 있습니다.
Google Cloud 문서에서 멀티모달 모델 간의 차이점을 알아보세요.
지원되는 파일 형식, MIME 유형을 지정하는 방법, 파일 및 멀티모달 요청이 요구사항을 충족하는지 확인하고 Vertex AI Gemini API에서 지원되는 입력 파일 및 요구사항의 권장사항을 따르는 방법을 알아보세요.
모델 버전 관리
Gemini 모델은 안정화 버전, 자동 업데이트, 미리보기 버전으로 제공됩니다.
안정화 버전은 정식 버전으로 제공됩니다.
- 안정화 버전에는 모델 이름에 특정 3자리 버전 번호가 추가됩니다(예:
).gemini-1.0-pro-001
- 안정화 버전에는 모델 이름에 특정 3자리 버전 번호가 추가됩니다(예:
자동 업데이트 버전은 항상 해당 모델의 최신 안정화 버전을 가리킵니다. 새로운 안정화 버전이 출시되면 자동 업데이트된 버전이 자동으로 새로운 안정화 버전을 가리키기 시작합니다.
- 자동 업데이트된 버전에는 추가 사항이 없는 모델 이름이 포함됩니다(예:
).gemini-1.0-pro
- 자동 업데이트된 버전에는 추가 사항이 없는 모델 이름이 포함됩니다(예:
미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다. 미리보기 버전은 항상 해당 모델의 최신 미리보기 버전을 가리킵니다. 새 미리보기 버전이 출시되면 기존 미리보기 버전이 자동으로 새 미리보기 버전을 가리키기 시작합니다.
- 미리보기 버전에는 모델의 초기 출시일 (
)과 함께 모델 이름에-MMDD
가 추가됩니다. 예:-preview
(2024년 4월 9일 출시)gemini-1.5-pro-preview-0409
- 미리보기 버전에는 모델의 초기 출시일 (
Google Cloud 문서에서 사용 가능한 Gemini 모델 버전과 수명 주기에 대해 자세히 알아보세요.
사용 가능한 모델 이름
모델 이름은 Gemini API를 호출하는 데 필요한 단계로서 생성 모델을 초기화하는 동안 코드에 포함되는 명시적 값입니다. 사용 중인 언어의 초기화 예시는 시작 가이드를 참고하세요.
Gemini 1.5 플래시 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
정식 버전 | ||||
gemini-1.5-flash-001 |
Gemini 1.5 플래시의 최신 안정화 버전 | 정식 버전 | 2024-05-24 | 2025년 5월 24일 이전 |
자동 업데이트된 버전 | ||||
gemini-1.5-flash |
1.5 플래시의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.5-flash-001 |
정식 버전 | 2024-05-24 | --- |
미리보기 버전 | ||||
gemini-1.5-flash-preview-0514 |
Gemini 1.5 플래시의 최신 미리보기 버전 | 공개 미리보기 | 2024-05-14 | 2024-06-24 |
Gemini 1.5 Pro 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
정식 버전 | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro의 최신 안정화 버전 | 정식 버전 | 2024-05-24 | 2025년 5월 24일 이전 |
자동 업데이트된 버전 | ||||
gemini-1.5-pro |
1.5 Pro의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.5-pro-001 |
정식 버전 | 2024-05-24 | --- |
미리보기 버전 | ||||
gemini-1.5-pro-preview-0514 |
Gemini 1.5 Pro의 최신 미리보기 버전 | 공개 미리보기 | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
gemini-1.5-pro-preview-0514 (최신 미리보기 버전)을 가리킵니다. |
공개 미리보기 | 2024-04-09 | 2024-06-14 |
Gemini 1.0 Pro Vision 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
정식 버전 | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision의 최신 안정화 버전 | 정식 버전 | 2024-02-15 | 2025년 2월 15일 이전 |
자동 업데이트된 버전 | ||||
gemini-1.0-pro-vision |
1.5 Pro Vision의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.5-pro-vision-001 |
정식 버전 | 2024-01-04 | --- |
Gemini 1.0 Pro 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
정식 버전 | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro의 최신 안정화 버전 | 정식 버전 | 2024-04-09 | 2025년 4월 9일 이전 |
gemini-1.0-pro-001 |
Gemini 1.0 Pro의 안정화 버전 | 정식 버전 | 2024-02-15 | 2025년 2월 15일 이전 |
자동 업데이트된 버전 | ||||
gemini-1.0-pro |
1.0 Pro의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.0-pro-002 |
정식 버전 | 2024-02-15 | --- |
지원 언어
Gemini 모델은 다음 언어를 지원합니다.
한국어(ar), 벵골어(bn), 한국어(스웨덴어), 태국어(슬로비어), 태국어(슬로베니아어), 태국어(슬로비어), 중국어(슬로베니아어), 중국어(스와이어), 중국어(번체), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아어(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hilove), 인도네시아어(hu), 히브리어(iw), 힌디어(hilove), 인도네시아어(hu)
다음 단계
Gemini API의 기능 사용해 보기
- 멀티턴 대화 (채팅)를 만듭니다.
- 텍스트 전용 프롬프트에서 텍스트를 생성합니다.
- 멀티모달 프롬프트(텍스트, 이미지, PDF, 동영상, 오디오 포함)에서 텍스트를 생성합니다.
- 함수 호출을 사용하여 생성 모델을 외부 시스템 및 정보에 연결합니다.