Gemini 모델 제품군은 이미지, 동영상, 텍스트 등 여러 형식의 정보를 처리할 수 있으므로 멀티모달로 간주됩니다. 예를 들어 Gemini 모델에 쿠키 접시 사진을 전송하고 해당 쿠키의 레시피를 요청할 수 있습니다.
프롬프트 | 응답 |
Give me a recipe for these cookies. |
**INGREDIENTS**
|
Google Cloud의 Vertex AI에서 제공하는 Gemini API를 사용하여 Gemini 모델 제품군과 상호작용할 수 있습니다. 모바일 및 웹 앱의 경우 Vertex AI in Firebase SDK를 사용하여 Gemini API를 호출하고 앱에서 직접 Gemini 모델과 상호작용할 수 있습니다.
이 페이지에서는 Gemini 모델에 관한 다음 정보를 제공합니다.
지원되는 입력 유형을 포함하여 다양한 Gemini 모델의 사용 사례를 대략적으로 비교합니다.
최대 입력 토큰 또는 최대 동영상 길이와 같은 각 모델의 세부정보 비교
Gemini 모델의 버전 관리 방법, 특히 안정화, 자동 업데이트, 미리보기 버전에 관한 설명입니다.
초기화 중에 코드에 포함할 사용 가능한 모델 이름 목록입니다.
Gemini 모델에서 지원되는 언어 목록입니다.
사용 가능한 모델
Vertex AI in Firebase와 함께 다음 Gemini 모델을 사용할 수 있습니다.
Gemini 1.5 Flash
1.5 Pro와 동일한 입력 및 출력 유형을 지원하지만 100만 개의 토큰으로 긴 컨텍스트 이해를 제공하는 멀티모달 모델입니다. Gemini 1.5 Flash는 비용 효율적인 대용량 애플리케이션을 위해 특별히 설계되었습니다.Gemini 1.5 Pro
텍스트 또는 코드 응답에 대한 텍스트 또는 채팅 프롬프트에서 이미지, 오디오, 동영상, PDF 파일 추가를 지원하는 멀티모달 모델입니다. 또한 2백만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다.Gemini 1.0 Pro Vision
텍스트 또는 코드 응답에 대한 텍스트와 이미지, 동영상을 처리하도록 설계된 멀티모달 모델입니다. 채팅에는 사용할 수 없습니다.Gemini 1.0 Pro
자연어 태스크, 텍스트 및 코드로 된 멀티턴 채팅, 코드 생성을 처리하도록 설계된 모델입니다.
각 모델의 사용 사례 및 기능
각 Gemini 모델은 다양한 사용 사례를 지원하기 위해 서로 다른 기능을 갖추고 있습니다. Google Cloud 문서에서 각 Gemini 모델에 관해 자세히 알아볼 수 있습니다.
각 모델에 지원되는 입력 및 출력
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
입력 유형 | ||||
텍스트 | ||||
코드 | ||||
이미지 | ||||
동영상 (프레임만) | ||||
동영상 (프레임 및 오디오) | ||||
오디오 | ||||
출력 유형 | ||||
텍스트 | ||||
응답 스키마를 사용하는 구조화된 출력 (예: JSON) | ||||
코드 |
지원되는 파일 형식에 관한 자세한 내용은 지원되는 입력 파일 및 에 대한 요구사항을 참고하세요.Vertex AI Gemini API
각 모델에 지원되는 기능 및 일반적인 기능
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
텍스트 전용 입력에서 텍스트 생성 | |||||
멀티모달 입력에서 텍스트 생성 | |||||
응답 스키마를 사용한 구조화된 출력 (예: JSON) | |||||
멀티턴 채팅 | |||||
함수 호출 | |||||
기본 함수 호출 | |||||
병렬 함수 호출 | |||||
함수 호출 모드 | |||||
토큰 및 청구 가능한 문자 수 계산 | |||||
시스템 안내 |
각 모델에 관한 세부정보
속성 | Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|---|
총 토큰 한도 (입력 및 출력 합산) * | 토큰 1,048,576개 | 토큰 2,097,152개 | 토큰 16,384개 | 토큰 32,760개 |
출력 토큰 한도 * | 토큰 8,192개 | 토큰 8,192개 | 토큰 2,048개 | 토큰 8,192개 |
요청당 최대 이미지 수 | 이미지 3,000개 | 이미지 3,000개 | 이미지 16개 | 해당 사항 없음 |
base64로 인코딩된 최대 이미지 크기 | 7 MB | 7 MB | 7 MB | 해당 사항 없음 |
최대 PDF 크기 | 30MB | 30MB | 30MB | 해당 사항 없음 |
요청당 최대 동영상 파일 수 | 동영상 파일 10개 | 동영상 파일 10개 | 동영상 파일 1개 | 해당 사항 없음 |
최대 동영상 길이 (프레임만 해당) | 동영상 약 60분 | 동영상 약 60분 | 2분 | 해당 사항 없음 |
최대 동영상 길이 (프레임 및 오디오) | 동영상 약 45분 | 동영상 약 45분 | 해당 사항 없음 | 해당 사항 없음 |
요청당 최대 오디오 파일 수 | 오디오 파일 1개 | 오디오 파일 1개 | 해당 사항 없음 | 해당 사항 없음 |
최대 오디오 길이 | 오디오 최대 8.4시간 | 오디오 최대 8.4시간 | 해당 사항 없음 | 해당 사항 없음 |
* 모든 Gemini 모델에서 토큰은 약 4자(영문 기준)에 해당하므로 토큰 100개는 영어 단어 약 60~80개에 해당합니다. countTokens
를 사용하여 요청의 총 토큰 수를 확인할 수 있습니다.
지원되는 입력 파일 및 Vertex AI Gemini API 요구사항에서 지원되는 파일 형식, MIME 유형을 지정하는 방법, 파일 및 다중 모드 요청이 요구사항을 충족하고 권장사항을 따르는지 확인하는 방법을 알아보세요.
모델 버전 관리
Gemini 모델은 안정화, 자동 업데이트, 미리보기 버전으로 제공됩니다.
안정화 버전은 정식 버전으로 간주됩니다.
- 안정화 버전에는 특정 세 자리 버전 번호(예:
)가 추가된 모델 이름이 있습니다.gemini-1.5-pro-002
- 안정화 버전에는 특정 세 자리 버전 번호(예:
자동 업데이트 버전은 항상 해당 모델의 최신 안정화 버전을 가리킵니다. 새 안정화 버전이 출시되면 자동 업데이트 버전이 새 안정화 버전을 자동으로 가리키기 시작합니다.
- 자동 업데이트 버전에는 추가 항목이 없는 모델 이름이 있습니다(예:
).gemini-1.5-pro
- 자동 업데이트 버전에는 추가 항목이 없는 모델 이름이 있습니다(예:
미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다. 미리보기 버전은 항상 해당 모델의 최신 미리보기 버전을 가리킵니다. 새 미리보기 버전이 출시되면 기존 미리보기 버전이 자동으로 새 미리보기 버전을 가리키기 시작합니다.
- 미리보기 버전에는 모델 이름에 모델의 최초 출시일(
)과 함께-MMDD
이 추가됩니다(예:-preview
(2024년 4월 9일에 출시됨)).gemini-1.5-pro-preview-0409
- 미리보기 버전에는 모델 이름에 모델의 최초 출시일(
Google Cloud 문서에서 사용 가능한 Gemini 모델 버전 및 수명 주기에 대해 자세히 알아보세요.
사용 가능한 모델 이름
모델 이름은 생성형 모델을 초기화하는 동안 코드에 포함하는 명시적 값입니다 (Gemini API를 호출하는 데 필요한 단계임). 사용 중인 언어의 초기화 예시는 시작 가이드를 참고하세요.
Gemini 1.5 Flash 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.5-flash-002 |
Gemini 1.5 Flash의 최신 안정화 버전 | 정식 버전 | 2024-09-24 | 2025년 9월 24일 이후 |
gemini-1.5-flash-001 |
Gemini 1.5 Flash의 초기 안정화 버전 | 정식 버전 | 2024-05-24 | 2025년 5월 24일 이후 |
자동 업데이트 버전 | ||||
gemini-1.5-flash |
1.5 Flash의 최신 안정화 버전을 가리킵니다. (현재 gemini-1.5-flash-002 |
정식 버전 | 2024-09-24 | --- |
Gemini 1.5 Pro 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.5-pro-002 |
Gemini 1.5 Pro의 최신 안정화 버전 | 정식 버전 | 2024-09-24 | 2025년 9월 24일 이후 |
gemini-1.5-pro-001 |
Gemini 1.5 Pro의 초기 안정화 버전 | 정식 버전 | 2024-05-24 | 2025년 5월 24일 이후 |
자동 업데이트 버전 | ||||
gemini-1.5-pro |
1.5 Pro 의 최신 안정화 버전을 가리킵니다(현재 gemini-1.5-pro-002 |
정식 버전 | 2024-09-24 | --- |
Gemini 1.0 Pro Vision 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision의 최신 안정화 버전 | 정식 버전 | 2024-02-15 | 2025년 2월 15일 이후 |
자동 업데이트 버전 | ||||
gemini-1.0-pro-vision |
1.5 Pro Vision 의 최신 안정화 버전을 가리킵니다(현재 gemini-1.5-pro-vision-001 |
정식 버전 | 2024-01-04 | --- |
Gemini 1.0 Pro 모델 이름
모델 이름 | 설명 | 출시 단계 | 최초 출시일 | 지원 중단 날짜 |
---|---|---|---|---|
안정화 버전 | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro의 최신 안정화 버전 | 정식 버전 | 2024-04-09 | 2025년 4월 9일 이후 |
gemini-1.0-pro-001 |
Gemini 1.0 Pro의 안정화 버전 | 정식 버전 | 2024-02-15 | 2025년 2월 15일 이후 |
자동 업데이트 버전 | ||||
gemini-1.0-pro |
1.0 Pro 의 최신 안정화 버전(현재 gemini-1.0-pro-002 |
정식 버전 | 2024-02-15 | --- |
지원 언어
모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.
한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)
Gemini 1.5 Pro 및 Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.
아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)
다음 단계
Gemini API의 기능 사용해 보기
- 멀티턴 대화 (채팅)를 빌드합니다.
- 텍스트 전용 프롬프트에서 텍스트를 생성합니다.
- 멀티모달 프롬프트(텍스트, 이미지, PDF, 동영상, 오디오 포함)에서 텍스트를 생성합니다.
- 텍스트 및 멀티모달 프롬프트에서 구조화된 출력 (예: JSON)을 생성합니다.
- 함수 호출을 사용하여 생성형 모델을 외부 시스템 및 정보에 연결합니다.