Gemini 모델에 대해 자세히 알아보기

Gemini 모델 제품군은 이미지, 동영상, 텍스트 등 여러 형식의 정보를 처리할 수 있으므로 멀티모달로 간주됩니다. 예를 들어 Gemini 모델에 쿠키 접시 사진을 전송하고 해당 쿠키의 레시피를 요청할 수 있습니다.

프롬프트 응답
Give me a recipe for these cookies.

초콜릿 칩 쿠키 여러 개 사진
**INGREDIENTS**
- 1 c. (2 sticks) unsalted butter, softened
- 3/4 c. granulated sugar
- 3/4 c. brown sugar, packed
- 1 tsp . vanilla extract
- 2 large eggs
- 2 1/4 c. all-purpose flour
- 1 tsp. baking soda
- 1 tsp. salt
...

Google CloudVertex AI에서 제공하는 Gemini API를 사용하여 Gemini 모델 제품군과 상호작용할 수 있습니다. 모바일 및 웹 앱의 경우 Vertex AI in Firebase SDK를 사용하여 Gemini API를 호출하고 앱에서 직접 Gemini 모델과 상호작용할 수 있습니다.

이 페이지에서는 Gemini 모델에 관한 다음 정보를 제공합니다.

사용 가능한 모델

Vertex AI in Firebase와 함께 다음 Gemini 모델을 사용할 수 있습니다.

  • Gemini 1.5 Flash
    1.5 Pro와 동일한 입력 및 출력 유형을 지원하지만 100만 개의 토큰으로 긴 컨텍스트 이해를 제공하는 멀티모달 모델입니다. Gemini 1.5 Flash는 비용 효율적인 대용량 애플리케이션을 위해 특별히 설계되었습니다.

  • Gemini 1.5 Pro
    텍스트 또는 코드 응답에 대한 텍스트 또는 채팅 프롬프트에서 이미지, 오디오, 동영상, PDF 파일 추가를 지원하는 멀티모달 모델입니다. 또한 2백만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다.

  • Gemini 1.0 Pro Vision
    텍스트 또는 코드 응답에 대한 텍스트와 이미지, 동영상을 처리하도록 설계된 멀티모달 모델입니다. 채팅에는 사용할 수 없습니다.

  • Gemini 1.0 Pro
    자연어 태스크, 텍스트 및 코드로 된 멀티턴 채팅, 코드 생성을 처리하도록 설계된 모델입니다.

코드에 포함할 모델 이름으로 이동

각 모델의 사용 사례 및 기능

각 Gemini 모델은 다양한 사용 사례를 지원하기 위해 서로 다른 기능을 갖추고 있습니다. Google Cloud 문서에서 각 Gemini 모델에 관해 자세히 알아볼 수 있습니다.

각 모델에 지원되는 입력 및 출력

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
입력 유형
텍스트
코드
이미지
PDF
동영상 (프레임만)
동영상 (프레임 및 오디오)
오디오
출력 유형
텍스트
응답 스키마를 사용하는 구조화된 출력 (예: JSON)
코드

지원되는 파일 형식에 관한 자세한 내용은 지원되는 입력 파일 및 에 대한 요구사항을 참고하세요.Vertex AI Gemini API

각 모델에 지원되는 기능 및 일반적인 기능

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
텍스트 전용 입력에서 텍스트 생성
멀티모달 입력에서 텍스트 생성
응답 스키마를 사용한 구조화된 출력 (예: JSON)
멀티턴 채팅
함수 호출
기본 함수 호출
병렬 함수 호출
함수 호출 모드
토큰 및 청구 가능한 문자 수 계산
시스템 안내

각 모델에 관한 세부정보

속성 Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
총 토큰 한도 (입력 및 출력 합산) * 토큰 1,048,576개 토큰 2,097,152개 토큰 16,384개 토큰 32,760개
출력 토큰 한도 * 토큰 8,192개 토큰 8,192개 토큰 2,048개 토큰 8,192개
요청당 최대 이미지 수 이미지 3,000개 이미지 3,000개 이미지 16개 해당 사항 없음
base64로 인코딩된 최대 이미지 크기 7 MB 7 MB 7 MB 해당 사항 없음
최대 PDF 크기 30MB 30MB 30MB 해당 사항 없음
요청당 최대 동영상 파일 수 동영상 파일 10개 동영상 파일 10개 동영상 파일 1개 해당 사항 없음
최대 동영상 길이 (프레임만 해당) 동영상 약 60분 동영상 약 60분 2분 해당 사항 없음
최대 동영상 길이 (프레임 및 오디오) 동영상 약 45분 동영상 약 45분 해당 사항 없음 해당 사항 없음
요청당 최대 오디오 파일 수 오디오 파일 1개 오디오 파일 1개 해당 사항 없음 해당 사항 없음
최대 오디오 길이 오디오 최대 8.4시간 오디오 최대 8.4시간 해당 사항 없음 해당 사항 없음

* 모든 Gemini 모델에서 토큰은 약 4자(영문 기준)에 해당하므로 토큰 100개는 영어 단어 약 60~80개에 해당합니다. countTokens를 사용하여 요청의 총 토큰 수를 확인할 수 있습니다.

지원되는 입력 파일 및 Vertex AI Gemini API 요구사항에서 지원되는 파일 형식, MIME 유형을 지정하는 방법, 파일 및 다중 모드 요청이 요구사항을 충족하고 권장사항을 따르는지 확인하는 방법을 알아보세요.

모델 버전 관리

Gemini 모델은 안정화, 자동 업데이트, 미리보기 버전으로 제공됩니다.

  • 안정화 버전은 정식 버전으로 간주됩니다.

    • 안정화 버전에는 특정 세 자리 버전 번호(예: gemini-1.5-pro-002)가 추가된 모델 이름이 있습니다.
  • 자동 업데이트 버전은 항상 해당 모델의 최신 안정화 버전을 가리킵니다. 새 안정화 버전이 출시되면 자동 업데이트 버전이 새 안정화 버전을 자동으로 가리키기 시작합니다.

    • 자동 업데이트 버전에는 추가 항목이 없는 모델 이름이 있습니다(예: gemini-1.5-pro).
  • 미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다. 미리보기 버전은 항상 해당 모델의 최신 미리보기 버전을 가리킵니다. 새 미리보기 버전이 출시되면 기존 미리보기 버전이 자동으로 새 미리보기 버전을 가리키기 시작합니다.

    • 미리보기 버전에는 모델 이름에 모델의 최초 출시일(-MMDD)과 함께 -preview이 추가됩니다(예: gemini-1.5-pro-preview-0409(2024년 4월 9일에 출시됨)).

Google Cloud 문서에서 사용 가능한 Gemini 모델 버전 및 수명 주기에 대해 자세히 알아보세요.

사용 가능한 모델 이름

모델 이름은 생성형 모델을 초기화하는 동안 코드에 포함하는 명시적 값입니다 (Gemini API를 호출하는 데 필요한 단계임). 사용 중인 언어의 초기화 예시는 시작 가이드를 참고하세요.

Gemini 1.5 Flash 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-flash-002 Gemini 1.5 Flash의 최신 안정화 버전 정식 버전 2024-09-24 2025년 9월 24일 이후
gemini-1.5-flash-001 Gemini 1.5 Flash의 초기 안정화 버전 정식 버전 2024-05-24 2025년 5월 24일 이후
자동 업데이트 버전
gemini-1.5-flash 1.5 Flash의 최신 안정화 버전을 가리킵니다.
(현재 gemini-1.5-flash-002)
정식 버전 2024-09-24 ---

Gemini 1.5 Pro 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-pro-002 Gemini 1.5 Pro의 최신 안정화 버전 정식 버전 2024-09-24 2025년 9월 24일 이후
gemini-1.5-pro-001 Gemini 1.5 Pro의 초기 안정화 버전 정식 버전 2024-05-24 2025년 5월 24일 이후
자동 업데이트 버전
gemini-1.5-pro 1.5 Pro
최신 안정화 버전을 가리킵니다(현재 gemini-1.5-pro-002).
정식 버전 2024-09-24 ---

Gemini 1.0 Pro Vision 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision의 최신 안정화 버전 정식 버전 2024-02-15 2025년 2월 15일 이후
자동 업데이트 버전
gemini-1.0-pro-vision 1.5 Pro Vision
최신 안정화 버전을 가리킵니다(현재 gemini-1.5-pro-vision-001).
정식 버전 2024-01-04 ---

Gemini 1.0 Pro 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.0-pro-002 Gemini 1.0 Pro의 최신 안정화 버전 정식 버전 2024-04-09 2025년 4월 9일 이후
gemini-1.0-pro-001 Gemini 1.0 Pro의 안정화 버전 정식 버전 2024-02-15 2025년 2월 15일 이후
자동 업데이트 버전
gemini-1.0-pro 1.0 Pro
최신 안정화 버전(현재 gemini-1.0-pro-002)을 가리킵니다.
정식 버전 2024-02-15 ---

지원 언어

  • 모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.

    한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)

  • Gemini 1.5 Pro 및 Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.

    아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)

다음 단계

Gemini API의 기능 사용해 보기