Gemini API'yi kullanarak çok modlu istemlerden metin oluşturma


Firebase için Vertex AI SDK'sı kullanarak uygulamanızdan Gemini API'yi çağırırken Gemini modelinden çok modlu girişe göre metin oluşturmasını isteyebilirsiniz. Çok modlu istemler; resimler, PDF'ler, video ve ses ile birlikte metin gibi birden çok modalite (veya giriş türü) içerebilir.

Çok modlu istemleri test etmek ve yinelemek için Vertex AI Studio'yu kullanmanızı öneririz.

Başlamadan önce

Henüz yapmadıysanız Firebase için Vertex AI SDK'ları ile ilgili başlangıç kılavuzunu inceleyin. Aşağıdakilerin tümünü yaptığınızdan emin olun:

  • Blaze fiyatlandırma planını kullanma ve gerekli API'leri etkinleştirme dahil olmak üzere yeni veya mevcut bir Firebase projesi oluşturun.

  • Uygulamanızı Firebase'e bağlayın. Bu işlemler arasında, uygulamanızı kaydetme ve Firebase yapılandırmanızı uygulamanıza ekleme yer alır.

  • SDK'yı ekleyip uygulamanızda Vertex AI hizmetini ve üretken modeli başlatın.

Uygulamanızı Firebase'e bağladıktan, SDK'yı ekledikten, Vertex AI hizmetini ve üretken modeli başlattıktan sonra, Gemini API'yi çağırmaya hazırsınız demektir.

Metinden ve tek bir resimden metin oluştur

Bu örneği denemeden önce, bu kılavuzun Başlamadan önce bölümünü tamamladığınızdan emin olun.

Gemini API'yi hem metin hem de tek bir dosya (bu örnekte gösterildiği gibi bir resim gibi) içeren çok modlu istemlerle çağırabilirsiniz. Bu çağrılar için çok modlu istemleri destekleyen bir model (ör. Gemini 1.5 Pro) kullanmanız gerekir.

Desteklenen dosyalar arasında resim, PDF, video, ses ve diğer dosyalar yer alır. Giriş dosyalarıyla ilgili şartları ve önerileri incelemeyi unutmayın.

Yanıtı akış şeklinde göstermeyi (generateContentStream) veya sonucun tamamı oluşturulana kadar (generateContent) yanıt beklemeyi seçin.

Akışlı

Model oluşturma işleminin sonucunun tamamını beklemeden, bunun yerine kısmi sonuçları işlemek için akışı kullanarak daha hızlı etkileşimler gerçekleştirebilirsiniz.

Bu örnekte, metin ve tek bir resim içeren çok modlu bir istem isteğinden oluşturulan metnin akışı için generateContentStream() özelliğinin nasıl kullanılacağı gösterilmektedir:

Akış olmadan

Alternatif olarak, akış yerine sonucun tamamını bekleyebilirsiniz. Sonuç yalnızca model tüm oluşturma işlemini tamamladıktan sonra döndürülür.

Bu örnekte, metin ve tek bir resim içeren çok modlu istem isteğinden metin oluşturmak için generateContent() özelliğinin nasıl kullanılacağı gösterilmektedir:

Gemini modelini ve isteğe bağlı olarak kullanım alanınıza ve uygulamanıza uygun konumu nasıl seçeceğinizi öğrenin.

Metin ve birden çok resimden metin oluşturun

Bu örneği denemeden önce, bu kılavuzun Başlamadan önce bölümünü tamamladığınızdan emin olun.

Gemini API'yi hem metin hem de birden çok dosya (bu örnekte gösterildiği gibi resimler gibi) içeren çok modlu istemlerle çağırabilirsiniz. Bu çağrılar için çok modlu istemleri destekleyen bir model (ör. Gemini 1.5 Pro) kullanmanız gerekir.

Desteklenen dosyalar arasında resim, PDF, video, ses ve diğer dosyalar yer alır. Giriş dosyalarıyla ilgili şartları ve önerileri incelemeyi unutmayın.

Yanıtı akış şeklinde göstermeyi (generateContentStream) veya sonucun tamamı oluşturulana kadar (generateContent) yanıt beklemeyi seçin.

Akışlı

Model oluşturma işleminin sonucunun tamamını beklemeden, bunun yerine kısmi sonuçları işlemek için akışı kullanarak daha hızlı etkileşimler gerçekleştirebilirsiniz.

Bu örnekte, metin ve birden çok resim içeren çok modlu bir istem isteğinden oluşturulan metnin akışı için generateContentStream() özelliğinin nasıl kullanılacağı gösterilmektedir:

Akış olmadan

Alternatif olarak, akış yerine sonucun tamamını bekleyebilirsiniz. Sonuç yalnızca model tüm oluşturma işlemini tamamladıktan sonra döndürülür.

Bu örnekte, metin ve birden çok resim içeren çok modlu bir istem isteğinden metin oluşturmak için generateContent() ürününün nasıl kullanılacağı gösterilmektedir:

Gemini modelini ve isteğe bağlı olarak kullanım alanınıza ve uygulamanıza uygun konumu nasıl seçeceğinizi öğrenin.

Metin ve videodan metin oluştur

Bu örneği denemeden önce, bu kılavuzun Başlamadan önce bölümünü tamamladığınızdan emin olun.

Gemini API'yi hem metin hem de tek bir video içeren çok modlu istemlerle (bu örnekte gösterildiği gibi) çağırabilirsiniz. Bu çağrılar için çok modlu istemleri destekleyen bir model (ör. Gemini 1.5 Pro) kullanmanız gerekir.

Giriş dosyalarıyla ilgili şartları ve önerileri incelemeyi unutmayın.

Yanıtı akış şeklinde göstermeyi (generateContentStream) veya sonucun tamamı oluşturulana kadar (generateContent) yanıt beklemeyi seçin.

Akışlı

Model oluşturma işleminin sonucunun tamamını beklemeden, bunun yerine kısmi sonuçları işlemek için akışı kullanarak daha hızlı etkileşimler gerçekleştirebilirsiniz.

Bu örnekte, metin ve tek bir video içeren çok modlu bir istem isteğinden oluşturulan metnin akışı için generateContentStream() özelliğinin nasıl kullanılacağı gösterilmektedir:

Akış olmadan

Alternatif olarak, akış yerine sonucun tamamını bekleyebilirsiniz. Sonuç yalnızca model tüm oluşturma işlemini tamamladıktan sonra döndürülür.

Bu örnekte, metin ve tek bir video içeren çok modlu bir istem isteğinden metin oluşturmak için generateContent() özelliğinin nasıl kullanılacağı gösterilmektedir:

Gemini modelini ve isteğe bağlı olarak kullanım alanınıza ve uygulamanıza uygun konumu nasıl seçeceğinizi öğrenin.

Giriş dosyaları için gereksinimler ve öneriler

Desteklenen dosya türleri, MIME türünün nasıl belirtileceği, dosyalarınızın ve çok modlu isteklerinizin gereksinimleri karşıladığından nasıl emin olacağınızı ve en iyi uygulamaları nasıl takip edeceğinizi öğrenmek için Desteklenen giriş dosyaları ve Vertex AI Gemini API koşulları başlıklı makaleyi inceleyin.

Başka ne yapabilirsiniz?

Gemini API'nin diğer özelliklerini deneyin

İçerik üretme işlemini nasıl kontrol edeceğinizi öğrenin

Vertex AI Studio'yu kullanarak istemler ve model yapılandırmalarıyla da denemeler yapabilirsiniz.

Gemini modelleri hakkında daha fazla bilgi

Çeşitli kullanım alanları için kullanılabilecek modeller ve bunların kotaları ve fiyatlandırması hakkında bilgi edinin.


Firebase için Vertex AI deneyiminizle ilgili geri bildirimde bulunun