Google, yapay zekâ chatbotu Bard’ı Gemini olarak yeniden markalaştırıyor ve özel bir uygulama başlatmayı planlıyor. Gemini karmaşık konularda uzmanlar kadar iyi sonuçlar sunabiliyor.
X’te sızdırılan bir belgeye göre Google, önümüzdeki hafta Bard AI aracında bazı büyük değişiklikler yapmayı planlıyor. Kamuoyuna açıklanmayan planların arasında Bard adının Gemini olarak değiştirilmesinin de yer aldığı belirtiliyor.
Google, geniş yapay zekâ dil modeli Gemini’yı 2023’ün sonunda tanıtmıştı ve bunu Bard da dahil olmak üzere bazı ürünlerine entegre etmeye başladı.
Android uygulama geliştiricisi Dylan Roussel tarafından paylaşılan değişiklik 7 Şubat tarihli ve aynı zamanda ücretli Gemini Advanced sürümünün bu tarihte kullanıma sunulacağını belirtiyor. Android için bir Gemini uygulamasının da “yakında” geleceğinden bahsediyor.
Dylan Roussel’in paylaştığı görüntüye göre Gemini Advanced, kullanıcılara “kodlama, mantıksal akıl yürütme, incelikli talimatları takip etme ve yaratıcı işbirliği gibi son derece karmaşık görevlerde çok daha yetenekli” olan Gemini’ın Ultra 1.0 modeline erişim sağlayacak. Gemini Advanced, başlangıçta İngilizce dil desteğiyle 150’den fazla ülkede kullanılabilir olacak. Ayrıca bu sürümle birlikte Gemini’ın Kanada’ya genişleyeceği belirtiliyor.
Gemini nedir?
Çok modlu bir yapay zekâ modeli olan Gemini, metin, görüntüler, ses, video, kodlama dilleri gibi farklı türdeki bilgileri genelleştirip sorunsuz bir şekilde anlayabiliyor, bunlar üzerinde çalışabiliyor ve birleştirebiliyor.
Gemini, yapay zeka modellerinin bilgi ve problem çözme yeteneklerini test etmek için en popüler yöntemlerden biri olan MMLU (Massive Multitask Language Understanding) konusunda insan uzmanlarından daha iyi performans gösteren ilk model.
Gemini, aynı zamanda mobil cihazlardan veri merkezlerine kadar her şeyde verimli bir şekilde çalışabilen, şimdiye kadarki en esnek model olarak dikkat çekiyor. Gemini’nin geliştiricilerin ve kurumsal müşterilerin yapay zekâ ile oluşturma ve ölçeklendirme yöntemlerini önemli ölçüde geliştireceği belirtiliyor.
Yeni nesil yetenekler
Pichai ve Hassabis’in blog yazısında verdiği bilgilere göre; şimdiye kadar çok modlu modeller oluşturmaya yönelik standart yaklaşım, farklı yöntemler için ayrı bileşenlerin eğitilmesini ve daha sonra bu işlevlerin bir kısmını kabaca taklit edecek şekilde bunları bir araya getirmeyi içeriyordu. Bu modeller bazen görüntüleri tanımlamak gibi belirli görevleri yerine getirmek konusunda iyi olabilir, ancak daha kavramsal ve karmaşık akıl yürütme konusunda zorluk yaşayabiliyorlar.
Gemini metin, görseller, video, ses ve kod arasında kusursuz bir şekilde akıl yürütüyor.
Pichai ve Hassabis, “Gemini’yi doğal olarak çok modlu olacak ve başlangıçtan itibaren farklı yöntemler konusunda önceden eğitilmiş şekilde tasarladık. Daha sonra etkinliğini daha da iyileştirmek için ek çok modlu verilerle ince ayar yaptık. Bu, Gemini’nin her türlü girdiyi, mevcut çok modlu modellerden çok daha iyi bir şekilde, en başından itibaren sorunsuz bir şekilde anlamasına ve bunlar hakkında akıl yürütmesine yardımcı olur ve yetenekleri neredeyse her alanda en son teknolojidir” diyor.
Kaynak : Google, Digital Age
Kommentare