Yapay zeka dünyasında her gün yeni bir gelişmeye yaşanmakta. En kolay takip edip günlük kullanımda deneyimlenebilenler elbette Chat GPT, Gemini gibi Google niyetiyle kullanılan uygulamalar.
Doğru prompt oluşturma üzerine eğitimler açılmaya, prompt mühendisliği alanları meydana gelmektedir. Devamında istenilenleri görsel olarak oluşturan uygulamalarla kendilerini güncellediler. Şimdilerdeyse artık istenilenler hareketlendirilmeye ve video maker uygulamalar olarak kullanılma yoluna girilmiş durumda.
Bu gelişmelerin en günceli yeni sunulan Sora ve Gemini 2.0, yeni nesil yapay zeka modellerinin öncülüğünü yapıyor. (Bu yazı yayınlandığında belki bu uygulamalar bile güncelliğini kaybetmiş olabilir.)
Sora, görsel içerik oluşturma konusunda uzmanlaşmış bir model. Görüntüler, videolar ve animasyonlar oluşturabiliyor ve bu alanda devrim yaratma potansiyeline sahip. Gemini 2.0 ise daha genel amaçlı bir model. Metin, kod ve görüntüler üzerinde çalışabiliyor ve karmaşık görevleri yerine getirebiliyor.
OpenAI, Sora’yı ilk olarak Şubat ayında sundu ancak yalnızca belirli sanatçılar ve film yapımcıları tarafından erişilebilirdi. Aralık ayında ise bunun herkese açık olacağını duyurdu. Video oluşturma modeline buradan ulaşabilirsiniz.
Kullanıcılar 1080p çözünürlüğe kadar, 20 saniyeye kadar uzunlukta ve geniş ekran, dikey veya kare en boy oranlarında videolar oluşturabilir. Başlangıç videosu na buradan göz atabilirsiniz.
Sora, ek bir ücret ödemeden Plus hesabınızın bir parçası olarak dahildir. Her ay 480p çözünürlükte 50 adede kadar video veya 720p çözünürlükte daha az video üretebilirsiniz.
Daha fazla Sora isteyenler için Pro planı 10 kat daha fazla kullanım, daha yüksek çözünürlükler ve daha uzun süreler içerir.
Sora tarafından oluşturulan tüm videolar, şeffaflık sağlamak için Sora’dan geldiğini belirleyecek ve kökeni doğrulamak için kullanılabilecek C2PA(yeni pencerede açılır) meta verileriyle birlikte gelir. Kusurlu olsa da, varsayılan olarak görünür filigranlar gibi güvenlik önlemleri eklenmiş ve içeriğin Sora’dan gelip gelmediğini doğrulamaya yardımcı olmak için generations2’nin teknik özelliklerini kullanan dahili bir arama aracı oluşturulmuştur.
Google’da bu sırada; şimdiye kadarki en yetenekli yapay zeka modelimiz diyerek Gemini 2.0’ı duyurdu. Bu model, aracılık dönemi için tasarlandı. Gemini 2.0, yerel görüntü oluşturma ve ses çıkışıyla çok modlu çıktı ve Google Arama ve Haritalar gibi araçların yerel kullanımı gibi yeni özelliklere sahip.
Gemini 2.0, Android cihazlar için evrensel bir asistan olan Astra ve otonom web gezintisi yapabilen bir aracı olan Mariner gibi projelere güç vermektedir. Bu modeli Düşük gecikme süresi ve gelişmiş performansa sahip Gemini 2.0 Flash’ın ön sürümü olarak yayınlandı.
Gemini 2.0 Flash’taki açılır menünün katmanlar arasında mevcut olduğunu belirtmekte fayda var, bu da Gemini Advanced için ödeme yapmasanız bile yeni modele erişebileceğiniz anlamına geliyor. Ancak, ücretsiz kullanıcılar Gemini 1.5 Pro’ya erişemeyecek. Gemini 2.0 Flash’ın birkaç önemli metrikte 1.5 Pro’yu geride bıraktığı düşünülürse, bunun çok büyük bir fark yaratmaması gerekir.
Geliştiriciler, Google AI Studio ve Vertex AI aracılığıyla Gemini API’sinde bu modelle oluşturmaya başlayabilir. Ayrıca, Gemini ve Gemini Advanced kullanıcıları, masaüstündeki model açılır menüsünden seçerek Gemini 2.0’ın sohbet için optimize edilmiş bir sürümünü deneyebilir.
Gemini 2.0, daha düşük gecikme süresine, daha iyi sonuçlar ve daha doğru yanıtlar sunmak için optimize edilmiş gelişmiş performansa ve modelin ses hızını ve aksanını ayarlayarak kişiselleştirilmiş bir deneyim elde edebilecekleri ses özelliklerine sahiptir.
Referanslar: