Open AI, 13 Mayıs 2024 tarihinde gerçekleştirdiği lansmanında, daha sezgisel olan en yeni amiral gemisi modeli ChatGPT-4O modeli tanıtıldı ve ücretsiz olarak kullanıma açtı. “o” harfi “omni” yani çok yönlü, birleştirilmiş anlamına gelmektedir.
Ses, görüntü ve metin girişlerini kabul edebilen ve aynı zamanda ses, görüntü ve metin olarak çıktılar üretebilen bir sürüm olduğundan dolayı bu şekilde ifade edilmiştir.
Ses girişlerine 232 milisaniye kadar kısa bir sürede, ortalama 320 milisaniyede yanıt verebildiği; bunun da bir konuşmadaki insan tepki süresine yaklaşık eşit olduğu belirtilmiştir. 50 dilde simultane tercüme yapıp, telefon kamerasıyla çevreyi görüp algılayabileceği ifade edilmiştir.
OpenAI, GPT-4’ün bu yeni sürümünü, girdilere insandan insana konuşmalarla aynı hızda yanıt veren, insan ve makine etkileşimlerinde daha doğal bir ilerleme olarak tanımladı.
Şu anda temel faydası, ilk kez ChatGPT’nin ücretsiz sürümüne büyük akıl yürütme ve doğal dil yetenekleri getirmesidir.
Bahar lansmanı duyurusunda şirket, en iyi yapay zekayı geniş çapta erişilebilir hale getirmek istediğini belirtmiştir.
Önceki sürümde sesle iletişim kurmada izlenilen yol, ses girdilerini metne dönüştürmek için üç farklı modeli bir araya getirmeyi içeriyordu; burada ikinci model (GPT 3.5 veya GPT-4) bunu işleyip metni çıktı olarak veriyordu ve üçüncü bir model de metni tekrar sese dönüştürüyordu.
Yeni sürümde üç farklı modele ihtiyaç duyulmadan uçtan uca ses girişi ve çıkışı için tüm giriş ve çıkışlar tek bir modelde birlikte ele alındığı belirtilmiştir. İlginç bir şekilde OpenAI, yeni modelin tüm yeteneklerini henüz keşfetmediklerini veya sınırlamalarını tam olarak anlamadıklarını belirtmiştir.
ChatGPT’nin adresi https://chat.openai.com artık https://chatgpt.com olarak değişmiştir. Bu da yapay zekanın bir deneyden ziyade bir ürün olarak kullanılacağını gösteriyor.
Şimdilik, ChatGPT’de oturum açıldığında, daha gelişmiş ses veya video işlevlerinden herhangi birine erişim olmayıp sadece GPT-4o’nun sohbet sürümüne erişim olacaktır, önümüzdeki haftalarda Plus ve Team hesaplarıyla “kademeli olarak kullanıma sunulacaktır”.
Canlı demolar sırasında GPT-40, çeşitli görevleri kolaylıkla yerine getirme yeteneğini gösterilmiştir. Temel olarak bunlar:
- Gerçek zamanlı çeviri: Konuşmaların anında çevrilmesi, dil engellerinin aşılması.
- Duygu algılama: Duyguları anlamak için yüz ifadelerini analiz etmek, yapay zeka etkileşimlerine insani bir dokunuş eklemek.
- Bellek yeteneği: Kullanıcılarla yapılan önceki görüşmelerden öğrenme kabiliyeti.
- Çoklu ortam analizi: Görselleri ve metni analiz ederek, metin ve görsel veriler arasında ilişki kurabilme yeteneği.
- Kodlama yardımı: Kodlama sorunlarına gerçek zamanlı destek sağlayarak çok yönlülüğünü sergiler.
- Ses Değişimi: İstenilen ses tonu için yönlendirmelere cevap verdiği ve GPT-4o ile bunun da mümkün olabileceği gösterilmiştir.
Bu yetenekler, GPT-40’ın eğitim ve içerik oluşturmadan iş ve kişisel üretkenliğe kadar çeşitli alanlarda ezber bozan potansiyelini vurguluyor. Bu nedenle aşağıda belirtilen birçok sektörü önemli ölçüde etkileyebileceği öngörülmektedir. Bunlar:
- Yaratıcı endüstriler: ChatGPT 4o’nun insan kalitesinde metin üretme yeteneği yazma, çeviri ve içerik oluşturmada devrim yaratabilir. Yazarlara, gazetecilere ve pazarlamacılara fikir, taslak ve hatta bitmiş ürün oluşturma konusunda yardımcı olabilir.
- Müşteri hizmetleri: ChatGPT 4o, müşteri hizmetlerine yönelik son derece gerçekçi sohbet robotları oluşturmak için kullanılabilir.
Bu, daha hızlı yanıt sürelerine, 7/24 kullanılabilirliğe ve müşteriler için daha kişiselleştirilmiş etkileşimlere yol açabilir.
Bu çok modlu destek, müşterilerin tutarlı ve etkili yardım almasını sağlayarak insan temsilcilerinin üzerindeki yükü azaltır.
GPT-4o’nun çeşitli veri formatlarını anlama ve işleme yeteneği sayesinde müşteri sorguları daha hızlı ve daha doğru bir şekilde çözülebilir.
GPT-4o, hassas sorun giderme adımları sağlamak için görüntüyü analiz ederek destek deneyimini önemli ölçüde iyileştirebilir.
Eğitim: ChatGPT 4o kişiselleştirilmiş öğrenme için güçlü bir araç olabilir. Özelleştirilmiş çalışma planları, metin, video gösterimleri ve etkileşimli öğeler içeren kapsamlı eğitim materyalleri oluşturabilir, öğrenci sorularını ayrıntılı olarak yanıtlayabilir ve hatta ödev yazma konusunda geri bildirim sağlayabilir.
Ayrıca video ve etkileşimli öğeleri kullanarak gerçek dünya senaryolarını simüle edebilir ve sanal ortamda uygulamalı deneyim sunabilir.
- Bilimsel araştırma: Modelin büyük miktarda veriyi analiz etme yeteneği, bilimsel keşifleri hızlandırabilir. Araştırmacıların kalıpları belirlemesine, hipotezler oluşturmasına ve bilimsel makaleler yazmasına yardımcı olabilir.
- Yazılım geliştirme: ChatGPT 4o, kod oluşturarak, belge yazarak, yazılım sorunlarını gidererek, karmaşık teknik kavramların ayrıntılı açıklamalarını sağlayarak ve hataları ayıklayarak programcılara yardımcı olabilir.
Bu, kodun hem metinsel hem de görsel yönlerini anlayarak geliştiricilere daha doğru ve bağlamsal yardım sunarak yazılım geliştirmenin verimliliğini ve hızını önemli ölçüde artırabilir.
- Görsel ağ teşhisi: GPT-4o, ağ ekipmanının görüntülerini veya videolarını analiz ederek arızaları ve sorunları tespit edebilir ve teknisyenlere hassas teşhis ve önerilerle yardımcı olabilir.
Bu yetenek, kesinti süresini önemli ölçüde azaltabilir ve ağ güvenilirliğini artırabilir. GPT-4o ayrıca teknik çizimleri ve şemaları yorumlayarak ayrıntılı bilgiler ve çözümler sunarak saha teknisyenlerinin verimliliğini artırabilir.
Pazarlama: GPT-4o, müşteri incelemelerini, resimlerini ve diğer verileri analiz ederek müşteri davranışı ve tercihlerine ilişkin daha derin içgörüler sunarak kişiselleştirilmiş pazarlama stratejilerine olanak tanır.
Bu çok modlu analiz, müşteri duygularını daha bütünsel olarak anlamalarına yardımcı olarak daha hedefli ve etkili pazarlama kampanyalarına olanak tanır. ChatGPT-4o’nin sıralamakla bitmeyecek birçok kullanım alanına sahip olduğu görülmektedir. Daha fazlası için bekleyip göreceğiz.
Görüşmek dileğiyle…
Referanslar:
1- https://www.searchenginejournal.com/openai-announces-chatgpt-4o-omni/516189/
2- https://aitrends.com.tr/
3- https://www.nytimes.com/2024/05/13/technology/openai-chatgpt-app.html
4- https://openai.com/index/hello-gpt-4o/
5- https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4o
6- https://www.techradar.com/news/gpt-4