Aylarca süren söylentiler ve teorilerden sonra OpenAI, ChatGPT ve Bing gibi uygulamaları destekleyen yapay zeka dil modelleri serisinin en yeni sürümü olan GPT-4'ü duyurdu.
Şirket, yeni dil modelinin "her zamankinden daha yaratıcı ve işbirlikçi" olduğunu ve "zor sorunları daha yüksek doğruluklarla çözebileceğini" iddia etti. GPT-3'ün yalnızca metin yoluyla yanıt verebilmesine rağmen, yeni nesil yapay zeka hem resim içindeki metin yazılarını hem de görüntü girişlerini kolaylıkla ayrıştırabilir. Aşağıdaki görselde de göreceğiniz üzere internet mimlerini açıklama gibi çeşitli farklı soruları cevaplayabilecek.
OpenAI ayrıca GPT-4'ün, bilgi uydurma ve şiddetli ve zararlı metin üretme eğilimleri dahil olmak üzere önceki dil modelleriyle aynı sorunları hala barındırdığını söyledi.
OpenAI, GPT-4'ü dijital ürünlere veya hizmetlere entegre etmek için Duolingo, Stripe ve Khan Academy dahil olmak üzere bir dizi şirketle zaten ortaklık kurduğunu söyledi. Yeni model, OpenAI'nin aylık 20 ABD doları tutarındaki ChatGPT aboneliği olan ChatGPT Plus aracılığıyla kullanıma sunuldu ve ayrıca Microsoft'un Bing sohbet robotunda da kullanılmaya başlandığı söyleniyor. Geliştiricilerin üzerinde çalışmalar yapması için bir API olarak da bekleme listesinden sonra tüm kullanıcılara erişilebilir olacaktır.
Bir araştırma blog gönderisinde OpenAI, GPT-4 ile selefi GPT-3.5 arasındaki farkın gündelik konuşmada "incelikli" olduğu belirtildi.
GPT-4 ve yetenekleri hakkındaki spekülasyonlar geçtiğimiz yıl çok fazla tartışılıyordu ve birçok kişi bunun önceki sistemlere göre büyük bir sıçrama olacağını öne sürüyordu. Ancak, OpenAI'nin duyurusuna bakılırsa, şirketin daha önce uyardığı gibi bazı iyileştirmeler gerekli olacak.
Söylentiler, geçen hafta bir Microsoft yöneticisinin Alman basınına verdiği bir röportajda sistemin bu hafta başlayacağını ağzından kaçırmasının ardından daha da güçlendi. Yönetici ayrıca sistemin çok modlu olacağını, yani yalnızca metin değil diğer medya ortamlarını da üretebileceğini öne sürdü. Birçok yapay zeka araştırmacısı, metin, ses ve videoyu entegre eden çok modlu sistemlerin, daha yetenekli yapay zeka sistemleri oluşturmaya yönelik en büyük adımı olduğu belirtiyor.