Site icon Bikonu

Öne çıkan yönleriyle OpenAI’ın ChatGPT’deki yeni genel amaçlı yapay zeka ajanı

OpenAI, ChatGPT’de yeni genel amaçlı yapay zeka ajanını tanıttı. Şirketin belirttiğine göre; ChatGPT ajanı olarak adlandırılan bu ajan, kullanıcılar adına çeşitli bilgisayar tabanlı görevleri yerine getirebilecek. Öyle ki ChatGPT ajanının, kullanıcının takviminde otomatik olarak gezinebileceği, düzenlenebilir sunumlar ve slayt gösterileri oluşturabilirken, kod çalıştırabileceği belirtiliyor.

ChatGPT ajanı neler sunuyor?

ChatGPT ajanı ile OpenAI’ın önceki ajan araçlarının çeşitli yeteneklerini bir araya getirdiğini söyleyebiliriz. Bu bağlamda Operator’ın web sitelerinde tıklama yeteneği ile Deep Research’ün onlarca web sitesinden bilgiyi özet bir araştırma raporunda sentezleme yeteneği bir araya geliyor. OpenAI’ın ifadesine göre; kullanıcılar, ChatGPT’ye doğal dilde komut vererek ajanla etkileşime girebilecek. 

[embedded content]

Kullanıcılar ChatGPT ajanını kullanırken, aynı zamanda ChatGPT arayüzünde, yapay zekanın kendi özel sanal ortamında gerçekleştirdiği tüm eylemleri gösteren bir pencere sunuluyor. Bu sanal ortam, gerçek internete erişimi olan kendi sanal işletim sistemi ve web tarayıcısına sahip. 

ChatGPT konnektörlerine erişebilen OpenAI’ın yeni ajanı, kullanıcıların Gmail ve GitHub gibi uygulamaları bağlayarak ajanın komutlara uygun bilgileri bulmasını sağlıyor. OpenAI’ın belirttiğine göre; bir terminale erişimi bulunan ChatGPT ajanı, API’leri kullanarak belirli uygulamalara erişebilecek. ChatGPT ajanları, dosya düzenleme gibi görevler için terminali kullanabilecek.

Bu arada ChatGPT ajanının, çevrim içi hizmetlerle etkileşim kurmak için iki farklı tarayıcı kullandığını belirtelim. Metin işleme için optimize edilmiş ilk tarayıcı, daha basit akıl yürütme tabanlı web sorgularını desteklerken, ikinci tarayıcı, ChatGPT ajanının bir kullanıcı gibi grafik arayüzler aracılığıyla web siteleriyle etkileşim kurmasını sağlıyor. 

Ayrıca ChatGPT, satın alma gibi hassas işlemleri gerçekleştirmeden önce izin istiyor. OpenAI’ın sunduğu yerleşik kontroller ise bir görevi durdurmayı, manuel olarak tamamlamayı veya ChatGPT ajanına güncellenmiş talimatlar vermeyi mümkün kılıyor. 

OpenAI’ın paylaştığı kullanım örnekleri arasında kullanıcıların ChatGPT ajanı aracılığıyla dört kişilik Japon kahvaltısı için malzemeleri planlayıp satın alabilmesi ve üç rakibi analiz edip bir slayt sunumu hazırlayabilmesi yer alıyor. Bu kullanım örnekleri kapsamında ChatGPT ajanı web sitelerini tarama, bir eylem planı hazırlama ve araçlar kullanmak gibi görevleri tamamlamak durumunda. Bu anlamda ChatGPT ajanının yerine getirmesi gereken görevlerin, OpenAI’ın ajanlarla daha önce denediği görevlerden çok daha karmaşık olduğunu söyleyebiliriz. 

ChatGPT ajanı modelinin performansı 

OpenAI’ın belirttiğine göre, ChatGPT ajanın temelini oluşturan model, çeşitli benchmark testlerinde en son teknolojiye sahip performansı sunuyor. Şirket tarafından paylaşılan bilgilere göre; ChatGPT ajanı modelinin, Humanity’s Last Exam (pass@1) testinde yüzde 41,6 puan aldı. Humanity’s Last Exam (pass@1) testi, yüzün üzerinde konuda binlerce sorudan oluşuyor. ChatGPT ajanı modelinin aldığı puan, OpenAI’ın o3 ve o4-mini modellerinin testte aldığı puanın yaklaşık iki katı.

ChatGPT ajanının kod yürütme terminali gibi araçlara erişimi olduğunda, OpenAI’ın belirttiğine göre; FrontierMath’te yüzde 27,4 puan alıyor. FrontierMath, bilinen en zor matematik benchmark testlerinden biri. Önceki en iyi puan, sadece yüzde 6,3 puan alan o4-mini’ye aitti.

Başka bir değerlendirmede OpenAI, SpreadsheetBench adlı bir benchmark kullanarak ChatGPT ajanının elektronik tablo bilgisini test etti. ChatGPT ajanı, Excel’de bulunan Microsoft Copilot sürümünden yüzde 25 daha iyi bir puan elde etti.

OpenAI, hackerların ChatGPT ajanının yeteneklerini kötüye kullanmasını önlemek için yeni bir dizi koruma önlemi geliştirdiğini ifade ediyor. Bu önlemler, web sayfalarında gizlenmiş kötü niyetli komut istemlerini engellemeye özellikle önem veriyor. OpenAI çalışanları bu konuda şu açıklamayı yapıyor: 

“Ajanı, komut istemleri enjeksiyonlarını tespit etme ve bunlara direnme konusunda eğittik ve test ettik. Ayrıca, komut istemleri enjeksiyon saldırılarını hızla tespit etmek ve bunlara yanıt vermek için izleme sistemi de kullanıyoruz” 

ChatGPT ajanı, dün OpenAI’ın Pro, Plus ve Team planlarına abone olan kullanıcılara sunuldu. Aracı etkinleştirmek isteyen kullanıcıların, ChatGPT’nin açılır araç menüsünden ajan modunu seçmesi yeterli. 

Kaynak: webrazzi

Exit mobile version