Öne çıkan yönleriyle xAI’ın yeni yapay zeka modelleri: Grok 4 ve Grok 4 Heavy

Elon Musk’ın yapay zeka şirketi xAI, Çarşamba günü en yeni yapay zeka modeli Grok 4’ü piyasaya sürdü. Grok 4 aynı zamanda şirketin yeni amiral gemisi modeli olarak konumlanıyor. xAI, Grok 4 ile birlikte aylık 300 dolarlık yeni bir yapay zeka abonelik planı olan SuperGrok Heavy’yi de tanıttı. 

Elon Musk, Çarşamba gecesi gerçekleşen canlı yayında akademik sorular konusunda Grok 4’ün istisnasız her konuda doktora seviyesinden daha iyi olduğunu dile getirdi ve ekledi:

“Bazen sağduyu eksikliği gösterebilir ve henüz yeni teknolojiler icat etmemiş veya yeni fizik keşifleri yapmamış olabilir, ancak bu sadece zaman meselesi.”

Grok 4 ve Grok 4 Heavy’nin performansı 

Grok 4’ün bu yazın sonlarında piyasaya sürülmesi beklenen yapay zeka modeli GPT-5 ile rekabet edecek nitelikte olması bekleniyor. xAI, Grok 4’ün, Humanity’s Last Exam dahil olmak üzere çeşitli benchmark testlerinde en üst düzey performans gösterdiğini iddia ediyor. Humanity’s Last Exam, matematik, beşeri bilimler ve doğa bilimleri gibi konularda binlerce kitle kaynaklı soruyu yanıtlama becerisini ölçen zorlu bir test. xAI’ın belirttiğine göre, Grok 4, “araçlar” kullanmadan Humanity’s Last Exam’da yüzde 25,4 puan aldı. Bu testte Google’ın Gemini 2.5 Pro modeli yüzde 21,6 alırken, OpenAI’ın o3 modeli yüzde 21 puan aldı. 

Genel olarak daha yüksek performans sunan Grok 4 Heavy ise şirketin “çoklu ajan versiyonu” olarak karşımıza çıkıyor. Musk’ın iddiasına göre; Grok 4 Heavy, bir sorunu aynı anda çözmek için birden fazla ajan oluşturuyor ve ardından hepsinin “çalışma grubu gibi” çalışmalarını karşılaştırarak en iyi cevabı buluyor. xAI’ın belirttiğine göre; “araçlar” kullanıldığında Grok 4 Heavy, yüzde 44,4 puan alarak yüzde 26,9 puan alan Gemini 2.5 Pro’yu geride bırakıyor. 

Kâr amacı gütmeyen bir kurum olan Arc Prize ise Grok’un ARC-AGI-2 testinde yeni bir rekor kırdığını ifade ediyor. ARC-AGI-2’nin yapay zekanın görsel kalıpları tanımlaması gereken bulmaca benzeri problemlerden oluşan bir başka zorlu benchmark testi olduğunu belirtelim. Grok, ARC-AGI-2’de yüzde 16,2 puan aldı. Bu da Anthropic’in Claude Opus 4 modelinin aldığı puanının neredeyse iki katına denk gelmekte. 

SuperGrok Heavy abonelik planı

Bu iki yeni modelin yanı sıra, xAI şimdiye kadarki en pahalı yapay zeka abonelik planı olan SuperGrok Heavy adlı abonelik planını piyasaya sürdü. Aylık 300 dolara sunulan SuperGrok Heavy planı ile kulanıcılar Grok 4 Heavy’yi önceden deneyimleyebilecek. Grok 4 Heavy abonelerinin aynı zamanda yeni özelliklere erken erişim hakkına sahip olacağını da belirtelim. xAI, Grok 4 Heavy kapsamında şu anda büyük yapay zeka sağlayıcıları arasında en pahalı abonelik ile karşımıza çıkıyor. 

Bunlara ek olarak xAI, Ağustos ayında bir yapay zeka kodlama modeli, Eylül ayında çok modlu bir ajan ve Ekim ayında bir video oluşturma modeli piyasaya sürüleceğini duyurdu. Bu yeni lansmanda geliştiricilere de odaklanan xAI, Grok 4’ü API’si aracılığıyla piyasaya sürüyor. Bakalım son dönemde X platformunda yaptığı hatalarla gündeme gelen Grok yeni modeliyle geliştiricileri ve kurumsal müşterileri kendine çekmeyi başaracak mı? 

Kaynak: webrazzi

Lionel

Yazıya tutkuyla bağlı olan Lionel, At gözlüklerini çıkarıp çevresine bakiyor ve gördüklerini Bikonu.com’da gündemi farklı bir bakış açısıyla ele alıyor. Analitik yaklaşımı, sade dili ve dikkat çekici yorumlarıyla okurların ilgisini çekmeyi başarıyor. İlgi alanları arasında güncel haberler, kültür, toplum ve insan hikâyeleri yer alıyor.

İlgili Yazılar

Issız kıtada insan izleri: Antarktika’da bulunan kafatası bize ne anlatıyor?
  • Temmuz 10, 2025

1985’te Şili’den bir araştırmacı tarafından keşfedilen kafatası, kıtaya insan ulaşımının sanılandan daha erken başlamış olabileceğine dair soruları gündeme getiriyor. Kalıntıların 19. yüzyıla ait olduğu tahmin ediliyor. Kaynak chip

Devamı

Devamı
Psikopatların beyni, normal bir beyinden daha farklıymış
  • Temmuz 10, 2025

Yeni bir araştırma, psikopati düzeyi yüksek bireylerin beyin yapılarında belirli bölgelerde hacim farklılıkları bulunduğunu ortaya koydu. Bu bulgular, duygusal düzenleme ve dürtü kontrolüyle ilişkili alanlarda yoğunlaşıyor. Kaynak chip

Devamı

Devamı

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir