Öne çıkan yönleriyle xAI’ın yeni yapay zeka modelleri: Grok 4 ve Grok 4 Heavy

Elon Musk’ın yapay zeka şirketi xAI, Çarşamba günü en yeni yapay zeka modeli Grok 4’ü piyasaya sürdü. Grok 4 aynı zamanda şirketin yeni amiral gemisi modeli olarak konumlanıyor. xAI, Grok 4 ile birlikte aylık 300 dolarlık yeni bir yapay zeka abonelik planı olan SuperGrok Heavy’yi de tanıttı.

Elon Musk, Çarşamba gecesi gerçekleşen canlı yayında akademik sorular konusunda Grok 4’ün istisnasız her konuda doktora seviyesinden daha iyi olduğunu dile getirdi ve ekledi:

“Bazen sağduyu eksikliği gösterebilir ve henüz yeni teknolojiler icat etmemiş veya yeni fizik keşifleri yapmamış olabilir, ancak bu sadece zaman meselesi.”

Grok 4 ve Grok 4 Heavy’nin performansı

Grok 4’ün bu yazın sonlarında piyasaya sürülmesi beklenen yapay zeka modeli GPT-5 ile rekabet edecek nitelikte olması bekleniyor. xAI, Grok 4’ün, Humanity’s Last Exam dahil olmak üzere çeşitli benchmark testlerinde en üst düzey performans gösterdiğini iddia ediyor. Humanity’s Last Exam, matematik, beşeri bilimler ve doğa bilimleri gibi konularda binlerce kitle kaynaklı soruyu yanıtlama becerisini ölçen zorlu bir test. xAI’ın belirttiğine göre, Grok 4, “araçlar” kullanmadan Humanity’s Last Exam’da yüzde 25,4 puan aldı. Bu testte Google’ın Gemini 2.5 Pro modeli yüzde 21,6 alırken, OpenAI’ın o3 modeli yüzde 21 puan aldı.

Genel olarak daha yüksek performans sunan Grok 4 Heavy ise şirketin “çoklu ajan versiyonu” olarak karşımıza çıkıyor. Musk’ın iddiasına göre; Grok 4 Heavy, bir sorunu aynı anda çözmek için birden fazla ajan oluşturuyor ve ardından hepsinin “çalışma grubu gibi” çalışmalarını karşılaştırarak en iyi cevabı buluyor. xAI’ın belirttiğine göre; “araçlar” kullanıldığında Grok 4 Heavy, yüzde 44,4 puan alarak yüzde 26,9 puan alan Gemini 2.5 Pro’yu geride bırakıyor.

Kâr amacı gütmeyen bir kurum olan Arc Prize ise Grok’un ARC-AGI-2 testinde yeni bir rekor kırdığını ifade ediyor. ARC-AGI-2’nin yapay zekanın görsel kalıpları tanımlaması gereken bulmaca benzeri problemlerden oluşan bir başka zorlu benchmark testi olduğunu belirtelim. Grok, ARC-AGI-2’de yüzde 16,2 puan aldı. Bu da Anthropic’in Claude Opus 4 modelinin aldığı puanının neredeyse iki katına denk gelmekte.

SuperGrok Heavy abonelik planı

Bu iki yeni modelin yanı sıra, xAI şimdiye kadarki en pahalı yapay zeka abonelik planı olan SuperGrok Heavy adlı abonelik planını piyasaya sürdü. Aylık 300 dolara sunulan SuperGrok Heavy planı ile kulanıcılar Grok 4 Heavy’yi önceden deneyimleyebilecek. Grok 4 Heavy abonelerinin aynı zamanda yeni özelliklere erken erişim hakkına sahip olacağını da belirtelim. xAI, Grok 4 Heavy kapsamında şu anda büyük yapay zeka sağlayıcıları arasında en pahalı abonelik ile karşımıza çıkıyor.

Bunlara ek olarak xAI, Ağustos ayında bir yapay zeka kodlama modeli, Eylül ayında çok modlu bir ajan ve Ekim ayında bir video oluşturma modeli piyasaya sürüleceğini duyurdu. Bu yeni lansmanda geliştiricilere de odaklanan xAI, Grok 4’ü API’si aracılığıyla piyasaya sürüyor. Bakalım son dönemde X platformunda yaptığı hatalarla gündeme gelen Grok yeni modeliyle geliştiricileri ve kurumsal müşterileri kendine çekmeyi başaracak mı?

Kaynak: webrazzi