Anthropic, Claude’a bazı sohbetleri sonlandırma yetkisi verdi

Anthropic, Claude Opus 4 ve 4.1 modellerine belirli koşullarda sohbeti sonlandırma yetkisi tanıdı. Şirketin açıklamasına göre bu özellik, yalnızca “ısrarla zarar verici veya istismara açık kullanıcı etkileşimleri” gibi uç durumlarda devreye girecek. Amaç, yapay zekanın bu tür içeriklerle uzun süreli temasını önlemek.

Anthropic bu özelliğin, örneğin çocuk istismarı içeren içerik talepleri ya da geniş çaplı şiddet ve terör eylemlerine dair bilgi isteyen kullanıcı girişimleri gibi ciddi senaryolarda kullanılacağını belirtiyor. Bu tür durumlarda Claude, önce yönlendirme ve yanıt vermeme gibi stratejiler uygulayacak; eğer bunlar başarısız olursa ve konuşmanın yapıcı bir yöne evrilmesi mümkün görünmezse, sohbeti sonlandıracak.

Sohbetin bitmesi, kullanıcının platformla olan erişimini engellemeyecek. Aynı hesapla yeni bir sohbet başlatmak veya önceki mesajları düzenleyerek konuşmayı farklı bir yöne çekmek mümkün olacak. Yani kullanıcı tamamen engellenmeyecek, sadece ilgili konuşma noktalanmış olacak.

Bu adımın dikkat çeken tarafı ise özelliğin amacının kullanıcıyı değil, yapay zeka modelini korumak olması. Anthropic, Claude’un ya da herhangi bir büyük dil modelinin bilinçli ya da duygusal olduğunu savunmuyor. Ancak şirket, “model refahı” (model welfare) adını verdiği bir araştırma programı kapsamında, olası etik ve teknik risklere karşı önleyici adımlar atmayı sürdürüyor.

Anthropic, testler sırasında Claude’un bazı zararlı isteklerle karşılaştığında yanıt vermekte isteksiz davrandığını ve rahatsızlık belirtisi gösterdiğini aktarıyor. Bu da şirketin düşük maliyetli önlemleri devreye almasına neden olmuş gibi görünüyor. Şirket ayrıca Claude’un, kendine ya da başkalarına zarar verme riski taşıyan bir kullanıcıyla karşılaştığında bu yetkiyi kullanmaması gerektiğini de vurguluyor. Bu tür durumlarda Claude’un konuşmayı sürdürmesi ve gerektiğinde yardım kaynaklarına yönlendirmesi bekleniyor.

Anthropic, bu sohbet sonlandırma özelliğini halen deneysel bir uygulama olarak görüyor ve kullanıcıların geri bildirimleri doğrultusunda sistemin geliştirileceğini belirtiyor. Özellik şimdilik sadece Claude Opus 4 ve 4.1 modelleriyle sınırlı.

Kaynak: webrazzi

Lionel

Yazıya tutkuyla bağlı olan Lionel, At gözlüklerini çıkarıp çevresine bakiyor ve gördüklerini Bikonu.com’da gündemi farklı bir bakış açısıyla ele alıyor. Analitik yaklaşımı, sade dili ve dikkat çekici yorumlarıyla okurların ilgisini çekmeyi başarıyor. İlgi alanları arasında güncel haberler, kültür, toplum ve insan hikâyeleri yer alıyor.

İlgili Yazılar

Çığır açacak deniyordu: Açamadı, kapısına kilit vuruluyor
  • Ekim 4, 2025

2014 yılında çığır açacak bir enerji teknolojisi olarak tanıtılmıştı… Ancak teknolojiye çok hızlı yenik düştü. 2.2 milyar dolarla yapılan tesis 2026 yılında kapatılıyor. Kaynak chip

Devamı

Devamı
Ucuz ve “kırpılmış” Tesla Model Y ilk kez görüntülendi
  • Ekim 4, 2025

Otomobil dünyası, Tesla’nın tamamen yeni bir platform üzerine kurulacak ve 25.000 dolarlık fiyat etiketine sahip olması beklenen “Model 2″sini beklerken, Teksas’tan gelen görüntüler her şeyi değiştirdi. Elon Musk’ın bu büyük projeyi iptal ederek yerine ucuz bir Model Y…

Devamı

Devamı

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir