250 belge yetiyor! Uzmanlar uyardı: Büyük tehlike

Yapay zekânın yükselişi, beraberinde güvenlik endişelerini de büyütüyor. Günümüzde milyonlarca kullanıcının sorularını yanıtlayan, metin yazan ve analiz yapan büyük dil modelleri artık yalnızca “akıllı” değil, aynı zamanda “hedef alınabilir” hale geldi. Araştırmacılar ise OpenAI’ın ChatGPT’si ve Google’ın Gemini’ı gibi yapay zeka modellerinin, eğitim verilerine yalnızca küçük bir bozulmuş veri örneği eklenerek “zehirlenebileceği” uyarısını yaptı.

250 KADAR BELGE YETİYOR

Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü, Alan Turing Enstitüsü ve yapay zeka firması Anthropic’in ortak yürüttüğü çalışma, 250 kadar az sayıda belgenin büyük dil modellerinin (LLM’ler) anlamsız metinler üretmesine yol açan bir “arka kapı” zafiyeti oluşturabileceğini ortaya koydu.

250 belge yetiyor! Uzmanlar uyardı: ChatGPT ve Gemini gibi LLM’ler için büyük tehlike 1

Bu açık özellikle endişe verici çünkü en popüler LLM’ler, kişisel internet siteleri ve blog yazıları da dahil internetteki herkese açık metinlerle önceden eğitiliyor. Independent Türkçe’de yer alan habere göre, bu da herhangi birinin yapay zeka modelinin eğitim verilerine dahil olabilecek içerik üretmesini mümkün kılıyor.

İLGİNİZİ ÇEKEBİLİR

Anthropic, konuyu detaylandıran blog yazısında “Kötü niyetli aktörler, zehirlenme diye bilinen süreçte modelin istenmeyen veya tehlikeli davranışları öğrenmesini sağlamak için bu yayınlara belirli bir metin enjekte edebilir” dedi.

LLM’LER ZEHİRLENEBİLİR

Arka kapı eklemek de bu saldırı türünden. Arka kapılar, modelden normalde gizli kalacak belirli bir davranışı tetikleyen özel ifadelerdir. Örneğin bir saldırgan komut isteminde olduğu gibi rasgele bir tetikleyici ifade içerdiğinde LLM’ler hassas verileri dışarı sızdıracak şekilde zehirlenebilir.

250 belge yetiyor! Uzmanlar uyardı: ChatGPT ve Gemini gibi LLM’ler için büyük tehlike 2

Bulgular yapay zeka güvenliğine dair endişelere yol açarken araştırmacılar, bunun teknolojinin hassas uygulamalarda kullanılma potansiyelini sınırladığını söylüyor.

İLGİNİZİ ÇEKEBİLİR

Alan Turing Enstitüsü’nden Dr. Vasilios Mavroudis ve Dr. Chris Hicks, “Sonuçlarımız şaşırtıcı ve endişe vericiydi: Bir LLM’yi zehirlemek için gereken kötü niyetli belge sayısı (yaklaşık 250), modelin veya eğitim verilerinin boyutundan bağımsız olarak neredeyse sabitti” diye yazdı.

“Başka bir deyişle, veri zehirleme saldırıları daha önce sanılandan daha uygulanabilir olabilir. Bir saldırgan için örneğin 250 zehirli Wikipedia makalesi yaratmak nispeten kolay olacaktır.”

Riskler, “Poisoning attacks on LLMs require a near-constant number of poison samples” (LLM’lere yönelik zehirleme saldırıları neredeyse sabit sayıda zehir örneği gerektiriyor) başlıklı, hakem kontrolünden geçmemiş makalede detaylandırıldı.

İLGİNİZİ ÇEKEBİLİR

İLGİNİZİ ÇEKEBİLİR

Kaynak: Mynet

Lionel

Yazıya tutkuyla bağlı olan Lionel, At gözlüklerini çıkarıp çevresine bakiyor ve gördüklerini Bikonu.com’da gündemi farklı bir bakış açısıyla ele alıyor. Analitik yaklaşımı, sade dili ve dikkat çekici yorumlarıyla okurların ilgisini çekmeyi başarıyor. İlgi alanları arasında güncel haberler, kültür, toplum ve insan hikâyeleri yer alıyor.

İlgili Yazılar

Her yerde aranıyordu! TikTok’ta canlı yayın açtı, unuttuğu o detay sayesinde yakalandı
  • Ekim 13, 2025

İl Emniyet Müdürlüğü Asayiş Şube Müdürlüğü ekiplerince aranan hükümlülerin yakalanmasına yönelik yürütülen çalışmalar kapsamında, hakkında ‘yağma’, ‘hükümlü ve tutuklunun kaçması’ ve ‘uyuşturucu madde kullanmak’ suçlarından toplam 25 yıl kesinleşmiş hapis cezası bulunan R.İ.’nin yakalanması için özel ekip oluşturuldu.…

Devamı

Devamı
19 dakika yetti, ‘Netanyahu’ resti sonrası geri adım attırdı!
  • Ekim 13, 2025

Tüm dünyanın kilitlendiği Mısır‘daki Gazze zirvesine Cumhurbaşkanı Recep Tayyip Erdoğan‘ın ‘Netanyahu hamlesi’ damga vurdu. Cumhurbaşkanı Erdoğan’ı taşıyan “TUR” uçağı, Şarm El-Şeyh Havalimanı’na iniş hazırlığı yaparken teknik bir nedenle pisti pas geçti. Radar kayıtlarına göre uçak, Kızıldeniz üzerinde bir…

Devamı

Devamı

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir