250 belge yetiyor! Uzmanlar uyardı: Büyük tehlike

Yapay zekânın yükselişi, beraberinde güvenlik endişelerini de büyütüyor. Günümüzde milyonlarca kullanıcının sorularını yanıtlayan, metin yazan ve analiz yapan büyük dil modelleri artık yalnızca “akıllı” değil, aynı zamanda “hedef alınabilir” hale geldi. Araştırmacılar ise OpenAI’ın ChatGPT’si ve Google’ın Gemini’ı gibi yapay zeka modellerinin, eğitim verilerine yalnızca küçük bir bozulmuş veri örneği eklenerek “zehirlenebileceği” uyarısını yaptı.

250 KADAR BELGE YETİYOR

Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü, Alan Turing Enstitüsü ve yapay zeka firması Anthropic’in ortak yürüttüğü çalışma, 250 kadar az sayıda belgenin büyük dil modellerinin (LLM’ler) anlamsız metinler üretmesine yol açan bir “arka kapı” zafiyeti oluşturabileceğini ortaya koydu.

250 belge yetiyor! Uzmanlar uyardı: ChatGPT ve Gemini gibi LLM’ler için büyük tehlike 1

Bu açık özellikle endişe verici çünkü en popüler LLM’ler, kişisel internet siteleri ve blog yazıları da dahil internetteki herkese açık metinlerle önceden eğitiliyor. Independent Türkçe’de yer alan habere göre, bu da herhangi birinin yapay zeka modelinin eğitim verilerine dahil olabilecek içerik üretmesini mümkün kılıyor.

İLGİNİZİ ÇEKEBİLİR

Anthropic, konuyu detaylandıran blog yazısında “Kötü niyetli aktörler, zehirlenme diye bilinen süreçte modelin istenmeyen veya tehlikeli davranışları öğrenmesini sağlamak için bu yayınlara belirli bir metin enjekte edebilir” dedi.

LLM’LER ZEHİRLENEBİLİR

Arka kapı eklemek de bu saldırı türünden. Arka kapılar, modelden normalde gizli kalacak belirli bir davranışı tetikleyen özel ifadelerdir. Örneğin bir saldırgan komut isteminde olduğu gibi rasgele bir tetikleyici ifade içerdiğinde LLM’ler hassas verileri dışarı sızdıracak şekilde zehirlenebilir.

250 belge yetiyor! Uzmanlar uyardı: ChatGPT ve Gemini gibi LLM’ler için büyük tehlike 2

Bulgular yapay zeka güvenliğine dair endişelere yol açarken araştırmacılar, bunun teknolojinin hassas uygulamalarda kullanılma potansiyelini sınırladığını söylüyor.

İLGİNİZİ ÇEKEBİLİR

Alan Turing Enstitüsü’nden Dr. Vasilios Mavroudis ve Dr. Chris Hicks, “Sonuçlarımız şaşırtıcı ve endişe vericiydi: Bir LLM’yi zehirlemek için gereken kötü niyetli belge sayısı (yaklaşık 250), modelin veya eğitim verilerinin boyutundan bağımsız olarak neredeyse sabitti” diye yazdı.

“Başka bir deyişle, veri zehirleme saldırıları daha önce sanılandan daha uygulanabilir olabilir. Bir saldırgan için örneğin 250 zehirli Wikipedia makalesi yaratmak nispeten kolay olacaktır.”

Riskler, “Poisoning attacks on LLMs require a near-constant number of poison samples” (LLM’lere yönelik zehirleme saldırıları neredeyse sabit sayıda zehir örneği gerektiriyor) başlıklı, hakem kontrolünden geçmemiş makalede detaylandırıldı.

İLGİNİZİ ÇEKEBİLİR

İLGİNİZİ ÇEKEBİLİR

Kaynak: Mynet

Lionel

Yazıya tutkuyla bağlı olan Lionel, At gözlüklerini çıkarıp çevresine bakiyor ve gördüklerini Bikonu.com’da gündemi farklı bir bakış açısıyla ele alıyor. Analitik yaklaşımı, sade dili ve dikkat çekici yorumlarıyla okurların ilgisini çekmeyi başarıyor. İlgi alanları arasında güncel haberler, kültür, toplum ve insan hikâyeleri yer alıyor.

İlgili Yazılar

Otobüs firmaları arasında kanlı rekabet! Firma sahibine silahlı saldırısı kamerada
  • Ekim 13, 2025

Olay, 9 Ekim tarihinde Tacin Mahallesi Aksaray Şehirlerarası Otobüs Terminali’nde meydana geldi. Edinilen bilgiye göre, terminalde otobüs firması sahibi olan K. Y. (40) işten çıkıp eve gitmek istediği sırada Y. D. (20) tarafından tabancayla vuruldu. 3 el ateş…

Devamı

Devamı
Doğurduğu bebeği havluya sarıp terasa bırakmıştı! Karar verildi
  • Ekim 13, 2025

Yaklaşık 5 ay önce Kırgızistan‘dan Bodrum‘a çalışmaya gelen 19 yaşındaki Z.U.K., geçtiğimiz cuma günü yoğun kan kaybı şikayetiyle hastaneye gitti. Kadının doğum yaptığını anlayan sağlık görevlileri, polise haber verdi. Kadının ifadesini alan ekipler, daha sonra lojmana gitti. TERASTA…

Devamı

Devamı

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir