Yapay zeka sohbet robotlarının büyük bir kusuru var

BBC’nin araştırmasına göre yapay zeka sohbet robotları, haber özetleme konusunda tam bir vasat.

11 Şubat 2025 17:24 Güncellenme: 10 Nisan 2025 21:54

AI teknolojileri o kadar iyi bir noktaya geldi ki, zaman zaman tıptaki sorunları çözerken, çoğu testlerde insanlardan bile daha iyi sonuçlar elde edebiliyor.

Akıllı telefon üreticileri de AI teknolojilerini cihazlarına entegre etmeye başladı. Hatta Apple, iOS 18 sonrası sürümlerinde AI destekli bildirim özetleri özelliğini devreye almış, fakat yanlış ve hatalı özetlemeler nedeniyle Apple bu özelliği durdurma kararı almıştı.

Şimdi ise bu hatayla da bağlantılı yeni araştırma sonuçları ortaya çıktı. BBC, yaptığı bir araştırmada yapay zeka sohbet robotlarının haber özetlemelerini test etti ve şaşırtıcı olmayan bir sonuca ulaştı.

AI, HABER ÖZETLEMEDE SINIFTA KALDI

Haber kuruluşu BBC, dört farklı yapay zeka modelini testten geçirdi.

BBC, OpenAI'nin ChatGPT, Microsoft'un Copilot, Google'ın Gemini ve Perplexity yapay zekalarına BBC web sitesinden içerik verdi ve ardından onlara haberlerle ilgili sorular sordu.

Paylaşılan bir blogda, BBC News and Current Affairs'in CEO'su Deborah Turness, yapay zekanın "sonsuz fırsatlar" getirdiğini, ancak araçları geliştiren şirketlerin "ateşle oynadığını" söyleyerek sözlerini, "Sıkıntılı zamanlarda yaşıyoruz ve yapay zeka tarafından çarpıtılmış bir manşetin gerçek dünyada önemli zararlara yol açması ne kadar sürecek?" diye noktaladı.

Ayrıca sohbet robotlarına sahip olan teknoloji şirketlerine yorum için başvuruldu.

Söz konusu araştırmada BBC, ChatGPT, Copilot, Gemini ve Perplexity'den 100 haberi özetlemelerini ve her bir yanıtı derecelendirmelerini istedi. Peki sonuçlar nasıl çıktı? İşte her şey tam da burada gün yüzüne çıkıyor.

Haberlerle ilgili sorulara verilen tüm YZ yanıtlarının %51'inin bir şekilde önemli sorunları olduğuna karar verilirken, ayrıca BBC içeriğinden alıntı yapan YZ cevaplarının %19'u yanlış olgusal ifadeler, sayılar ve tarihler gibi olgusal hatalar içerdiği tespiti yapıldı.

Bayan Turness blogunda BBC'nin “çözüm bulmak için ortaklaşa çalışabilmek” amacıyla “yapay zeka teknoloji sağlayıcılarıyla yeni bir diyalog başlatmak” istediğini söyledi.

APPLE INTELLIGENCE ÖZELLİĞİ DEVRE DIŞI BIRAKILMIŞTI

Bu arada BBC'nin Apple Intelligence'ın haberleri yanlış aktardığı yönündeki şikayetleri üzerine Apple'ın yaptığı gibi, teknoloji şirketlerini yapay zeka haber özetlerini “geri çekmeye” çağırdı.

BBC’nin tespit ettiği bazı yanlışlar şöyle sıralandı:

-Gemini, NHS'in sigarayı bırakmak için elektronik sigara kullanımını önermediğini yanlış bir şekilde söyledi.
-ChatGPT ve Copilot, Rishi Sunak ve Nicola Sturgeon'ın görevlerinden ayrılmalarına rağmen hâlâ görevde olduklarını belirtti.
-Perplexity, Orta Doğu ile ilgili bir haberde BBC News'i yanlış alıntılayarak İran'ın başlangıçta "itidalli" davrandığını ve İsrail'in eylemlerini "agresif" olarak nitelendirdiğini söyledi.

Genel olarak, Microsoft'un Copilot'u ve Google'ın Gemini'si, Jeff Bezos'u yatırımcılarından biri olarak sayan OpenAI'nin ChatGPT ve Perplexity'sinden daha önemli sorunlar yaşadı.

Normalde BBC, içeriğini yapay zeka sohbet robotlarından korumasıyla biliniyor. Ancak geçen yılın sonlarında internet sitesini testler için AI botlarına erişilebilir hale getirdi.

Ayrıca raporda, gerçeklere dayalı yanlışlıklar içermesinin yanı sıra, sohbet robotlarının “fikir ve gerçek arasında ayrım yapmakta zorlandığı, editörlük yaptığı ve genellikle gerekli bağlamı dahil etmede başarısız olduğu” da belirtildi.

Son olarak BBC'nin Generative AI Program Direktörü Pete Archer, yayıncıların “içeriklerinin kullanılıp kullanılmayacağı ve nasıl kullanılacağı üzerinde kontrol sahibi olmaları gerektiğini ve AI şirketlerinin asistanların haberleri nasıl işlediklerini ve ürettikleri hata ve yanlışlıkların ölçeğini ve kapsamını göstermeleri gerektiğini” söyledi.

Kaynak: BBC