Yapay Zeka Uzmanlarından DeepSeek R1 Yorumu: Büyük Olan Her Zaman İyi Değildir

Milyarlık yatırımlar, sadece bir günde düşük bütçeli bir rakip tarafından saf dışı bırakılabilir.

29 Ocak 2025 01:00 Güncellenme: 30 Ocak 2025 13:38

Teknoloji dünyası son günlerde Çinli bir yapay zeka modelinden bahsediyor; DeepSeek R1. Özellikle aylardır OpenAI'in ChatGPT modeli, Google Gemini ve Microsoft'un yapay zekaları tartışılırken, sadece son iki haftada tüm oklar tersine döndü.

Çinli şirketler 2025'e çok iddialı giriş yaptı ve çok sayıda yeni yapay zeka modellerini sahaya sürdü. Üstelik çip kısıtlamalarına rağmen Silikon Vadisi'nin şoka uğratmayı başardılar. Bugünlerde adından en çok söz ettiren yapay zeka DeepSeek V3, düşük bütçeli fakat iyi performans sergileyen AI modeli nasıl geliştirilir tüm dünyaya kanıtladı.

DEEPSEEK, ÇİN İÇİN SADECE BİR BAŞLANGIÇTA

DeepSeek fırtınası günlerdir devam ediyor, ABD'li teknoloji devlerinin hisseleri çakılıyor ve daha birçok ilginç anlara tanık oluyoruz. Peki yapay zeka uzmanları DeepSeek için ne diyor?

Ticaret kısıtlamaları ve Nvidia GPU'larına erişim nedeniyle engellenen Çin merkezli DeepSeek, harika fikirler ve mühendislikler sonucunda ortaya çıktı. Kısacası Çinliler, nasıl daha ucuza müthiş bir AI modeli geliştirilir bunu gösterdi.

Yapay zeka uzmanları ise diğer ABD'li firmaları kaleme alarak eleştirdi. Timnit Gebru, "Google'a, neden EN BÜYÜK modeli inşa etmeye bu kadar odaklandıklarını sordum. Neden boyuta odaklanıyorsunuz? Hangi işlevi başarmaya çalışıyorsunuz? Neden EN BÜYÜK modele sahip olmadığınız için sinirlendiğiniz şey bu? Bana kovmayla karşılık verdiler," ifadelerini kullandı. Tabii ki önyargıları nedeniyle Timnit'in Google'daki işine de son verildi.

Sadece bununla bitmiyor. Hugging Face'in iklim ve yapay zeka lideri Sasha Luccioni ise, yapay zeka yatırımının pazarlama ve abartı üzerine nasıl tehlikeli bir şekilde inşa edildiğine dikkat çekti. Luccioni, "Tek bir (yüksek performanslı) LLM'nin binlerce GPU'yu zorla çalıştırmadan bu performansı elde edebileceğini ima etmenin buna sebep olması çılgınca," dedi.

DEEPSEEK R1'İ BU KADAR DEĞERLİ YAPAN ŞEY NEDİR?

Mashable.com'a göre DeepSeek R1, temel ölçütlerde OpenAI o1 modeliyle karşılaştırılabilir bir performans gösterdi. Matematik, kodlama ve genel bilgi testlerinde o1'i biraz geçerken, ona eşit oldu ya da çok az farkla altında kaldı. Yani, ortalama kullanıcı için Anthropic Claude, Google Gemini ve Meta'nın açık kaynaklı modeli Llama gibi başka modeller de var.

Ancak R1, üretiminin çok düşük maliyetli olması nedeniyle böyle bir çılgınlığa neden oluyor. Yapay zeka araştırma bilimcisi Gary Marcus, "Daha önceki modellerden daha akıllı değil, sadece daha ucuza eğitilmiş" dedi.

OPENAI YETKİLİLERİ DE SESSİZ KALMADI

Çinli rakibinin bu gelişimine tanıklık eden OpenAI yetkililerinden Andrej Karpathy, X'te "Bu, sınır LLM'leri için büyük GPU kümelerine ihtiyacınız olmadığı anlamına mı geliyor? Hayır, ancak elinizdekilerle israf etmediğinizden emin olmalısınız ve bu, hem verilerle hem de algoritmalarla hala çok şey başarmanız gerektiğini gösteren güzel bir gösteri gibi görünüyor." ifadelerini kullandı.

Öte yandan Wharton yapay zeka profesörü Ethan Mollick, konunun DeepSeek'in yetenekleriyle değil, insanların şu anda erişebildiği modellerle ilgili olduğunu şu sözlerle dile getirdi:

“DeepSeek gerçekten iyi bir model, ancak genel olarak o1 veya Claude'dan daha iyi bir model değil. Ancak hem ücretsiz olduğu hem de büyük ilgi gördüğü için, bence ücretsiz 'mini' modeller kullanan pek çok insan, 2025'in başlarında akıl yürüten bir yapay zekanın neler yapabileceğini görüyor ve şaşırıyor.”

Kaynak: Mashable SEA