Albert Einstein’ı bile canlandırıyor. TikTok’un sahibinden gerçekçi videolar üreten yapay zeka aracı

TikTok’un çatı şirketi ByteDance, gerçeğinden ayırt edilemeyecek kadar harika görüntüler oluşturan yapay zeka aracı OmniHuman-1’i tanıttı.

05 Şubat 2025 23:16 Güncellenme: 06 Şubat 2025 02:22

Yapay zeka sohbet robotlarının hemen akabinde yaygınlaşan görüntü oluşturma araçları, günümüzün hem eğlenceli hem de en tehlikeli yeniliklerinden biri haline geldi.

Kimi zaman eğlence amaçlı kullanılsa da, bazı kötü niyetli kişiler deepfake görüntüler oluşturarak bunu farklı amaçlar için kullanılabiliyor.

Kullanıcıların tercih ettiği pek çok AI görüntü oluşturma aracı bulunurken, TikTok’un sahibi ByteDance, OmniHuman-1 adını verdiği yapay zeka görüntü oluşturma aracını tanıttı.

OMNIHUMAN-1 İLE GERÇEKÇİ GÖRÜNTÜLER OLUŞTURULABİLİYOR

Yeni yapay zeka görüntü oluşturma aracı OmniHuman-1, insanların konuştuğu, jestler yaptığı, şarkılar söyleyip enstürmanlar çaldığı gerçekçi görüntüler oluşturabiliyor.

ArXiv’de yayımlanan bir araştırma makalesinde "OmniHuman, özellikle ses olmak üzere zayıf sinyal girişlerine dayalı son derece gerçekçi insan videoları üreterek mevcut yöntemlerden önemli ölçüde daha iyi performans gösteriyor. Portreler, yarım vücut veya tam vücut görüntüleri olsun, her en boy oranındaki görüntü girişlerini destekliyor ve çeşitli senaryolarda daha gerçekçi ve yüksek kaliteli sonuçlar sunuyor." açıklamalarına yer verildi.

OmniHuman-1 proje sayfasında ise, aracın yeteneklerini sergileyen örnek videolar bulunuyor. Örnekler, el ve vücut hareketlerinin kapsamını ve animasyonlu karakterlerin ve hayvanların netliğini gösterirken, daha da ileri giderek tarihi figürleri bile hayata geri döndürüyor. Başlıkta belirttiğimiz Albert Einstein örneği gibi.

Aşağıda paylaştığımız videoda da görüldüğü üzere Çinli yapay zeka görüntü oluşturma aracı, Albert Einstein bir kara tahtanın önünde konuşuyor, noktalarını el hareketleri ve ince yüz ifadeleriyle vurguluyor. Sanki zamanda geriye gidip ünlü teorik fizikçinin bir ders anlatıyormuş gibi bu AI görüntüsü gerçekten de harika işler ortaya koyuyor.

Annenberg İletişim ve Gazetecilik Okulu'nda klinik doçent olan Freddy Tran Nager, örnek videoları izledikten sonra verdiği bir röportajda. “Eğer Humphrey Bogart’ı yeniden canlandırıp bir filmde oynatmayı düşünüyorsanız, nasıl görüneceklerinden emin değilim. Ancak küçük bir ekranda, özellikle bir telefonda, bunlar etkileyici.” dedi.

OmniHuman-1 ile ilgili yorumlar epey artarken, New York Üniversitesi Steinhardt Kültür, Eğitim ve İnsan Gelişimi Okulu'nda yardımcı doçent olan Samantha G. Wolfe da OmniHuman gibi araçların hem umut verici hem de potansiyel tehlikelerinin olduğunu şu ifadelerle kaydetti:

“Yalnızca bir resimden bir şey oluşturmak ve onun gerçekten konuşuyormuş ve hareket ediyormuş gibi görünmesini sağlamak, teknolojik açıdan büyüleyici, ancak bunun birçok potansiyel olumsuz sonucu da olabilir. İş dünyasının veya siyaset dünyasının önde gelen isimlerinin gerçekte söylemedikleri şeyleri söylediği sahte versiyonlar, bir şirket üzerinde büyük bir etkiye sahip olabilir ya da bir ülkeyi ciddi şekilde etkileyebilir. Hepimizden belli bir düzeyde rehberlik ve koruyucu önlemler gerekli.”

EĞİTİLMESİ 18.700 SAATTEN FAZLA SÜRDÜ

forbes.com’a göre ByteDance ekibi, OmniHuman’ı 18.700 saatten fazla insan video verisiyle eğitti ve eğitim sürecinde metin, ses ve fiziksel duruşlar gibi birden fazla veri türünü birleştirdi. Ancak ByteDance, eğitim verileriyle ilgili daha fazla ayrıntı talebine hemen yanıt vermedi.

ByteDance, OmniHuman-1'i henüz genel kullanıma sunmadı, ancak yakında piyasaya çıkması bekleniyor.