Yeşil çek
Panoya kopyalanan bağlantı

Meta Movie Gen: İçerik Oluşturmayı Yeniden Hayal Etmek

Meta Movie Gen'in video ve ses oluşturmayı nasıl yeniden tanımladığını görün. Bu modelin nasıl hassas video düzenleme sunduğunu ve kişiselleştirilmiş medya oluşturmayı desteklediğini öğrenin.

İster hevesli bir film yapımcısı olun, ister izleyicileriniz için videolar hazırlamaktan hoşlanan bir içerik oluşturucu, yaratıcılığınızı genişleten yapay zeka araçlarına sahip olmak her zaman yararlıdır. Yakın zamanda Meta , Meta Movie Gen olarak bilinen en yeni jeneratif video modelini piyasaya sürdü. 

Runway, OpenAI ve Meta gibi şirketlerin çığır açan yeniliklere öncülük ettiği medya ve eğlence alanındaki küresel jeneratif yapay zeka pazarının 2033 yılına kadar 11,57 milyar dolara ulaşacağı tahmin ediliyor. Özellikle Meta Movie Gen, film yapımı, video içeriği oluşturma ve dijital hikaye anlatımı gibi uygulamalar için mükemmeldir ve yüksek kaliteli, yapay zeka tarafından oluşturulan videolar aracılığıyla yaratıcı vizyonları hayata geçirmeyi her zamankinden daha kolay hale getirir. Bu makalede Meta Movie Gen'i ve nasıl çalıştığını inceleyeceğiz. Ayrıca bazı uygulamalarına daha yakından bakacağız. Hadi başlayalım!

Şekil 1. Meta Movie Gen kullanılarak oluşturulan bir video klip karesi.

Meta Movie Gen nedir?

Meta Movie Gen'in ne olduğunu tartışmadan önce, nasıl ortaya çıktığına bir göz atalım. 

Meta'nın üretken yapay zek a ile ilgili araştırma çabaları Make-A-Scene model serisi ile başladı. Bu araştırma, sanatçıların ve vizyonerlerin hayal güçlerini hayata geçirmelerine yardımcı olan multimodal bir üretken yapay zeka yöntemine odaklanıyor. Sanatçılar istedikleri görüntü çıktısını elde etmek için görüntü, ses, video veya 3D animasyonlar girebilirler. İnovasyondaki bir sonraki sıçrama, çok daha yüksek kalitede görüntü ve videolar oluşturmayı mümkün kılan ve görüntü düzenlemeyi mümkün kılan Lama Görüntü Temel modelleri(Emu) gibi difüzyon modelleri ile geldi.

Şekil 2. Oluşturulan bir görüntüyü elde etmek için Make-A-Scene'in taslağını ve metin girişini kullanma örneği.

Movie Gen, Meta'nın üretici yapay zeka araştırmalarına yaptığı en son katkıdır. Daha önce bahsedilen tüm modaliteleri birleştirir ve insanların modelleri daha yaratıcı şekillerde kullanabilmeleri için daha fazla ince taneli kontrol sağlar. Meta Movie Gen, metinden videoya, metinden sese ve metinden görüntüye gibi farklı medya türlerini üretmeye yönelik temel modellerden oluşan bir koleksiyondur. Lisanslı ve kamuya açık veri kümelerinin bir kombinasyonu üzerinde eğitilen dört modelden oluşur. 

İşte bu modellere hızlı bir genel bakış:

  • Movie Gen Video modeli: Metin istemlerinden yüksek kaliteli videolar üreten 30 milyar parametreli bir model. 
  • Film Gen Ses modeli: Video içeriğiyle senkronize olan film müzikleri oluşturabilen 13 milyar parametreli bir model. 
  • Kişiselleştirilmiş Film Gen Video modeli: Bir metin istemine ve tek bir görüntüye dayalı olarak, benzerliklerini koruyarak belirli kişilerin videolarını oluşturur. 
  • Movie Gen Edit modeli: Model, gerçek ve kurgusal videolar için ayrıntılı, metin tabanlı video düzenlemelerine olanak tanır. 

Meta Movie Gen Video Modelinin Eğitimi

Movie Gen Video modelinin oluşturulmasında ve eğitilmesinde birkaç temel süreç yer almıştır. İlk adım, öncelikle kalite, hareket ve uygunluk açısından filtrelenmiş insan faaliyetlerini içeren görüntüler ve video klipler dahil olmak üzere görsel verilerin toplanmasını ve hazırlanmasını içeriyordu. Veriler daha sonra her sahnede neler olduğunu açıklayan metin başlıklarıyla eşleştirildi. Meta'nın LLaMa3-Video modeli kullanılarak oluşturulan başlıklar, her sahnenin içeriği hakkında zengin ayrıntılar sağlayarak modelin görsel hikaye anlatma yeteneklerini geliştirdi.

Şekil 3. Movie Gen Video modelinin eğitim öncesi veri iyileştirme işlem hattına genel bir bakış.

Eğitim süreci, modelin metni düşük çözünürlüklü görüntülere dönüştürmeyi öğrenmesiyle başladı. Daha sonra, giderek daha yüksek kaliteli görseller kullanarak metinden görüntüye ve metinden videoya eğitimin bir kombinasyonu yoluyla tam video klipler oluşturmaya doğru ilerledi. 

Temporal Autoencoder (TAE) adı verilen bir araç, büyük hacimli verileri verimli bir şekilde yönetmek için videoları sıkıştırdı. İnce ayar video kalitesini daha da keskinleştirdi ve model ortalaması adı verilen bir yöntem (daha pürüzsüz, daha tutarlı sonuçlar için birden fazla model çıktısını birleştirir) daha fazla çıktı tutarlılığı sağladı. Son olarak, başlangıçta 768p olan video, daha net görseller için piksel verileri ekleyerek görüntü çözünürlüğünü artıran uzamsal örnekleyici tekniği kullanılarak keskin bir 1080p çözünürlüğe yükseltildi. Sonuç olarak yüksek kaliteli, ayrıntılı video çıktıları elde edildi.

Meta Film Üretme Yeteneklerini Keşfetme

Meta Movie Gen modelleri temel olarak dört farklı yeteneği destekler. Her birine daha yakından bakalım.

Video ve Ses Üretimi

Meta Movie Gen yüksek kaliteli videolar oluşturabilir. Bu video klipler 16 saniyeye kadar uzunlukta olabilir ve 16 fps (saniye başına kare) hızında çalışarak metin komutlarından hareket, etkileşim ve kamera açılarını yakalayan gerçekçi görseller oluşturur. 13 milyar parametreli ses modeliyle eşleştirildiğinde, görsellerle eşleşecek ortam sesleri, Foley efektleri ve müzik dahil olmak üzere senkronize ses üretebilir. 

Bu kurulum, hem görsellerin hem de sesin çeşitli sahneler ve yönlendirmeler boyunca aynı hizada ve gerçekçi kaldığı kesintisiz ve gerçekçi bir deneyim sağlıyor. Örneğin, bu modeller Moo Deng adlı Tayland'ın viral domuzsu su aygırının video kliplerini oluşturmak için kullanıldı.

Şekil 4. Moo Deng'in Meta'nın Movie Gen'i kullanılarak oluşturulmuş bir video klibinden bir kare.

Kişiselleştirilmiş Video Üretimi

Meta Movie Gen modelinin bir diğer ilginç özelliği de kişiselleştirilmiş video üretimidir. Kullanıcılar bir kişinin görüntüsünü ve video klibin nasıl oluşturulması gerektiğini açıklayan bir metin istemi sağlayabilir, bu da referans kişiyi içeren ve metin isteminde belirtilen zengin görsel ayrıntıları içeren bir video ile sonuçlanır. Model, kişinin benzersiz görünümünü ve doğal vücut hareketlerini korumak için her iki girdiyi de (görüntü ve metin) kullanırken, istemde açıklanan sahneyi doğru bir şekilde takip eder.

Şekil 5. Modelin kişiselleştirilmiş video oluşturma kabiliyetine bir örnek.

Hassas Video Düzenleme 

Movie Gen Edit modelini kullanan kullanıcılar, videoyu yaratıcı şekillerde düzenlemek için girdi olarak hem bir video klip hem de bir metin istemi sağlayabilir. Model, öğe ekleme, kaldırma veya değiştirme gibi çok özel düzenlemeleri gerçekleştirmek için video oluşturmayı gelişmiş görüntü düzenlemeyle birleştirir. Ayrıca video klibin arka planını veya genel stilini değiştirmek gibi genel değişiklikler de gerçekleştirebilir. Ancak modeli gerçekten benzersiz kılan şey hassasiyeti: yalnızca düzenleme gerektiren belirli pikselleri hedefleyebilir ve geri kalanına dokunmadan bırakabilir. Bu sayede orijinal içerik mümkün olduğunca korunur. 

Şekil 6. Movie Gen Edit modelinin video düzenleme yeteneklerine çeşitli örnekler.

Meta Movie Gen'in Kıyaslama Araçları

Meta, jeneratif yapay zeka modellerinin yanı sıra, jeneratif yapay zek a modellerinin performansını test etmek için bir kıyaslama araçları paketi olan Movie Gen Bench'i de tanıttı. İki ana araçla birlikte geliyor: Movie Gen Video Bench ve Movie Gen Audio Bench. Her ikisi de video ve ses üretiminin farklı yönlerini test etmek için tasarlanmıştır.

İşte her iki araca da bir bakış:

  • Movie Gen Video Bench: İnsan aktiviteleri, hayvanlar, doğal manzara, fizik ve sıra dışı konular ve aktiviteler gibi çok çeşitli test kategorilerini kapsayan 1003 istemden oluşur. Bu değerlendirme ölçütünü özellikle değerli kılan şey, video oluşturma modelinin hem hızlı hem de daha yavaş sekanslar için test edilmesini sağlayan hareket seviyelerini kapsamasıdır.
  • Movie Gen Audio Bench: Ses oluşturma yeteneklerini 527 istemde test etmek için tasarlanmıştır. Bu istemler, modelin ses efektlerini ve müziği görsel içerikle ne kadar iyi senkronize edebildiğini değerlendirmek için oluşturulan videolarla eşleştirilir.
Şekil 7. Diyagram, solda kavramların bir listesi ve sağda yaygın olarak kullanılan isim ve fiillerden oluşan bir kelime bulutu ile değerlendirme istemlerinin bir dökümünü göstermektedir.

Meta Movie Gen'in Pratik Bir Uygulaması

Meta Movie Gen modellerinin ne olduğunu ve nasıl çalıştığını ele aldığımıza göre, şimdi bunların pratik uygulamalarından birini inceleyelim. 

Film Yapımında Movie Gen Yapay Zeka Yenilikleri

Meta'nın Movie Gen'inin en heyecan verici kullanım alanlarından biri, yapay zeka destekli video ve ses oluşturma yoluyla film yapımcılığını nasıl dönüştürebileceğidir. Movie Gen ile içerik oluşturucular, basit metin komutlarından yüksek kaliteli görseller ve sesler üreterek hikayeler anlatmanın yeni yollarını açabilir. 

Aslında Meta, Blumhouse ve bir grup film yapımcısıyla birlikte çalışarak Movie Gen'in yaratıcı süreci en iyi şekilde nasıl destekleyebileceğine dair geri bildirimlerini topladı. Aneesh Chaganty, Spurlock Sisters ve Casey Affleck gibi film yapımcıları aracın ruh halini, tonu ve görsel yönü yakalama becerisini test etti. Modellerin yeni fikirlerin ortaya çıkmasına yardımcı olduğunu keşfettiler.

Bu pilot program, Movie Gen'in geleneksel film yapımının yerini almasa da yönetmenlere görsel ve işitsel unsurları hızlı ve yaratıcı bir şekilde denemeleri için yeni bir yol sunduğunu gösterdi. Film yapımcıları ayrıca aracın düzenleme özelliklerinin arka plan sesleri, efektler ve görsel stillerle daha özgürce oynamalarına izin vermesini de takdir ettiler. 

Şekil 8. Meta Movie Gen kullanılarak oluşturulan kısa filmden bir kare.

Önemli Çıkarımlar

Meta Movie Gen, basit metin açıklamalarından yüksek kaliteli videolar ve sesler oluşturmak için üretken yapay zeka kullanımında bir adım öne çıkıyor. Araç, kullanıcıların kolayca gerçekçi ve özel videolar oluşturmasına yardımcı olur. Hassas video düzenleme ve kişiselleştirilmiş medya oluşturma gibi özellikleriyle Meta Movie Gen, hikaye anlatımı, film yapımı ve daha fazlası için yeni olanaklar sunan esnek bir araç seti sunuyor. Ayrıntılı ve kullanışlı görseller oluşturmayı kolaylaştıran Meta Movie Gen, farklı alanlarda videoların oluşturulma ve kullanılma şeklini dönüştürüyor ve yapay zeka odaklı içerik oluşturma için yeni bir standart belirliyor.

Daha fazla bilgi edinmek için GitHub depomuzu ziyaret edin ve topluluğumuzla etkileşime geçin. Çözüm sayfalarımızda sürücüsüz otomobiller ve tarım alanındaki yapay zeka uygulamalarını keşfedin. 🚀

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın