X
YOLO Vision 2024 is here!
YOLO Vision 24
27 Eylül 2024
YOLO Vision 24
Free hybrid event
Yeşil çek
Panoya kopyalanan bağlantı

Meta AI'nin Segment Anything Model 2 Uygulamaları (SAM 2)

Meta AI'nin Segment Anything Model 2'sini (SAM 2) incelerken bize katılın ve çeşitli sektörlerde hangi gerçek zamanlı uygulamalar için kullanılabileceğini anlayın.

29 Temmuz 2024'te Meta AI, Segment Anything Model'in ikinci versiyonunu yayınladı, SAM 2. Yeni model, hem görüntülerde hem de videolarda hangi piksellerin bir hedef nesneye ait olduğunu belirleyebiliyor! İşin en iyi yanı, modelin bir nesneyi gerçek zamanlı olarak bir videonun tüm kareleri boyunca tutarlı bir şekilde takip edebilmesidir. SAM 2 video düzenleme, karma gerçeklik deneyimleri ve bilgisayarla görme sistemlerinin eğitimi için görsel verilere daha hızlı açıklama ekleme gibi heyecan verici olanaklar sunuyor.

Deniz bilimleri, uydu görüntüleri ve tıp gibi alanlarda kullanılan orijinal SAM'un başarısı üzerine inşa edilen SAM 2, hızlı hareket eden nesneler ve görünüm değişiklikleri gibi zorlukların üstesinden geliyor. Geliştirilmiş doğruluğu ve verimliliği, onu çok çeşitli uygulamalar için çok yönlü bir araç haline getirmektedir. Bu makalede, SAM 2'nin nerelerde uygulanabileceğine ve yapay zeka topluluğu için neden önemli olduğuna odaklanacağız.

SAM 2 nedir?

Segment Anything Model 2, hem görüntülerde hem de videolarda istenebilir görsel segmentasyonu veya PVS'yi destekleyen gelişmiş bir temel modeldir. PVS, bir modelin kullanıcı tarafından verilen belirli istemlere veya girdilere dayalı olarak bir görüntünün veya videonun farklı bölümlerini segmentlere ayırabildiği veya tanımlayabildiği bir tekniktir. Bu istemler, ilgilenilen alanı vurgulayan tıklamalar, kutular veya maskeler şeklinde olabilir. Model daha sonra belirtilen alanın ana hatlarını çizen bir segmentasyon maskesi oluşturur.

SAM 2 mimarisi, görüntü segmentasyonundan video segmentasyonunu da içerecek şekilde genişletilerek orijinal SAM üzerine inşa edilmiştir. Segmentasyon maskeleri oluşturmak için görüntü verilerini ve istemlerini kullanan hafif bir maske kod çözücüye sahiptir. Videolar için SAM 2, önceki karelerdeki bilgileri hatırlamasına yardımcı olan ve zaman içinde doğru izleme sağlayan bir bellek sistemi sunar. Bellek sistemi, segmente edilen nesnelerle ilgili ayrıntıları depolayan ve geri çağıran bileşenler içerir. SAM 2 ayrıca oklüzyonlarla başa çıkabilir, nesneleri birden fazla kare boyunca izleyebilir ve birkaç olası maske oluşturarak belirsiz istemleri yönetebilir. SAM 2'nin gelişmiş mimarisi, onu hem statik hem de dinamik görsel ortamlarda son derece yetenekli kılar.

Özellikle, video segmentasyonu ile ilgili olarak, SAM 2 önceki yöntemlere kıyasla üç kat daha az kullanıcı etkileşimi ile daha yüksek bir doğruluk elde etmektedir. Görüntü segmentasyonu için SAM 2, orijinal Segment Anything Model'den (SAM) altı kat daha hızlı ve daha doğru performans göstermektedir. Bu gelişme SAM 2 araştırma makalesinde, SAM 'un daha önce test edildiği 23 veri kümesi de dahil olmak üzere 37 farklı veri kümesinde sergilenmiştir. 

Şekil 1. Karşılaştırma SAM ve SAM 2.

İlginç bir şekilde, Meta AI'nin SAM 2'si bugüne kadarki en büyük video segmentasyon veri seti olan SA-V veri seti oluşturularak geliştirilmiştir. Bu kapsamlı veri kümesi 50.000'den fazla video ve 35,5 milyon segmentasyon maskesi içeriyor ve interaktif kullanıcı katkılarıyla toplanmış. Açıklayıcılar, modelin çok çeşitli senaryolardan ve nesne türlerinden öğrenmesine yardımcı olmak için yönlendirmeler ve düzeltmeler sağlamıştır.

Segment Anything Model 2 Uygulamaları

Görüntü ve video segmentasyonundaki gelişmiş yetenekleri sayesinde SAM 2 çeşitli sektörlerde kullanılabilir. Bu uygulamalardan bazılarını inceleyelim.

SAM 2 Artırılmış Gerçeklik (AR) ve Sanal Gerçeklik (VR) sağlar

Meta AI'nin yeni segmentasyon modeli Artırılmış Gerçeklik (AR) ve Sanal Gerçeklik (VR) uygulamaları için kullanılabilir. Örneğin, SAM 2 gerçek dünyadaki nesneleri doğru bir şekilde tanımlayıp segmentlere ayırabilir ve sanal nesnelerle etkileşimi daha gerçekçi hale getirebilir. Sanal ve gerçek unsurlar arasında gerçekçi bir etkileşimin gerekli olduğu oyun, eğitim ve öğretim gibi çeşitli alanlarda faydalı olabilir.

AR gözlükleri gibi cihazların daha gelişmiş hale gelmesiyle, SAM 2'nin yetenekleri yakında bunlara entegre edilebilir. Gözlüğünüzü taktığınızı ve oturma odanızın etrafına baktığınızı hayal edin. Gözlüğünüz segmentlere ayrıldığında ve köpeğinizin su kabını fark ettiğinde, aşağıdaki resimde gösterildiği gibi size onu yeniden doldurmanızı hatırlatabilir. Ya da yeni bir tarif pişiriyorsanız, gözlükler tezgahınızdaki malzemeleri belirleyebilir ve adım adım talimatlar ve ipuçları sağlayarak pişirme deneyiminizi geliştirebilir ve gerekli tüm malzemelerin elinizin altında olmasını sağlayabilir.

Şekil 2. SAM 2 yakında AR gözlüklerinde kullanılabilir.

Segment Anything Model 2 ile Sonar Görüntüleme

SAM modelini kullanan araştırmalar, bu modelin sonar görüntüleme gibi özel alanlarda uygulanabileceğini göstermiştir. Sonar görüntüleme, düşük çözünürlüğü, yüksek gürültü seviyeleri ve görüntülerdeki nesnelerin karmaşık şekilleri nedeniyle benzersiz zorluklarla birlikte gelir. Araştırmacılar, sonar görüntüleri için SAM adresinde ince ayar yaparak, deniz enkazı, jeolojik oluşumlar ve diğer ilgi çekici öğeler gibi çeşitli su altı nesnelerini doğru bir şekilde bölümlere ayırma yeteneğini göstermiştir. Hassas ve güvenilir sualtı görüntülemesi deniz araştırmalarında, sualtı arkeolojisinde, balıkçılık yönetiminde ve habitat haritalama, eser keşfi ve tehdit tespiti gibi görevler için gözetimde kullanılabilir.

Şekil 3. Sonar görüntülerinin segmentasyonu için ince ayarlı SAM kullanımına bir örnek.

SAM 2, SAM 'un karşılaştığı zorlukların birçoğunu temel alıp geliştirdiğinden, sonar görüntülemenin analizini daha da iyileştirme potansiyeline sahiptir. Hassas segmentasyon yetenekleri, bilimsel araştırma ve balıkçılık dahil olmak üzere çeşitli denizcilik uygulamalarına yardımcı olabilir. Örneğin, SAM 2 sualtı yapılarını etkili bir şekilde belirleyebilir, denizdeki enkazı tespit edebilir ve ileriye dönük sonar görüntülerindeki nesneleri tanımlayarak daha doğru ve verimli sualtı keşif ve izlemesine katkıda bulunabilir.

Sonar görüntülerini analiz etmek için SAM 2 adresini kullanmanın potansiyel faydaları şunlardır:

  • Verimlilik: Manuel segmentasyon için gereken zaman ve çabayı azaltarak profesyonellerin analiz ve karar verme süreçlerine daha fazla odaklanmasını sağlar.
  • Tutarlılık: Büyük ölçekli deniz araştırmaları ve izleme için gerekli olan tutarlı ve tekrarlanabilir segmentasyon sonuçları sağlar.
  • Çok yönlülük: Çok çeşitli sonar görüntülerini işleyebilmesi, deniz bilimi ve endüstrideki çeşitli uygulamalar için kullanışlı olmasını sağlar.

Denizcilik endüstrisi, SAM 2 adresini sonar görüntüleme süreçlerine entegre ederek su altı keşif ve analizlerinde daha yüksek verimlilik, doğruluk ve güvenilirlik elde edebilir ve sonuçta deniz araştırmalarında daha iyi sonuçlar elde edebilir.

Otonom Araçlarda SAM 2 Kullanımı

SAM 2'nin bir başka uygulaması da otonom araçlardır. SAM 2 yayalar, diğer araçlar, yol işaretleri ve engeller gibi nesneleri gerçek zamanlı olarak doğru bir şekilde tanımlayabilir. SAM 2'nin sağlayabildiği ayrıntı düzeyi, güvenli navigasyon ve çarpışmadan kaçınma kararları almak için çok önemlidir. Görsel verileri hassas bir şekilde işleyen SAM 2, çevrenin ayrıntılı ve güvenilir bir haritasının oluşturulmasına yardımcı olur ve daha iyi kararlar alınmasını sağlar.

Şekil 4. Trafiği anlamak için segmentasyonu kullanma. 

SAM 2'nin farklı aydınlatma koşullarında, hava değişikliklerinde ve dinamik ortamlarda iyi çalışabilmesi, onu otonom araçlar için güvenilir kılmaktadır. İster kalabalık bir şehir caddesi ister sisli bir otoyol olsun, SAM 2 nesneleri tutarlı bir şekilde doğru olarak tanımlayabilir ve bölümlere ayırabilir, böylece araç çeşitli durumlara doğru şekilde yanıt verebilir. 

Bununla birlikte, akılda tutulması gereken bazı sınırlamalar vardır. Karmaşık, hızlı hareket eden nesneler için SAM 2 bazen ince ayrıntıları kaçırabilir ve tahminleri kareler arasında kararsız hale gelebilir. Ayrıca, SAM 2 bazen kalabalık sahnelerde birden fazla benzer görünümlü nesneyi karıştırabilir. Bu zorluklar, otonom sürüş uygulamalarında ek sensörlerin ve teknolojilerin entegrasyonunun çok önemli olmasının nedenidir.

SAM 2 Yardımıyla Çevresel İzleme

Bilgisayar görüşü kullanarak çevresel izleme, özellikle de açıklamalı veri eksikliği olduğunda zor olabilir, ancak bu aynı zamanda onu SAM 2 için ilginç bir uygulama haline getiren şeydir. SAM 2, uydu veya drone görüntülerinden ormanlar, su kütleleri, kentsel alanlar ve tarım arazileri gibi çeşitli çevresel özellikleri doğru bir şekilde bölümlere ayırıp tanımlayarak doğal manzaralardaki değişiklikleri izlemek ve analiz etmek için kullanılabilir. Özellikle, hassas segmentasyon, çevresel koruma ve planlama için değerli veriler sağlamak üzere ormansızlaşma, kentleşme ve arazi kullanımındaki değişikliklerin zaman içinde izlenmesine yardımcı olur.

Şekil 5. Ormansızlaşmayı izlemek için segmentasyon kullanımına bir örnek.

Zaman içindeki çevresel değişiklikleri analiz etmek için SAM 2 gibi bir model kullanmanın faydalarından bazıları şunlardır:

  • Erken Tespit: Çevresel bozulmanın erken belirtilerini tespit ederek daha fazla zararı önlemek için zamanında müdahalelere olanak tanır.
  • Kaynak yönetimi: Çeşitli çevresel özelliklerin durumu hakkında ayrıntılı bilgiler sağlayarak doğal kaynakların verimli bir şekilde yönetilmesine yardımcı olur.
  • Biyoçeşitliliğin korunması: Yaban hayatının izlenmesine ve biyoçeşitliliğin izlenmesine yardımcı olur, koruma çabalarına ve nesli tükenmekte olan türlerin korunmasına katkıda bulunur.
  • Afet müdahalesi: Seller, orman yangınları ve kasırgalar gibi doğal afetlerin etkisinin değerlendirilmesine yardımcı olarak hızlı ve etkili afet müdahalesi ve kurtarma planlaması sağlar.

SAM 2 ile Video Düzenleme: Kendiniz Deneyin

Segment Anything 2 Demo, modeli bir video üzerinde denemek için harika bir yoldur. SAM 2'nin PVS özelliklerini kullanarak eski bir Ultralytics YouTube videos unu aldık ve videodaki üç nesneyi veya kişiyi bölümlere ayırıp pikselleştirebildik. Geleneksel olarak, böyle bir videodan üç kişiyi düzenlemek zaman alıcı ve sıkıcı olurdu ve manuel kare kare maskeleme gerektirirdi. Ancak SAM 2 bu süreci basitleştiriyor. Demoda birkaç tıklamayla, ilgilendiğiniz üç nesnenin kimliğini birkaç saniye içinde koruyabilirsiniz.

Şekil 6. SAM 2 Demosunun denenmesi. 

Demo ayrıca, takip için seçtiğiniz nesnelerin üzerine spot ışığı koymak ve takip edilen nesneleri silmek gibi birkaç farklı görsel efekti denemenizi sağlar. Demoyu beğendiyseniz ve SAM 2 ile yenilik yapmaya hazırsanız, modelle ilgili ayrıntılı talimatlar için Ultralytics SAM 2 model dokümanları sayfasına göz atın. Projelerinizde SAM 2'nin potansiyelinden tam olarak yararlanmak için özellikleri, kurulum adımlarını ve örnekleri keşfedin!

Toparlıyoruz

Meta AI'nin Segment Anything Model 2'si (SAM 2) video ve görüntü segmentasyonunu dönüştürüyor. Nesne takibi gibi görevler geliştikçe, video düzenleme, karma gerçeklik, bilimsel araştırma ve tıbbi görüntüleme alanlarında yeni fırsatlar keşfediyoruz. Karmaşık görevleri kolaylaştırarak ve ek açıklamaları hızlandırarak SAM 2, yapay zeka topluluğu için önemli bir araç haline gelmeye hazırlanıyor. SAM 2 gibi modellerle keşfetmeye ve yenilikler yapmaya devam ettikçe, çeşitli alanlarda daha da çığır açan uygulamalar ve ilerlemeler bekleyebiliriz!

GitHub depomuzu keşfederek ve topluluğumuza katılarak yapay zeka hakkında daha fazla bilgi edinin. Üretim ve sağlık hizmetlerinde yapay zeka hakkında ayrıntılı bilgiler için çözüm sayfalarımıza göz atın. 🚀

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın