Yeşil çek
Panoya kopyalanan bağlantı

Ultralytics YOLO11 Adresinin Çapasız Dedektör Olmasının Faydaları

Ultralytics YOLO11 adresinin çapasız nesne algılamayı nasıl desteklediğini ve bu model mimarisinin çeşitli uygulamalara getirdiği avantajları anlayın.

Görme Yapay Zeka modellerinin geçmişine bir göz atacak olursak, bir görüntü veya videodaki nesneleri tanımlamayı ve konumlandırmayı içeren temel bir bilgisayarla görme görevi olan nesne algılama kavramının 1960'lardan beri var olduğunu görürüz. Bununla birlikte, günümüzde en son yeniliklerdeki öneminin temel nedeni, nesne algılama tekniklerinin ve model mimarilerinin o zamandan bu yana gelişmiş ve hızla iyileşmiş olmasıdır. 

Önceki bir makalede, nesne algılamanın evrimini ve Ultralytics YOLO modellerine giden yolu tartışmıştık. Bugün, bu yolculukta daha spesifik bir kilometre taşını keşfetmeye odaklanacağız: çapa tabanlı dedektörlerden çapasız dedektörlere sıçrama. 

Çapa tabanlı dedektörler, nesnelerin bir görüntüde nerede olduğunu tahmin etmek için "çapa" adı verilen önceden tanımlanmış kutulara güvenir. Buna karşılık, çapasız ded ektörler bu önceden tanımlanmış kutuları atlar ve bunun yerine nesne konumlarını doğrudan tahmin eder.

Bu değişim basit ve mantıklı bir değişiklik gibi görünse de, aslında nesne algılama doğruluğu ve verimliliğinde büyük gelişmelere yol açmıştır. Bu makalede, çapasız dedektörlerin aşağıdaki gibi gelişmelerle bilgisayarla görmeyi nasıl yeniden şekillendirdiğini anlayacağız Ultralytics YOLO11.

Çapa Tabanlı Dedektörler Nedir?

Çapa tabanlı dedektörler, bir görüntüdeki nesneleri bulmaya yardımcı olmak için çapa olarak bilinen önceden tanımlanmış kutuları kullanır. Bu çapaları, görüntünün üzerine yerleştirilmiş farklı boyut ve şekillerde kutulardan oluşan bir ızgara olarak düşünün. Model daha sonra bu kutuları tespit ettiği nesnelere uyacak şekilde ayarlar. Örneğin, model bir araba tespit ederse, arabanın konumu ve boyutuyla daha doğru bir şekilde eşleşmesi için bağlantı kutusunu değiştirecektir.

Her bir çapa, görüntüdeki olası bir nesneyle ilişkilendirilir ve eğitim sırasında model, nesnenin konumu, boyutu ve en boy oranıyla daha iyi eşleşmesi için çapa kutularını nasıl değiştireceğini öğrenir. Bu, modelin farklı ölçek ve yönlerdeki nesneleri tespit etmesini sağlar. Ancak, doğru bağlantı kutuları setini seçmek zaman alıcı olabilir ve ince ayar yapma süreci hatalara açık olabilir.

Şekil 1. Çapa Kutusu Nedir?

YOLOv4 gibi çapa tabanlı dedektörler birçok uygulamada iyi çalışmış olsa da bazı dezavantajları vardır. Örneğin, çapa kutuları farklı şekil veya boyutlardaki nesnelerle her zaman iyi hizalanmaz, bu da modelin küçük veya düzensiz şekilli nesneleri algılamasını zorlaştırır. Çapa kutusu boyutlarını seçme ve ince ayar yapma süreci de zaman alıcı olabilir ve çok fazla manuel çaba gerektirir. Bunun yanı sıra, önceden tanımlanmış kutular bu daha karmaşık senaryolara iyi uyum sağlayamayabileceğinden, çapa tabanlı modeller genellikle örtülü veya üst üste binen nesneleri tespit etmekte zorlanır.

Çapasız Nesne Algılamaya Geçiş

Çapasız dedektörler, önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırarak nesne algılamaya yeni bir yaklaşım getiren CornerNet ve CenterNet gibi modellerle 2018 yılında dikkat çekmeye başladı. Nesnelerin nerede olduğunu tahmin etmek için farklı boyut ve şekillerde bağlantı kutularına dayanan geleneksel modellerin aksine, bağlantısız modeller nesnelerin konumlarını doğrudan tahmin eder. Nesnenin merkez gibi kilit noktalarına veya özelliklerine odaklanarak algılama sürecini basitleştiriyor, daha hızlı ve daha doğru hale getiriyor.

Çapasız modeller genellikle şu şekilde çalışır:

  • Anahtar noktası algılama: Önceden tanımlanmış kutular kullanmak yerine, bazı modeller bir nesne üzerindeki merkez veya belirli köşeler gibi önemli noktaları tanımlar. Bu önemli noktalar, modellerin nesnenin nerede olduğunu ve ne kadar büyük olduğunu anlamasına yardımcı olur.
  • Merkez Tahmin: Bazı modeller bir nesnenin merkezini tahmin etmeye odaklanır. Merkez bulunduktan sonra, model buradan tüm nesnenin boyutunu ve konumunu tahmin edebilir.
  • Isı haritası regresyonu: Birçok çapasız model, her pikselin bir nesnenin olası bir konumunu temsil ettiği ısı haritalarını kullanır. Daha güçlü ısı haritası değerleri, bir nesnenin o noktada mevcut olduğuna dair daha yüksek güvene işaret eder.
Şekil 2. Çapa Tabanlı Algılama ile Çapasız Algılama.

Ankrajsız modeller ankraj kutularına dayanmadığı için daha basit bir tasarıma sahiptir. Bu da hesaplama açısından daha verimli oldukları anlamına gelir. Birden fazla bağlantı kutusunu işlemek zorunda olmadıkları için nesneleri daha hızlı tespit edebilirler - bu da otonom sürüş ve video gözetimi gibi gerçek zamanlı uygulamalarda önemli bir avantajdır. 

Ankrajsız modeller ayrıca küçük, düzensiz veya tıkalı nesneleri ele almada çok daha iyidir. Çapa kutularına uymaya çalışmak yerine kilit noktaları tespit etmeye odaklandıkları için çok daha esnektirler. Bu, çapa tabanlı modellerin başarısız olabileceği karmaşık veya karmaşık ortamlarda nesneleri doğru bir şekilde tespit etmelerini sağlar.

Ultralytics YOLO11: Çapasız Bir Dedektör

Başlangıçta hız ve verimlilik için tasarlanan YOLO modelleri, kademeli olarak çapa tabanlı yöntemlerden çapasız algılamaya geçerek YOLO11 gibi modelleri daha hızlı, daha esnek ve çok çeşitli gerçek zamanlı uygulamalar için daha uygun hale getirmiştir.

İşte çapasız tasarımın farklı YOLO versiyonlarında nasıl geliştiğine hızlı bir bakış:

  • Ultralytics YOLOv5u: Önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldıran Çapasız Bölme Ultralytics Başlığı tanıtıldı. Bunun yerine model, nesnelerin bir görüntüde nerede olduğunu doğrudan tahmin ederek süreci basitleştirir, esnekliği ve hızı artırır.
  • YOLOv6: Çapaların yalnızca eğitim sırasında kullanıldığı Çapa Destekli Eğitim (AAT) adı verilen yeni bir yöntem kullanılmıştır. Bu, modelin eğitim sırasında çapa tabanlı yöntemlerin yapısından yararlanmasına izin verirken, daha iyi hız ve uyarlanabilirlik için çalışma zamanında çapasız algılama kullanmaya devam etti.
  • Ultralytics YOLOv8: Çapasız Bölünmüş Ultralytics Başlığını kullanarak çapasız algılamaya tamamen geçildi. Bu, özellikle çapa kutularına iyi uymayan küçük veya garip şekilli nesneler için modeli daha hızlı ve daha doğru hale getirdi.
  • Ultralytics YOLO11: YOLOv8 'un çapasız yaklaşımını temel alır ve çapa kutularını tamamen ortadan kaldırarak algılamayı daha da optimize eder. Bu da hayvan davranışlarının izlenmesi ve perakende analizleri gibi gerçek zamanlı uygulamalar için daha hızlı ve daha doğru algılama sağlar.
Şekil 3. Karşılaştırma Ultralytics YOLOv8 ve Ultralytics YOLO11 .

Gerçek Dünya Uygulamaları YOLO11

YOLO11 kullanarak çapasız algılamanın faydalarına harika bir örnek otonom araçlardır. Sürücüsüz araçlarda yayaları, diğer araçları ve engelleri hızlı ve doğru bir şekilde tespit etmek güvenlik için çok önemlidir. YOLO11'nin çapasız yaklaşımı, önceden tanımlanmış çapa kutularına güvenmek yerine, bir yayanın merkezi veya başka bir aracın sınırları gibi nesnelerin kilit noktalarını doğrudan tahmin ederek algılama sürecini basitleştirir. 

Şekil 4. YOLO11 'da Çapasız Algılamanın Faydaları (Resim Yazara Aittir).

YOLO11 hesaplama açısından pahalı ve yavaş olabilen bir çapa ızgarasını her nesneye ayarlamaya veya uydurmaya ihtiyaç duymaz. Bunun yerine, temel özelliklere odaklanarak daha hızlı ve daha verimli hale getiriyor. Örneğin, bir yaya aracın yoluna girdiğinde, YOLO11 kişi kısmen gizlenmiş veya hareket ediyor olsa bile kilit noktaları saptayarak konumunu hızla belirleyebilir. Bağlantı kutuları olmadan değişen şekil ve boyutlara uyum sağlama yeteneği, YOLO11 'un nesneleri daha güvenilir bir şekilde ve daha yüksek hızlarda tespit etmesini sağlar; bu da otonom sürüş sistemlerinde gerçek zamanlı karar verme için hayati önem taşır.

YOLO11'un çapasız yeteneklerinin gerçekten öne çıktığı diğer uygulamalar şunlardır:

  • Perakende ve envanter yönetimi: YOLO11 istiflenmiş veya kısmen tıkanmış olsalar bile raflardaki ürünlerin izlenmesini kolaylaştırır. Bu, daha hızlı, daha doğru envanter takibine yardımcı olur ve hataları azaltır.
  • Tıbbi görüntüleme: YOLO11 tıbbi taramalarda tümörleri veya diğer anormallikleri tespit edebildiği sağlık hizmetlerinde de etkilidir. Düzensiz şekilli nesnelerle çalışma yeteneği, karmaşık durumların teşhisinde doğruluğu artırmaya yardımcı olur.
  • Yaban hayatı izleme: Yaban hayatı araştırmalarında, YOLO11 yoğun ormanlarda veya zorlu arazilerde hayvanları takip ederek araştırmacıların davranışlarını izlemelerine veya nesli tükenmekte olan türleri korumalarına yardımcı olabilir.
  • Spor analitiği: YOLO11 spor etkinlikleri sırasında oyuncuları, top hareketlerini veya diğer unsurları gerçek zamanlı olarak izlemek için kullanılabilir ve takımlar, antrenörler ve yayıncılar için değerli bilgiler sağlar.

Ankrajsız Modellerle Çalışırken Dikkat Edilmesi Gerekenler

YOLO11 gibi çapasız modeller birçok avantaj sunsa da bazı sınırlamaları da beraberinde getirir. Pratikte göz önünde bulundurulması gereken en önemli hususlardan biri, çapasız modellerin bile oklüzyonlar veya yüksek oranda örtüşen nesnelerle mücadele edebilmesidir. Bunun arkasındaki mantık, bilgisayarla görmenin insan görüşünü taklit etmeyi amaçlamasıdır ve tıpkı bazen tıkalı nesneleri tanımlamakta zorlandığımız gibi, yapay zeka modelleri de benzer zorluklarla karşılaşabilir.

Bir başka ilginç faktör de model tahminlerinin işlenmesiyle ilgilidir. Çapasız modellerin mimarisi çapa tabanlı modellerden daha basit olsa da, bazı durumlarda ek iyileştirmeler gerekli hale gelmektedir. Örneğin, üst üste binen tahminleri temizlemek veya kalabalık sahnelerde doğruluğu artırmak için maksimum olmayan bastırma (NMS) gibi işlem sonrası teknikler gerekebilir.

Yapay Zekanın Geleceğine Demir Atmak YOLO11

Çapa tabanlı algılamadan çapasız algılamaya geçiş, nesne algılamada önemli bir ilerleme olmuştur. YOLO11 gibi çapasız modellerle süreç basitleştirilerek hem doğruluk hem de hızda iyileştirmeler sağlanmıştır.

YOLO11 sayesinde, hızlı ve hassas algılamanın çok önemli olduğu sürücüsüz arabalar, video izleme ve tıbbi görüntüleme gibi gerçek zamanlı uygulamalarda çapasız nesne algılamanın nasıl üstün olduğunu gördük. Bu yaklaşım, YOLO11 'un değişen nesne boyutlarına ve karmaşık sahnelere daha kolay adapte olmasını sağlayarak farklı ortamlarda daha iyi performans sunar.

Bilgisayarla görme gelişmeye devam ettikçe, nesne algılama daha hızlı, daha esnek ve daha verimli hale gelecektir.

GitHub depomuzu keşfedin ve yapay zeka ile ilgili her konuda güncel kalmak için ilgi çekici topluluğumuza katılın. Vision AI'ın üretim ve tarım gibi sektörleri nasıl etkilediğine göz atın.

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın