Nesne algılama için Maksimum Olmayan Bastırma (NMS) özelliğini keşfedin. Sonuçları nasıl iyileştirdiğini, doğruluğu nasıl artırdığını ve YOLO gibi yapay zeka uygulamalarına nasıl güç verdiğini öğrenin.
Maksimum Olmayan Bastırma (NMS), bilgisayarla görmede, özellikle de nesne algılama görevlerinde kullanılan temel bir son işlem algoritmasıdır. Birincil amacı, her nesnenin yalnızca bir kez tanımlanmasını sağlamak için gereksiz ve örtüşen sınırlayıcı kutuları filtreleyerek bir algılama modelinin çıktısını temizlemektir. Ultralytics YOLO gibi bir nesne algılama modeli tahminler yaptığında, genellikle aynı nesnenin etrafında her biri farklı bir güven puanına sahip birden fazla aday kutu oluşturur. NMS, her nesne için en iyi tek sınırlayıcı kutuyu akıllıca seçer ve maksimal olmadığı düşünülen diğer tüm örtüşen kutuları bastırır veya ortadan kaldırır.
NMS algoritması, tahmin edilen sınırlayıcı kutular arasında yineleme yaparak ve iki temel ölçüme dayalı kararlar vererek çalışır: güven puanları ve Birlik Üzerinde Kesişim (IoU) eşiği. Süreç şu adımlarla özetlenebilir:
IoU eşiği kritik, kullanıcı tanımlı bir hiperparametredir. Düşük bir IoU eşiği, küçük bir örtüşmeye sahip kutuları bile bastıracağından daha az tespitle sonuçlanırken, yüksek bir eşik aynı nesne için birden fazla tespite izin verebilir. Bu eşiğe ince ayar yapmak genellikle bir modelin belirli bir veri kümesindeki performansını optimize etmenin bir parçasıdır.
NMS, doğru nesne algılamaya dayanan birçok gerçek dünya yapay zeka uygulamasında çok önemli bir bileşendir.
NMS, özellikle bir nesne algılama modeli ilk aday sınırlayıcı kutu kümesini oluşturduktan sonra uygulanan bir işlem sonrası adımdır. Çapa tabanlı dedektörler ile çapasız dedektörler arasındaki fark gibi algılama mimarisinin kendisiyle karıştırılmamalıdır. Bu mimariler potansiyel kutuların nasıl önerildiğini tanımlarken, NMS bu önerileri iyileştirir.
İlginç bir şekilde, NMS ile ilişkili hesaplama maliyeti ve potansiyel darboğazlar, NMS içermeyen nesne dedektörlerine yönelik araştırmaları teşvik etmiştir. YOLOv10 gibi modeller, çıkarım gecikmesini azaltmayı ve gerçekten uçtan uca tespit sağlamayı amaçlayarak, gereksiz kutuları tahmin etmekten doğal olarak kaçınmak için eğitim sırasında mekanizmaları entegre eder. Bu, NMS'nin çıkarım işlem hattının standart ve önemli bir parçası olmaya devam ettiği Ultralytics YOLOv8 veya YOLOv5 gibi geleneksel yaklaşımlarla tezat oluşturmaktadır. YOLOv10 ve YOLOv8 gibi teknik karşılaştırmaları belgelerimizde inceleyebilirsiniz. Soft-NMS gibi varyantlar, örtüşen kutuların puanlarını tamamen ortadan kaldırmak yerine azaltan alternatif yaklaşımlar sunar.
NMS, Ultralytics ekosistemine sorunsuz bir şekilde entegre edilmiştir. Ultralytics YOLO modelleri NMS'yi otomatik olarak tahmin (predict
) ve doğrulama (val
) modları, kullanıcıların varsayılan olarak temiz ve doğru algılama çıktıları almasını sağlar. NMS davranışını kontrol eden parametreler (IoU eşiği ve güven eşiği gibi) genellikle özel uygulama ihtiyaçları için ayarlanabilir.
Ultralytics HUB gibi platformlar bu ayrıntıları daha da soyutlayarak kullanıcıların modelleri eğitmesine ve NMS'nin optimize edilmiş boru hattının bir parçası olarak otomatik olarak ele alındığı yerlerde dağıtmasına olanak tanır. Bu entegrasyon, kullanıcıların MLOps konusundaki derin teknik uzmanlıklarından bağımsız olarak, çeşitli bilgisayarla görme görevleri için son teknoloji ürünü nesne algılama sonuçlarından yararlanabilmelerini sağlar. Ultralytics çerçevesindeki özel uygulama ayrıntıları Ultralytics yardımcı programları referansında keşfedilebilir. Daha fazla tanım için ana Ultralytics Sözlüğü'ne göz atın.