Bu modellerin 2023'ten 2025'e nasıl geliştiğini ve iyileştirildiğini anlamak için Ultralytics YOLOv8, YOLOv9, YOLOv10 ve Ultralytics YOLO11 'i karşılaştırın.
Günlük işlerin otomatikleştirilmesinden gerçek zamanlı olarak bilinçli kararlar alınmasına yardımcı olmaya kadar, yapay zeka (AI) çeşitli sektörlerin geleceğini yeniden şekillendiriyor. YZ'nin özellikle büyüleyici alanlarından biri, Vision AI olarak da bilinen bilgisayarla görmedir. Makinelerin görsel verileri insanlar gibi analiz etmesini ve yorumlamasını sağlamaya odaklanır.
Özellikle, bilgisayarla görme modelleri hem güvenliği hem de verimliliği artıran yeniliklere yön veriyor. Örneğin, bu modeller yayaları tespit etmek için sürücüsüz araçlarda ve günün her saati binaları izlemek için güvenlik kameralarında kullanılmaktadır.
En iyi bilinen bilgisayarla görme modellerinden bazıları, gerçek zamanlı nesne algılama yetenekleriyle bilinen YOLO (You Only Look Once) modelleridir. Zaman içinde YOLO modelleri gelişti ve her yeni sürüm daha iyi performans ve daha fazla esneklik sundu.
Gibi daha yeni sürümler Ultralytics YOLO11 örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve çoklu nesne takibi gibi çeşitli görevleri daha önce hiç olmadığı kadar iyi doğruluk, hız ve hassasiyetle yerine getirebilir.
Bu makalede, aşağıdakileri karşılaştıracağız Ultralytics YOLOv8YOLOv9, YOLOv10 ve Ultralytics YOLO11 'i inceleyerek bu modellerin nasıl geliştiği hakkında daha iyi bir fikir edinebilirsiniz. Temel özelliklerini, kıyaslama sonuçlarını ve performans farklılıklarını analiz edeceğiz. Hadi başlayalım!
Ultralytics tarafından 10 Ocak 2023 tarihinde piyasaya sürülen YOLOv8, önceki YOLO modellerine kıyasla ileriye doğru atılmış büyük bir adımdır. Daha iyi sonuçlar için iyi test edilmiş yaklaşımları yenilikçi güncellemelerle birleştirerek gerçek zamanlı, doğru tespit için optimize edilmiştir.
Nesne algılamanın ötesine geçerek, aşağıdaki bilgisayarla görme görevlerini de destekler: örnek segmentasyonu, poz tahmini, yönlendirilmiş sınırlayıcı kutular (OBB) nesne algılama ve görüntü sınıflandırma. YOLOv8 'in bir diğer önemli özelliği de Nano, Small, Medium, Large ve X olmak üzere beş farklı model çeşidinin mevcut olmasıdır; böylece ihtiyaçlarınıza göre doğru hız ve doğruluk dengesini seçebilirsiniz.
Çok yönlülüğü ve güçlü performansı sayesinde YOLOv8 , güvenlik sistemleri, akıllı şehirler, sağlık hizmetleri ve endüstriyel otomasyon gibi birçok gerçek dünya uygulamasında kullanılabilir.
İşte YOLOv8'in diğer bazı temel özelliklerine daha yakından bir bakış:
YOLOv9, 21 Şubat 2024 tarihinde Tayvan, Academia Sinica, Bilgi Bilimleri Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından yayınlanmıştır. Nesne algılama ve örnek segmentasyonu gibi görevleri destekler.
Bu model şu temeller üzerine kuruludur Ultralytics YOLOv5 ve iki önemli yeniliği tanıtmaktadır: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).
PGI, YOLOv9'un verileri katmanları aracılığıyla işlerken önemli bilgileri korumasına yardımcı olur ve bu da daha doğru sonuçlar elde edilmesini sağlar. GELAN ise modelin katmanlarını kullanma şeklini geliştirerek performansı ve hesaplama verimliliğini artırıyor. Bu yükseltmeler sayesinde YOLOv9, bilgi işlem kaynaklarının genellikle sınırlı olduğu uç cihazlarda ve mobil uygulamalarda gerçek zamanlı görevleri yerine getirebilir.
İşte YOLOv8'in diğer bazı temel özelliklerine bir bakış:
YOLOv10, 23 Mayıs 2024'te Tsinghua Üniversitesi araştırmacıları tarafından tanıtıldı ve gerçek zamanlı nesne tespitine odaklandı. Yinelenen algılamaları ortadan kaldırmak için kullanılan bir işlem sonrası adımı olan maksimum olmayan bastırma (NMS) ihtiyacını ortadan kaldırarak ve genel model tasarımını iyileştirerek önceki YOLO sürümlerindeki sınırlamaların üstesinden gelir. Bu, daha hızlı ve daha verimli nesne tespiti ile sonuçlanırken, yine de son teknoloji ürünü doğruluğa ulaşır.
Bunu mümkün kılan şeyin önemli bir parçası, tutarlı çift etiket atamaları olarak bilinen bir eğitim yaklaşımıdır. Bu yaklaşım iki stratejiyi birleştirir: Biri birden fazla tahminin aynı nesneden öğrenmesine izin veren (bire-çok), diğeri ise en iyi tek tahmini seçmeye odaklanan (bire-bir). Her iki strateji de aynı eşleştirme kurallarını izlediğinden, model kendi başına kopyalardan kaçınmayı öğrenir, bu nedenle NMS gerekli değildir.
YOLOv10'un mimarisi ayrıca özellikleri daha etkili bir şekilde öğrenmek için geliştirilmiş bir CSPNet omurgası ve farklı katmanlardan gelen bilgileri birleştirerek hem küçük hem de büyük nesneleri algılamada daha iyi hale getiren bir PAN (Yol Toplama Ağı) boynu kullanır. Bu iyileştirmeler YOLOv10'un üretim, perakende ve otonom sürüş alanlarındaki gerçek dünya uygulamaları için kullanılmasını mümkün kılıyor.
İşte YOLOv10'un öne çıkan diğer özelliklerinden bazıları:
Ultralytics , bu yıl 30 Eylül'de YOLO11 serisinin en yeni modellerinden biri olan YOLO 'i yıllık hibrit etkinliği YOLO Vision 2024'te (YV24) resmi olarak tanıttı.
Bu sürüm, önceki sürümlere göre önemli iyileştirmeler getirmiştir. YOLO11 daha hızlı, daha doğru ve son derece verimlidir. Nesne algılama, örnek segmentasyonu ve görüntü sınıflandırma dahil olmak üzere YOLOv8 kullanıcılarının aşina olduğu tüm bilgisayarla görme görevlerini destekler. Ayrıca YOLOv8 iş akışlarıyla uyumluluğu koruyarak kullanıcıların yeni sürüme sorunsuz bir şekilde geçiş yapmasını kolaylaştırır.
Bunun da ötesinde YOLO11 , hafif uç cihazlardan güçlü bulut sistemlerine kadar çok çeşitli bilgi işlem ihtiyaçlarını karşılamak üzere tasarlanmıştır. Modelin hem açık kaynak hem de kurumsal sürümleri mevcuttur, bu da onu farklı kullanım durumları için uyarlanabilir hale getirir.
Tıbbi görüntüleme ve uydu algılama gibi hassas görevlerin yanı sıra otonom araçlar, tarım ve sağlık hizmetlerinde daha geniş uygulamalar için mükemmel bir seçenektir.
İşte YOLO11'in diğer benzersiz özelliklerinden bazıları:
Farklı modelleri keşfederken, sadece özelliklerine bakarak onları karşılaştırmak her zaman kolay değildir. İşte bu noktada kıyaslama devreye girer. Tüm modelleri aynı veri kümesi üzerinde çalıştırarak performanslarını objektif olarak ölçebilir ve karşılaştırabiliriz. Şimdi her bir modelin COCO veri kümesinde nasıl performans gösterdiğine bir göz atalım.
YOLO modelleri karşılaştırıldığında, her yeni sürüm doğruluk, hız ve esneklik açısından kayda değer iyileştirmeler getiriyor. Özellikle YOLO11m, YOLOv8m'den %22 daha az parametre kullandığı için burada bir sıçrama yapıyor, bu da daha hafif ve daha hızlı çalıştığı anlamına geliyor. Ayrıca, daha küçük boyutuna rağmen, COCO veri setinde daha yüksek bir ortalama hassasiyet (mAP) elde ediyor. Bu metrik, modelin nesneleri ne kadar iyi algıladığını ve konumlandırdığını ölçer, bu nedenle daha yüksek mAP daha doğru tahminler anlamına gelir.
Bu modellerin gerçek dünya koşullarında nasıl performans gösterdiğini inceleyelim.
YOLOv8, YOLOv9, YOLOv10 ve YOLO11 'i karşılaştırmak için, dördü de aynı trafik videosunda 0,3 güven puanı (model yalnızca bir nesneyi doğru tanımladığından en az %30 emin olduğunda algılamaları görüntüler) ve adil değerlendirme için 640 görüntü boyutu kullanılarak çalıştırılmıştır. Nesne algılama ve izleme sonuçları, algılama doğruluğu, hızı ve hassasiyetindeki önemli farklılıkları vurgulamıştır.
İlk kareden itibaren YOLO11 , YOLOv10'un kaçırdığı kamyon gibi büyük araçları yakaladı. YOLOv8 ve YOLOv9 iyi bir performans gösterdi ancak aydınlatma koşullarına ve nesne boyutuna bağlı olarak değişiklik gösterdi. Daha küçük, uzaktaki araçlar tüm modellerde bir zorluk olmaya devam etti, ancak YOLO11 bu tespitlerde de gözle görülür gelişmeler gösterdi.
Hız açısından, tüm modeller kare başına 10 ila 20 milisaniye arasında çalışarak 50 FPS'nin üzerinde gerçek zamanlı görevleri yerine getirecek kadar hızlıdır. Bir yandan, YOLOv8 ve YOLOv9 video boyunca istikrarlı ve güvenilir tespitler sağladı. İlginç bir şekilde, daha düşük gecikme süresi için tasarlanan YOLOv10 daha hızlıydı ancak belirli nesne türlerini tespit etmede bazı tutarsızlıklar gösterdi.
Öte yandan YOLO11, hız ve doğruluk arasında güçlü bir denge sunarak hassasiyeti ile öne çıktı. Modellerden hiçbiri her karede mükemmel performans göstermese de, yan yana karşılaştırma YOLO11 'in en iyi genel performansı sunduğunu açıkça gösterdi.
Bir proje için model seçimi, projenin özel gereksinimlerine bağlıdır. Örneğin, bazı uygulamalar hıza öncelik verirken, diğerleri daha yüksek doğruluk gerektirebilir veya kararı etkileyen dağıtım kısıtlamalarıyla karşılaşabilir.
Bir diğer önemli faktör de ele almanız gereken bilgisayarla görme görevlerinin türüdür. Farklı görevlerde daha geniş esneklik arıyorsanız, YOLOv8 ve YOLO11 iyi seçeneklerdir.
YOLOv8 'i mi yoksa YOLO11 'i mi seçeceğiniz gerçekten ihtiyaçlarınıza bağlıdır. Bilgisayarla görmede yeniyseniz ve daha büyük bir topluluğa, daha fazla eğiticiye ve kapsamlı üçüncü taraf entegrasyonlarına değer veriyorsanız YOLOv8 sağlam bir seçenektir.
Öte yandan, daha iyi doğruluk ve hız ile üstün performans arıyorsanız, YOLO11 daha iyi bir seçimdir, ancak daha yeni bir sürüm olması nedeniyle daha küçük bir topluluk ve daha az entegrasyon ile birlikte gelir.
Ultralytics YOLOv8 'den Ultralytics YOLO11'e, YOLO model serisinin gelişimi, daha akıllı bilgisayarla görme modellerine doğru tutarlı bir ilerlemeyi yansıtmaktadır. YOLO 'nun her sürümü hız, doğruluk ve hassasiyet açısından anlamlı yükseltmeler getiriyor.
Bilgisayarla görme gelişmeye devam ettikçe, bu modeller nesne tespitinden otonom sistemlere kadar gerçek dünyadaki zorluklara güvenilir çözümler sunmaktadır. YOLO modellerinin devam eden gelişimi, alanın ne kadar ilerlediğini ve gelecekte ne kadar daha fazlasını bekleyebileceğimizi gösteriyor.
Yapay zeka hakkında daha fazla bilgi edinmek için GitHub depomuzu ziyaret edin ve topluluğumuzla etkileşime geçin. Üretimde Görme Yapay Zekasından sağlık hizmetlerinde bilgisayarla görmeye kadar farklı sektörlerdeki gelişmeleri keşfedin. Vision AI projelerinize bugün başlamak için lisanslama seçeneklerimize göz atın.
Makine öğreniminin geleceği ile yolculuğunuza başlayın