Yeni Ultralytics YOLO11 modelinin çeşitli sektörlerdeki çeşitli uygulamalarda daha yüksek hassasiyet elde etmek için nesne algılamada nasıl kullanılabileceğini keşfedin.
Bilgisayarla görme, makinelerin görsel bilgileri yorumlamasına ve anlamasına yardımcı olarak nesne algılama gibi temel görevleri yerine getirmesini sağlayan bir yapay zeka (AI) alanıdır. Görüntü sınıflandırmanın aksine, nesne algılama yalnızca bir görüntüde hangi nesnelerin olduğunu tanımlamakla kalmaz, aynı zamanda tam konumlarını da belirler. Bu da onu sürücüsüz arabalar, gerçek zamanlı güvenlik sistemleri ve depo otomasyonu gibi vizyon yapay zeka uygulamaları için kritik bir araç haline getirir.
Zaman içinde nesne algılama teknolojisi daha gelişmiş ve kullanımı daha kolay hale gelmiştir. Ultralytics 'un yıllık hibrit etkinliği olan YOLO Vision 2024'te (YV24) Ultralytics YOLO11 modelinin piyasaya sürülmesiyle ileriye doğru büyük bir adım atıldığı duyuruldu. YOLO11 doğruluk ve performansı artırırken YOLOv8Bu da önceki modellerin kullanıcılarının sorunsuz bir şekilde geçiş yapmasını kolaylaştırıyor.
Bu makalede, nesne algılamanın ne olduğunu, diğer bilgisayarla görme görevlerinden nasıl farklı olduğunu ve gerçek dünyadaki uygulamalarını inceleyeceğiz. Ayrıca YOLO11 modelini Ultralytics Python paketi ve Ultralytics HUB platformu ile nasıl kullanacağınız konusunda size yol göstereceğiz. Haydi başlayalım!
Nesne alg ılama, bilgisayarla görmede bir görüntüdeki nesneleri tanımlamaktan daha fazlasını yapan temel bir görevdir. Yalnızca belirli bir nesnenin mevcut olup olmadığını belirleyen görüntü sınıflandırmanın aksine, nesne algılama birden fazla nesneyi tanır ve sınırlayıcı kutular kullanarak tam konumlarını belirler.
Örneğin, bir grup fotoğrafındaki yüzleri, işlek bir caddedeki arabaları veya bir mağaza rafındaki ürünleri tanımlayabilir ve yerini belirleyebilir. Nesne tanıma ve lokalizasyonu bir araya getirmesi onu özellikle gözetim, kalabalık izleme ve otomatik envanter yönetimi gibi uygulamalar için kullanışlı hale getirir.
Nesne algılamayı semantik veya örnek segmentasyonu gibi diğer görevlerden ayıran şey, odak noktası ve verimliliğidir.
Anlamsal segmentasyon bir görüntüdeki her pikseli etiketler ancak aynı türdeki nesneler arasında ayrım yapmaz (örneğin, bir fotoğraftaki tüm yüzler "yüz" olarak gruplandırılır). Örnek segmentasyonu, her nesneyi ayırarak ve aynı sınıftaki nesneler için bile tam şeklini ana hatlarıyla belirleyerek bunu daha da ileri götürür.
Ancak nesne algılama, nesneleri tanımlayıp sınıflandırırken konumlarını da işaretleyerek daha akıcı bir yaklaşım sunar. Bu da onu güvenlik görüntülerindeki yüzleri tespit etmek veya otonom araçlar için engelleri belirlemek gibi gerçek zamanlı görevler için ideal hale getirir.
YOLO11'in gelişmiş nesne algılama özellikleri onu birçok sektörde kullanışlı hale getiriyor. Bazı örneklere bir göz atalım.
YOLO11 ve nesne algılama, envanter yönetimini ve raf izlemeyi daha verimli ve doğru hale getirerek perakende analitiğini yeniden tanımlıyor. Modelin nesneleri hızlı ve güvenilir bir şekilde tespit etme yeteneği, perakendecilerin stok seviyelerini takip etmelerine, rafları düzenlemelerine ve envanter sayımlarındaki hataları azaltmalarına yardımcı oluyor.
Örneğin, YOLO11 bir mağaza rafındaki güneş gözlüğü gibi belirli ürünleri tespit edebilir. Peki bir perakendeci neden bir rafı izlemek ister? Rafları stoklu ve düzenli tutmak, müşterilerin ihtiyaç duyduklarını bulabilmelerini sağlamak için hayati önem taşır ve bu da satışları doğrudan etkiler. Perakendeciler rafları gerçek zamanlı olarak izleyerek ürünlerin azaldığını, yanlış yerleştirildiğini veya aşırı kalabalık olduğunu hızla tespit edebilir ve alışveriş deneyimini iyileştiren düzenli ve çekici bir teşhir sağlamalarına yardımcı olabilir.
Hareketli bir şehrin verimli bir şekilde işleyebilmesi için akıcı trafik akışına ve güvenli sokaklara ihtiyacı vardır ve YOLO11 bunu mümkün kılmaya yardımcı olabilir. Aslında, birçok akıllı şehir uygulaması YOLO11 ile entegre edilebilir.
İlginç bir durum, hareket halindeki araçların plakalarını tanımlamak için nesne algılamayı kullanmayı içerir. Bu sayede YOLO11 daha hızlı geçiş ücreti toplama, daha iyi trafik yönetimi ve daha hızlı düzenleme uygulamasını destekleyebilir.
Yolları izleyen Vision AI sistemlerinden elde edilen bilgiler, daha büyük sorunlara dönüşmeden önce yetkilileri trafik ihlalleri veya tıkanıklık konusunda uyarabilir. YOLO11 Ayrıca yayaları ve bisikletlileri tespit ederek sokakları herkes için daha güvenli ve daha verimli hale getirebilir.
Aslında, YOLO11'un görsel verileri işleme yeteneği, onu şehir altyapısını iyileştirmek için güçlü bir araç haline getiriyor. Örneğin, araç ve yaya hareketlerini analiz ederek trafik ışığı zamanlamasını optimize etmeye yardımcı olabilir. Ayrıca çocukları tespit ederek ve sürücüleri yavaşlamaları için uyararak okul bölgelerinde güvenliği artırabilir. YOLO11 ile şehirler zorlukları ele almak için proaktif önlemler alabilir ve herkes için daha verimli bir ortam yaratabilir.
Gerçek zamanlı nesne algılama, bir sistemin canlı bir video akışındaki nesneleri göründükleri anda tanımlama ve sınıflandırma yeteneğini ifade eder. YOLO11 üstün gerçek zamanlı performans için tasarlanmıştır ve bu yeteneği destekleme konusunda mükemmeldir. Uygulamaları sadece süreçleri kolaylaştırmanın ötesine geçerek daha kapsayıcı ve erişilebilir bir dünya yaratmaya da yardımcı olabilir.
Mesela, YOLO11 nesneleri gerçek zamanlı olarak tanımlayarak görme engelli bireylere yardımcı olabilir. Tespitlere dayanarak, kullanıcıların çevrelerinde daha bağımsız bir şekilde gezinmelerine yardımcı olan sesli açıklamalar sağlanabilir.
Görme engelli bir kişinin market alışverişi yaptığını düşünün. Doğru ürünleri seçmek zor olabilir, ancak YOLO11 yardımcı olabilir. Alışveriş sepetine ürünleri yerleştirirken, YOLO11 ile entegre bir sistem, muz, avokado veya bir kutu süt gibi her bir ürünü tanımlamak ve gerçek zamanlı sesli açıklamalar sağlamak için kullanılabilir. Bu sayede tüketiciler seçimlerini teyit edebilir ve ihtiyaç duydukları her şeyi aldıklarından emin olabilirler. YOLO11 günlük eşyaları tanıyarak alışverişi daha kolay hale getirebilir.
Nesne algılamanın temellerini ve çeşitli uygulamalarını ele aldığımıza göre, nesne algılama gibi görevler için Ultralytics YOLO11 modelini kullanmaya nasıl başlayabileceğinizi inceleyelim.
YOLO11 adresini kullanmanın iki basit yolu vardır: Ultralytics Python paketi veya Ultralytics HUB aracılığıyla. Şimdi Python paketi ile başlayarak her iki yöntemi de inceleyelim.
Çıkarım, bir yapay zeka modelinin eğitim sırasında öğrendiklerine dayanarak tahminlerde bulunmak, bilgileri sınıflandırmak veya içgörüler sağlamak için yeni, görülmemiş verileri analiz etmesidir. Nesne algılama ile ilgili olarak bu, bir görüntü veya video içindeki belirli nesneleri tanımlamak ve konumlandırmak, etraflarına sınırlayıcı kutular çizmek ve modelin eğitimine göre etiketlemek anlamına gelir.
YOLO11 nesne algılama modelini kullanarak çıkarım yapmak için öncelikle pip, conda veya Docker aracılığıyla Ultralytics Python paketini yüklemeniz gerekir. Herhangi bir kurulum sorunuyla karşılaşırsanız, bunları çözmenize yardımcı olacak ipuçları ve püf noktaları için sorun giderme kılavuzuna göz atın. Yüklendikten sonra, YOLO11 nesne algılama modelini yüklemek ve bir görüntü üzerinde tahminler yapmak için aşağıdaki kodu kullanabilirsiniz.
YOLO11 ayrıca özel kullanım durumlarınıza daha iyi uyması için özel eğitimi de destekler. Modele ince ayar yaparak, projenizle ilgili nesneleri tespit edecek şekilde uyarlayabilirsiniz. Örneğin, sağlık hizmetlerinde bilgisayarla görmeyi kullanırken, MRI taramalarındaki tümörler veya X-ışınlarındaki kırıklar gibi tıbbi görüntülerdeki belirli anormallikleri tespit etmek için özel olarak eğitilmiş bir YOLO11 modeli kullanılabilir ve doktorların daha hızlı ve daha doğru teşhisler koymasına yardımcı olabilir.
Aşağıdaki kod parçacığı, nesne algılama için bir YOLO11 modelinin nasıl yükleneceğini ve eğitileceğini göstermektedir. Bir YAML yapılandırma dosyasından veya önceden eğitilmiş bir modelden başlayabilir, ağırlıkları aktarabilir ve daha rafine nesne algılama yetenekleri için COCO gibi veri kümeleri üzerinde eğitebilirsiniz.
Bir modeli eğittikten sonra, eğitilen modeli farklı ortamlarda dağıtmak için çeşitli biçimlerde dışa aktarabilirsiniz.
Kodsuz bir alternatif arayanlar için Ultralytics HUB, YOLO11 dahil olmak üzere YOLO modellerini eğitmek ve dağıtmak için kullanımı kolay bir Vision AI platformu sağlar.
Görüntüler üzerinde nesne algılamayı çalıştırmak için bir hesap oluşturmanız, 'Modeller' bölümüne gitmeniz ve YOLO11 nesne algılama modeli varyantını seçmeniz yeterlidir. Resminizi yükleyin ve platform tespit edilen nesneleri bir önizleme bölümünde gösterecektir.
Python paketinin esnekliğini HUB'ın kolaylığıyla birleştiren YOLO11 , hem geliştiricilerin hem de işletmelerin gelişmiş nesne algılama teknolojisinin gücünden yararlanmasını kolaylaştırıyor.
YOLO11 çeşitli sektörlerin ihtiyaçlarını karşılamak için yüksek doğruluğu çok yönlülükle birleştirerek nesne algılamada yeni bir standart belirler. Perakende analitiğini geliştirmekten akıllı şehir altyapısını yönetmeye kadar, YOLO11 sayısız uygulamada gerçek zamanlı, güvenilir performans için üretilmiştir.
Özel eğitim seçenekleri ve Ultralytics HUB üzerinden kullanımı kolay bir arayüz ile YOLO11 adresini iş akışlarınıza entegre etmek hiç bu kadar kolay olmamıştı. İster bilgisayarla görmeyi keşfeden bir geliştirici ister yapay zeka ile yenilik yapmak isteyen bir işletme olun, YOLO11 başarılı olmak için ihtiyacınız olan araçları sunar.
Daha fazla bilgi edinmek için GitHub depomuza göz atın ve topluluğumuzla etkileşime geçin. Çözüm sayfalarımızda sürücüsüz otomobillerdeki yapay zeka uygulamalarını ve tarım için bilgisayarla görmeyi keşfedin. 🚀
Makine öğreniminin geleceği ile yolculuğunuza başlayın