Yeşil çek
Panoya kopyalanan bağlantı

Ultralytics YOLO11 ile el anahtar noktaları tahminini geliştirme

Ultralytics YOLO11'in gerçek zamanlı hareket tanıma gibi uygulamalarda poz tahmini desteği ile yapay zeka odaklı el anahtar noktaları tahminini keşfedin.

Son zamanlarda, Super Bowl'daki işaret dili tercümanları çok dikkat çekti. Onları televizyonda en sevdiğiniz sanatçının şarkısını söylerken izlediğinizde, işaret dili biliyorsanız onları anlayabilirsiniz çünkü beyniniz onların el hareketlerini işler. Peki ya aynı şeyi bir bilgisayar yapabilseydi? Yapay zeka odaklı el izleme çözümleri sayesinde, makinelerin el hareketlerini etkileyici bir doğrulukla izlemesi ve yorumlaması mümkün.

Bu çözümlerin merkezinde, makinelerin görsel bilgileri işlemesini ve anlamasını sağlayan yapay zekanın bir alt alanı olan bilgisayarla görme yer alıyor. Vision AI, görüntüleri ve videoları analiz ederek nesneleri tespit etmelerine, hareketleri izlemelerine ve karmaşık hareketleri dikkate değer bir doğrulukla tanımalarına yardımcı olur.

Örneğin, bilgisayarla görme modelleri Ultralytics YOLO11 poz tahmini kullanarak gerçek zamanlı olarak el anahtar noktalarını tespit etmek ve analiz etmek için eğitilebilir. Böylece bu modeller jest tanıma, işaret dili çevirisi ve AR/VR etkileşimleri gibi uygulamalar için kullanılabilir. 

Bu makalede, YOLO11 'in yapay zeka tabanlı el takibini nasıl sağladığını, eğitim için kullanılan veri kümelerini ve el pozu tahmini için bir modelin nasıl özel olarak eğitileceğini inceleyeceğiz. Ayrıca gerçek dünya uygulamalarına da bakacağız. Hadi başlayalım!

Yapay zeka tabanlı el anahtar noktalarının tespitini anlama

Yapay zeka, bilek, parmak uçları ve parmak eklemleri gibi kilit noktaları tanımlayarak görsel verilerdeki el hareketlerini tanımak ve izlemek için kullanılabilir. Poz tahmini olarak bilinen bir yaklaşım, bilgisayarların kilit noktaları haritalayarak ve zaman içinde nasıl değiştiklerini analiz ederek insan hareketini anlamalarına yardımcı olur. Bu, yapay zeka sistemlerinin vücut duruşunu, jestleri ve hareket modellerini yüksek doğrulukla yorumlamasına olanak tanır.

Bilgisayarla görme modelleri, el üzerindeki kilit noktaları belirlemek ve hareketlerini izlemek için görüntüleri veya videoları analiz ederek bunu mümkün kılar. Bu noktalar haritalandıktan sonra yapay zeka, anahtar noktalar arasındaki uzamsal ilişkileri ve bunların zaman içinde nasıl değiştiğini analiz ederek hareketleri tanıyabilir. 

Örneğin, bir başparmak ve işaret parmağı arasındaki mesafe azalırsa, yapay zeka bunu bir çimdikleme hareketi olarak yorumlayabilir. Benzer şekilde, tuş noktalarının diziler halinde nasıl hareket ettiğini izlemek, karmaşık el hareketlerini tanımlamaya ve hatta gelecekteki hareketleri tahmin etmeye yardımcı olur.

Şekil 1. Bilgisayar görüşü kullanarak bir eldeki anahtar noktaların tanınmasına bir örnek.

İlginç bir şekilde, el takibi için poz tahmini, akıllı cihazların eller serbest kontrolünden gelişmiş robotik hassasiyete ve sağlık uygulamalarında yardıma kadar heyecan verici olasılıkların önünü açmıştır. Yapay zeka ve bilgisayar görüşü gelişmeye devam ettikçe, el takibi teknolojiyi günlük yaşamda daha etkileşimli, erişilebilir ve sezgisel hale getirmede muhtemelen daha büyük bir rol oynayacaktır.

Poz tahmini için YOLO11 'i keşfetme

Yapay zeka tabanlı el takibi için bir çözümün nasıl oluşturulacağına geçmeden önce, poz tahminine ve YOLO11 'in bu bilgisayarla görme görevini nasıl desteklediğine daha yakından bakalım. Nesnelerin tamamını tanımlayan standart nesne algılamanın aksine, poz tahmini, hareketi ve duruşu analiz etmek için eklemler, uzuvlar veya kenarlar gibi temel işaretleri tespit etmeye odaklanır. 

Özellikle, Ultralytics YOLO11 gerçek zamanlı poz tahmini için tasarlanmıştır. Hem yukarıdan aşağıya hem de aşağıdan yukarıya yöntemlerinden yararlanarak, insanları verimli bir şekilde algılar ve anahtar noktaları tek adımda tahmin ederek hız ve doğruluk açısından önceki modellerden daha iyi performans gösterir.

YOLO11 , COCO-Pose veri kümesi üzerinde önceden eğitilmiş olarak gelir ve baş, omuzlar, dirsekler, bilekler, kalçalar, dizler ve ayak bilekleri dahil olmak üzere insan vücudundaki önemli noktaları tanıyabilir. 

Şekil 2. İnsan pozu tahmini için YOLO11 kullanımı.

İnsan pozu tahmininin ötesinde, YOLO11 hem canlı hem de cansız çeşitli nesneler üzerindeki anahtar noktaları tespit etmek için özel olarak eğitilebilir. Bu esneklik, YOLO11 'i çok çeşitli uygulamalar için mükemmel bir seçenek haline getirir.

Hand Keypoints veri setine genel bir bakış

Bir modeli özel olarak eğitmenin ilk adımı veri toplamak ve bu verilere açıklama eklemek ya da projenin ihtiyaçlarına uygun mevcut bir veri kümesi bulmaktır. Örneğin, Hand Keypoints veri seti, el takibi ve poz tahmini için Vision AI modellerini eğitmek için iyi bir başlangıç noktasıdır. 26.768 açıklamalı görüntü ile manuel etiketleme ihtiyacını ortadan kaldırır. 

Ultralytics YOLO11 gibi modelleri eğiterek el hareketlerinin nasıl tespit edileceğini ve izleneceğini hızlı bir şekilde öğrenmek için kullanılabilir. Veri kümesi, bilek, parmaklar ve eklemleri kapsayan el başına 21 anahtar nokta içerir. Ayrıca, veri kümesinin açıklamaları, gerçek zamanlı medya işleme için yapay zeka destekli çözümler geliştirmeye yönelik bir araç olan Google MediaPipe ile oluşturularak hassas ve güvenilir anahtar nokta tespiti sağlanmıştır. 

Şekil 3. El Anahtar Noktaları veri kümesinde yer alan 21 anahtar nokta.

Bunun gibi yapılandırılmış bir veri kümesi kullanmak zaman kazandırır ve geliştiricilerin veri toplamak ve etiketlemek yerine modellerini eğitmeye ve ince ayar yapmaya odaklanmalarını sağlar. Aslında, veri kümesi zaten eğitim (18.776 görüntü) ve doğrulama (7.992 görüntü) alt kümelerine bölünmüştür, bu da model performansını değerlendirmeyi kolaylaştırır. 

El pozu tahmini için YOLO11 nasıl eğitilir

YOLO11 'i el pozu tahmini için eğitmek, özellikle modelin kurulumunu ve eğitimini kolaylaştıran Ultralytics Python paketi ile basit bir işlemdir. Hand Keypoints veri kümesi eğitim hattında zaten desteklendiğinden, ekstra biçimlendirme olmadan hemen kullanılabilir, zamandan ve emekten tasarruf sağlar.

Eğitim süreci şu şekilde işliyor:

  • Ortamı ayarlayın: İlk adım Ultralytics Python paketini yüklemektir.
  • Hand Keypoints veri setini yükleyin: YOLO11 bu veri setini yerel olarak destekler, böylece otomatik olarak indirilebilir ve hazırlanabilir.
  • Önceden eğitilmiş bir model kullanın: Doğruluğu artırmaya yardımcı olan ve eğitim sürecini hızlandıran önceden eğitilmiş bir YOLO11 poz tahmin modeli ile başlayabilirsiniz.
  • Modeli eğitin: Model, birden fazla eğitim döngüsünden geçerek el anahtar noktalarını tespit etmeyi ve izlemeyi öğrenir.
  • Performansı izleyin: Ultralytics paketi ayrıca doğruluk ve kayıp gibi temel ölçümleri izlemek için yerleşik araçlar sağlayarak modelin zaman içinde gelişmesini sağlamaya yardımcı olur.
  • Kaydedin ve dağıtın: Model eğitildikten sonra dışa aktarılabilir ve gerçek zamanlı el izleme uygulamaları için kullanılabilir.

Özel eğitimli modelinizi değerlendirme

Özel bir model oluşturma adımlarını izlerken, performansı izlemenin çok önemli olduğunu fark edeceksiniz. Eğitim sırasında ilerlemeyi izlemenin yanı sıra, modelin daha sonra değerlendirilmesi, el kilit noktalarını doğru bir şekilde algıladığından ve izlediğinden emin olmak için çok önemlidir. 

Doğruluk, kayıp değerleri ve ortalama ortalama hassasiyet (mAP) gibi temel performans ölçümleri, modelin ne kadar iyi performans gösterdiğini değerlendirmeye yardımcı olur. Ultralytics Python paketi, sonuçları görselleştirmek ve tahminleri gerçek ek açıklamalarla karşılaştırmak için yerleşik araçlar sağlayarak iyileştirme alanlarını tespit etmeyi kolaylaştırır.

Modelin performansını daha iyi anlamak için eğitim günlüklerinde otomatik olarak oluşturulan kayıp eğrileri, kesinlik-geri çağırma grafikleri ve karışıklık matrisleri gibi değerlendirme grafiklerini kontrol edebilirsiniz. 

Bu grafikler aşırı uyum (modelin eğitim verilerini ezberlediği ancak yeni verilerle zorlandığı durumlar) veya yetersiz uyum (modelin kalıpları doğru performans gösterecek kadar iyi öğrenemediği durumlar) gibi sorunların belirlenmesine yardımcı olur ve doğruluğu artırmak için ayarlamalara rehberlik eder. Ayrıca, modelin yeni görüntüler veya videolar üzerinde test edilmesi, gerçek dünya senaryolarında ne kadar iyi çalıştığını görmek açısından önemlidir.

Yapay zekaya dayalı el izleme çözümlerinin uygulamaları

Daha sonra, Ultralytics YOLO11 ile el anahtar noktaları tahmininin en etkili uygulamalarından bazılarını inceleyelim.

YOLO11 ile gerçek zamanlı hareket tanıma

Diyelim ki sadece elinizi sallayarak TV'nizin sesini ayarlayabiliyorsunuz veya basit bir kaydırma hareketiyle akıllı bir ev sisteminde gezinebiliyorsunuz. YOLO11 tarafından desteklenen gerçek zamanlı hareket tanıma özelliği, el hareketlerini gerçek zamanlı olarak doğru bir şekilde algılayarak bu temassız etkileşimleri mümkün kılar. 

Bu, elinizdeki önemli noktaları izlemek ve hareketleri komutlar olarak yorumlamak için yapay zeka kameraları kullanarak çalışır. Derinlik algılayan kameralar, kızılötesi sensörler ve hatta normal web kameraları el hareketlerini yakalarken, YOLO11 farklı hareketleri tanımak için verileri işleyebilir. Örneğin, böyle bir sistem bir şarkıyı değiştirmek için kaydırma hareketi, yakınlaştırmak için çimdikleme hareketi ya da ses seviyesini ayarlamak için dairesel hareket arasındaki farkı anlayabilir.

İşaret dili tanıma için yapay zeka tabanlı el tuş noktaları tespiti

El takibine yönelik yapay zeka çözümleri, sağır bir kişi ile işaret dili bilmeyen biri arasında sorunsuz iletişimi destekleyebilir. Örneğin, kameralar ve YOLO11 ile entegre edilmiş akıllı cihazlar işaret dilini anında metne veya konuşmaya çevirmek için kullanılabilir. 

YOLO11 gibi gelişmeler sayesinde işaret dili çeviri araçları daha doğru ve erişilebilir hale geliyor. Bu durum yardımcı teknoloji, canlı çeviri hizmetleri ve eğitim platformları gibi uygulamaları etkiliyor. Yapay zeka, iletişim boşluklarını kapatmaya ve iş yerlerinde, okullarda ve kamusal alanlarda kapsayıcılığı teşvik etmeye yardımcı olabilir.

El takibi için bilgisayar görüşü: AR ve VR deneyimlerini iyileştirme

Hiç kumanda kullanmadan nesneleri yakalayabildiğiniz bir sanal gerçeklik (VR) oyunu oynadınız mı? Bilgisayar görüşü ile desteklenen el takibi, kullanıcıların artırılmış gerçeklik (AR) ve VR ortamlarında doğal bir şekilde etkileşime girmesine olanak tanıyarak bunu mümkün kılar. 

Şekil 4. El takibi, AR ve VR uygulamalarının önemli bir parçasıdır.

Ultralytics YOLO11 gibi modellerin kullanıldığı el kilit noktaları tahmini ile yapay zeka, hareketleri gerçek zamanlı olarak izleyerek çimdikleme, yakalama ve kaydırma gibi hareketleri mümkün kılar. Bu da oyun, sanal eğitim ve uzaktan işbirliğini geliştirerek etkileşimleri daha sezgisel hale getiriyor. El izleme teknolojisi geliştikçe, AR ve VR daha da sürükleyici ve gerçekçi hissettirecek. 

Önemli çıkarımlar

Ultralytics YOLO11 ile el kilit noktaları tahmini, yapay zeka odaklı el izleme çözümlerini daha erişilebilir ve güvenilir hale getiriyor. Gerçek zamanlı hareket tanımadan işaret dili yorumlamaya ve AR/VR uygulamalarına kadar, bilgisayar görüşü insan-bilgisayar etkileşiminde yeni olasılıkların önünü açıyor.

Ayrıca, kolaylaştırılmış özel eğitim ve ince ayar süreçleri, geliştiricilerin çeşitli gerçek dünya kullanımları için verimli modeller oluşturmasına yardımcı oluyor. Bilgisayarla görme teknolojisi geliştikçe, sağlık, robotik, oyun ve güvenlik gibi alanlarda daha da fazla yenilik bekleyebiliriz.

Topluluğumuzla etkileşime geçin ve GitHub depomuzdaki yapay zeka gelişmelerini keşfedin. Çözüm sayfalarımız aracılığıyla üretimde yapay zekanın ve sağlık hizmetlerinde bilgisayarla görmenin etkisini keşfedin. Lisanslama planlarımızı keşfedin ve yapay zeka yolculuğunuza bugün başlayın!

Facebook logosuTwitter logosuLinkedIn logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın