David Scott'ın YOLO Vision 2024 adresindeki yapay zeka odaklı davranış analizi ve bunun hayvan yetiştiriciliği gibi sektörlerdeki gerçek dünya uygulamaları hakkındaki açılış konuşmasını tekrar gözden geçirirken bize katılın.
Bilgisayarla görme alanındaki yenilikler uzun yıllar boyunca nesne algılama - görüntü ve videolardaki köpek veya araba gibi nesneleri tanımlama - gibi görevlere odaklanmıştır. Bu yaklaşımlar otonom araçlar, üretim ve sağlık hizmetleri gibi alanlarda uygulamalara olanak sağlamıştır.
Ancak bu görevler genellikle yalnızca bir nesnenin ne olduğunu belirlemeye odaklanır. Peki ya Vision AI sistemleri bir adım daha ileri gidebilseydi? Örneğin, sadece bir köpeği tespit etmek yerine, diyelim ki köpeğin bir topu kovaladığını veya bir yaya karşıdan karşıya geçtiği için bir arabanın aniden fren yaptığını anlayabilir. Temel tanımadan bağlamsal anlamaya geçiş, daha akıllı, bağlama duyarlı davranışsal yapay zekaya doğru büyük bir değişimi temsil ediyor.
YOLO Vision 2024'te (YV24), Ultralytics' Vision AI'daki ilerlemeleri kutlayan yıllık hibrit etkinlikte, AI güdümlü davranış analizi kavramı, The Main Branch CEO'su David Scott tarafından yapılan ilginç bir konuşma sırasında merkez sahneye çıktı.
David konuşmasında, temel bilgisayarla görme görevlerinden davranışsal izlemeye geçişi inceledi. En yeni teknoloji uygulamalarını geliştirme konusundaki 25 yılı aşkın deneyimiyle, bu sıçramanın etkisini sergiledi. Örüntü ve davranışların deşifre edilmesinin tarım ve hayvan refahı gibi sektörleri nasıl yeniden şekillendirdiğini vurguladı.
Bu makalede, David'in konuşmasının önemli noktalarını gözden geçirecek ve davranışsal izlemenin yapay zekayı nasıl daha pratik hale getirdiğini keşfedeceğiz.
David Scott açılış konuşmasına cesur bir gerçeklik kontrolüyle başladı ve şöyle dedi: "Bir meslektaşım sık sık 'Bilim satmaz' der, bu da buradaki pek çoğumuzu rahatsız eder çünkü bilimi gerçekten severiz. Yapay zeka gerçekten harika - insanlar neden onu satın almasın ki? Ama gerçek şu ki, insanlar sadece biz havalı olduğunu düşündüğümüz için satın almak istemiyor; satın almak için bir nedene ihtiyaçları var."
Devam etti ve şirketi The Main Branch'ta odak noktasının her zaman yapay zeka ile gerçek sorunları çözmek olduğunu, sadece yeteneklerini göstermek olmadığını açıkladı. Pek çok müşteri genel olarak yapay zekayı nasıl kullanabilecekleri hakkında konuşmak için geliyor, ancak o bunu geriye dönük bir yaklaşım olarak görüyor - bu, sorun olmadan bir çözüme sahip olmak gibi. Bunun yerine, gerçekten fark yaratacak YZ çözümleri oluşturabilmek için belirli zorlukları olan müşterilerle çalışıyorlar.
David ayrıca çalışmalarının genellikle bir sahnedeki nesneleri tanımanın ötesine geçtiğini paylaştı. Orada ne olduğunu tespit etmek yalnızca ilk adımdır. Asıl değer, bu bilgiyle ne yapılacağını bulmak ve onu daha büyük değer zinciri içinde faydalı hale getirmekten geliyor.
YZ'yi gerçekten faydalı hale getirmenin hayati bir adımı, nesne algılama gibi temel bilgisayarla görme görevlerinin ötesine geçmek ve bu içgörüleri davranışsal izleme için kullanmaktır. David, davranışsal YZ'nin sadece nesneleri tanımlamaya değil, eylemleri ve kalıpları anlamaya odaklandığını vurguladı. Bu, yapay zekayı anlamlı olayları tanıyabilir ve eyleme geçirilebilir içgörüler sağlayabilir hale getirir.
Bir hayvanın yerde yuvarlanmasını örnek verdi, bu da hastalık belirtisi olabilir. İnsanlar bir hayvanı günün her saati izleyemezken, davranışsal izleme özelliklerine sahip yapay zeka odaklı gözetim sistemleri bunu yapabilir. Bu tür çözümler nesneleri sürekli olarak izleyebilir, belirli davranışları tespit edebilir, bir uyarı gönderebilir ve zamanında harekete geçilmesini sağlayabilir. Bu da ham veriyi pratik ve değerli bir şeye dönüştürür.
David ayrıca bu yaklaşımın yapay zekayı sadece ilginç değil, aynı zamanda gerçekten etkili kıldığını da gösterdi. Davranışların izlenmesi ve bunlara göre hareket edilmesi gibi gerçek sorunları ele alarak, davranışsal izleme çeşitli sektörlerde etkili YZ çözümlerinin önemli bir parçası haline gelebilir.
David Scott daha sonra nasıl Ultralytics YOLOv8bir bilgisayarla görme modeli, ekibinin davranışsal izleme projeleri için bir atılım oldu. Nesneleri tespit etmek, sınıflandırmak ve izlemek için onlara sağlam bir temel sağladı. Ekibi ayrıca bir adım daha ileri giderek YOLOv8 'u zaman içindeki davranışları izlemeye odaklanacak şekilde özel olarak eğitti ve gerçek dünyadaki durumlar için daha pratik ve yararlı hale getirdi.
İlginç bir şekilde Ultralytics YOLO11The Main Branch tarafından üretilenler gibi çözümler daha da güvenilir ve doğru hale gelebilir. Bu son model, davranışları takip etme kabiliyetini artıran gelişmiş hassasiyet ve daha hızlı işleme gibi özellikler sunuyor. Davranışsal yapay zekanın kullanılabileceği uygulamaları daha iyi anladıktan sonra bunu daha ayrıntılı olarak tartışacağız.
Şimdi David'in bahsettiği çözümleri ve davranışsal izleme teknolojisinin günlük zorlukları çözmek ve anlamlı bir etki yaratmak için gerçek dünya uygulamalarında nasıl kullanıldığını inceleyelim.
David ilk olarak, büyük bir besi çiftliğindeki binlerce ineğin sağlığının izlenmesini içeren HerdSense adlı bir projede üstesinden geldikleri heyecan verici bir zorluğu paylaştı. Amaç, potansiyel sağlık sorunlarını tespit etmek için tek tek ineklerin davranışlarını izlemekti. Bu, aynı anda on binlerce hayvana göz kulak olmak anlamına geliyordu ve bu basit bir görev değildi.
Her bir ineği tanımlama ve davranışlarını izleme sorununu çözmeye başlamak için David'in ekibi, izlemeleri gereken olası her davranışı ana hatlarıyla belirlemek üzere iki günlük bir atölye çalışması gerçekleştirdi. Toplamda 200'den fazla davranış belirlediler.
Tüm verilerin belirli hayvanlara bağlanması gerektiğinden, 200 davranışın her biri inekleri tek tek doğru bir şekilde tanıyabilmeye bağlıydı. En büyük sorunlardan biri, ineklerin grup halinde bir araya geldiklerinde takip edilmesiydi, bu da hayvanları tek tek görmeyi zorlaştırıyordu.
David'in ekibi, zor durumlarda bile her bir ineğin tutarlı bir şekilde tanımlanmasını sağlamak için bir bilgisayar görüş sistemi geliştirdi. Aynı inek gözden kaybolsa, diğerlerinin arasına karışsa veya daha sonra tekrar ortaya çıksa bile her zaman aynı kimliğin verileceğini doğrulayabildiler.
Devamında David, benzer davranışsal izleme tekniklerini atları izlemek için uyguladıkları bir başka büyüleyici projeyi tanıttı. Bu projede David'in ekibinin atların kimliklerini ineklerde olduğu kadar yakından takip etmesine gerek yoktu. Bunun yerine, belirli davranışlara odaklandılar ve herhangi bir sağlık sorununu erkenden tespit etmek için yeme düzenleri ve genel aktivite seviyeleri gibi ayrıntıları izlediler. Davranışlardaki küçük değişiklikleri tespit etmek, daha iyi bakım sağlamak ve sorunları ciddileşmeden önlemek için daha hızlı müdahalelere yol açabilir.
David ayrıca davranışsal izlemenin karmaşıklığını ilgi çekici bir örnek üzerinden tartıştı. Davranışsal analizi geliştirmenin yollarını araştırırken ekibi, birinin elini cebine sokması gibi belirli pozları analiz ederek mağaza hırsızlığını tespit ettiğini iddia eden bir şirketle karşılaştı. İlk başta bu akıllıca bir fikir gibi göründü - belirli hareketler şüpheli davranışlara işaret edebilir, değil mi?
Ancak David daha fazla araştırma yaptıkça bu yöntemin sınırlarını fark etti. Elin cepte olması gibi tek bir poz, bir kişinin mutlaka hırsızlık yaptığı anlamına gelmez. Sadece rahat olduklarını, düşündüklerini ya da hatta üşüdüklerini gösterebilir. İzole pozlara odaklanmanın sorunu, daha geniş bağlamı göz ardı etmesidir. Davranış sadece tek bir eylem değildir - zaman içinde bağlam ve niyet tarafından şekillendirilen bir eylem örüntüsüdür.
David, gerçek davranışsal takibin çok daha karmaşık olduğunu ve bütünsel bir yaklaşım gerektirdiğini vurguladı. Bu, eylem dizilerini analiz etmek ve daha geniş resimde ne anlama geldiklerini anlamakla ilgilidir. Yapay zeka endüstrisi adımlar atıyor olsa da, anlamlı ve doğru içgörüler sunmak için davranışsal izlemeyi ilerletme konusunda hala yapılması gereken işler olduğunu belirtti.
Daha sonra David, ekibinin YOLOv8 ve poz tahmin yetenekleri yardımıyla inek sağlığını izlemek için nasıl bir bilgisayarla görme çözümü oluşturduğunu göstermek için izleyicileri perde arkasına götürdü.
Bir ineğin poz tahmini için özel bir veri kümesi oluşturarak işe başlayan araştırmacılar, modelin hareketi daha iyi analiz etmesini sağlamak için standart anahtar nokta sayısını 17'den 145'e çıkardı. Ardından model, 2 milyondan fazla görüntü ve 110 milyon davranış örneğinden oluşan devasa bir veri kümesi üzerinde eğitildi.
David'in ekibi, gelişmiş donanım altyapısını kullanarak, modeli geleneksel donanımla haftalarca sürecek bir çalışma yerine sadece iki günde eğitebildi. Eğitilen model daha sonra, ineklerin eylemlerindeki kalıpları tespit etmek için aynı anda birden fazla video karesini analiz eden özel bir davranış izleyiciyle entegre edildi.
Sonuç, sağlık sorunlarına işaret edebilecek küçük davranış değişikliklerini tespit etmek için yeme, içme ve yatma gibi sekiz farklı inek davranışını tespit edip izleyebilen yapay zeka odaklı bir vizyon çözümü oldu. Bu da çiftçilerin hızlı hareket etmesini sağlıyor ve sürü yönetimini iyileştiriyor.
David konuşmasını dinleyicilerle önemli bir ders paylaşarak tamamladı: "Yapay zekaya başarısız olması için yer vermezseniz, kendinizi başarısızlığa hazırlamış olursunuz çünkü günün sonunda bu bir istatistiktir." Yapay zekanın güçlü yönlerine rağmen kusursuz olmadığına dikkat çekti. Örüntülerden öğrenen bir araçtır ve her zaman işleri doğru yapamadığı zamanlar olacaktır. Önemli olan bu hatalardan korkmak yerine, bunların üstesinden gelebilecek ve zaman içinde gelişmeye devam edecek sistemler oluşturmaktır.
Bu durum, bilgisayarla görme modellerinin kendileri söz konusu olduğunda da geçerlidir. Örneğin, Ultralytics YOLO modellerinin en son sürümü olan Ultralytics YOLO11 , YOLOv8 ile karşılaştırıldığında işleri bir sonraki seviyeye taşıma ihtiyacı göz önünde bulundurularak oluşturulmuştur.
Özellikle YOLO11 , tarım ve sağlık hizmetleri gibi hassasiyetin önemli olduğu gerçek zamanlı uygulamalar açısından daha iyi performans sunuyor. Gelişmiş özellikleriyle YOLO11 , yenilikçi gerçek zamanlı içgörüler sağlayarak ve zorlukların daha etkili bir şekilde üstesinden gelmelerine yardımcı olarak sektörlerin yapay zekayı kullanma şeklini yeniden tanımlıyor.
David'in YV24'teki açılış konuşması, yapay zekanın havalı bir yenilikten daha fazlası olduğunu, gerçek sorunları çözmek ve yaşama ve çalışma şeklimizi iyileştirmek için güçlü bir araç olduğunu hatırlattı. Yapay zeka, davranışa odaklanarak hayvan sağlığını izleme ve günlük eylemlerdeki anlamlı kalıpları tanıma gibi alanlarda zaten bir etki yaratıyor.
Davranışsal yapay zekanın potansiyeli heyecan verici ve henüz işin başındayız. Davranışsal YZ, ham verileri eyleme geçirilebilir içgörülere dönüştürerek pasif izlemeden aktif sorun çözmeye geçiyor. Daha da geliştikçe, davranışsal yapay zeka daha akıllı kararlar almaya, süreçleri kolaylaştırmaya ve hayatlarımıza anlamlı iyileştirmeler getirmeye hazırlanıyor.
Yapay zeka ve gerçek dünyadaki uygulamaları hakkında daha fazla bilgi edinmek için topluluğumuzla bağlantıda kalın. Tarımda yapay zeka ve üretimde bilgisayar görüşü gibi alanlardaki yenilikleri keşfetmek için GitHub depomuzu ziyaret edin.
Makine öğreniminin geleceği ile yolculuğunuza başlayın